
Nvidia построила свою империю искусственного интеллекта на графических процессорах. Но ставка на Groq в 20 миллиардов долларов предполагает, что компания не убеждена в том, что одни только графические процессоры будут доминировать на самом важном этапе развития искусственного интеллекта: запуске моделей в масштабе, известном как логический вывод.
Битва за победу в умозаключениях ИИ, конечно же, связана с его экономикой. После обучения модели все ее полезные действия (ответ на запрос, генерация кода, рекомендация продукта, обобщение документа, запуск чат-бота или анализ изображения) происходят во время вывода. Это тот момент, когда ИИ переходит от невозвратных затрат к приносящей доход услуге, со всем сопутствующим давлением, направленным на снижение затрат, уменьшение задержки (как долго вам придется ждать ответа ИИ) и повышение эффективности.
Именно это давление стало причиной того, что логический вывод стал следующим полем битвы в отрасли за потенциальную прибыль, и почему Nvidia в сделке, объявленной незадолго до рождественских праздников, лицензировала технологию Groq, стартапа, который создает чипы, разработанные специально для быстрого вывода ИИ с малой задержкой, и наняла большую часть своей команды, включая генерального директора и основателя Джонатана Росса.
Вывод — это «промышленная революция» ИИ
Генеральный директор Nvidia Дженсен Хуанг открыто высказался о проблеме вывода. Хотя он говорит, что Nvidia «превосходна на каждом этапе ИИ», он сказал аналитикам на телефонной конференции по доходам компании за третий квартал в ноябре, что такой вывод «очень, очень сложен». Современный вывод не является простым случаем входного сообщения и выходного ответа. Современный вывод должен поддерживать непрерывные рассуждения, миллионы одновременных пользователей, гарантированную низкую задержку и неумолимые ограничения по стоимости. А агенты ИИ, которым приходится выполнять несколько шагов, резко повысят требования и сложность выводов, а также повысят риски ошибиться.
«Люди думают, что вывод делается единожды и поэтому прост. Любой может подойти к рынку таким образом», — сказал Хуанг. «Но это оказывается труднее всего, потому что, оказывается, думать довольно трудно».
Поддержка Groq со стороны Nvidia подчеркивает это убеждение и указывает на то, что даже компания, которая доминирует в обучении ИИ, уклоняется от того, чем в конечном итоге закончится экономика умозаключений.
Хуан также откровенно заявил, что выводы будут иметь решающее значение для развития ИИ. В недавнем разговоре на подкасте BG2 Хуан сказал, что на логические выводы уже приходится более 40% доходов, связанных с ИИ, и предсказал, что они «увеличатся в миллиард раз».
«Это та часть, которую большинство людей не полностью усвоили», — сказал Хуанг. «Это та отрасль, о которой мы говорили. Это промышленная революция».
Уверенность генерального директора помогает объяснить, почему Nvidia готова активно страховаться от того, как будут сделаны выводы, даже если основные экономические проблемы остаются нерешенными.
Nvidia хочет монополизировать рынок логических выводов
Nvidia хеджирует свои ставки, чтобы заполучить все части рынка, сказал Карл Фройнд, основатель и главный аналитик Cambrian-AI Research. «Это немного похоже на то, как Meta приобретает Instagram», — объяснил он. «Дело не в том, что они считали Facebook плохим, они просто знали, что существует альтернатива, и они хотели убедиться, что она не будет конкурировать с ними».
И это несмотря на то, что Хуанг делал резкие заявления об экономике существующей платформы Nvidia, позволяющей делать выводы. «Я подозреваю, что они обнаружили, что это не нашло такого большого отклика у клиентов, как они надеялись, или, может быть, они увидели что-то в подходе, основанном на памяти чипа, который используют Groq и другая компания под названием D-Matrix», — сказал Фройнд, имея в виду еще один стартап по производству ИИ-чипов с низкой задержкой, поддерживаемый Microsoft, который недавно привлек 275 миллионов долларов при оценке в 2 миллиарда долларов.
Фройнд сказал, что вхождение Nvidia в Groq может стимулировать развитие всей категории. «Я уверен, что D-Matrix сейчас является довольно счастливым стартапом, потому что я подозреваю, что их следующий этап будет иметь гораздо более высокую оценку благодаря (сделке Nvidia-Groq)», — сказал он.
Другие руководители отрасли говорят, что экономика выводов ИИ меняется по мере того, как ИИ выходит за рамки чат-ботов и переходит к системам реального времени, таким как роботы, дроны и инструменты безопасности. Эти системы не могут позволить себе задержки, связанные с отправкой и получением данных в облако, или риск того, что вычислительная мощность может быть не всегда доступна. Вместо этого они предпочитают специализированные чипы, такие как Groq, централизованным кластерам графических процессоров.
Бехнам Бастани, генеральный директор и основатель компании OpenInfer, которая специализируется на выполнении выводов ИИ вблизи того места, где генерируются данные, например, на локальных устройствах, датчиках или серверах, а не в удаленных облачных центрах обработки данных, сказал, что его стартап ориентирован на такие типы приложений на «периферии».
Рынок умозаключений, подчеркнул он, все еще находится в зачаточном состоянии. И Nvidia стремится монополизировать этот рынок благодаря соглашению с Groq. По его словам, поскольку экономика вывода все еще не решена, Nvidia пытается позиционировать себя как компанию, охватывающую весь стек оборудования для вывода, а не делать ставку на единую архитектуру.
«Это позиционирует Nvidia как более крупную компанию», — сказал он.
Эта история первоначально появилась на Fortune.com.

