Goldman ищет недостающее звено ИИ: «модель мира», которую спешат открыть все крестные отцы ИИ | Удача

Дата:

У Goldman Sachs есть имя тому, чего не хватает. Новый отчет Глобального института Goldman Sachs, написанный содиректором Джорджем Ли и генеральным директором Дэном Кейзерлингом, охватывает то, что известно в отрасли как «глобальная модель», и утверждает, что ее решение представляет собой следующий решающий скачок в искусственном интеллекте. Это не незначительное улучшение. Качественное изменение того, что могут делать машины и, следовательно, что они могут делать.

Тот факт, что крестные отцы ИИ уже стремятся к этому, позволяет предположить, что Голдман, возможно, прав.

Разрыв, о котором никто не любит говорить

Великая революция в лингвистической модели привела к чему-то поистине удивительному. Обучите систему с достаточным количеством человеческого текста, оптимизируйте ее, чтобы предсказать, какое слово будет следующим, масштабируйте ее, и почти необъяснимым образом она начинает рассуждать, общаться, писать и кодировать на уровне, который обычно удивляет ее собственных создателей. Последовали бизнес-результаты: оценки в триллионы долларов, реструктуризация отраслей, поколение белых воротничков, переосмысливающее свою карьеру.

Но за этой способностью скрывается структурное ограничение, с которым отрасль не хочет сталкиваться лицом к лицу. «LLM сильны в составлении шаблонов, — пишут Ли и Кейзерлинг, — но им не хватает внутреннего ощущения мира, который описывают эти шаблоны». Эти системы, как отмечают авторы Голдмана, «генерируют это понимание посредством интерпретации второго порядка: они понимают, как устроен наш мир, на основе данных и текста, которым они подвергаются. Они не обладают пониманием основных принципов физики, движения, света, действия/противодействия или других фундаментальных свойств нашей Вселенной».

Проще говоря: сегодняшний ИИ узнал о мире, читая то, что о нем писали люди. Он впитывал описание реальности, но так и не нашел самой реальности. Вы можете объяснить плавной прозой, что стакан разобьется, если упадет. У него нет внутреннего чувства веса, траектории или последствий.

Это различие почти не проявляется в сценариях использования, которые сегодня доминируют в корпоративном ИИ: обобщение документов, составление сообщений, генерация кода. Это становится жесткой стеной в тот момент, когда ИИ просят ориентироваться в неструктурированной физической среде, координировать сложные организационные реакции в режиме реального времени или рассуждать о том, как стратегическое решение будет распространяться на живом рынке.

Что строят крестные родители

Именно здесь отчет Goldman становится больше, чем просто аналитической статьей. Исследователи, объединяющиеся вокруг глобальных моделей, не являются маргинальным движением. В некоторых случаях это те же самые люди, чья предыдущая работа породила эпоху искусственного интеллекта, которая сейчас доминирует в заголовках.

Янн ЛеКун, который несколько лет проработал главным научным сотрудником Meta по искусственному интеллекту, прежде чем уйти, чтобы основать свою новую компанию AMI Labs, сделал модели мира явной основой своего видения общего искусственного интеллекта. Его архитектура Joint Embedding Predictive Architecture (JEPA) предназначена для создания машин, которые разрабатывают внутренние модели мира посредством наблюдения, как это делают люди, а не посредством текстового предсказания. ЛеКун публично и настойчиво критиковал идею о том, что расширение LLM само по себе позволит достичь общего интеллекта. Модели мира — ваш альтернативный тезис.

Фей-Фей Ли, исследователь из Стэнфорда, чей набор данных ImageNet помог спровоцировать революцию глубокого обучения, которая привела к появлению доминирующих сегодня систем искусственного интеллекта, основал World Labs вокруг схожей идеи: пространственного интеллекта. Идея состоит в том, что подлинный интеллект требует не только распознавания объектов на изображениях, но и понимания того, как эти объекты существуют в пространстве, взаимодействуют друг с другом и меняются со временем. Ли делает ставку на то, что машинам необходимо обитать в трехмерной модели реальности, а не просто классифицировать ее.

Это не второстепенные фигуры, которые занимают противоположные позиции, чтобы привлечь внимание. Они являются архитекторами нынешней парадигмы и в своих собственных исследованиях и проектах утверждают, что парадигма неполна.

Две границы, одна идея

В отчете Goldman показано, как на самом деле выглядят глобальные модели, и определены два разных, но связанных между собой пути.

Модели физического мира обучают ИИ логике, управляющей материальным миром: гравитации, трения, термодинамики, гидродинамики. Вместо того, чтобы учиться исключительно методом проб и ошибок в реальном мире, эти системы усваивают законы физики посредством моделирования, практикуясь в цифровой среде, где отказ обходится дешево и быстро. Робот может тысячи раз упасть внутри симулятора, прежде чем упадет на землю. Когда он, наконец, действует в физическом пространстве, он делает это с уже усвоенными последствиями.

Результаты уже заметны в логистике, производстве и автономных системах: складские роботы, которые перемещаются в людных пространствах с меньшим количеством столкновений, автономные транспортные средства, которые проверяют экстремальные ситуации, прежде чем столкнуться с ними на дороге. Критический прорыв, по мнению Goldman, заключается не в улучшении аппаратного обеспечения. Они являются лучшими внутренними моделями реальности.

Модели виртуального или социального мира преследуют аналогичные цели в человеческих системах. Это цифровые среды, населенные агентами искусственного интеллекта с целями, воспоминаниями и стимулами, каждый из которых предназначен для приближения к реальному поведенческому профилю. По мере взаимодействия этих агентов возникают закономерности. Рынки ведут себя. Организации отвечают. Кризисный каскад. «Компании уже тратят огромные усилия, угадывая, как отреагируют другие, как будут действовать конкуренты, как рынки будут интерпретировать сигналы, как советы директоров будут реагировать под давлением», — пишут Ли и Кейзерлинг. «Многоагентное моделирование предлагает что-то более близкое к живой модели человеческих систем».

Авторы Goldman делают здесь различие, которое имеет огромное значение для того, как бизнес-лидеры должны относиться к этим инструментам: глобальные модели не являются прогнозами. «Эти системы не предсказывают будущее в каком-либо строгом смысле; они предназначены для выявления правдоподобного будущего и выявления скрытой динамики», — пишут они. «Прогнозирование предполагает единственный правильный результат. Глобальные модели показывают диапазоны, траектории и петли обратной связи».

Инвестиционный вопрос, который Уолл-стрит не задала

Goldman есть Goldman, и в отчете наконец-то затрагивается финансовый аргумент, и это просто.

В докладе отмечается, что все построение инфраструктуры искусственного интеллекта основано на одном предположении: будущее искусственного интеллекта — это более крупные языковые модели, работающие на большем количестве вычислений. Текущие прогнозы относительно чипов, центров обработки данных и энергетических мощностей почти полностью основаны на этом фундаменте. Вопрос Голдмана заключается в том, являются ли эти прогнозы правильными.

«Требования и возможности, связанные с глобальными моделями, еще не отражены в консенсусных прогнозах спроса и предложения на инфраструктуру искусственного интеллекта», — пишут Ли и Кейзерлинг. Если глобальные модели разрабатываются как дополнительный уровень (построенный параллельно с LLM, а не заменяющий их), требования к вычислительным ресурсам могут существенно превысить текущие прогнозы Уолл-стрит. Среды моделирования требуют специально разработанных конвейеров данных, генераторов синтетических данных и основанных на физике механизмов, которые выходят далеко за рамки текстовых корпусов. «История инфраструктуры, — пишут авторы, — это история частичного перекрытия, а не идеального повторного использования».

Конкурентная основа столь же ясна. «Конкурентное преимущество может зависеть как от того, кто обучает самую большую модель, так и от того, кто создает наиболее точную симуляцию физической, социальной и экономической реальности».

Недостающее звено

Отчет Goldman завершается формулировкой, которая также является наиболее четким изложением того, что представляют собой глобальные модели и почему гонка за их созданием привлекает лучшие умы в этой области.

«Если большие языковые модели обеспечивают беглость ИИ, то модели мира привносят в него ситуационную осведомленность», — пишут Ли и Кейзерлинг. «На протяжении большей части своей недавней истории мы рассматривали искусственный интеллект как систему, которая дает ответы. Глобальные модели предполагают нечто более амбициозное».

ИИ, который изменил облик за последнее десятилетие, научился говорить о мире с поразительной изощренностью. ИИ, который сейчас строят крестные отцы, пытается научиться чему-то более сложному и фундаментальному: каково на самом деле находиться внутри него.

Для этой статьи журналисты Fortune использовали генеративный искусственный интеллект в качестве инструмента расследования. Редактор проверил достоверность информации перед ее публикацией.

Website |  + posts

Поделиться публикацией:

spot_imgspot_img

Популярный

Больше похожего
Связанный