Добро пожаловать в Eye on AI. В этом выпуске… Президент Трамп своим новым указом ставит целью регулирование ИИ штата… OpenAI представляет новый имидж-сканер, который догонит Nano Banana от Google… Google DeepMind обучает более способного агента для работы в виртуальных мирах… и отчет о рейтингах безопасности ИИ не дает особого утешения.
Привет. 2025 год должен был стать годом агентов ИИ. Но по мере того, как год подходит к концу, становится ясно, что прогнозы поставщиков технологий были чрезмерно оптимистичными. Да, некоторые компании начали использовать агентов ИИ. Но большинство из них пока этого не делают, особенно при развертывании в масштабах предприятия. Опрос McKinsey «Состояние ИИ», проведенный в прошлом месяце, показал, что большинство компаний еще не начали использовать агентов ИИ, а 40% заявили, что экспериментируют. Менее четверти заявили, что они широко развернули агенты ИИ хотя бы в одном сценарии использования; а когда консалтинговая фирма спросила людей, используют ли они ИИ в конкретных функциях, таких как маркетинг и продажи или управление персоналом, результаты были еще хуже. Не более 10% респондентов заявили, что у них есть агенты ИИ, «полностью масштабированные» или «находящиеся в процессе масштабирования» в любой из этих областей. Функция, в которой наибольшее использование эскалированных агентов использовалась, была ИТ (где агенты часто используются для автоматического разрешения заявок на обслуживание или установки программного обеспечения для сотрудников), и даже здесь только 2% сообщили, что имеют «полностью масштабируемые» агенты, а еще 8% заявили, что они «эскалируют».
Большая часть проблемы заключается в том, что сложно разработать рабочие процессы для агентов ИИ, которые позволили бы им получать надежные результаты. Даже самые способные сегодня модели ИИ оказываются у странного предела: они способны выполнять определенные задачи в рабочем процессе так же, как люди, но не могут выполнять другие. Сложные задачи, включающие сбор данных из нескольких источников и многократное использование программных инструментов, представляют собой особую проблему. Чем дольше рабочий процесс, тем выше риск того, что ошибка на одном из первых этапов процесса усугубится и приведет к неудачному результату. Кроме того, использование более эффективных моделей ИИ в больших масштабах может оказаться дорогостоящим, особенно если рабочий процесс предполагает, что агенту приходится много планировать и рассуждать. Многие компании пытались решить эти проблемы, разрабатывая «мультиагентные рабочие процессы», в которых активируются разные агенты, и каждому назначается только один отдельный шаг рабочего процесса, иногда включая использование одного агента для проверки работы другого агента. Это может повысить производительность, но также может быть дорогостоящим, иногда слишком дорогим, чтобы автоматизировать рабочий процесс.
Всегда ли два ИИ-агента лучше, чем один?
Теперь команда Google провела исследование, направленное на то, чтобы дать предприятиям хороший критерий для принятия решения, когда лучше использовать один агент, а не создавать многоагентный рабочий процесс, и какие многоагентные рабочие процессы могут лучше всего подойти для конкретной задачи.
Исследователи провели 180 контролируемых экспериментов с использованием моделей искусственного интеллекта от Google, OpenAI и Anthropic. Он протестировал их с помощью четырех различных тестов искусственного интеллекта агентов, охватывающих разнообразный набор задач: получение информации с нескольких веб-сайтов; планирование в игровой среде Minecraft; планирование и использование инструментов для выполнения общих бизнес-задач, таких как ответы на электронные письма, планирование встреч и использование программного обеспечения для управления проектами; и ориентир финансового агента. Этот финансовый тест требует, чтобы агенты извлекли информацию из документов SEC и провели базовый анализ, например, сравнение фактических результатов с прогнозами руководства за предыдущий квартал, определение того, как доход, полученный от определенного сегмента продуктов, изменился с течением времени, или определение того, сколько денежных средств компания может иметь свободно для деятельности по слияниям и поглощениям.
В прошлом году все пришли к единому мнению, что многоагентные рабочие процессы дают более надежные результаты. (Ранее я писал об этой точке зрения, которая была подтверждена опытом некоторых компаний, таких как Prosus, здесь, в Eye on AI.) Но вместо этого исследователи Google обнаружили, что подтверждение общепринятого мнения во многом зависит от того, в чем именно заключалась задача.
Отдельные агенты работают лучше на последовательных этапах и хуже на параллельных.
Если задача была последовательной, как это было во многих тестовых задачах Minecraft, то оказалось, что до тех пор, пока один ИИ-агент мог выполнить задачу точно, по крайней мере, в 45% случаев (что, на мой взгляд, довольно низкая планка), тогда лучше было развернуть только одного агента. Использование нескольких агентов в любой конфигурации значительно снизило общую производительность — на 39–70%. Причина, по мнению исследователей, заключается в том, что если бы у компании был ограниченный бюджет токенов для выполнения всей задачи, то требования нескольких агентов, пытающихся выяснить, как использовать разные инструменты, быстро переполнили бы бюджет.
Но если задача включала шаги, которые можно было выполнять параллельно, как это было во многих задачах финансового анализа, то мультиагентные системы имели большие преимущества. Более того, исследователи обнаружили, что большое значение имеет то, как именно настроены агенты для работы друг с другом. Для задач финансового анализа наилучший результат дала централизованная мультиагентная система, в которой один агент-координатор направляет и контролирует деятельность множества субагентов и все коммуникационные потоки к координатору и от него. Эта система работала на 80% лучше, чем один агент. Между тем независимая мультиагентная система, в которой нет координатора и каждому агенту просто отведена ограниченная роль, которую он выполняет параллельно, оказалась всего на 57% лучше, чем одиночный агент.
Подобные исследования должны помочь компаниям найти наилучшие способы настройки агентов ИИ и позволить технологии наконец начать выполнять прошлогодние обещания. Для тех, кто продает технологии агентов искусственного интеллекта, лучше поздно, чем никогда. Что касается людей, которые работают в компаниях, использующих агентов ИИ, нам придется посмотреть, какое влияние эти агенты оказывают на рынок труда. За этой историей мы будем внимательно следить по мере приближения к 2026 году.
Тем не менее, вот еще новости об искусственном интеллекте.
Джереми Канджереми.kahn@fortune.com@jeremyakahn
Эта история первоначально появилась на Fortune.com.

