Если бы команда инженеров создала веб-браузер, который работал бы лишь наполовину, люди бы не разговаривали. Но когда Майкл Труэлл, генеральный директор стартапа Cursor, занимающегося программированием, опубликовал сообщение на
Зачем вся эта суета? Две важные причины: с одной стороны, концентрация внимания ИИ исторически была короткой. На заре ChatGPT модели могли сосредоточиться на своей задаче всего несколько секунд. Для лучших моделей этот горизонт простирался до минут, а затем до часов. Проект Cursor утверждает, что это один из первых случаев, когда система искусственного интеллекта поддерживала сложный проект открытого программного обеспечения в течение целой недели без человеческого руководства.
Кроме того, отдельные агенты ИИ ограничены выполнением небольших, целенаправленных задач. Но заставить сотни агентов координировать работу над большим проектом все еще кажется футуристическим. Вот почему Cursor хотел посмотреть, насколько далеко они смогут продвинуть автономное кодирование (в проекте, который может занять месяцы для человеческой команды), имея «оркестр» агентов ИИ, работающих вместе. Может ли система искусственного интеллекта быть достаточно настойчивой и достаточно хорошо работать вместе, чтобы исследовать код, разбивать работу на части, отлаживать и продолжать двигаться вперед в течение нескольких дней, не отклоняясь от поставленной задачи?
«Оркестр» ИИ-агентов
Исследователи обнаружили, что ответ в основном положительный. Эксперимент «Курсор» объединил сотни агентов в нечто вроде команды разработчиков программного обеспечения. В нем были «планировщики», «работники» и «судьи», координирующие работу миллионов строк кода. Это указывает на то, что, по мнению Cursor и OpenAI, ближайшее будущее, в котором ИИ не только будет помогать сотрудникам, но и возьмет на себя управление целыми проектами. Это коренным образом изменило бы способ выполнения сложной работы, сначала в разработке программного обеспечения, а затем и в других профессиях.
Уже пару лет проводятся эксперименты с роями ИИ. Но сегодня, по словам Курсора, модели стали умнее и могут оставаться согласованными гораздо дольше. Модели можно запускать в гораздо большем масштабе, используя специальный уровень, который организует сотни агентов и не дает им погрузиться в хаос.
Йонас Нелле, инженер компании Cursor, работающий над долгоживущими агентами ИИ, рассказал Fortune, что, поскольку модели ИИ продолжают совершенствоваться, инженерам и исследователям следует каждые несколько месяцев пересматривать свои предположения о том, на что способны модели ИИ. Хотя он признал, что «не стал бы загружать или удалять Chrome сегодня», проект браузера был «определенно лучше, чем все, что могли сделать предыдущие модели».
«Эти долгоживущие агенты являются важным рубежом», — добавил Билл Чен, инженер OpenAI, который проводит стресс-тесты и оценивает поведение моделей компании в реальном мире. Продолжительность задачи и тот факт, что система ИИ может выполнять ее автономно и согласованно, являются «очень хорошим показателем того, насколько умна и универсальна система», сказал он. Проект Cursor, основанный на OpenAI GPT-5.2, является «прямым результатом нашего постоянного расширения возможностей моделей». В будущем, по его словам, испытания будут еще более продолжительными.
Рои агентов ИИ не готовы к корпоративному использованию
Тем не менее, это не готовые к производству системы. Помимо того, что проект содержит ошибки и является неполным, проект, в котором в течение нескольких дней или недель работает множество агентов, обходится дорого. Хотя цены резко упали за последний год, долгосрочная работа с сотнями агентов ИИ все еще может привести к увеличению затрат.
Есть также проблемы с безопасностью. Автономная система вызывает опасения по поводу уязвимостей, утечек данных и т. д. и требует множества новых уровней контроля и аудита.
Но Чэнь сказал, что видит ближайшее будущее, в котором что-то подобное может быть готово «для широкого потребления и по невысокой цене. До сих пор прогресс был устойчивым, — пояснил он, — и на каждом этапе пути наблюдались значительные успехи. На данный момент, по его словам, волнение вызвано тем фактом, что это реальный, практический пример возможностей модели», «по сравнению с тем, как эта модель работает в академических и общественных оценках и тестах».
Это изменение удивило даже самых опытных наблюдателей за искусственным интеллектом. В недавнем сообщении независимый исследователь Саймон Уиллисон предсказал, что к 2029 году кто-то создаст целый веб-браузер, используя в основном искусственный интеллект, и это даже неудивительно. «Разработка нового веб-браузера — один из самых сложных программных проектов, которые я могу себе представить», — написал он. Курсор, возможно, ускорил эту временную шкалу. «Возможно, меня отбросили на три года назад», — сказал Уиллисон. «Должен признаться, я очень удивлен, увидев, что что-то столь способное появилось так быстро».
Это говорит о том, что OpenAI и другие называют «избытком возможностей»: идея о том, что самые сложные модели ИИ могут делать гораздо больше, чем публично развертывается, но правильное сочетание инструментов, дизайна продукта и снижения затрат может внезапно сделать их пригодными для использования в больших масштабах. Таким образом, хотя такие инструменты, как браузер Cursor, еще не готовы к использованию в прайм-тайм, траектория ясна.

