Meta представляет Muse Spark, свою первую новую модель после неудачного дебюта Llama 4. Но оправдает ли Muse Spark ожидания?

Meta представила Muse Spark, первую модель искусственного интеллекта, созданную ее Meta Superintelligence Labs, новым исследовательским подразделением искусственного интеллекта, которое она создала в прошлом году и потратила миллиарды долларов на персонал и оборудование.

Модель, согласно бенчмарк-тестам, опубликованным Meta, во многих задачах конкурирует с ведущими моделями ИИ от OpenAI, Anthropic и Google, хотя и не превосходит их по всем направлениям. Тем не менее, если результаты тестов подтвердятся при тестировании независимыми экспертами, Muse Spark, похоже, вернет Meta в гонку ИИ после того, как ее последняя модель ИИ, Llama 4, выпущенная в апреле 2025 года, была широко раскритикована как провальная.

Однако в прошлом Meta была уличена в манипулировании опубликованными результатами тестов модели ИИ, чтобы сделать ее более функциональной, чем на самом деле была версия, доступная большинству пользователей. Так было с тестами Llama 4 от Meta, где компания позже призналась, что использовала специализированные, неизданные версии модели, настроенные для конкретных задач, для улучшения результатов тестов в этих областях, в то время как общая версия, доступная всем пользователям, не показала хороших результатов.

И есть еще одна проблема. Мало кто сможет использовать новую мета-модель за пределами продуктовой экосистемы компании. В отличие от предыдущих моделей искусственного интеллекта Meta, которые были выпущены как модели «открытого веса», то есть каждый мог бесплатно загрузить модели и запустить их на своем компьютере, а также модифицировать и настраивать их по своему желанию, Muse Spark, по крайней мере на данный момент, в первую очередь является внутренним инструментом Meta.

В настоящее время модель поддерживает помощника Meta AI в автономном приложении Meta AI компании и в Meta.ai. Компания заявила, что в ближайшие недели внедрит ее в WhatsApp, Instagram, Facebook, Messenger и очки Ray-Ban AI от Meta. Компания также заявила, что предложит модель в «частной предварительной версии» для выбора партнеров через интерфейс прикладного программирования (API). Это делает Muse Spark еще более запатентованным, чем платные проприетарные модели, предлагаемые конкурентами Meta. (В своем блоге компания Meta сообщила, что надеется открыть исходный код будущих версий модели.)

Muse Spark — это первая модель рассуждения Meta, означающая, что вы можете работать поэтапно, используя разные стратегии, если ваш первоначальный подход не сработал. Все предыдущие модели компании были разработаны для мгновенного реагирования на основе обучения моделей. Muse Spark также является мультимодальной моделью, которая может получать и генерировать текст и изображения. Согласно техническому сообщению в блоге, опубликованному Meta, модель также поддерживает использование других программных инструментов и может помочь организовать работу нескольких субагентов.

В своем блоге, анонсирующем новую модель, Meta описывает Muse Spark как «маленькую и быструю по конструкции, но достаточно способную решать сложные вопросы по науке, математике и здоровью». В нем описывается модель как первая в серии новых моделей, в которых Muse Spark используется для проверки архитектуры и режима обучения, используемых Meta, прежде чем компания расширит ее до более крупных и еще более мощных моделей из того же семейства.

Модель также имеет режим «обдумывания» или «обдумывания», в котором субагенты могут параллельно рассуждать о различных частях задачи. В техническом блоге, опубликованном о новой модели, Meta сообщила, что этот режим позволяет Muse Spark «конкурировать с экстремальными режимами рассуждения передовых моделей, таких как Gemini Deep Think и GPT Pro».

Результаты тестов, опубликованные одновременно с запуском, рисуют картину конкурентоспособной, но не доминирующей модели. Например, в тесте GPQA Diamond, который должен проверять способность к рассуждению на уровне доктора философии, Muse Spark набрал 89,5%, немного отстав от Gemini 3.1 Pro с 94,3%, а также 92,7% и 92,8%, полученных Anthropic Claude Opus 4.6 и OpenAI GPT-5.4 соответственно. По ведущему тесту здоровья HealthBench Hard Muse Spark превзошел все конкурирующие модели с результатом 42,8%, что намного лучше, чем у Opus 4.6 или Gemini 3.1 Pro, и немного лучше, чем у GPT-5.4.

Мета признала недостатки в производительности. В сообщении в техническом блоге говорится, что компания продолжает «инвестировать в области с текущими недостатками в производительности, в частности, в долгосрочные агентские системы и рабочие процессы кодирования».

Запуск Muse Spark — самый ощутимый результат обширной реорганизации, которую Meta предприняла после фиаско Llama 4. В июне 2025 года Meta потратила 14,3 миллиарда долларов на приобретение 49% акций Scale AI без права голоса и наняла своего соучредителя и генерального директора Александра Ванга в качестве первого директора Meta по искусственному интеллекту.

Вану было поручено возглавить недавно созданное подразделение Лабораторий Мета Суперинтеллекта. Ван и Цукерберг начали активно привлекать таланты, предлагая исследователям искусственного интеллекта из конкурирующих лабораторий искусственного интеллекта вознаграждение, которое, как сообщается, достигало сотен миллионов долларов с учетом акционерного капитала. Компания также выделила сотни миллиардов долларов на создание вычислительной инфраструктуры искусственного интеллекта для поддержки своего нового направления в области искусственного интеллекта.

С тех пор произошла дальнейшая реорганизация, даже когда Muse Spark находилась в разработке. В марте 2026 года Meta создала новую организацию по прикладному проектированию искусственного интеллекта, которую возглавил Махер Саба, вице-президент, ранее работавший в подразделении Meta по виртуальной и дополненной реальности Reality Labs. Саба подчиняется непосредственно техническому директору Meta Эндрю Босворту. Подразделение Сабы работает вместе с Wang Superintelligence Labs над созданием того, что во внутренней записке описано как «система обработки данных, которая помогает нашим моделям становиться лучше и быстрее». Этот шаг был широко истолкован как Цукерберг, хеджирующий свои ставки, гарантирующий, что разработка ИИ, ориентированного на продукт, продолжится, даже когда Ван проводит долгосрочные исследования в области сверхинтеллекта.

В техническом сообщении в блоге Meta сообщает, что за последние девять месяцев ее команда перестроила свой стек искусственного интеллекта с нуля, включая улучшения в архитектуре модели, оптимизации и курировании данных. Компания утверждает, что эти достижения позволяют ей достичь тех же возможностей, «более чем на порядок меньше вычислительных ресурсов», чем Llama 4 Maverick, предыдущая модель Meta. Meta также заявляет, что ее конвейер обучения с подкреплением теперь обеспечивает «бесшовный и предсказуемый результат» и что Muse Spark — это первый шаг в продуманной «лестнице масштабирования», в которой каждое поколение проверяет последнее, прежде чем компания будет обучать более крупные модели.

Что касается безопасности, в Meta говорят, что перед развертыванием Muse Spark прошла тщательную оценку в соответствии с обновленной системой безопасности компании. Модель сообщает о впечатляющих результатах в области безопасности при разработке потенциального биологического оружия: в одном тесте она отклонила 98% запросов, которые, по мнению разработчиков тестов, могли помочь кому-то разработать биологическое оружие.

Однако в сообщении в блоге также говорится, что сторонний тестер Apollo Research обнаружил, что Muse Spark продемонстрировала самый высокий уровень «осведомленности об оценке» среди всех моделей, которые когда-либо наблюдал Apollo, часто идентифицируя сценарии тестирования как «ловушки выравнивания». Мета говорит, что его собственное последующее исследование выявило первоначальные доказательства того, что эта осведомленность может повлиять на поведение модели в небольшом подмножестве оценок согласованности, но пришел к выводу, что «это не было проблемой, блокирующей выпуск».

В 2001 году Fortune впервые созвала «Самых умных людей, которых мы знаем», объединив генеральных директоров и основателей, строителей и инвесторов, мыслителей и предпринимателей. С тех пор Fortune Brainstorm Tech стала местом, где сталкиваются смелые идеи. С 8 по 10 июня мы вернемся в Аспен, где все началось, чтобы отметить 25-летие Brainstorm. Зарегистрируйтесь сейчас.

Admin

Website | + posts

Meta представляет Muse Spark, свою первую новую модель после неудачного дебюта Llama 4. Но оправдает ли Muse Spark ожидания? | Удача

Admin

Walmart продает легкий комод за 35 долларов, который подойдет для любой комнаты вашего дома.

Акции Великобритании выглядят дешевыми, но рынок, возможно, скоро это заметит

Эксперт отмечает условие, которое спровоцирует рост XRP на 2300% до $50

Знаменитый 41-летний мексиканский ресторан вынужден закрыться

Ethereum укрепляет структуру восходящего тренда, поскольку рынок ожидает еще одну волну роста

Больше похожего
Связанный

Бритни Спирс признала себя виновной по менее строгому обвинению в «мокром безрассудстве» по делу о вождении в нетрезвом виде, чтобы избежать тюрьмы | Удача

Рынки в тревоге: Трамп обещает «Проект Свободы» для Ормуза и готовит возможную конфронтацию после новых нападений на корабли | Удача

Трамп заявил, что рассматривается «окончательное предложение» по приобретению Spirit Airlines, финансируемому налогоплательщиками | Удача

О нас

Компания

Последние

Почему «покрытие расходов» на социальное обеспечение — неправильная цель

XRP ожидает прорыв, но падение до $1,53 может спровоцировать распродажу

Самая продаваемая пара беспроводных наушников Walmart за 179 долларов продается за 22 доллара.

Meta представляет Muse Spark, свою первую новую модель после неудачного дебюта Llama 4. Но оправдает ли Muse Spark ожидания? | Удача

Больше похожегоСвязанный

О нас

Компания

Последние

Больше похожего
Связанный