Проблема, как сказал мне Де Розен в телефонном разговоре на прошлой неделе, заключается в том, что, хотя различные модели искусственного интеллекта, как правило, последовательны в том, как они характеризуют продуктовые предложения бренда (как правило, правильно сообщая о характере продукта, его характеристиках и сравнении этих характеристик с конкурирующими продуктами, а также цитируя источники этой информации), они непоследовательны и подвержены ошибкам, когда задаются вопросы, связанные с финансовой стабильностью компании, управлением и технической сертификацией. Однако эта информация может сыграть важную роль в принятии важных решений о закупках.
Модели ИИ менее надежны в финансовых и управленческих вопросах.
В одном из примеров AIVO Standard оценила, как передовые модели искусственного интеллекта отвечают на вопросы о Ramp, быстрорастущей компании по разработке программного обеспечения для управления корпоративными расходами. AIVO Standard обнаружила, что модели не могут достоверно ответить на вопросы о сертификации Ramp в области кибербезопасности и стандартах управления. В некоторых случаях, по словам де Розена, это, вероятно, будет тонко подталкивать компании к принятию решений о приобретении более крупных, публично торгуемых и авторитетных предприятий, даже в тех случаях, когда новая частная компания также соответствует тем же стандартам, просто потому, что модели ИИ не могут точно ответить на вопросы об управлении и финансовой пригодности более молодой частной компании или ссылаться на источники предоставленной ими информации.
В другом примере компания проанализировала, что говорят модели искусственного интеллекта о факторах риска конкурирующих препаратов для похудения. Он обнаружил, что модели ИИ не просто перечисляют факторы риска, но дают рекомендации и суждения о том, какой препарат, скорее всего, будет «самым безопасным вариантом» для пациента. «Результаты были в основном объективными и измеренными, с наличием оговорок об отказе от ответственности, но они все равно определяли право на участие, восприятие риска и предпочтения», – сказал де Розен.
AIVO Standard обнаружила, что эти проблемы возникали во всех основных моделях ИИ и при различных запросах и сохранялись, даже когда моделям предлагалось проверить свои ответы. Фактически, в некоторых случаях модели склонны удвоить свои усилия перед лицом неточной информации, настаивая на том, что она верна.
GEO по-прежнему больше искусство, чем наука
Есть несколько последствий. Во-первых, для всех компаний, продающих услуги GEO, GEO может неэффективно работать с различными аспектами информации о бренде. Компании не обязательно должны доверять компании, занимающейся маркетинговыми технологиями, которая заявляет, что может показать им, как их бренд выглядит в ответах чат-ботов, и тем более верить, что у компании, занимающейся маркетинговыми технологиями, есть некая волшебная формула, позволяющая надежно формировать эти ответы ИИ. Быстрые результаты могут значительно различаться, даже от минуты к минуте, в зависимости от типа оцениваемой информации о бренде. И до сих пор не так много доказательств того, как именно направлять ответы чат-бота на информацию, не связанную с продуктом.
Но гораздо более серьезная проблема заключается в том, что во многих рабочих процессах агентов (даже в тех, в которых участвует человек) есть момент, когда информация, предоставляемая ИИ, становится основой для принятия решений. И, как говорит де Розен, сегодня большинство компаний на самом деле не контролируют границы между информацией, суждениями и принятием решений. У них нет возможности отслеживать, какое именно сообщение было использовано, что модель вернула в ответ и как именно это повлияло на окончательную рекомендацию или решение. В регулируемых отраслях, таких как финансы или здравоохранение, если что-то пойдет не так, регулирующие органы запросят именно эти детали. И если регулируемые компании не внедрят системы для сбора всех этих данных, их ждут проблемы.
УДАЧА В ИИ
Anthropic запускает Claude Cowork, агента управления файлами на базе искусственного интеллекта, который может поставить под угрозу десятки стартапов (Беатрис Нолан, Великобритания). Расследование
Anthropic представляет Claude для здравоохранения, расширяет возможности медико-биологических наук и сотрудничает с HealthEx, чтобы предоставить пользователям возможность подключать медицинские записи, Джереми Кан
ИИ В НОВОСТЯХ
Apple выбирает обновленный искусственный интеллект Google для Siri. Apple подписала многолетнее партнерство с Google для реализации ключевых функций искусственного интеллекта в своих продуктах, включая долгожданное обновление Siri, объявили компании в понедельник. Сделка подчеркивает возрождение Google в области искусственного интеллекта и помогла поднять рыночную стоимость материнской компании Google Alphabet выше порога в 4 триллиона долларов. Apple заявила, что сделка не меняет существующего партнерства с OpenAI, в рамках которого Siri в настоящее время передает некоторые запросы ChatGPT, хотя неясно, как альянс с Google повлияет на будущую интеграцию Siri с искусственным интеллектом. Финансовые условия сделки также не разглашаются, хотя ранее агентство Bloomberg сообщало, что Apple рассматривает возможность платить Google до $1 млрд в год за доступ к ее моделям искусственного интеллекта для Siri.
ВЗГЛЯД НА ИССЛЕДОВАНИЯ ИИ
Microsoft, Nvidia и британский стартап Basecamp Research совершают прорыв с помощью искусственного интеллекта в редактировании генов. Международная исследовательская группа, в которую входят ученые из Nvidia и Microsoft, использовала искусственный интеллект для сбора эволюционных данных более чем миллиона видов с целью разработки потенциальных новых инструментов редактирования генов и лекарственной терапии. Команда разработала набор моделей искусственного интеллекта под названием Eden, которые были обучены на огромном наборе неопубликованных биологических данных, собранных Basecamp. Подразделение венчурного капитала Nvidia является инвестором Basecamp.
У ВАС ЕСТЬ КАЛЕНДАРЬ
19-23 января: Всемирный экономический форум, Давос, Швейцария.
20–27 января: Конференция AAAI по искусственному интеллекту, Сингапур.
10–11 февраля: Саммит действий по искусственному интеллекту, Нью-Дели, Индия.
2-5 марта: Mobile World Congress, Барселона, Испания.
16–19 марта: Nvidia GTC, Сан-Хосе, Калифорния.
ПИТАНИЕ ДЛЯ МОЗГА
Что, если люди предпочитают художественную литературу, написанную искусственным интеллектом, или просто не видят разницы? Именно этот вопрос задает нью-йоркская писательница Водини Вара в провокационном эссе, которое несколько недель назад было опубликовано под названием «Эссе выходного дня» на сайте журнала. В то время как готовые модели ИИ продолжают с трудом создавать истории, столь же убедительные, как истории выпускников ведущих программ MFA и опытных писателей, оказывается, что, когда эти модели адаптированы к произведениям существующего автора, они могут создавать прозу, которая часто неотличима от того, что мог бы создать оригинальный автор. Удивительно, но в тесте, проведенном исследователем Тухином Чакрабарти, который провел одни из лучших на сегодняшний день экспериментов по творческим писательским способностям моделей ИИ и который Вара повторяет несколько по-другому, даже читатели с хорошо развитым литературным чутьем (например, студенты МИД) предпочитают версии, написанные ИИ, прозе, написанной человеком. Если это так, то на что будут надеяться авторы любовных романов или жанровой фантастики? Несколько месяцев назад у меня состоялся разговор с другом, известным писателем. Он пессимистично относился к тому, будут ли будущие поколения ценить литературу, написанную людьми. Я пытался доказать, что читателей всегда будет волновать мысль о том, что они общаются с автором-человеком, что за словами стоит разум с пережитым опытом. Меня это не убедило. И меня все больше беспокоит, что его пессимизм вполне обоснован. В конечном итоге Вара приходит к выводу, что единственный способ сохранить идею литературы как передачи жизненного опыта через страницу — это коллективно потребовать этого (и, возможно, даже запретить внедрение моделей ИИ в произведения существующих писателей). Я не уверен, что это реалистично. Но, возможно, это единственный вариант, который у нас остался.
FORTUNE AIQ: ГОД ИИ И ЧТО БУДЕТ
В 2025 году компании сделали большие шаги в направлении ИИ: от найма директоров по ИИ до экспериментов с ИИ-агентами. Извлеченные уроки, как хорошие, так и плохие, в сочетании с новейшими технологическими инновациями сделают 2026 год еще одним решающим годом. Изучите все возможности Fortune AIQ и прочитайте новейшую книгу ниже:
– 3 тенденции, которые доминируют в запусках компаний в области искусственного интеллекта в 2025 году.
–2025 год был годом агента ИИ. Как мы это сделали?
– Инструменты кодирования искусственного интеллекта получили широкое распространение в 2025 году. Ранние уязвимости безопасности показывают, что может пойти не так.
–Великое новогоднее решение в области искусственного интеллекта для компаний в 2026 году: рентабельность инвестиций.
– Компании сталкиваются с запутанной смесью политик и правил в области искусственного интеллекта. Есть ли ясность на горизонте?

