Anthropic создала тестовый маркетплейс для торговли ИИ-агентами
Компания Anthropic провела внутреннее экспериментальное исследование под кодовым названием Project Deal, в рамках которого изучалась модель взаимодействия «агент-агент» в условиях коммерческого рынка. В ходе теста автономные ИИ-агенты выступали в роли покупателей и продавцов, самостоятельно заключая сделки с использованием реальных товаров и денежных эквивалентов.
Методология и параметры эксперимента
Пилотная группа состояла из 69 сотрудников Anthropic. Каждый участник получил бюджет в размере 100 долларов (в виде подарочных карт) для совершения покупок у коллег. За время функционирования площадки было зафиксировано 186 успешных транзакций, совокупный объем которых превысил 4 000 долларов. Разработчики отдельно отметили высокую работоспособность системы в заданных условиях.
Проект включал четыре изолированных рынка, различавшихся по используемым языковым моделям. На одной из площадок применялась наиболее производительная версия архитектуры Anthropic, а сделки являлись юридически значимыми — обязательства по ним исполнялись после завершения испытаний. Остальные три площадки функционировали исключительно в исследовательских целях.
Результаты и оценка модели
Анализ результатов показал наличие отчетливой корреляции между «интеллектуальностью» используемой модели и качеством сделки. Проще говоря, участие более продвинутых LLM обеспечивало пользователям объективно лучшие финансовые условия. При этом участники эксперимента зачастую не фиксировали разницу в эффективности работы агентов. На практике это значит, что при масштабировании подобных систем возможен скрытый разрыв в производительности, когда пользователь, чьи интересы представляет менее совершенная модель, даже не осознает, что проигрывает в выгоде.
Исследователи также изучили влияние промпт-инжиниринга на ход переговоров. Выяснилось, что первоначальные инструкции, заданные агентам, практически не оказали статистически значимого влияния ни на вероятность закрытия сделки, ни на итоговую цену товара. Это указывает на то, что способность агентов к самостоятельному ведению переговоров и принятию решений в коммерческом контексте оказалась сильнее заложенных в них предустановок.