Запущен ARC-AGI-3: ИИ-агенты учатся в интерактивных средах

Сан-Франциско • Все права принадлежат AInDev.ru

• Категория: RAG / AI-агенты / автоматизация • Автор: Алексей Воронов • Проверил: Екатерина Морозова • 26.03.2026 10:13

Сегодня на мероприятии Y Combinator в Сан-Франциско была запущена инициатива ARC-AGI-3. Этот проект представляет собой полностью открытый инструментарий для создания искусственных агентов, доступный через pip и лицензированный под MIT.

Главное отличие ARC-AGI-3 заключается в том, что это первая интерактивная бенчмарка для ИИ, где агенты должны исследовать видеоигровые среды без явно сформулированных правил или целей. Это требует от агентов способности к самостоятельному обучению и адаптации.

Во время 30-дневного превью лучший ИИ-агент смог достичь результата в 12,58% по сравнению с человеческим бейзлайном в 100%. Даже передовые языковые модели (LLMs) не смогли преодолеть порог в 1%, что подчеркивает сложность задачи.

Проект также предполагает проведение конкурса с призовым фондом более 2 миллионов долларов. Конкурс разделен на три трека, и все победные решения должны быть открытыми исходными кодами. При этом использование внешних API не допускается.

Автор

Алексей Воронов

Senior PHP Developer / AI Engineer • 10+ • AInDev.ru

Алексей Воронов — backend-разработчик и специалист в области веб-разработки на PHP и AI-интеграций. Более 10 лет занимается разработкой серверных приложений, REST API, микросервисной архитектуры и SaaS-решений. Основная...

Проверил

Екатерина Морозова

AI Systems Reviewer & Backend Software Engineer • 8+ • AInDev.ru

Екатерина Морозова — специалист в области интеграции систем искусственного интеллекта и backend-разработки. Имеет более 8 лет опыта в разработке программного обеспечения и внедрении AI-технологий в веб-приложения. Основ...

Теги: #ИИ, #AGI, #Y Combinator, #AI Agents, #ARC Prize, #интерактивный бенчмарк, #open-source toolkit

Запущен ARC-AGI-3: ИИ-агенты учатся в интерактивных средах

Алексей Воронов

Екатерина Морозова

Похожие материалы

Мультимодальный ИИ: простое объяснение для начинающих

Claude Opus 4.6 — лидер бенчмарков ИИ для творческого письма марта 2026

Google представила Gemini 3.1 Flash Live — самую естественную модель голосового ИИ

Английская Википедия запретила использование генеративного ИИ для статей