Тег

METR

Материалы, в которых упоминается METR.

Нет изображения
AI-инструменты для разработчиков Выделенный материал Автор Алексей Воронов

Половина кода ИИ, прошедшего тест SWE-bench, отвергнут реальными разработчиками

Исследование METR на основе 296 вкладов ИИ-агентов выявило: несмотря на успех в автоматизированных тестах SWE-bench Verified, около половины решений содержат фундаменталь...

Новостей по этой теме пока нет.