Claude Opus 4.6 от Anthropic взломал шифрование бенчмарка ИИ
Модель самостоятельно заподозрила искусственность вопроса, провела анализ известных тестов, нашла BrowseComp и написала программу для дешифровки XOR-защищенных ответов из...
Тег
Материалы, в которых упоминается BrowseComp.
Модель самостоятельно заподозрила искусственность вопроса, провела анализ известных тестов, нашла BrowseComp и написала программу для дешифровки XOR-защищенных ответов из...