GPT-5.4 возглавил бенчмарк Vibe Code Bench v1.1 для вайб-кодинга
Модель набрала 67,42%, обойдя предыдущего лидера GPT-5.3 Codex на 5,7 процентных пункта. Третье место у Claude Opus 4.6 без режима рассуждений — 57,57%. Тест проверяет со...
Тег
Материалы, в которых упоминается Vibe Code Bench.
Модель набрала 67,42%, обойдя предыдущего лидера GPT-5.3 Codex на 5,7 процентных пункта. Третье место у Claude Opus 4.6 без режима рассуждений — 57,57%. Тест проверяет со...