GPT-5.4 возглавил бенчмарк Vibe Code Bench v1.1 для вайб-кодинга
Модель набрала 67,42%, обойдя предыдущего лидера GPT-5.3 Codex на 5,7 процентных пункта. Третье место у Claude Opus 4.6 без режима рассуждений — 57,57%. Тест проверяет создание полноценных веб-приложений по текстовому описанию.