GPT-5.4 занял первое место на Vibe Code Bench v1.1, согласно данным Vals.ai. Модель продемонстрировала результат 67,42%, обойдя предыдущего лидера GPT-5.3 Codex на 5,7 процентных пункта.
На третьем месте оказался Claude Opus 4.6 без режима рассуждений, набравший 57,57%. Бенчмарк Vibe Code Bench v1.1 оценивает способность модели создавать полноценные веб-приложения от начала до конца по текстовому описанию.