← Все новости

Сотрудники OpenAI намекают на новую омни-модель

• Категория: Generative AI • Автор: Алексей Воронов • Проверил: Екатерина Морозова • 09.03.2026 21:14

Похоже, OpenAI активно занимается разработкой новой мультимодальной модели, которая, вероятно, станет преемником GPT-4o. Эти предположения подогреваются недавними публикациями от сотрудников компании.

Реакция команды и ожидания

Этти Элети (Atty Eleti) из голосовой команды OpenAI, выразил свой энтузиазм по поводу грядущих разработок, написав: "очень рад тому, что будет дальше", и поинтересовался у пользователей, что бы они хотели получить от новой "омни-модели". Брэндон МакКинзи (Brandon McKinzie), научный сотрудник OpenAI с опытом работы в мультимодальных системах из Apple, поддержал эту идею, отметив, что потенциальная "омни-модель" "звучит как отличная идея".

Мультимодальность и развитие GPT

Термин "мультимодальный" или "омни" подразумевает, что одна модель способна обрабатывать различные форматы данных — текст, изображения, аудио и видео — вместо того чтобы использовать отдельные модели для каждой задачи. GPT-4o ("омни") был первой моделью OpenAI, которая объединила обработку текста, изображений и аудио в единой системе. Новейшая модель компании, GPT-5.4, уже включает в себя нативную поддержку "computer use", что позволяет ей взаимодействовать с пользовательскими интерфейсами, предназначенными для человека.

Проект BiDi и естественные диалоги

Также, по данным The Information, OpenAI разрабатывает новую аудиомодель под названием "BiDi" (от bidirectional — двунаправленный), цель которой — сделать диалоги с ИИ более естественными. Современные аудиомодели функционируют по принципу "поочередного общения", то есть ИИ ждет, пока пользователь закончит говорить, прежде чем дать ответ. BiDi же спроектирована для обработки перебиваний в реальном времени. Прототип этой модели уже существует, но, как сообщается, он имеет тенденцию к сбоям после нескольких минут диалога. Запуск BiDi может быть отложен до второго квартала текущего года или позже.

Теги: #искусственный интеллект, #OpenAI, #GPT-4o, #мультимодальные модели, #омни-модель, #BiDi, #аудиообработка