Тег: мультимодальные модели

Generative AI Выделенный материал Автор Алексей Воронов 16.03.2026 12:37

Tongyi Lab выпустила открытую модель Fun-CineForge для кинодубляжа

Модель вводит 'временную модальность' для точной синхронизации речи с видео в сложных сценах. Включает датасет CineDub с автоматизированной разметкой, снижающей ошибки до...

Нет изображения

Generative AI Автор Алексей Воронов 15.03.2026 11:47

Zhipu AI представила GLM-OCR: мультимодальную OCR-модель для анализа документов

С 900 млн параметров модель на базе GLM обрабатывает сложные структуры — таблицы, списки, изображения, сохраняя контекст. Поддерживает несколько языков и извлек...

Generative AI Автор Алексей Воронов 09.03.2026 21:14

Сотрудники OpenAI намекают на новую омни-модель

Недавние посты команды подогревают спекуляции о преемнике GPT-4o. Упоминается проект BiDi для двунаправленной аудиообработки, которая позволит ИИ реагировать на...

Нет изображения

Generative AI Автор Алексей Воронов 08.03.2026 21:40

Meta видит немаркированное видео новым фронтиром обучения ИИ

Исследователи Meta FAIR и NYU обучили мультимодальную модель с нуля на текстах и видео, опровергая ключевые предположения. Единый энкодер справляется с генераци...

LLM / ChatGPT / Claude / Qwen Автор Алексей Воронов 07.03.2026 12:31

Microsoft выпустила Phi-4-Reasoning-Vision-15B: компактную модель для математики, науки и GUI

Модель с 15 млрд параметров сочетает визуальную и текстовую обработку, обеспечивая высокую эффективность на разных устройствах. Подходит для интеллектуальных tu...

Нет изображения

Generative AI Автор Алексей Воронов 05.03.2026 10:56

YuanLab AI выпустила Yuan 3.0 Ultra — мультимодальную MoE-модель для ИИ

Новая нейросеть на базе Mixture-of-Experts имеет 1 трлн параметров в сумме и 68,8 млрд активных. Она сокращает параметры на 33,3% и повышает эффективность предо...