Тег

мультимодальные модели

Материалы, в которых упоминается мультимодальные модели.

Tongyi Lab выпустила открытую модель Fun-CineForge для кинодубляжа
Generative AI Выделенный материал Автор Алексей Воронов

Tongyi Lab выпустила открытую модель Fun-CineForge для кинодубляжа

Модель вводит 'временную модальность' для точной синхронизации речи с видео в сложных сценах. Включает датасет CineDub с автоматизированной разметкой, снижающей ошибки до...

Нет изображения
Generative AI Автор Алексей Воронов

Zhipu AI представила GLM-OCR: мультимодальную OCR-модель для анализа документов

С 900 млн параметров модель на базе GLM обрабатывает сложные структуры — таблицы, списки, изображения, сохраняя контекст. Поддерживает несколько языков и извлек...

Нет изображения
Generative AI Автор Алексей Воронов

Meta видит немаркированное видео новым фронтиром обучения ИИ

Исследователи Meta FAIR и NYU обучили мультимодальную модель с нуля на текстах и видео, опровергая ключевые предположения. Единый энкодер справляется с генераци...

Microsoft - Фасад магазина с логотипом

Microsoft выпустила Phi-4-Reasoning-Vision-15B: компактную модель для математики, науки и GUI

Модель с 15 млрд параметров сочетает визуальную и текстовую обработку, обеспечивая высокую эффективность на разных устройствах. Подходит для интеллектуальных tu...