Meta видит немаркированное видео новым фронтиром обучения ИИ
Исследователи Meta FAIR и NYU обучили мультимодальную модель с нуля на текстах и видео, опровергая ключевые предположения. Единый энкодер справляется с генерацией и пониманием, а MoE автоматически распределяет ресурсы.