NotebookLM представил Cinematic Video Overviews
Новая функция выходит за рамки озвучки слайдов, создавая уникальные иммерсивные видео с плавными анимациями на базе моделей Gemini 3, Nano Banana Pro и Veo 3. G...
Категория
Новости и примеры генеративного AI: изображения, видео, код, аудио и мультимедиа.
Новая функция выходит за рамки озвучки слайдов, создавая уникальные иммерсивные видео с плавными анимациями на базе моделей Gemini 3, Nano Banana Pro и Veo 3. G...
Экспериментальная платформа Project Genie позволяет создавать виртуальные миры через естественный язык. Узнайте, как детализация, структура и итерации помогут г...
Модель оптимизирована для высоконагруженных задач с минимальной задержкой и низкими затратами на токен. Поддерживает регулируемые уровни мышления. Доступна в Pu...
Американский ученый Стивен Талер судился за регистрацию прав на картину «Недавний вход в рай», созданную его автономной ИИ-системой DABUS. Все инстанции, включа...
Новая функция Frame Extend позволяет продолжать любой сгенерированный клип с выбранного кадра на таймлайне, сохраняя стиль, движение и аудио. Можно добавлять не...
Модель сочетает глубокие знания о мире, стабильность объектов и производство-ready характеристики. Оптимизирована для реального времени и быстрых итераций в сло...
Французская лаборатория Mistral AI и консалтинговый гигант Accenture будут совместно разрабатывать ИИ-решения для корпоративных клиентов. Accenture внедрит техн...
Разработчики Google делятся деталями: Project Genie использует изображения вроде Nano Banana и текст для запуска динамичных сцен, где волны плещутся, а объекты...
Guide Labs выпустила Steerling-8B — 8-миллиардную модель LLM, которая позволяет отследить каждый токен до его источника данных.
Модель Grok Imagine от xAI уверенно удерживает первенство в рейтинге лучших ИИ-систем по созданию видео из изображений.
Новое исследование выявило, что передовые ИИ-модели, вроде ChatGPT, теряют точность и начинают «галлюцинировать» в долгих диалогах, несмотря на заявления о прор...
xAI открыла публичную бета Grok 4.2 с мультиагентной архитектурой: команда агентов снижает галлюцинации на заявленные ~65%, но увеличивает затраты и задержки.
Владелец TikTok представил BitDance — гигантскую нейросеть с открытым кодом, которая способна создавать визуальные сцены недоступного ранее уровня сложности.
Команда Qwen представила радикальное обновление визуальной модели: теперь ИИ не просто рисует, а верстает полноценные макеты и диаграммы с идеальным текстом.