Fish Audio представила S2: TTS нового поколения с точным контролем эмоций
Новая модель использует передовые нейросети для модуляции эмоций вроде возбуждения или спокойствия с высокой точностью. Идеальна для виртуальных ассистентов, ау...
Категория
Новости и примеры генеративного AI: изображения, видео, код, аудио и мультимедиа.
Новая модель использует передовые нейросети для модуляции эмоций вроде возбуждения или спокойствия с высокой точностью. Идеальна для виртуальных ассистентов, ау...
Новый ассистент интегрируется в Photoshop, автоматизируя выделение объектов, удаление фона и улучшение изображений. Понимает команды на естественном языке, дост...
Модель от Google объединяет текст, изображения, видео, аудио и документы в единое пространство вложений. Это упрощает мультимедийный поиск и классификацию, повы...
Старшие инженеры Amazon теперь выступают 'человеческими фильтрами' для кода от ИИ после инцидентов с высоким радиусом воздействия в AWS. Внутренний брифинг указ...
Функция внедрена без анонсов в iOS-приложении в меню загрузки изображений. Это реакция на скандал начала 2026 года, когда Grok сгенерировал 3 млн сексуализирова...
Недавние посты команды подогревают спекуляции о преемнике GPT-4o. Упоминается проект BiDi для двунаправленной аудиообработки, которая позволит ИИ реагировать на...
Uni-1 объединяет понимание и генерацию изображений в единой архитектуре на базе автогрессивного трансформера. Модель разбирает сложные промпты, планирует сцены,...
Исследователи Meta FAIR и NYU обучили мультимодальную модель с нуля на текстах и видео, опровергая ключевые предположения. Единый энкодер справляется с генераци...
Легендарный ученый Дональд Кнут несколько недель безуспешно работал над частным случаем этой проблемы в информатике. ИИ от Anthropic справился за час, продемонс...
Чжоу Хунъи, основатель компании 360, запустил курс по ИИ-анимации. Сверхпопулярный ИИ-сериал на платформе демонстрирует новые возможности, заставляя Netflix ада...
Ученые РТУ МИРЭА разработали платформу «Цифровой ковчег», которая анализирует изображения, распознает персонажей и сюжеты, а затем восстанавливает утраченные фр...
Международный консорциум из 50+ исследователей представил датасет VBVR — в 1000 раз больше аналогов, с 1 млн видео и 200 задачами по человеческой когниции. Sora...
Модель с 14 млрд параметров работает на одном GPU, обходя проблемы дрейфа и артефактов. Поддерживает текст, изображения и видео как входные данные. Код и веса д...
Бета-добавка позволяет создавать, редактировать и анализировать таблицы естественным языком. GPT-5.4 Thinking лидирует в тестах на инвестиционные задачи, оперед...
Команда из трех человек сняла 80 серий за пять дней с помощью платформы Nano Comic Production Line. Стоимость спецэффектов — всего 0,4 доллара за секунду. Режис...
Сотрудники Google создали интерактивный пазл с серией испытаний, где ИИ динамически генерирует контент и адаптирует его под прогресс пользователя. Проект показы...
Эксперт Google Молли Макхью-Джонсон в серии Ask a Techspert объяснила метод query fan-out: система анализирует объекты, цвета и текст на изображении, генерируя...
Сервис автоматизирует озвучку из оцифрованной библиотеки НГУ, включая 7000 наименований с разрешения правообладателей. Уже обработано 100 книг на обычном процес...
Новая нейросеть на базе Mixture-of-Experts имеет 1 трлн параметров в сумме и 68,8 млрд активных. Она сокращает параметры на 33,3% и повышает эффективность предо...
Обновленный Canvas предлагает динамичное пространство для организации проектов. Теперь с поддержкой творческого письма и программирования: создавайте документы...