Google выпустила Gemini 3.1 Flash TTS с поддержкой 70+ языков
Новая модель преобразует текст в естественную речь, позволяя разработчикам точно настраивать стиль, темп и эмоциональный тон через специальные аудиотэги. Доступна в Googl...
Тег
Материалы, в которых упоминается синтез речи.
Новая модель преобразует текст в естественную речь, позволяя разработчикам точно настраивать стиль, темп и эмоциональный тон через специальные аудиотэги. Доступна в Googl...
TADA синхронно обрабатывает текст и аудио, точно сопоставляя один сигнал каждому токену. В тестах на 1000+ образцах — ни одной ошибки транскрипции. Компактна дл...
Новая модель использует передовые нейросети для модуляции эмоций вроде возбуждения или спокойствия с высокой точностью. Идеальна для виртуальных ассистентов, ау...
Доступны пять уникальных голосов: Eve, Ara, Rex, Sal и Leo. Управление паузами, смехом, шепотом и интонацией осуществляется прямо в тексте с помощью простых тег...