Компания ElevenLabs представила вторую версию своей модели генерации музыки — Music v2. Ключевым технологическим усовершенствованием стало умение нейросети менять жанровую стилистику внутри одного трека. Релиз состоялся спустя десять месяцев после выхода первой итерации музыкального генератора компании.
Технические возможности и функционал
Разработчики сделали упор на проработку композиционной сложности и вокальных партий. Модель способна переключаться между контрастными музыкальными направлениями, например, переходить из оперного исполнения в хеви-метал и обратно. При этом система сохраняет связность быстрого темпа в рэп-композициях и позволяет интегрировать в аудиодорожку внемузыкальные звуковые эффекты.На практике это значит, что пользователи получили инструменты для фрагментарного редактирования. Доступна функция изменения отдельных сегментов трека с помощью текстовых промптов без перегенерации композиции целиком. Архитектура модели теперь позволяет поэтапно выстраивать структуру песни, отдельно создавая вступление, куплеты и припевы с последующей склейкой. По заявлениям разработчиков, текущая версия демонстрирует более стабильные результаты при обработке различных языков, лирических текстов и вокальных аранжировок.
Контекст рынка генеративного аудио
Выпуск Music v2 происходит на фоне активной конкуренции в сегменте аудиогенеративных ИИ. Аналогичные решения с поддержкой генерации длинных и технически сложных композиций ранее представили Google, Stability AI и Suno. В свою очередь, Google в рамках конференции I/O расширила функционал инструмента Flow Music, добавив возможности создания каверов, секционного редактирования и генерации видеоряда.
Правовые аспекты и доступность
В ElevenLabs отдельно подчеркнули, что обучающая выборка модели состоит из лицензированных данных. Это делает сгенерированный контент легальным для коммерческого использования. Подобная стратегия — вынужденная мера на фоне судебных исков о нарушении авторских прав, с которыми столкнулись другие игроки рынка, такие как Suno и Udio.Модель уже интегрирована в платформу ElevenCreative, предназначенную для команд маркетинга и брендинга, а также доступна на специализированном сервисе ElevenMusic. В ближайшее время функционал будет развернут в ElevenAPI.