Luma представила Luma Agents — инструмент, основанный на новой линейке моделей «Объединённого Интеллекта», который позволяет координировать работу нескольких AI-систем и создавать креативный контент в тексте, изображениях, видео и аудио. Luma Agents предназначены для рекламных агентств, маркетинговых команд, дизайн-студий и предприятий.
Агенты Luma способны планировать и генерировать текст, изображения, видео и аудио, координируя работу с другими AI-моделями, такими как Luma’s Ray 3.14, Google’s Veo 3 и Nano Banana Pro, ByteDance’s Seedream и ElevenLabs’ голосовыми моделями. Эти агенты построены на базе Uni-1 — первой модели из семейства Unified Intelligence AI-моделей Luma.
По словам Амира Джайна, генерального директора и соучредителя Luma, модель Uni-1 была обучена на аудио, видео, изображениях, языке и пространственном мышлении. Он отметил, что Uni-1 может «думать на языке и воображать и рендерить в пикселях или изображениях», что они называют «интеллектом в пикселях». В последующих версиях модели будут добавлены возможности генерации аудио и видео.
Джайн подчеркнул, что клиенты Luma не просто покупают инструмент, они меняют способ выполнения бизнес-задач. Luma Agents способны сохранять постоянный контекст между активами, участниками и творческими итерациями, а также оценивать и улучшать результаты, проходя через итеративную самооценку.
«Вам нужна возможность проверять свою работу, исправлять её и повторять этот цикл до тех пор, пока решение не будет хорошим и точным», — отметил Джайн. Он также добавил, что текущий подход к использованию AI-инструментов в творческих средах не предоставляет такого ускорения, как ожидают специалисты отрасли. Вместо этого это выглядит как: «Вот вам 100 моделей. Научитесь их использовать», — отметил он.
Особенность Luma Agents заключается в том, что пользователям не нужно подбирать промпты для каждой итерации изображения или идеи. Система генерирует большие наборы вариаций и позволяет пользователю управлять направлением через разговор.
Джайн привёл пример, как человеческий архитектор при проектировании здания создаёт внутреннее ментальное представление структуры, освещения, пространственной динамики и живого опыта. Он отметил, что принцип работы Unified Intelligence основан на той же логике.
Джайн продемонстрировал, как 200-словое описание и изображение продукта (помады) привели к генерации различных идей для местоположений, моделей и цветовых схем рекламной кампании. В другом примере Luma Agents преобразовали годовую рекламную кампанию стоимостью $15 миллионов в несколько локализованных объявлений для разных стран за 40 часов и менее $20,000, прошедших внутренние проверки качества и точности бренда.
Хотя Luma Agents уже доступны через API, Джайн отметил, что доступ будет предоставляться постепенно, чтобы обеспечить надёжное использование и избежать нарушений рабочих процессов.