Яндекс запустил быструю нейросеть Alice AI LLM Flash для B2B-задач
Компания «Яндекс» расширила инструментарий своего облачного подразделения, выпустив специализированную языковую модель Alice AI LLM Flash. Разработка оптимизирована для оперативного выполнения наиболее востребованных в корпоративном секторе задач. Согласно статистике внутренних обращений к облачным ИИ-решениям компании, около 60% B2B-запросов приходится на обработку текстовых данных и документов; именно этот сегмент и призвана закрыть новая модель. Инструмент уже добавлен в рабочее пространство Yandex AI Studio.
Сценарии использования и производительность
Архитектура Alice AI LLM Flash сфокусирована на обеспечении низкого времени отклика при сохранении высокого качества генерации. Если коротко: модель рассчитана на сценарии, где критичны скорость и предсказуемость результата. Сюда относится динамическая модерация контента, автоматическая классификация входящих тикетов в техподдержке и работа в режиме реального времени. На практике это значит, что для бизнеса, оперирующего большими потоками однотипных обращений — например, ритейлеров, банковских организаций или телеком-операторов — внедрение Flash-версии позволит кратно сократить затраты на инференс при сохранении пропускной способности инфраструктуры.
Технические характеристики модели позволяют ей конкурировать с зарубежными аналогами в своем классе. Согласно внутренним бенчмаркам, в 56% случаев Alice AI LLM Flash демонстрирует более эффективное решение прикладных бизнес-задач по сравнению с GPT-5.4 mini. В профильных дисциплинах показатели еще выше: модель превосходит западный аналог в 73% случаев в диалоговых сценариях, в 66% — при структуризации и обобщении текстов, и в 61% — при извлечении фактов из баз знаний и загруженных файлов.
Роль в экосистеме Yandex AI Studio
С точки зрения архитектуры, Alice AI LLM Flash является полностью собственной разработкой, прошедшей полный цикл обучения на данных «Яндекса». Руководитель платформы Yandex AI Studio Артур Самигуллин отмечает, что продукт ориентирован на импортозамещение в сфере автоматизации обработки данных. При сопоставимых затратах на интеграцию относительно GPT-5.4 mini, российское решение обеспечивает локальную безопасность данных и стабильность работы в инфраструктурном контуре РФ.
Расширение доступа к DeepSeek V4 Flash
Одновременно с релизом собственной разработки платформа предоставила доступ к модели с открытым исходным кодом — DeepSeek V4 Flash. Ключевой особенностью этого решения стало внедрение контекстного окна объемом 1 млн токенов. Для разработчиков это означает возможность полноценной работы с массивами документов большой структуры и создание сложных многоэтапных ИИ-агентов. Важно отметить, что модель DeepSeek V4 Flash в облаке «Яндекса» при обновлении архитектуры стала в полтора раза доступнее по стоимости по сравнению с предыдущей итерацией DeepSeek V3.2.