11 марта Microsoft запустила публичную предварительную версию Fireworks AI на платформе Microsoft Foundry, интегрируя высокоскоростной open-weight инференс-движок Fireworks напрямую в стек Azure для предприятий. Это решение позволяет командам использовать модели DeepSeek V3.2, Kimi K2.5 и MiniMax M2.5 через единый конечный пункт Azure, при этом обеспечивая ту же степень управления и наблюдаемости, что и для собственных моделей.
Этот шаг демонстрирует стратегическое направление Microsoft на предоставление наиболее разнообразного каталога open-weight моделей, снижая риски привязанности к одному поставщику. Интеграция обеспечивает возможность развертывания и управления этими моделями через единый Azure-конечный пункт, поддерживая последовательные стандарты управления и наблюдаемости как для собственных, так и для открытых моделей.
Fireworks AI разработан специально для open-weight моделей, предлагая уникальные характеристики производительности, отличающиеся от традиционных GPU-серверов. В рамках анонса доступны пять моделей с двумя уровнями ценообразования: серверный (pay-per-token) и обеспеченный пропускной способностью (PTUs) для производственных развертываний, требующих стабильной задержки. Кроме того, функция Bring-Your-Own-Weights (BYOW) позволяет командам загружать собственные или квантованные варианты моделей без необходимости переплатформирования, поддерживая изначальную настройку на проприетарных данных.
Эта разработка позиционирует Azure Foundry как более открытую и гибкую платформу по сравнению с конкурентами, такими как AWS Bedrock и Google Vertex AI, которые традиционно фокусировались на проприетарных моделях. Партнерство также соответствует общей стратегии Microsoft, представленной на конференции NVIDIA GTC 2026, где компания анонсировала поддержку моделей NVIDIA Nemotron на Foundry через микросервисы NIM, акцентируя внимание на возможности изначальной настройки open-weight моделей для распределения на краевой инфраструктуре.
Несмотря на значительные возможности, предлагаемые публичной предварительной версией, предприятиям следует учитывать, что вопросы резидентности данных, заявленные характеристики производительности и доступность могут изменяться до выхода общей доступности.