Компания Multiverse Computing представила свои сжатые модели искусственного интеллекта, созданные на основе разработок таких крупных лабораторий AI, как OpenAI, Meta, DeepSeek и Mistral AI. В рамках этого проекта была запущена платформа CompactifAI, которая включает как мобильное приложение для демонстрации возможностей сжатых моделей, так и API для их широкого использования.
Приложение CompactifAI, названное в честь квантовой технологии сжатия компании, представляет собой инструмент AI-чата. Оно функционирует аналогично ChatGPT или Le Chat от Mistral, но с ключевым отличием: модель Gilda, внедренная в приложение, настолько компактна, что может работать локально и без подключения к интернету.
Для конечных пользователей это означает, что данные не покидают их устройства, обеспечивая дополнительный уровень приватности. Однако для полноценной работы приложения требуется достаточное количество оперативной памяти и свободного пространства на устройстве. При недостатке ресурсов (например, на старых моделях iPhone) CompactifAI автоматически переключается на облачные модели через API.
Этот переход к облачному режиму снижает основное преимущество приложения — приватность данных. Тем не менее, по данным Sensor Tower, за последний месяц приложение скачали менее 5000 раз, что указывает на ограниченную массовую популярность.
Основная цель CompactifAI — бизнес-клиенты. Компания запустила API-портал для разработчиков и предприятий, предоставляющий прямой доступ к сжатым моделям без необходимости использования AWS Marketplace.
«API-портал CompactifAI теперь дает разработчикам прямой доступ к сжатым моделям с необходимой прозрачностью и контролем для их применения в производственной среде», — отметил генеральный директор Multiverse Computing Энрике Лизасо.
Одним из ключевых преимуществ API является мониторинг использования в реальном времени. Это особенно важно, учитывая, что сжатые модели могут существенно снизить затраты на вычисления по сравнению с крупными моделями языкового AI (LLMs). Кроме того, современные сжатые модели стали значительно эффективнее, как показал недавний запуск Mistral Small 4 от компании Mistral. Эта модель оптимизирована для общения, программирования, выполнения агентских задач и логических операций.
Результаты Multiverse также демонстрируют сужение разрыва между сжатыми моделями и LLMs. Последняя модель компании, HyperNova 60B 2602, построенная на основе gpt-oss-120b от OpenAI, обеспечивает более быстрые ответы и меньшие затраты, что особенно важно для агентского кодирования, где AI выполняет сложные многошаговые задачи.
Создание моделей, способных работать на мобильных устройствах без потери полезности, является серьезной технической задачей. Компания Apple решила эту проблему, комбинируя локальную и облачную модели. CompactifAI также может перенаправлять запросы к gpt-oss-120b через API, но основная цель приложения — показать, что локальные модели, такие как Gilda, обладают преимуществами, выходящими за рамки экономии затрат.
Для специалистов в критических сферах, таких как военная и медицинская индустрия, модель, способная работать локально без подключения к интернету, обеспечивает повышенную приватность и устойчивость. Однако наибольшую ценность это может принести в бизнес-сценариях, где AI можно внедрить в дроны, спутники и другие устройства, для которых постоянное подключение к сети не гарантировано.
Компания уже обслуживает более 100 глобальных клиентов, включая Банк Канады, Bosch и Iberdrola. Расширение базы клиентов может способствовать привлечению дополнительного финансирования. После привлечения $215 миллионов в рамках раунда Series B в прошлом году, Multiverse сейчас обсуждает новую инвестицию в размере €500 миллионов при оценке более €1.5 миллиардов.
*Компания Meta Признана экстремистской организацией и запрещена в РФ