Спрос на вычислительные мощности для работы моделей искусственного интеллекта продолжает расти, однако отрасль упирается в две фундаментальные проблемы: дефицит подходящих чипов и логистические сложности при развертывании оборудования в дата-центрах. Компания General Compute, работающая в сегменте так называемых «неооблаков» (neocloud), нашла специфическое решение этих задач, что позволило стартапу привлечь 15 млн долларов в рамках посевного раунда при оценке в 60 млн долларов. Инвесторами выступили FUSE VC, Carya Venture Partners и Village Global Ventures.
Переход от GPUs к специализированным решениям для инференса
В индустрии сформировался консенсус: графические процессоры (GPU), несмотря на их текущую популярность, не являются идеальным инструментом для стадии инференса — процесса, когда обученная модель генерирует ответы пользователю. Вычислительные требования для этой фазы существенно отличаются от обучения, что открывает окно возможностей для специализированных архитектур, подобных тем, что разрабатывают Groq или Cerebras.Основатели General Compute Финн Пукловски и Джейсон Гудисон решили не конкурировать за дефицитные мощности топовых производителей, а сделали ставку на чипы от SambaNova. Этот разработчик, поддерживаемый Intel, делает упор на архитектуру с повышенной гибкостью и расширенным объемом памяти для хранения контекста во время вычислений.Согласно заявлениям разработчиков, новые чипы обеспечивают скорость генерации от 600 до 700 токенов в секунду, что значительно выше показателей типичных GPU, выдающих около 250 токенов в секунду. General Compute уже разместила заказ на чипы SN50 стоимостью 300 млн долларов и планирует стать первым поставщиком облачных услуг, внедряющим данные решения.
Инфраструктурная адаптация и оптимизация затрат
Выбор железа от SambaNova решает и задачу размещения оборудования. В отличие от многих современных ИИ-ускорителей, требующих жидкостного охлаждения, чипы SambaNova обходятся воздушным охлаждением и отличаются более низким энергопотреблением. Это позволяет инсталлировать их в уже существующие серверные стойки без капитальных затрат на переоборудование дата-центров.Стратегия компании строится на развитии сегмента колокейшн-площадок. Примечательно, что General Compute ведет переговоры о размещении оборудования не только с классическими операторами дата-центров, но и с майнинговыми фермами, для которых текущая экономика добычи криптовалют стала менее прибыльной. В рамках этой модели инфраструктура, предназначенная для криптовычислений, трансформируется под задачи ИИ-инференса.
Экономика скорости и будущее агентных систем
Запуск облака General Compute сопровождается заявлениями о рекордной скорости работы с открытой LLM MiniMax 2.7. Отраслевые эксперты, в частности Джо Хасселман из Evercrest Capital Partners, видят в союзе General Compute и SambaNova попытку повторить модель взаимодействия CoreWeave и Nvidia.Инвестор подчеркивает, что развитие подобных «инференс-облаков» — это ставка на мультимодельный рынок, где скорость и стоимость вычислений становятся главными конкурентными преимуществами. В условиях, когда приложения переходят от прямого взаимодействия «человек-ИИ» к сложным цепочкам автономных агентов, обмен данными между которыми превращается в постоянный поток запросов к базам данных, производительность выходит на первый план.Если коротко: текущие 50 токенов в секунду, выдаваемые ChatGPT, вполне комфортны для чтения человеком, однако для эффективного «общения» программных агентов между собой требуется на порядок большая скорость. Цель General Compute заключается в сокращении времени выполнения задач (например, при работе AI-кодинг агентов) с одного часа до нескольких минут, что напрямую влияет на экономическую эффективность использования моделей.