Компания AWS представила обновленную архитектуру OpenSearch Serverless — управляемого решения для поиска и векторной обработки данных, которое спроектировано с прицелом на специфику работы AI-агентов. Эксперты AWS отмечают, что текущий переход агентов из фазы прототипирования к промышленной эксплуатации создает принципиально новые паттерны нагрузки: резкие краткосрочные всплески активности с последующим моментальным переходом в состояние покоя.
Трансформация архитектуры: от связанности к независимости
Ранее работа с сервисом подразумевала наличие постоянно зарезервированных вычислительных ресурсов, так как хранилище и «вычисления» были жестко связаны. Если объяснять проще: пользователю приходилось оплачивать функционирующий инстанс даже в периоды простоя, чтобы система была готова к потенциальному запросу.Ключевым изменением в обновленной версии стала полная декомпозиция вычислительных мощностей и хранилища данных. Теперь инфраструктура способна масштабироваться от нуля до тысяч запросов в секунду и обратно. В режиме ожидания «вычисления» отключаются, что позволяет нивелировать затраты на простаивающие мощности. По оценкам AWS, такой подход обеспечивает экономию до 60% по сравнению с использованием выделенных кластеров, ориентированных на пиковые нагрузки.
Оптимизация для динамических сред
Традиционный подход к OpenSearch требовал администрирования инстансов EC2: от ручной настройки кластеров до управления обновлениями и процессами бэкапа. Переход на модель Serverless перекладывает эти задачи на облачного провайдера. Масштабирование происходит автоматически с помощью расчетных единиц OpenSearch (OCU), которые динамически подстраиваются под текущий трафик без участия инженера.Для интеграции в рабочие процессы сервис на старте поддерживает платформы разработки приложений, такие как Vercel и Kiro. Это дает возможность развертывать поисковые бэкенды для агентных систем непосредственно в production-контурах, минуя необходимость глубокой настройки инфраструктуры.
Контекст индустриальных изменений
Развитие агентного ИИ стало драйвером изменений в масштабах всего облачного сектора. Подобные инициативы наблюдаются у ключевых игроков рынка: Microsoft внедряет в Azure инструменты для обработки всплесков ИИ-трафика и механизмы управления общей памятью агентов.В свою очередь, Cloudflare недавно представила инфраструктуру, ориентированную на создание постоянных сред для ботов. Статистические данные Cloudflare указывают на то, что уже сейчас на долю нечеловеческого трафика приходится порядка 31% всего объема HTTP-запросов. Прогнозы компании свидетельствуют о том, что к первой половине 2027 года объем запросов от поисковых роботов, систем ИИ и голосовых помощников превысит показатели активности реальных пользователей.