Hardware

AMD представила ИИ-платформу Helios MI455X с UALink-over-Ethernet

AMD представила ИИ-платформу Helios MI455X с UALink-over-Ethernet
AMD представила ИИ-платформу Helios MI455X с UALink-over-Ethernet • Все права на публикацию принадлежат AInDev.ru

Корпорация AMD анонсировала Helios MI455X — свою первую платформу серверного уровня, ориентированную на высокопроизводительные вычисления в сфере искусственного интеллекта. Решение создается в партнерстве с компанией Wiwynn, специализирующейся на интеграции стоечных вычислительных систем и масштабируемых инфраструктур. Позиционирование Helios подразумевает прямую конкуренцию с актуальными ускорителями лидерского сегмента, включая решения на базе архитектуры NVIDIA Rubin.

Особенности сетевой инфраструктуры и архитектурный подход

Ключевой технической особенностью Helios MI455X является ставка на технологию UALink-over-Ethernet. В отличие от проприетарных шин и стандартов вроде InfiniBand или CXL, которые традиционно доминируют в кластерах ИИ благодаря минимальным задержкам, здесь коммуникация между ускорителями реализована поверх стандартной сетевой инфраструктуры Ethernet. Если коротко, это позволяет инженерам проектировать крупные вычислительные узлы, опираясь на повсеместно доступные сетевые протоколы.

На практике это означает упрощение проектирования и снижение капитальных затрат при развертывании ИИ-кластеров. Проще говоря, отказ от специализированных «железных» интерконнектов в пользу Ethernet делает систему более гибкой, но архитектурно уязвимой. Несмотря на преимущества в стоимости, использование Ethernet может стать ахиллесовой пятой проекта: стандарт не обладает нативной оптимизацией для экстремально быстрой передачи данных, критически важной при обучении массивных нейросетей и выполнении задач инференса.

Стратегические возможности и ограничения

AMD стремится занять освобождающуюся нишу, предлагая рынку платформу, способную конкурировать с доминирующими A100 и H100 по показателям эффективности и масштабируемости. Helios MI455X здесь — это попытка компании реализовать баланс между доступностью развертывания и заявленной вычислительной мощью платформы.

Главная дискуссия вокруг новой системы разворачивается именно вокруг целесообразности использования Ethernet. Хотя гибкость и экономическая эффективность играют на руку масштабируемым решениям, для задач, требующих критически низкой латентности (задержки) и высокой пропускной способности, этот шаг несет в себе риски просадки производительности. Успех платформы будет напрямую зависеть от того, удастся ли нивелировать технические ограничения Ethernet в рамках работы с крупными языковыми моделями (LLM), где скорость обмена данными между ускорителями зачастую определяет время завершения итерации обучения.