← Все новости

AMD Instinct MI455X — флагман MI400 с 432 ГБ HBM4

• Категория: Hardware • Автор: Александр Ковалёв • Проверил: Екатерина Морозова • 17.03.2026 10:18

Флагманский ускоритель AMD Instinct MI455X на базе архитектуры CDNA 4 стал ключевым компонентом стратегии компании в сегменте дата-центров. Устройство представляет собой сложную гетерогенную структуру, состоящую из чиплетов, произведенных по различным техпроцессам TSMC: вычислительные блоки (GCD) выполнены по нормам 2 нм, а блоки ввода-вывода (I/O) — по 3 нм. Суммарное количество транзисторов в составе одного ускорителя достигает 320 миллиардов. Подобный подход, при котором высокотехнологичный узел (N2) используется для расчетов, а проверенный (N3P) — для инфраструктурной логики и Infinity Fabric, оптимизирует выход годных кристаллов и снижает производственные издержки.

В отличие от более ранних решений, MI455X не предназначен для интеграции в стандартные серверы. Ускоритель является неотъемлемой частью стойки Helios, объединяющей 72 GPU. Это решение прямо нацелено на конкуренцию с архитектурой NVIDIA GB300 NVL72. Архитектурно MI455X разделен на два крупных GCD, что влияет на способ обработки межблочных коммуникаций и взаимодействие с программным обеспечением.

Подсистема памяти и производительность

Ключевым преимуществом AMD является подсистема памяти: 432 ГБ HBM4 со скоростью 19,6 ТБ/с. Это позволяет MI455X опережать по емкости GPU NVIDIA GB300 (288 ГБ HBM3e). На практике это значит, что при запуске моделей объемом 405B с использованием квантования FP8, один ускоритель AMD может заменить два GPU от NVIDIA, что существенно снижает операционные затраты на инфраструктуру. При этом в аспекте пропускной способности памяти NVIDIA сохраняет лидерство с показателем 22 ТБ/с против 19,6 ТБ/с у AMD.

Производитель заявляет о десятикратном превосходстве над MI355X, однако эти цифры требуют критического анализа. Вероятно, показатель отражает пиковую теоретическую производительность в режиме FP4, а не реальный прирост в комплексных задачах обучения или инференса. Финальная эффективность будет зависеть от зрелости стека ROCm: качества компиляторов и того, насколько оптимизирована архитектура под популярные модели нейронных сетей.

Интерфейсы и масштабируемость

Для коммуникации внутри стойки Helios применяется Infinity Fabric с поддержкой UALink — открытого стандарта интерконнекта, продвигаемого консорциумом из AMD, Intel, Google, Microsoft и Meta. Это прямой ответ проприетарной технологии NVLink. Масштабируемость внутри стойки составляет 3,6 ТБ/с на чип, чего достаточно для параллельной обработки крупных моделей. При этом соединение между стойками (scale-out) реализовано через Ultra Ethernet с пропускной способностью 300 ГБ/с на GPU, что уступает показателям NVIDIA в закрытых сетях, но опирается на стандартные сетевые протоколы.

Поддержка форматов вычислений включает FP4, FP8, BF16 и FP16. Внедрение нативного режима FP4 позволяет значительно увеличить количество запросов в секунду при инференсе, что является важным фактором для моделей с параметрами более 70B после процедуры калибровки.

Ожидания и реализация

Выход на рынок запланирован на вторую половину 2026 года. Точная стоимость ускорителей не разглашается, но с учетом дороговизны памяти HBM4 и стоимости 2-нм техпроцесса, эксперты прогнозируют ценник в диапазоне от 25 000 до 45 000 долларов за единицу. Основная сложность для конечных потребителей заключается в отсутствии данных о тепловыделении (TDP) и требованиях к системе охлаждения инфраструктуры Helios.

Несмотря на заявленные характеристики, успех MI455X будет зависеть от способности AMD выдержать обещанные сроки поставок и обеспечить программную поддержку, способную конкурировать с CUDA. Интеграция в экосистему гиперскейлеров остается открытым вопросом, так как развертывание требует полной перестройки серверных стоек, а не простой замены ускорителей в существующих шасси.

Теги: #AMD, #GPU, #Instinct MI455X, #MI400 серия, #HBM4 память, #TSMC 2nm, #Helios rack