Производители HBM планируют вынести память за пределы GPU для увеличения ее объема
Архитектура HBM (High Bandwidth Memory), изначально спроектированная как решение для стековой компоновки кристаллов в ограниченном пространстве, столкнулась с физическим пределом масштабируемости. Текущие требования к пропускной способности и объему памяти в современных ускорителях вычислений заставляют индустрию рассматривать радикальные изменения в топологии систем. Одной из перспективных концепций, обсуждаемой южнокорейскими производителями памяти, стал отказ от размещения стеков HBM непосредственно на одной подложке (interposer) с графическим процессором.
Переход к оптической передаче данных
Техническая концепция предполагает вынос стеков HBM на отдельную печатную плату. Для компенсации задержек и обеспечения высокой скорости обмена данными между вынесенным массивом памяти и вычислительным ядром планируется интеграция оптических интерфейсов. Проще говоря, вместо традиционных медных соединений на подложке разработчики намерены использовать фотонные связи, что позволит радикально увеличить дистанцию между чипами без деградации сигнала. При реализации такой схемы объем доступной для GPU памяти кратно возрастет по сравнению с текущими ограничениями.
Пределы стекирования и физические ограничения
Попытки экстенсивного масштабирования HBM за счет увеличения количества слоев в стеке подходят к технологическому барьеру. Инженерные группы уже переходят от 12-слойных к 16-слойным сборкам, а в планах индустрии значится достижение 20-слойной компоновки. Однако на практике это оборачивается экспоненциальным ростом сложности производства и сопутствующего уровня брака, что делает экономическую эффективность подобных решений крайне низкой. Традиционная же расстановка чипов HBM вокруг GPU ограничена площадью подложки и необходимостью минимизировать длину проводников для сохранения целостности сигнала.
Новые подходы к компоновке
Проблема плотности размещения компонентов на печатной плате ускорителя вынуждает производителей искать нелинейные способы монтажа. Одной из рабочих версий является создание дочерней печатной платы с памятью, которая может монтироваться вторым ярусом с обратной стороны основного ускорителя. Это решение требует тесного взаимодействия не только с поставщиками чипов, но и с компаниями, специализирующимися на специализированной упаковке (advanced packaging), поскольку внедрение оптических интерфейсов потребует изменения всей цепочки проектирования корпуса устройства.