Nvidia анонсировала процессор нового поколения Groq 3 LPU, ставший ключевым вычислительным элементом перспективной платформы Vera Rubin. Основной особенностью данного чипа является отказ от традиционных иерархий памяти в пользу значительного объема встроенной статической оперативной памяти (SRAM). Объем SRAM в Groq 3 LPU составляет 500 МБ, при этом пропускная способность подсистемы достигает 150 ТБ/с. Столь внушительные показатели позволяют процессору оперировать данными практически без задержек, что критически важно для задач реального времени.
Архитектурные особенности и область применения
Платформа Vera Rubin проектировалась с прицелом на максимальную производительность при обработке массивов данных. В ее состав входят не только сами процессоры Groq 3 LPU, но и специализированные вычислительные модули, оптимизированные для работы с облачными инфраструктурами. Если говорить проще, архитектура системы сфокусирована на устранении «узких мест» при передаче данных, которые обычно возникают из-за низких скоростей обмена с внешней видеопамятью или системной памятью. На практике это значит, что вычислительные операции выполняются непосредственно вблизи данных, что радикально повышает эффективность вычислений.
Технические характеристики Groq 3 LPU ориентированы как на крупные серверные решения в составе дата-центров, так и на сегмент граничных (edge) вычислений. В сферу компетенций новых чипов входят ресурсоемкие процессы: тренировка моделей машинного обучения, алгоритмы компьютерного зрения и задачи обработки естественного языка. Nvidia заявляет, что применение Groq 3 LPU позволит сократить время отклика систем искусственного интеллекта, что открывает новые сценарии эксплуатации для разработчиков облачных сред.
Развертывание системы на базе платформы Vera Rubin является логическим продолжением текущей стратегии компании по наращиванию вычислительной мощности в области ИИ-технологий. Интеграция высокоскоростных модулей обработки в связке с оперативной SRAM-памятью призвана обеспечить баланс между пропускной способностью и энергоэффективностью, что станет фундаментом для следующих итераций решений в области высокопроизводительных вычислений.