Стоимость серверных стоек Nvidia на архитектуре Vera Rubin может вырасти до $7,8 млн
Согласно оценкам аналитиков Morgan Stanley, внедрение аппаратных комплексов следующего поколения на архитектуре Vera Rubin потребует от облачных провайдеров значительных капиталовложений. Стоимость одной серверной стойки Nvidia VR200 NVL72 прогнозируется на уровне $7,8 млн. Для сравнения, текущее решение GB300 NVL72 обходится заказчикам примерно в $4 млн, что указывает на почти двукратный рост цены при переходе к новой платформе.
Структура затрат и вычислительные мощности
Существенная часть стоимости новой архитектуры — около 25% — приходится на подсистему памяти, объем использования которой значительно возрос. Конфигурация стоек VR200 NVL72 предусматривает 1,5 Тбайт оперативной памяти стандарта DDR5 и 128 Гбайт NAND-флеш-памяти. Помимо увеличения количественных показателей, инженеры Nvidia повысили рабочие частоты модулей. Если говорить проще, рост затрат на память в составе стоек Vera Rubin по сравнению с предыдущими поколениями оборудования достиг 435%.
Цена в $7,8 млн не ограничена лишь стоимостью «железа». В итоговую смету включены лицензии на проприетарное программное обеспечение, а также комплекс услуг по инсталляции и пусконаладочным работам. По мнению экспертов, такой ценник оправдан кратным приростом производительности и энергоэффективности, что становится критически важным фактором при масштабировании инфраструктуры для задач машинного обучения и обучения больших языковых моделей.
Перспективы внедрения линейки Vera Rubin
В ближайшие месяцы Nvidia планирует расширить семейство систем VR200 NVL72, выпустив различные модификации, различающиеся объемом памяти и итоговой топологией серверов. Переход на архитектуру Vera Rubin призван обеспечить вычислительные центры инструментами, которые справляются с растущей нагрузкой нейросетевых вычислений эффективнее, чем существующие решения. На практике это значит, что несмотря на высокую стоимость единицы оборудования, совокупная стоимость владения (TCO) может быть оптимизирована за счет более плотной интеграции памяти и высокой пропускной способности системы.