Hardware 17.03.2026 19:38

Nvidia расширила Vera Rubin на GTC 2026: POD с 40 стойками, 1,2 квадриллиона транзисторов и 60 эксафлопс

На конференции GTC 2026, компания Nvidia значительно расширила платформу Vera Rubin, представленную ранее на CES. В новую версию включены кастомные CPU-стойки, посвящённые инференсу чипы, новая архитектура хранения данных, операционная система для инференса, открытые модели и программное обеспечение для безопасности агентов. Платформа теперь состоит из семи чипов и пяти типов стоек, объединённых в Vera Rubin POD: 40 стоек, 1.2 квадриллиона транзисторов, около 20,000 NVIDIA-чипов, 1,152 GPU Rubin, 60 эксафлопс вычислительной мощности и 10 петабайт в секунду пропускной способности.

NVL72 стойка служит центральным вычислительным элементом POD. Она интегрирует 72 GPU Rubin, 36 CPU Vera, сетевые адаптеры ConnectX-9 SuperNICs и BlueField-4 DPUs в 18 вычислительных поддонов и 9 NVLink переключательных поддонов. Всего стойка содержит около 1.3 миллиона компонентов и примерно 1,300 чипов, весом около 4,000 фунтов. Nvidia утверждает, что NVL72 обеспечивает до 4 раз более высокую производительность обучения и 10 раз более высокую производительность инференса на ватт по сравнению с Blackwell. Шестое поколение NVLink обеспечивает пропускную способность 3.6 терабайта в секунду на GPU и 260 терабайт в секунду на всю стойку.

Разработка NVL72 включает значительные улучшения в сборке. Вычислительные поддоны теперь полностью без кабелей, шлангов и вентиляторов, с использованием PCB-платы вместо традиционных кабелей. Это позволяет сократить время сборки каждого поддона с почти двух часов до пяти минут.

Рубин Ultra масштабируется до 576 и 1,152 GPU. NVL72 является основой для более высоких уровней масштабирования: NVL576 использует новую двухслойную топологию all-to-all NVLink, соединяющую восемь стоечных модулей с 72 GPU Rubin Ultra в единую систему из 576 GPU. Дальше идёт Kyber-стойка, удваивающая количество GPU на стойку до 144. Вместо горизонтальных серверных поддонов используется вертикальная архитектура с вычислительным оборудованием, состоящим из четырёх GPU Rubin Ultra и двух CPU Vera спереди, мидплейном позади и NVLink-шиной сзади. Восемь таких стоек формируют NVL1152 с 1,152 GPU. Nvidia называет Kyber основой для следующего поколения архитектуры Feynman.

Одно GPU Rubin Ultra, по данным Nvidia, обеспечивает производительность в 100 петафлопс в формате FP4. Это GPU состоит из четырёх вычислительных кристаллов вместо двух, каждый размером более 800 квадратных миллиметров, с 16 стеками HBM4e, обеспечивающими общую ёмкость в один терабайт. Полная система NVL144 Kyber достигает 15 FP4 эксафлопс.

Новые CPU-стойки решают проблему агентного ИИ. Новая стойка с CPU Vera содержит 256 жидкостно охлаждаемых процессоров Vera и 64 BlueField-4 DPUs, более 22,500 ядер и 400 терабайт памяти. Одна стойка может поддерживать свыше 22,500 одновременных сред для обучения с подкреплением или песочницы агентов. Это решение направлено на устранение недостатка CPU в системах агентного ИИ, где вызовы инструментов, SQL-запросы, компиляция и выполнение песочниц требуют вычислительной мощности CPU.

Процессор Vera оснащён 88 кастомными ядрами на базе архитектуры Olympus Arm, памятью LPDDR5X с пропускной способностью до 1.2 терабайта в секунду и поддержкой NVLink C2C для прямого соединения с GPU Rubin.

Groq 3 LPX обеспечивает посвящённый инференсу поток. Одним из наиболее интересных объявлений стала презентация Groq 3 LPX, появившаяся в результате частичной покупки компании Groq. Система содержит 32 вычислительных поддона с восемью LPUs каждый, соединённые через прямое соединение чип-к-чип с тысячами пар медных кабелей. Несколько таких стоек могут работать как единая система инференса. LPUs разработаны для низколатентной генерации токенов при меньших затратах на эксплуатацию. Groq 3 LPX, по данным Nvidia, обеспечивает до 35 раз больше токенов и 10 раз более высокую рентабельность для моделей с триллионами параметров по сравнению с Blackwell.

Платформа CMX хранения, операционная система для инференса Dynamo 1.0 и сетевая архитектура Spectrum-6 завершают стек технологий. Платформа CMX, основанная на BlueField-4 STX, перемещает KV-кэш в выделенный высокоскоростной слой хранения данных. KV-кэш используется для хранения промежуточных результатов вычислений модели языка, чтобы не пересчитывать их с каждым новым токеном. Nvidia утверждает, что CMX обеспечивает 5 раз более высокую пропускную способность и 5 раз лучшую энергоэффективность по сравнению с традиционными системами хранения.

Операционная система Dynamo 1.0 представляет собой открытый исходный код для распределения GPU- и памятных ресурсов по кластеру, интегрированную в такие фреймворки, как LangChain, SGLang и vLLM. Платформа поддерживается такими провайдерами облака, как AWS, Azure, Google Cloud, Oracle, CoreWeave, Together AI, Nebius, Cursor, Perplexity и Pinterest.

Сетевая архитектура Spectrum-6 SPX объединяет всю систему POD в единую суперкомпьютерную структуру. Новый коммутатор Spectrum-6 обеспечивает пропускную способность 102.4 терабита в секунду через 512 линий на скорости 200 гигабит в секунду, используя космонагруженные оптики, интегрированные прямо в чип. Nvidia заменила традиционные сменные трансиверы на интегрированную кремниевую фотонику, что должно повысить энергоэффективность и уменьшить задержки.

Третье поколение архитектуры MGX стойки обеспечивает управление энергией от чипа до сети. Все пять типов стоек используют одну и ту же физическую инфраструктуру: корпусы, поддоны, кабельные картриджи, жидкостные манжеты, шины питания и другие элементы. Все стойки разработаны для работы при температуре в 45 градусов Цельсия с полностью жидкостным охлаждением. Новая функция Intelligent Power Smoothing использует конденсаторы с 6 раз большей ёмкостью энергии, чем у предыдущего поколения (400 джоулей на GPU), для сглаживания пиков нагрузки и снижения пиковых токов. Dynamic Max-Q позволяет центрам данных динамически распределять мощность по стойкам в зависимости от задач, что, по данным Nvidia, позволяет размещать до 30% больше GPU при той же энергетической мощности.

Дизайн NVL72 GB200 был передан проекту Open Compute. Более 80 партнёров формируют экосистему для производства и распространения стоечных систем, по данным компании.

Системы цифровых двойников позволяют планировать и управлять AI-фабриками до начала монтажа оборудования. Системы DSX и DSX Air расширяют возможности Nvidia в области проектирования и эксплуатации всего производства. DSX объединяет вычисления, сеть, хранение данных, питание и охлаждение в проект AI-фабрик, а DSX Air создаёт цифровые двойники этих проектов для полной симуляции среды до поставки оборудования.

Коалиция Nemotron и NemoClaw предлагают открытые модели с встроенными защитами. Nvidia основывает коалицию Nemotron, объединяющую Black Forest Labs, Cursor, LangChain, Mistral AI, Perplexity, Reflection AI, Sarvam и Thinking Machines Lab для разработки свободно доступных моделей на переднем крае ИИ. Первая модель будет совместной разработкой Mistral AI и Nvidia, лежащей в основе семейства Nemotron 4. Nvidia также расширяет портфель моделей для робототехники и автономных автомобилей с помощью Cosmos и Isaac GR00T, а также для биотехнологий и разработки лекарств с помощью BioNeMo, Proteina Complexa и nvQSP.

NemoClaw, программная платформа Nvidia, добавляет слой безопасности и конфиденциальности к открытым моделям, контролируя действия агентов и доступ к данным. Huang представил NemoClaw как ранний альфа-релиз с ожиданием "неровностей" на старте.

Партнёрство с Adobe и модули для космоса расширяют сферы применения Nvidia. Компания также объявила о партнёрстве с Adobe, которая планирует интегрировать Firefly, Firefly Foundry, Acrobat, Frame.io и новое облачное 3D-решение для маркетинга с технологиями CUDA X, NeMo, Cosmos, Agent Toolkit и Omniverse. Nvidia также представила модули для космических вычислений, включая Space-1 Vera Rubin module, IGX Thor и Jetson Orin, которые предназначены для обработки ИИ на орбите.

DLSS 5 обещает фотореалистичное освещение, но встречает сопротивление от геймеров. Nvidia также представила DLSS 5 — нейросетевую технологию рендеринга, которая должна появиться в конце 2026 года для серии RTX 50. В отличие от предыдущих версий DLSS, новая технология фокусируется на AI-улучшении освещения, теней и поведения материалов. Nvidia утверждает, что это самый значительный прорыв в графике после реального времени трассировки лучей. Технология была разработана за три года.

DLSS 5 использует только цветовую информацию и векторы движения из игрового движка. AI-сеть семантически распознаёт различные поверхности, такие как кожа, волосы, вода и металл, и обрабатывает каждую по-разному. Геометрия, текстуры и материалы остаются неизменными. Тестирование Digital Foundry показало "поразительные" результаты для окружающей среды, материалов и растительности, но также выявило некоторые визуальные ошибки.

Геймеры отреагировали на DLSS 5 довольно негативно, описывая изменённые лица как "общий фильтр AI", разрушающий художественные замыслы разработчиков игр. Nvidia указывает, что разработчики получат опции для настройки, и функция остаётся необязательной.

#Nvidia #инференс #GTC 2026 #Vera Rubin #Agentic AI #AI hardware #Groq LPX

Авторы и эксперты

Автор

Александр Ковалёв

Hardware-обозреватель и аналитик высокопроизводительных систем • 10+ • AInDev.ru

Александр Ковалёв - автор и редактор сайта AInDev.ru специализируется на аппаратном обеспечении для разработки, искусственного интеллекта и высоконагруженных вычислений. Освещает р...

Экспертная проверка

Екатерина Морозова

AI Systems Reviewer & Backend Software Engineer • 8+ • AInDev.ru

Екатерина Морозова — специалист в области интеграции систем искусственного интеллекта и backend-разработки. Имеет более 8 лет опыта в разработке программного обеспечения и внедрен...