NVIDIA представила Nemotron 3 Nano 4B для Jetson Orin Nano 8 ГБ
Модель с 3,97 млрд параметров на гибридной архитектуре Mamba-2 сжимается из 9B-версии методом прунинга. Достигает 95,4% на MATH500 в reasoning-режиме и генерирует 18 токенов/сек.
Модель с 3,97 млрд параметров на гибридной архитектуре Mamba-2 сжимается из 9B-версии методом прунинга. Достигает 95,4% на MATH500 в reasoning-режиме и генерирует 18 токенов/сек.