Тег

Mamba-Attention

Материалы, в которых упоминается Mamba-Attention.

NVIDIA представила Nemotron 3 Super — открытую модель с 120 млрд параметров
LLM / ChatGPT / Claude / Qwen Выделенный материал Автор Александр Ковалёв

NVIDIA представила Nemotron 3 Super — открытую модель с 120 млрд параметров

Модель использует гибридную архитектуру Mamba-Attention MoE, обеспечивая 5-кратный прирост пропускной способности для задач агентного ИИ. Это один из крупнейших открытых...

Новостей по этой теме пока нет.