← На главную (новости)

Тег: бенчмарки ИИ

Новости по теме

Обзор Gemini 3.1 Flash-Lite: быстрая модель ИИ по цене в 1/8 от Pro

Новость • Категория: Generative AI • Автор: Алексей Воронов • 17.03.2026 01:17

Выпущена 3 марта 2026 года модель предлагает контекст 1 млн токенов и пропускную способность до 363 ток/сек. Превосходит GPT-5 mini и Claude 4.5 Haiku в большинстве бенчмарков, но с задержкой первого токена 6,74 сек.

Новые работы ИИ: модели пере- и недодумывают, мультимодалки нарушают логику шагов, LLM-судьи дают 21% улучшения

Новость • Категория: Искусственный интеллект • Автор: Алексей Воронов • 17.03.2026 01:06

Новые работы показывают: модели пере- и недодумывают одновременно, мультимодальные системы нарушают логику шагов, а LLM-судьи с хорошей корреляцией захватывают лишь 21% потенциального улучшения при Best-of-N.