НИУ ВШЭ адаптирует языковые модели для русскоязычной научной терминологии
Модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная. Обучена на корпусе iFORA-QA из материалов по науке и инновациям. Программа зарегистрирова...
Тег
Материалы, в которых упоминается большие языковые модели.
Модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная. Обучена на корпусе iFORA-QA из материалов по науке и инновациям. Программа зарегистрирова...
Guide Labs выпустила Steerling-8B — 8-миллиардную модель LLM, которая позволяет отследить каждый токен до его источника данных.