Учёные из Центра практического искусственного интеллекта Сбера, в сотрудничестве с коллегами из AIRI и «Сколтеха», создали уникальный инструмент. Этот детектор автоматически определяет момент, когда чрезмерное сжатие информации начинает искажать её смысл. В результате большие языковые модели могут обходить испорченные данные, заменяя их оригинальным текстом или подключая свежие документы.
Современные языковые модели, работая с длинными текстами, часто сталкиваются с проблемой потери важных фрагментов из-за чрезмерного сжатия. Это может привести к необратимым искажениям данных. Новый детектор качества проверяет сжатые токены перед их обработкой моделью, блокируя те, где смысл нарушен.
Директор центра практического ИИ Сбера Николай Тиден подчеркнул, что это решение выступает защитным механизмом. Оно автоматически определяет порог, за которым краткость перестаёт быть оптимизацией и ведёт к ошибкам. Для бизнеса это означает повышение надёжности ИИ: сокращение издержек и улучшение точности принятия решений.
Технология уже внедрена в обновлённую версию GigaChat Ultra, что позволяет этой модели работать более эффективно и точно. Внедрение такого защитного механизма обеспечивает стабильность и надёжность ИИ-систем.
«Наше решение выполняет функцию защитного механизма: мы научились автоматически детектировать порог, за которым краткость перестаёт быть оптимизацией и ведёт к ошибкам, вызывая потерю устойчивости модели. Для бизнеса это означает принципиально новый уровень надёжности искусственного интеллекта — сокращение издержек и повышение точности принятия решений», — отметил Николай Тиден.