OpenAI выпустила датасет IH-Challenge для приоритизации инструкций в ИИ
Датасет использует reinforcement learning для четкой иерархии: система > разработчик > пользователь > инструмент. Тесты на GPT-5 Mini-R показали улучшения в безопасности...
Тег
Материалы, в которых упоминается IH-Challenge.
Датасет использует reinforcement learning для четкой иерархии: система > разработчик > пользователь > инструмент. Тесты на GPT-5 Mini-R показали улучшения в безопасности...