OpenAI запрещает Codex упоминать гоблинов и животных
OpenAI внедрила новые системные инструкции для своего инструмента Codex, призванные ограничить склонность модели к генерации нерелевантного контента. В обновленных правилах разработчикам агента дано прямое указание избегать упоминаний гоблинов, гремлинов, енотов, троллей, огров, голубей и прочих животных или мифических существ, если только эти сущности не имеют явного и прямого отношения к решаемой технической задаче. По сути, компания стремится купировать «галлюцинации» модели, которые часто возникают при обработке расплывчатых или абстрактных запросов.
Природа ограничений и их влияние на разработку
Codex, базирующийся на архитектуре GPT-3, предназначен для автоматизации написания кода на основе текстовых описаний. На практике это значит, что при недостаточной конкретике в запросе или при использовании метафор, связанных с фэнтезийными элементами, модель могла уходить от контекста программирования в сторону генерации нецелевого контента. Внедрение строгих рамок стало частью стратегии по повышению точности и надежности ИИ, так как неконтролируемые ответы создают риски для процессов разработки, где критически важна логическая корректность и предсказуемость результата.
Стратегии повышения точности моделей
Данное изменение отражает общую тенденцию в развитии LLM, направленную на выравнивание (alignment) алгоритмов с намерениями пользователя. OpenAI продолжает экспериментировать с методами управления поведением систем, включая более тщательную фильтрацию обучающих данных и усложнение стратегий промпт-инжиниринга. На практике для конечного пользователя это должно обернуться сокращением количества итераций, необходимых для получения рабочего кода, и минимизацией ошибок, вызванных некорректной интерпретацией контекста.
Ожидается, что эти ограничения сильнее всего проявятся при работе с сессиями, где ранее Codex мог позволить себе креативные или спекулятивные отступления. Повышение концентрации модели на сугубо технических аспектах должно повысить продуктивность инструментов автоматизации в условиях реальных проектов.