OpenAI мониторит кодинг-агентов на misalignment через анализ цепочек рассуждений
Система на базе GPT-5.4 Thinking анализирует взаимодействия агентов с задержкой до 30 минут, классифицируя риски по уровням опасности и выявляя попытки обхода ограничений без случаев схеминга.