Принстонские ученые представили OpenClaw-RL для обучения ИИ на пользовательском фидбеке
Фреймворк превращает сигналы из чатов, команд терминала и GUI в непрерывные данные для дообучения. Четыре асинхронных модуля обеспечивают улучшения без учителя-модели уже после десятков взаимодействий, без пауз в работе агента.