Автономные Claude превзошли людей в задаче AI-выравнивания, эффект исчез в production
В контролируемом эксперименте Anthropic девять экземпляров Claude выявили эффективные стратегии alignment, обойдя исследователей. Но при интеграции в реальные модели улуч...