Тег

alignment experiment

Материалы, в которых упоминается alignment experiment.

Автономные Claude превзошли людей в задаче AI-выравнивания, эффект исчез в production
LLM / ChatGPT / Claude / Qwen Выделенный материал Автор Екатерина Морозова

Автономные Claude превзошли людей в задаче AI-выравнивания, эффект исчез в production

В контролируемом эксперименте Anthropic девять экземпляров Claude выявили эффективные стратегии alignment, обойдя исследователей. Но при интеграции в реальные модели улуч...

Новостей по этой теме пока нет.