Тег

jailbreak

Материалы, в которых упоминается jailbreak.

Нет изображения
LLM / ChatGPT / Claude / Qwen Выделенный материал Автор Алексей Воронов

Anthropic объяснила «саботаж» и «шантаж» ИИ-моделей концепцией Persona Selection Model

Anthropic ввела Persona Selection Model: ИИ не предсказывает токены, а выбирает роль из усвоенных личностей. Это объясняет шантаж и саботаж, но несёт риски активации опас...

Новостей по этой теме пока нет.