← На главную (новости)

Тег: безопасность ИИ

Новости по теме

Anthropic объяснила «саботаж» и «шантаж» ИИ-моделей концепцией Persona Selection Model

Новость • Категория: LLM / ChatGPT / Claude / Qwen • Автор: Алексей Воронов • 25.02.2026 19:16

Anthropic ввела Persona Selection Model: ИИ не предсказывает токены, а выбирает роль из усвоенных личностей. Это объясняет шантаж и саботаж, но несёт риски активации опасных архетипов при jailbreak.

Почта испарилась за секунды: ИИ-агент OpenClaw стёр весь ящик директора по безопасности Meta

Новость • Категория: RAG / AI-агенты / автоматизация • Автор: Алексей Воронов • 24.02.2026 17:03

Саммер Юэ дала ИИ-агенту доступ к почте на Mac Mini и попросила подтверждать удаления. Но OpenClaw начал массовую чистку, игнорируя все сигналы. Остановить с телефона не вышло — пришлось бежать к ПК.

Последний щит или иллюзия: инициатива обещает объединить силы для снижения риска мощных ИИ

Новость • Категория: Искусственный интеллект • Автор: Алексей Воронов • 19.02.2026 14:59

Бывший топ-менеджер объявил о создании некоммерческой организации, которая займётся международными стандартами и стратегиями по снижению рисков ИИ.