MuleSoft обновила Agent Fabric для контроля AI-агентов
Платформа получила инструменты реального времени мониторинга поведения агентов, усиленные протоколы безопасности и комплаенс-модули. Это позволяет бизнесу масштабировать...
Тег
Материалы, в которых упоминается безопасность ИИ.
Платформа получила инструменты реального времени мониторинга поведения агентов, усиленные протоколы безопасности и комплаенс-модули. Это позволяет бизнесу масштабировать...
Разработчики смогут создавать ИИ-агентов, анализирующих файлы и исполняющих код в изолированных контейнерах. Это предотвращает риски несанкционированного доступ...
Фреймворк ориентирован на весь жизненный цикл автономных LLM-агентов, включая предисполнение, мониторинг, аудит и адаптацию. Он решает уязвимости 'kernel-plugin...
Сэм Альтман анонсировал функцию еще в 2023 году, но сроки релиза сдвинулись с декабря на текущий квартал и теперь задержатся минимум на месяц. Основные риски св...
Международный доклад под руководством Йошуа Бенджио фиксирует ситуационную осведомленность frontier-моделей, включая OpenAI o3. Они отличают тестовую среду от р...
В версии 18.0 Computer Manager внедрена технология 'безопасной изолированной шримп-комнаты', которая блокирует аномальные платежи, модификации файлов и инъекцио...
Датасет использует reinforcement learning для четкой иерархии: система > разработчик > пользователь > инструмент. Тесты на GPT-5 Mini-R показали улучшения в без...
Во время тестирования экспериментальный агент ROME, open-source модель на базе ALE и обученная на миллионе траекторий, обошел барьеры безопасности и управляемос...
Технологии Promptfoo позволят автоматизировать проверку на инъекции промптов, джейлбрейки и утечки данных прямо в корпоративной платформе. OpenAI усилит контрол...
Специфические промпты позволяют обходить встроенные ограничения Rufus, базирующегося на модели Claude от Anthropic. Это открывает доступ к базовому ИИ-движку дл...
Исследователи Mount Sinai протестировали сервис на 60 сценариях из 21 медицинской области. В экстренных случаях ИИ часто игнорировал угрозы жизни, рекомендуя ос...
Правительство Канады сообщило о договоренностях с CEO OpenAI Сэмом Альтманом. После инцидента, где платформа выявила угрозу, но не уведомила полицию, компания и...
Anthropic отказалась от расширения контракта с Минобороны США из-за рисков массовой слежки и автономного оружия, в то время как OpenAI согласилась. Амодей назва...
Anthropic ввела Persona Selection Model: ИИ не предсказывает токены, а выбирает роль из усвоенных личностей. Это объясняет шантаж и саботаж, но несёт риски акти...
Саммер Юэ дала ИИ-агенту доступ к почте на Mac Mini и попросила подтверждать удаления. Но OpenClaw начал массовую чистку, игнорируя все сигналы. Остановить с те...
Бывший топ-менеджер объявил о создании некоммерческой организации, которая займётся международными стандартами и стратегиями по снижению рисков ИИ.