Переход корпоративных ИИ-агентов из экспериментальных сред в критически важные бизнес-системы поставил перед разработчиками вопрос контроля над «мутациями» кода и предотвращения утечек данных, вызванных инъекциями промптов (prompt injection). Чтобы купировать эти риски, NVIDIA и Cisco представили совместное решение — OpenShell, систему выполнения (runtime) для ИИ-агентов, исходный код которой был открыт 17 марта.
Концепция изолированной среды выполнения
Разработка призвана стать своеобразным файрволом для ИИ-систем, выполняющих длительные операции, позволяя компаниям точно контролировать каждое действие нейросети при масштабировании автоматизированных процессов. Фундаментальный принцип работы OpenShell заключается в предоставлении каждому агенту физически изолированной «песочницы» (sandbox). В этой среде по умолчанию у агента отсутствуют какие-либо привилегии: любые попытки обращения к внешним ресурсам, вызовы инструментов или даже обработка данных для обезличивания облачными моделями проходят строгую проверку согласно заданным политикам полномочий.
Интеграция с платформой безопасности
Инструментарий дополняется платформой Cisco AI Defense. Если OpenShell определяет границы допустимого для агента, то AI Defense контролирует фактическое исполнение задач. Система ведет непрерывный лог процесса рассуждений и принятия решений нейросетью. Это гарантирует, что любой вызов специализированных функций проходит обязательную проверку безопасности цепочки поставок.
Применение в комплексных сценариях
Эффективность данной многоуровневой архитектуры на практике можно проиллюстрировать на примере нейтрализации атак типа «нулевого дня». В такой ситуации внутренние ИИ-агенты способны автоматически анализировать бюллетени безопасности и выявлять уязвимое оборудование с помощью графов сетевых связей. Сам процесс анализа и исправления системы полностью изолирован внутри «песочницы» OpenShell. Если же в ходе устранения неполадок агент столкнется с вредоносной инъекцией, направленной на кражу конфигурационных данных, шлюз AI Defense мгновенно блокирует эту аномальную попытку доступа.
По заявлениям NVIDIA, основная цель проекта — устранить фактор «черного ящика» при эксплуатации искусственного интеллекта. За счет внедрения верификации безопасности на уровне инфраструктуры компании получают возможность делегировать ИИ сложные задачи автоматизации, минимизируя страх потери контроля над корпоративной средой. Открытие исходного кода OpenShell знаменует переход к этапу, где масштабное внедрение корпоративного ИИ опирается на четкие регуляторные и технические протоколы.