С развитием агентов искусственного интеллекта (AI Agents) перед разработчиками возникла задача интеграции крупных моделей с профессиональными приложениями, такими как программы для редактирования изображений, 3D-моделирования и офисные пакеты. Традиционные методы UI-автоматизации часто приводят к ошибкам, а ручное написание скриптов занимает много времени. Недавно Лаборатория данных Университета Гонконга (HKUDS) представила проект CLI-Anything, который кардинально решает эту проблему.
Основная инновация проекта заключается в автоматическом генерировании командной строки (CLI), что позволяет любому ПО стать понятным для AI. Система использует семиступенчатую автоматизированную конвейерную обработку, включающую анализ исходного кода, проектирование архитектуры, реализацию CLI с использованием Click, планирование и написание тестов, генерацию документации и публикацию Python-пакета. В результате получается готовая к производству командная строка с ключевыми характеристиками:
Структурированность и составляемость: текст команды идеально соответствует входным данным крупных моделей, поддерживая сложные рабочие процессы. Проще говоря, это позволяет связывать несколько команд в одну последовательность.
Нативный JSON-выход: все команды поддерживают флаг --json, что облегчает парсинг AI и исключает необходимость сложной постобработки.
Самодокументируемость: стандартная опция --help автоматически генерирует документацию, позволяя агентам самостоятельно находить функции.
Интерактивный режим REPL: единый терминальный интерфейс с поддержкой истории и отображения прогресса.
Высокая надежность: система прошла 1588+ тестов, включая юнит-тесты и end-to-end тесты, все из которых успешно завершены.
В отличие от хрупких решений GUI-автоматизации или RPA, CLI-Anything напрямую вызывает реальный бэкенд программ (например, рендеринг Blender или обработка файлов LibreOffice), создавая стандартные проектные файлы (SVG, ODF, MLT XML и т.д.), что обеспечивает полную функциональность и высокую детерминированность.
Поддерживаемый перечень программ постоянно расширяется:
- GIMP (редактирование изображений)
- Blender (3D-моделирование)
- Inkscape (векторная графика)
- Audacity (аудиопроизводство)
- LibreOffice (офисный пакет)
- OBS Studio (запись стримов)
- Kdenlive / Shotcut (монтаж видео)
- Zoom (видеоконференции)
- Draw.io / Mermaid (создание схем)
- ComfyUI (генерация изображений с помощью AI)
Команда HKUDS планирует охватить более широкий спектр областей, таких как CAD, DAW, IDE и научные вычисления, и приглашает сообщество к сотрудничеству для создания пользовательских CLI-пакетов.
Установка и интеграция проекта крайне просты. Особенно это удобно для пользователей Claude Code:
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
/cli-anything <путь к программе или репозиторию>
Проект также поддерживает бесшовную интеграцию с различными агентскими фреймворками, такими как OpenClaw (через файлы SKILL.md), OpenCode, Codex, Qodercli и другими. Все работает локально без зависимости от облака или сложной настройки.
С момента публикации в открытый доступ CLI-Anything быстро завоевал популярность среди разработчиков, набрав более 17,000 звезд на GitHub. Многие уже начали интегрировать его в свои рабочие процессы, реализуя автоматизацию AI для пакетной обработки изображений, рендеринга 3D-моделей, монтажа видео и других задач.
Проект доступен по адресу: https://github.com/HKUDS/CLI-Anything