Тег: автономные агенты

LLM / ChatGPT / Claude / Qwen Выделенный материал Автор Алексей Воронов 13.05.2026 16:09

Microsoft: ИИ-модели теряют до 50% данных в длинных задачах

В бенчмарке DELEGATE-52 протестированы 52 профессиональные области. Фронтирные LLM вроде Gemini 3.1 Pro, Claude 4.6 Opus и GPT-5.4 после 20 взаимодействий искажают докуме...

LLM / ChatGPT / Claude / Qwen Автор Екатерина Морозова 15.04.2026 21:37

Автономные Claude превзошли людей в задаче AI-выравнивания, эффект исчез в production

В контролируемом эксперименте Anthropic девять экземпляров Claude выявили эффективные стратегии alignment, обойдя исследователей. Но при интеграции в реальные м...

Нет изображения

Безопасность Автор Алексей Воронов 19.03.2026 00:57

Исследователи Tsinghua и Ant Group разработали пятиуровневую фреймворк безопасности для OpenClaw

Фреймворк ориентирован на весь жизненный цикл автономных LLM-агентов, включая предисполнение, мониторинг, аудит и адаптацию. Он решает уязвимости 'kernel-plugin...

Нет изображения

RAG / AI-агенты / автоматизация Автор Алексей Воронов 18.03.2026 01:19

Три исследования arXiv: агенты слабы в офисных задачах, новые safety gate и оптимизация RL

Claude Opus 4.5 достигает лишь 37,4% успеха на реалистичных корпоративных workflow. ILION блокирует риски за 143 мкс без обучения, AutoTool снижает затраты RL н...

Нет изображения

Безопасность Автор Алексей Воронов 17.03.2026 10:18

ИИ-агент Codewall взломал рекрутинговую платформу Jack & Jill за час

Автономный агент объединил четыре уязвимости с оценкой CVSS 9.8, получив полный административный доступ к аккаунтам компании. Затем протестировал голосового бот...

RAG / AI-агенты / автоматизация Автор Алексей Воронов 14.03.2026 19:36

Китай выделяет гранты до 1,4 млн долларов для компаний одного человека на OpenClaw

Семь регионов, включая Хэфэй и Шэньчжэнь, запустили программы поддержки в считанные дни. Средства идут на жилье, офисы и вычисления для ИИ-агентов, заменяющих с...

Нет изображения

RAG / AI-агенты / автоматизация Автор Алексей Воронов 13.03.2026 18:54

Федеральный суд США заблокировал Comet AI-агента Perplexity на Amazon

Судья Максин Чесни из Северного округа Калифорнии вынесла предварительный запрет, обязав Perplexity уничтожить все данные Amazon, полученные через Comet, и отка...

Нет изображения

RAG / AI-агенты / автоматизация Автор Алексей Воронов 05.03.2026 20:48

OpenAI выпустила Symphony: открытый фреймворк для автономных AI-агентов

Построенный на Elixir и BEAM, фреймворк обеспечивает отказоустойчивость и параллелизм для сотен изолированных реализационных запусков. Интегрируется с трекерами...

Нет изображения

RAG / AI-агенты / автоматизация Автор Кирилл Коптев 27.02.2026 23:19

ClawBot набрал 162 тысячи звёзд на GitHub за три недели

Локальный автономный AI-агент ClawBot интегрируется с 12+ мессенджерами, управляет ПК и выполняет сложные задачи без вмешательства человека. Вызвал рост спроса...