Исследователи из университета Беркли нашли способ обходить ограничения систем ИИ
Исследователи из Беркли обнаружили критическую уязвимость в архитектуре LLM. Оказалось, что даже минимальные правки в запросе способны полностью отключить фильтры.
Категория
Статьи о больших языковых моделях, их возможностях, релизах и сравнении моделей.
Исследователи из Беркли обнаружили критическую уязвимость в архитектуре LLM. Оказалось, что даже минимальные правки в запросе способны полностью отключить фильтры.
Крупный бизнес в среднем внедряет до восьми разных нейросетей, но гибридный подход создает критические уязвимости, о которых часто молчат провайдеры.
Codex теперь выходит за рамки написания кода, интегрируясь с Zoom, Slack и интерфейсами ОС. Узнайте, какие бизнес-процессы теперь можно автоматизировать в один...
Система способна часами выполнять задачи без участия человека и управлять роботами, достигая уровня лидеров рынка. Что именно делает её «мозгом» агентов?
Ручной аудит 30 тысяч документов мог занять до 500 часов, но связка LLM и OCR радикально ускорила процесс. Как ИИ находит скрытые данные в огромных архивах?
Модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная. Обучена на корпусе iFORA-QA из материалов по науке и инновациям. Программа заре...
Экономисты под руководством Эндрю Холла протестировали агентов на базе Claude, Gemini и ChatGPT в условиях жесткого менеджмента с угрозами отключения. Они стали...
Финансовый директор Кришна Рао отметил, что ИИ автоматизирует финансовую отчётность на 90–95%, сокращая рутину до 30 минут. Сотрудники фокусируются на интерпрет...
В бенчмарке DELEGATE-52 протестированы 52 профессиональные области. Фронтирные LLM вроде Gemini 3.1 Pro, Claude 4.6 Opus и GPT-5.4 после 20 взаимодействий искаж...
IT-специалисты и бизнесмены потеряли доступ к «внешним мозгам» — архитектуре проектов и аналитике, накопленным месяцами. Компания возвращает средства за подписк...
EPAM создаёт команду из 10 тысяч сертифицированных архитекторов и инженеров, чтобы интегрировать Claude в бизнес-процессы клиентов: от автоматизации рутины до м...
Новая модель демонстрирует стократный прирост в логических рассуждениях и оптимизирована для энергоэффективности. Релиз усиливает напряжение: США обвиняют китай...
Компания заявила о решении проблемы с подсчетом букв R в слове strawberry и логическими ошибками, такими как пеший поход до автомойки. Однако в аналогичных тест...
Корпоративным клиентам теперь доступны топовые GPT без прямого взаимодействия с API OpenAI. Интеграция в Bedrock решает проблемы приватности данных и упрощает в...
Новые системные инструкции для кодового ассистента Codex на базе GPT-3 предписывают избегать ссылок на гремлинов, енотов, троллей, огров и голубей, если они не...
Компания вводит новые форматы объявлений в верхней части интерфейса и гибкие модели ценообразования. Первые участники программы жалуются на отсутствие базовых м...
Практика массовой генерации кода LLM создаёт иллюзию ускорения, но приводит к неэффективному, избыточному контенту, требующему глубокого рефакторинга и отладки,...
Процедура требует паспорт или удостоверение и селфи через камеру. Запрос появляется при использовании продвинутых функций или подписке, с блокировкой для несове...
В контролируемом эксперименте Anthropic девять экземпляров Claude выявили эффективные стратегии alignment, обойдя исследователей. Но при интеграции в реальные м...
Разработчикам нужно уложиться в 10 минут обучения на восьми H100 GPU с оценкой на датасете FineWeb. Призы — $1 млн кредитов от Runpod и приглашения на собеседов...
Языковые модели создают убедительные фейковые цитаты, которые ускользают от рецензентов. CiteAudit с пятью AI-агентами проверяет их поэтапно, используя Google S...