← Все новости

Google Gemini Beta: инструмент аннотации изображений и локальное редактирование

• Категория: Generative AI • Автор: Алексей Воронов • Проверил: Екатерина Морозова • 18.03.2026 11:34

В бета-версии 17.10.54.sa.arm64 приложения Gemini для Android компания Google представила значительные улучшения в области генеративного редактирования изображений. Главным нововведением стала глубоко интегрированная интерфейсная система аннотации и текстовое поле для реального времени, которое позволяет пользователю более точно формулировать свои инструкции по модификации изображений.

Эти изменения направлены на решение проблем неточной передачи указаний и разрыва в рабочем процессе при текущих методах AI-редактирования. Теперь пользователи могут наносить высокоточные метки на определенные области изображения, используя значок "карандаш", и одновременно вводить свои пожелания по модификации в текстовое поле, расположенное внизу экрана.

Двухмодальный подход "визуальное позиционирование + естественный язык" значительно повышает точность модели в понимании конкретных локальных инструкций. Кроме того, бета-версия также включает опции для изменения размеров (Resizing) и эффектов (Effects), что свидетельствует о стремлении Gemini к трансформации из простого текстово-изображенческого инструмента в полноценную рабочую станцию, объединяющую генерацию, обрезку и фильтрацию.

С точки зрения отраслевых трендов, действия Google указывают на смещение акцентов в конкурентной борьбе в области генеративного AI. Теперь основное внимание уделяется "точному контролируемому редактированию". Интеграция сложных инструментов аннотации в нативное мобильное приложение позволяет Google создать более высокий барьер взаимодействия в сфере мобильной AI-фотографии и цифрового создания.

Хотя указанные функции пока находятся на стадии анализа кода и не были официально выпущены, их "маркировка и немедленное изменение" логика демонстрирует важный шаг в развитии мульти-modal-моделей. Это позволит более точно воспринимать тонкие эстетические намерения пользователей, что ускорит внедрение AI-рисования из развлечений в профессиональные творческие процессы.

Теги: #ИИ, #Gemini, #Google, #редактирование изображений, #аннотация изображений, #бета-версия Android, #локальное редактирование