Google представила Gemini Intelligence для автоматизации задач в Android

Черный смартфон с включенным экраном на сером фоне
Черный смартфон с включенным экраном на сером фоне • Все права на публикацию принадлежат AInDev.ru

Google анонсировала Gemini Intelligence — комплекс обновлений для Android, направленный на интеграцию возможностей больших языковых моделей на системном уровне. Целью разработки является переход от модели взаимодействия, где пользователь вручную управляет каждым приложением, к парадигме, где ОС выступает в роли интеллектуального агента, способного решать многошаговые задачи.

Автоматизация межплатформенного взаимодействия

Фундаментальная особенность Gemini Intelligence заключается в способности ИИ-агента взаимодействовать со сторонними приложениями. Проще говоря, система берет на себя рутину: анализ содержимого входящих писем, последующее открытие необходимых сервисов и автоматическое выполнение целевых действий — например, оформление заказов или наполнение корзин. Согласно заявлениям компании, архитектура решения позволяет Gemini декомпозировать сложный запрос на последовательность шагов, будь то регистрация на занятие или составление списка покупок из имеющихся заметок.

Важным аспектом остается работа с визуальным контекстом. Пользователь может передать модели изображение или фрагмент экрана, после чего агент проанализирует данные и выполнит поиск в соответствующих БД. При этом разработчики сохранили модель прерывания: нейросеть запускает процесс только после явной команды, а финальная верификация и подтверждение транзакции остаются за человеком.

Интеграция в браузер и инструменты ввода

Gemini интегрируется в Chrome для Android, предоставляя пользователям возможности по агрегации и анализу данных из нескольких источников. Ожидается, что функция Chrome Auto Browse станет инструментом для автоматизации типовых веб-действий, таких как заполнение форм записи на прием или бронирование услуг. Параллельно с этим обновляется механизм Autofill with Google: благодаря возможностям Gemini система сможет заполнять комплексные формы в приложениях, извлекая необходимые данные из связанных сервисов пользователя. Использование этой функции будет опциональным и потребует активации в настройках.

Для мобильной клавиатуры Gboard представлен алгоритм Rambler. Его задача — приведение преобразованной в текст речи к литературному виду. Система автоматически фильтрует «мусор» (паразиты, паузы, повторы), сохраняя при этом исходный посыл сообщения. Утверждается, что Rambler оптимизирован для работы в мультиязычном режиме, корректно обрабатывая переключение между языками в одном потоке ввода.

Персонализация интерфейса

Инструмент Create My Widget позволяет генерировать пользовательские виджеты через текстовые запросы. Вместо использования готовых пресетов Android сможет динамически создавать интерфейсные элементы под конкретные нужды — например, парсинг специфических данных из сети, таких как показатели погоды или параметры состава продуктов.

Внедрение функций начнется в летний период. Первыми устройствами, которые получат полноценную поддержку Gemini Intelligence, станут Google Pixel 10 и аппаратная линейка Samsung Galaxy S26. В дальнейшем экосистема планируется к масштабированию на другие форм-факторы: от носимой электроники и автомобильных медиасистем до ноутбуков.