Компания Google опубликовала официальное руководство для своих моделей генерации изображений Nano Banana, подробно объясняя отличия между всеми тремя версиями и указывая, когда лучше использовать ту или иную. Основное внимание в документе уделено недавно выпущенной модели Nano Banana 2, основанной на Gemini 3.1 Flash Image.
По словам Google, Nano Banana 2 предоставляет около 95% возможностей более дорогой версии Nano Banana Pro, при этом стоимость значительно ниже. Это делает NB2 рекомендуемым выбором для большинства новых проектов. Модель также поддерживает генерацию изображений с разрешением 512 пикселей (0.5K), что ускоряет процесс и снижает затраты до уровня Nano Banana 1.
Google рекомендует использовать многостадийный подход: сначала сгенерировать десятки вариантов изображений с разрешением 512 пикселей через API, который предлагает 50% скидку. Затем лучший вариант можно масштабировать до разрешения 1K, 2K или даже 4K.
Одной из эксклюзивных особенностей Nano Banana 2 является визуальное анкорирование с использованием Google Search. Хотя Nano Banana Pro уже могла искать текстовую информацию в интернете, NB2 шагает дальше: она может искать реальные изображения для понимания, как выглядят объекты на практике. Это особенно полезно при работе со специфическими локациями, такими как церкви, мосты или городские площади, а также с определёнными видами животных и растений. Однако поиск изображений не поддерживается для людей.
В таблице ниже представлены основные функции каждой модели:
| Функция | Nano Banana 2 (Gemini 3.1 Flash Image) | Nano Banana Pro (Gemini 3 Pro Image) |
|---|---|---|
| Максимальное количество входных токенов | 131,072 | 65,536 |
| Максимальное количество выходных токенов | 32,768 | 32,768 |
| Разрешения | 0.5K (512px), 1K, 2K, 4K | 1K, 2K, 4K |
| Соотношения сторон | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, 1:4, 4:1, 1:8, 8:1 | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Текстовое анкорирование (веб-поиск) | Да | Да |
| Визуальное анкорирование (поиск изображений) | Да | Нет |
| Изображения на вход | До 14 эталонных изображений (PNG, JPEG, WebP, HEIC, HEIF) | До 14 эталонных изображений (PNG, JPEG, WebP, HEIC, HEIF) |
| Текстовые документы на вход | Текст и PDF (макс. 50 МБ через API, 7 МБ через Консоль) | Текст и PDF (макс. 50 МБ через API, 7 МБ через Консоль) |
| Выходные данные | Текст и изображения | Текст и изображения |
| База знаний | Состояние на январь 2025 года | Состояние на январь 2025 года |
| Реальный веб-поиск | Да | Да |
| Стандарты безопасности | C2PA контентные сертификаты, водяные знаки SynthID | C2PA контентные сертификаты, водяные знаки SynthID |
Google также рекомендует отключить режим Thinking Mode по умолчанию для модели Nano Banana, так как он в основном увеличивает время и вычислительные затраты при обычной генерации изображений. Режим стоит включать только в трёх случаях: когда модель выдаёт бессмысленные результаты, при создании сложных инфографических материалов или при сочетании визуального анкорирования с пространственным рассуждением.