Репортаж от Wedoany,Компания Google представила серию моделей генерации и редактирования изображений на базе ИИ под названием Nano Banana, построенных на архитектуре Gemini 3. Nano Banana — это не самостоятельный инструмент преобразования текста в изображение, а система визуального исполнения, работающая в связке с базовым когнитивным ядром Gemini, способная преобразовывать плотные наборы данных, бренд-киты и сложные макеты в попиксельный вывод.
В настоящее время линейка продуктов включает три модели:
Модель | Официальное название | Скорость | Наилучшее применение |
| Nano Banana | Gemini 2.5 Flash Image | Быстро | Повседневное редактирование, базовая генерация |
| Nano Banana Pro | Gemini 3 Pro Image | Медленнее | Брендовая работа, печать, точный вывод |
| Nano Banana 2 | Gemini 3.1 Flash Image | Самая быстрая (в 3 раза быстрее Pro) | Быстрая итерация, социальный контент, модели |
Nano Banana 2 — это не урезанная версия Pro, а другой инструмент для разных задач: скорость и количество против изысканности и точности.
Пользователи могут получить доступ к этим моделям через следующие платформы:
Платформа | Доступный контент |
| Приложение Gemini (iOS/Android/Web) | Полный доступ, включая бесплатный уровень — самый простой способ начать |
| Google Search (AI Mode) | Быстрая генерация в результатах поиска |
| Google Lens | Создание изображений через функцию Lens Create |
| Google AI Studio | Тестирование разработчиками и эксперименты с промптами |
| Gemini API / Vertex AI | Продуктовое развертывание, пакетные рабочие процессы, контроль управления |
| Google Slides ("Help me visualize") | Встроенная генерация изображений в слайдах |
Nano Banana 2 и Nano Banana Pro доступны бесплатно через приложение Gemini, но у Pro есть лимит на генерацию, после достижения которого приложение автоматически переключается на базовую модель.
Что касается ключевых характеристик: Nano Banana 2 (Gemini 3.1 Flash Image) генерирует каждое изображение за 2–5 секунд, максимальное разрешение 4K (4096×4096), предлагает нативные опции 512px, 1K и 2K, поддерживает 15 соотношений сторон (включая экстремальные форматы 8:1 и 1:8), до 4 персонажей в одной серии, до 14 ссылок на объекты в одном промпте, лимит входных токенов 131 072, лимит выходных токенов 32 768, точность рендеринга текста около 87%, функция поиска в реальном времени, стоимость одного изображения примерно на 75% дешевле, чем у Pro. Nano Banana Pro (Gemini 3 Pro Image) генерирует каждое изображение примерно за 10–15 секунд, нативное разрешение 4K, стандартные соотношения сторон (1:1, 16:9, 9:16, 4:3, 3:4, 21:9 и т.д.), до 5 персонажей, до 14 ссылок на объекты, лимит входных токенов 65 536, лимит выходных токенов 32 768, точность рендеринга текста около 64%, также поддерживает поиск в реальном времени и функцию фиксации стиля. Обе модели используют C2PA Content Credentials, невидимый цифровой водяной знак SynthID, многоязычную генерацию текста (более 10 языков), дата актуальности знаний — январь 2025 года, дополненная поиском в реальном времени.
Google предлагает пять фреймворков для промптов для получения наилучших результатов. Первый — текст в изображение (без референсов): формула: субъект + действие + место/фон + композиция + стиль. Пример промпта: «Уставший инженер-программист лет 30 с темными кругами под глазами, сидит за захламленным столом, окруженный пустыми чашками из-под кофе. Она смотрит на тускло светящийся зеленым монитор. Нижний ракурс, средний план. Кинематографичный тон, мягкие сине-зеленые оттенки, документальный свет.»
Второй — мультимодальная генерация (с референсными изображениями): формула: референсное изображение + указание на связь + новый сценарий. Пример промпта: «Используйте приложенное фото продукта в качестве объекта, а приложенную мудборд в качестве референса стиля. Разместите продукт в залитой солнцем обстановке прибрежного кафе. Сохраняйте точные пропорции продукта. Фотореалистичная сцена, качество редакционного уровня.»
Третий — редактирование изображений (диалоговое): пять основных глаголов редактирования: Добавить (Add), Удалить (Remove), Заменить (Replace), Изменить (Change), Сделать (Make). Профессиональный совет: всегда указывайте модели, что сохранить, а что изменить. Добавление фразы «сохранить лицо и одежду субъекта полностью неизменными» уменьшает дрейф вывода.
Четвертый — визуализация данных в реальном времени: Nano Banana 2 может получать информацию из сети в реальном времени и визуализировать ее. Пример промпта: «Найди сегодняшний индекс качества воздуха в Лондоне. Представь данные в виде чистой иллюстрированной панели приборов в стиле UI смартфона. Используй простую систему иконок: зеленый — хорошо, янтарный — средне, красный — плохо. Включи названия районов и временные метки.»
Функция данных в реальном времени перспективна, но не безошибочна: известно, что даты и статистика могут быть устаревшими. Перед публикацией следует перепроверять.
Пятый — пишите промпты как креативный директор: можно указывать варианты освещения (мягкий заполняющий свет, драматический, естественный теплый, чистый предметный), язык камеры и объектива (например, «снято на Fujifilm X100V, естественная цветопередача»), сокращения для цветокоррекции (ностальгический, эмоциональный кинематографичный, чистый коммерческий), подсказки по материалам и текстурам (например, «джинсовая куртка оверсайз в винтажном стиле, предварительно выстиранный индиго, следы потертостей на швах»).
Что касается рендеринга текста, точность текста у Nano Banana 2 в настоящее время является одной из лучших среди всех моделей AI-изображений. Для максимального эффекта: всегда заключайте текст для рендеринга в кавычки; указывайте шрифт или описывайте его; указывайте цвет и соотношение размеров; используйте трюк с приоритетом текста — сначала попросите Gemini сгенерировать текстовую копию, а затем запросите изображение, содержащее эту копию; напрямую указывайте целевой язык для локализации; не рекомендуется полагаться на нее для генерации длинного основного текста.
Краткий справочник по соотношениям сторон: 1:1 — для постов в Instagram, фото профиля; 16:9 — для миниатюр YouTube, презентаций; 9:16 — для Reels, TikTok, историй, мобильной рекламы; 4:5 — для ленты Instagram (лучший формат для вовлечения); 21:9 — для широкоэкранного кино, баннеров на сайтах; 8:1 (только Nano Banana 2) — для сверхшироких шапок сайтов, баннеров в email-рассылках; 1:8 (только NB2) — для вертикальных мобильных креативов, боковых графиков; 3:2 — для стандарта печатной фотографии; 4:3 — для слайдов презентаций.
Руководство по выбору модели: выбирайте Nano Banana 2 для — быстрой итерации, социальных сетей, веб-графики, необходимости в читаемом тексте (ее точность текста выше, чем у Pro), чувствительности к стоимости (на 75% дешевле), необходимости в экстремальных соотношениях сторон, пакетной сборки; выбирайте Nano Banana Pro для — печати или крупноформатных дисплеев, сложных сцен с несколькими субъектами, требующих максимальной реалистичности, важности консистентности бренда в больших партиях изображений, высококлассной предметной фотосъемки, длинных и узкоспециализированных промптов.
Частые ошибки и способы их решения: слияние или искажение лиц (размытый референсный промпт, добавьте «сохранять каждого визуально уникальным»); слишком много пальцев (перегенерировать или кадрировать композицию); дрейф стиля (включайте в промпт консистентную фразу о стиле или ссылайтесь на предыдущий вывод); искаженный текст (используйте кавычки, указывайте шрифт, делайте текст коротким); устаревшие данные в реальном времени (проверяйте вручную); вывод игнорирует часть промпта (разбейте на последовательные промпты); размытое изображение (добавьте «четкий фокус, высокая резкость»); сброс соотношения сторон на значение по умолчанию (указывайте пропорцию в начале промпта).
Что касается водяных знаков и обнаружения AI, каждое изображение, сгенерированное Nano Banana, содержит два слоя: SynthID — невидимый попиксельный цифровой водяной знак, незаметный для человеческого глаза, но считываемый инструментами обнаружения. Функция верификации SynthID в приложении Gemini была использована более 20 миллионов раз; C2PA Content Credentials — стандарт метаданных, записывающий способ создания изображения, включая участие AI. Функция верификации внедряется в приложение Gemini. Это означает, что изображения, созданные AI, технически идентифицируемы при использовании правильных инструментов, но водяные знаки не видны при беглом просмотре в социальных сетях.
Быстрые стартовые промпты включают: промпты для предметных моделей, графика для соцсетей с текстом, слайды для инфографики, серии с консистентными персонажами, реставрация фото, локализованные маркетинговые материалы и т.д.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









