Американская компания Google выпустила три модели AI-генерации изображений Nano Banana
2026-06-11 14:10
В избр.

Репортаж от Wedoany,Компания Google представила серию моделей генерации и редактирования изображений на базе ИИ под названием Nano Banana, построенных на архитектуре Gemini 3. Nano Banana — это не самостоятельный инструмент преобразования текста в изображение, а система визуального исполнения, работающая в связке с базовым когнитивным ядром Gemini, способная преобразовывать плотные наборы данных, бренд-киты и сложные макеты в попиксельный вывод.

В настоящее время линейка продуктов включает три модели:

Модель

Официальное название

Скорость

Наилучшее применение

Nano BananaGemini 2.5 Flash ImageБыстроПовседневное редактирование, базовая генерация
Nano Banana ProGemini 3 Pro ImageМедленнееБрендовая работа, печать, точный вывод
Nano Banana 2Gemini 3.1 Flash ImageСамая быстрая (в 3 раза быстрее Pro)Быстрая итерация, социальный контент, модели

Nano Banana 2 — это не урезанная версия Pro, а другой инструмент для разных задач: скорость и количество против изысканности и точности.

Пользователи могут получить доступ к этим моделям через следующие платформы:

Платформа

Доступный контент

Приложение Gemini (iOS/Android/Web)Полный доступ, включая бесплатный уровень — самый простой способ начать
Google Search (AI Mode)Быстрая генерация в результатах поиска
Google LensСоздание изображений через функцию Lens Create
Google AI StudioТестирование разработчиками и эксперименты с промптами
Gemini API / Vertex AIПродуктовое развертывание, пакетные рабочие процессы, контроль управления
Google Slides ("Help me visualize")Встроенная генерация изображений в слайдах

Nano Banana 2 и Nano Banana Pro доступны бесплатно через приложение Gemini, но у Pro есть лимит на генерацию, после достижения которого приложение автоматически переключается на базовую модель.

Что касается ключевых характеристик: Nano Banana 2 (Gemini 3.1 Flash Image) генерирует каждое изображение за 2–5 секунд, максимальное разрешение 4K (4096×4096), предлагает нативные опции 512px, 1K и 2K, поддерживает 15 соотношений сторон (включая экстремальные форматы 8:1 и 1:8), до 4 персонажей в одной серии, до 14 ссылок на объекты в одном промпте, лимит входных токенов 131 072, лимит выходных токенов 32 768, точность рендеринга текста около 87%, функция поиска в реальном времени, стоимость одного изображения примерно на 75% дешевле, чем у Pro. Nano Banana Pro (Gemini 3 Pro Image) генерирует каждое изображение примерно за 10–15 секунд, нативное разрешение 4K, стандартные соотношения сторон (1:1, 16:9, 9:16, 4:3, 3:4, 21:9 и т.д.), до 5 персонажей, до 14 ссылок на объекты, лимит входных токенов 65 536, лимит выходных токенов 32 768, точность рендеринга текста около 64%, также поддерживает поиск в реальном времени и функцию фиксации стиля. Обе модели используют C2PA Content Credentials, невидимый цифровой водяной знак SynthID, многоязычную генерацию текста (более 10 языков), дата актуальности знаний — январь 2025 года, дополненная поиском в реальном времени.

Google предлагает пять фреймворков для промптов для получения наилучших результатов. Первый — текст в изображение (без референсов): формула: субъект + действие + место/фон + композиция + стиль. Пример промпта: «Уставший инженер-программист лет 30 с темными кругами под глазами, сидит за захламленным столом, окруженный пустыми чашками из-под кофе. Она смотрит на тускло светящийся зеленым монитор. Нижний ракурс, средний план. Кинематографичный тон, мягкие сине-зеленые оттенки, документальный свет.»

Второй — мультимодальная генерация (с референсными изображениями): формула: референсное изображение + указание на связь + новый сценарий. Пример промпта: «Используйте приложенное фото продукта в качестве объекта, а приложенную мудборд в качестве референса стиля. Разместите продукт в залитой солнцем обстановке прибрежного кафе. Сохраняйте точные пропорции продукта. Фотореалистичная сцена, качество редакционного уровня.»

Третий — редактирование изображений (диалоговое): пять основных глаголов редактирования: Добавить (Add), Удалить (Remove), Заменить (Replace), Изменить (Change), Сделать (Make). Профессиональный совет: всегда указывайте модели, что сохранить, а что изменить. Добавление фразы «сохранить лицо и одежду субъекта полностью неизменными» уменьшает дрейф вывода.

Четвертый — визуализация данных в реальном времени: Nano Banana 2 может получать информацию из сети в реальном времени и визуализировать ее. Пример промпта: «Найди сегодняшний индекс качества воздуха в Лондоне. Представь данные в виде чистой иллюстрированной панели приборов в стиле UI смартфона. Используй простую систему иконок: зеленый — хорошо, янтарный — средне, красный — плохо. Включи названия районов и временные метки.»

Функция данных в реальном времени перспективна, но не безошибочна: известно, что даты и статистика могут быть устаревшими. Перед публикацией следует перепроверять.

Пятый — пишите промпты как креативный директор: можно указывать варианты освещения (мягкий заполняющий свет, драматический, естественный теплый, чистый предметный), язык камеры и объектива (например, «снято на Fujifilm X100V, естественная цветопередача»), сокращения для цветокоррекции (ностальгический, эмоциональный кинематографичный, чистый коммерческий), подсказки по материалам и текстурам (например, «джинсовая куртка оверсайз в винтажном стиле, предварительно выстиранный индиго, следы потертостей на швах»).

Что касается рендеринга текста, точность текста у Nano Banana 2 в настоящее время является одной из лучших среди всех моделей AI-изображений. Для максимального эффекта: всегда заключайте текст для рендеринга в кавычки; указывайте шрифт или описывайте его; указывайте цвет и соотношение размеров; используйте трюк с приоритетом текста — сначала попросите Gemini сгенерировать текстовую копию, а затем запросите изображение, содержащее эту копию; напрямую указывайте целевой язык для локализации; не рекомендуется полагаться на нее для генерации длинного основного текста.

Краткий справочник по соотношениям сторон: 1:1 — для постов в Instagram, фото профиля; 16:9 — для миниатюр YouTube, презентаций; 9:16 — для Reels, TikTok, историй, мобильной рекламы; 4:5 — для ленты Instagram (лучший формат для вовлечения); 21:9 — для широкоэкранного кино, баннеров на сайтах; 8:1 (только Nano Banana 2) — для сверхшироких шапок сайтов, баннеров в email-рассылках; 1:8 (только NB2) — для вертикальных мобильных креативов, боковых графиков; 3:2 — для стандарта печатной фотографии; 4:3 — для слайдов презентаций.

Руководство по выбору модели: выбирайте Nano Banana 2 для — быстрой итерации, социальных сетей, веб-графики, необходимости в читаемом тексте (ее точность текста выше, чем у Pro), чувствительности к стоимости (на 75% дешевле), необходимости в экстремальных соотношениях сторон, пакетной сборки; выбирайте Nano Banana Pro для — печати или крупноформатных дисплеев, сложных сцен с несколькими субъектами, требующих максимальной реалистичности, важности консистентности бренда в больших партиях изображений, высококлассной предметной фотосъемки, длинных и узкоспециализированных промптов.

Частые ошибки и способы их решения: слияние или искажение лиц (размытый референсный промпт, добавьте «сохранять каждого визуально уникальным»); слишком много пальцев (перегенерировать или кадрировать композицию); дрейф стиля (включайте в промпт консистентную фразу о стиле или ссылайтесь на предыдущий вывод); искаженный текст (используйте кавычки, указывайте шрифт, делайте текст коротким); устаревшие данные в реальном времени (проверяйте вручную); вывод игнорирует часть промпта (разбейте на последовательные промпты); размытое изображение (добавьте «четкий фокус, высокая резкость»); сброс соотношения сторон на значение по умолчанию (указывайте пропорцию в начале промпта).

Что касается водяных знаков и обнаружения AI, каждое изображение, сгенерированное Nano Banana, содержит два слоя: SynthID — невидимый попиксельный цифровой водяной знак, незаметный для человеческого глаза, но считываемый инструментами обнаружения. Функция верификации SynthID в приложении Gemini была использована более 20 миллионов раз; C2PA Content Credentials — стандарт метаданных, записывающий способ создания изображения, включая участие AI. Функция верификации внедряется в приложение Gemini. Это означает, что изображения, созданные AI, технически идентифицируемы при использовании правильных инструментов, но водяные знаки не видны при беглом просмотре в социальных сетях.

Быстрые стартовые промпты включают: промпты для предметных моделей, графика для соцсетей с текстом, слайды для инфографики, серии с консистентными персонажами, реставрация фото, локализованные маркетинговые материалы и т.д.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
95% логистических компаний Испании увеличат цифровые инвестиции в этом году
2026-06-12
Немецкая Rohde & Schwarz планирует в 2027 году провести лётные испытания сети многодоменной связи
2026-06-12
Намибия и Ангола подписали меморандум о сотрудничестве в сфере ИКТ для ускорения цифровой трансформации
2026-06-12
Инструмент управления скриншотами на базе ИИ Pool запущен, привлёк $2 млн посевного финансирования
2026-06-12
Французская компания Alice & Bob представила систему Helium с 18 кубитами «кота Шрёдингера»
2026-06-12
Microsoft с открытым исходным кодом выпустила фреймворк SkillOpt для оптимизации навыков ИИ-агентов
2026-06-12
Американский DoorDash запускает ИИ-чатбота Ask DoorDash, позволяющего делать заказы по фото и подсказкам
2026-06-12
Capital One исследует путь масштабирования ИИ от исследований до производства
2026-06-12
Microsoft с открытым исходным кодом выпустила фреймворк для оценки ИИ-агентов предприятия ASSERT
2026-06-12
Немецкий дистрибьютор ADN включает TP-Link Omada в свой сетевой портфель
2026-06-12
Последние новости
1
95% логистических компаний Испании увеличат цифровые инвестиции в этом году
2
Немецкая Rohde & Schwarz планирует в 2027 году провести лётные испытания сети многодоменной связи
3
Американская компания Babcock & Wilcox совместно с TerraSpark построит угольную электростанцию мощностью 1,6 ГВт
4
Coates расширяет парк крупных генераторных установок в Австралии, планируя удвоить его мощность
5
Канадская компания Acceleware получила грант в 2 млн канадских долларов на развертывание технологии для тяжелой нефти в 2026 году
6
В штате Колорадо (США) подписан закон об утилизации аккумуляторов для электромобилей: к 2031 году уровень извлечения кобальта и никеля достигнет 90%
7
Газовая турбина №1 проекта второй очереди Сырдарьинской ТЭС в Узбекистане завершила 72-часовую эксплуатационную проверку надежности
8
В 2026 году в Китае прошла сертификацию установка для производства водорода мощностью 10 Нм³/ч, разработанная компаниями Yiwei Industry и CNOOC
9
Намибия и Ангола подписали меморандум о сотрудничестве в сфере ИКТ для ускорения цифровой трансформации
10
Аккумуляторные системы FranklinWH (США) участвуют в проекте виртуальной электростанции в Сан-Хосе