Американская компания Google выпустила три модели AI-генерации изображений Nano Banana_Глобальные новости

Американская компания Google выпустила три модели AI-генерации изображений Nano Banana

2026-06-11 14:10

В избр.

Репортаж от Wedoany，Компания Google представила серию моделей генерации и редактирования изображений на базе ИИ под названием Nano Banana, построенных на архитектуре Gemini 3. Nano Banana — это не самостоятельный инструмент преобразования текста в изображение, а система визуального исполнения, работающая в связке с базовым когнитивным ядром Gemini, способная преобразовывать плотные наборы данных, бренд-киты и сложные макеты в попиксельный вывод.

В настоящее время линейка продуктов включает три модели:

Модель	Официальное название	Скорость	Наилучшее применение
Nano Banana	Gemini 2.5 Flash Image	Быстро	Повседневное редактирование, базовая генерация
Nano Banana Pro	Gemini 3 Pro Image	Медленнее	Брендовая работа, печать, точный вывод
Nano Banana 2	Gemini 3.1 Flash Image	Самая быстрая (в 3 раза быстрее Pro)	Быстрая итерация, социальный контент, модели

Nano Banana 2 — это не урезанная версия Pro, а другой инструмент для разных задач: скорость и количество против изысканности и точности.

Пользователи могут получить доступ к этим моделям через следующие платформы:

Платформа	Доступный контент
Приложение Gemini (iOS/Android/Web)	Полный доступ, включая бесплатный уровень — самый простой способ начать
Google Search (AI Mode)	Быстрая генерация в результатах поиска
Google Lens	Создание изображений через функцию Lens Create
Google AI Studio	Тестирование разработчиками и эксперименты с промптами
Gemini API / Vertex AI	Продуктовое развертывание, пакетные рабочие процессы, контроль управления
Google Slides ("Help me visualize")	Встроенная генерация изображений в слайдах

Nano Banana 2 и Nano Banana Pro доступны бесплатно через приложение Gemini, но у Pro есть лимит на генерацию, после достижения которого приложение автоматически переключается на базовую модель.

Что касается ключевых характеристик: Nano Banana 2 (Gemini 3.1 Flash Image) генерирует каждое изображение за 2–5 секунд, максимальное разрешение 4K (4096×4096), предлагает нативные опции 512px, 1K и 2K, поддерживает 15 соотношений сторон (включая экстремальные форматы 8:1 и 1:8), до 4 персонажей в одной серии, до 14 ссылок на объекты в одном промпте, лимит входных токенов 131 072, лимит выходных токенов 32 768, точность рендеринга текста около 87%, функция поиска в реальном времени, стоимость одного изображения примерно на 75% дешевле, чем у Pro. Nano Banana Pro (Gemini 3 Pro Image) генерирует каждое изображение примерно за 10–15 секунд, нативное разрешение 4K, стандартные соотношения сторон (1:1, 16:9, 9:16, 4:3, 3:4, 21:9 и т.д.), до 5 персонажей, до 14 ссылок на объекты, лимит входных токенов 65 536, лимит выходных токенов 32 768, точность рендеринга текста около 64%, также поддерживает поиск в реальном времени и функцию фиксации стиля. Обе модели используют C2PA Content Credentials, невидимый цифровой водяной знак SynthID, многоязычную генерацию текста (более 10 языков), дата актуальности знаний — январь 2025 года, дополненная поиском в реальном времени.

Google предлагает пять фреймворков для промптов для получения наилучших результатов. Первый — текст в изображение (без референсов): формула: субъект + действие + место/фон + композиция + стиль. Пример промпта: «Уставший инженер-программист лет 30 с темными кругами под глазами, сидит за захламленным столом, окруженный пустыми чашками из-под кофе. Она смотрит на тускло светящийся зеленым монитор. Нижний ракурс, средний план. Кинематографичный тон, мягкие сине-зеленые оттенки, документальный свет.»

Второй — мультимодальная генерация (с референсными изображениями): формула: референсное изображение + указание на связь + новый сценарий. Пример промпта: «Используйте приложенное фото продукта в качестве объекта, а приложенную мудборд в качестве референса стиля. Разместите продукт в залитой солнцем обстановке прибрежного кафе. Сохраняйте точные пропорции продукта. Фотореалистичная сцена, качество редакционного уровня.»

Третий — редактирование изображений (диалоговое): пять основных глаголов редактирования: Добавить (Add), Удалить (Remove), Заменить (Replace), Изменить (Change), Сделать (Make). Профессиональный совет: всегда указывайте модели, что сохранить, а что изменить. Добавление фразы «сохранить лицо и одежду субъекта полностью неизменными» уменьшает дрейф вывода.

Четвертый — визуализация данных в реальном времени: Nano Banana 2 может получать информацию из сети в реальном времени и визуализировать ее. Пример промпта: «Найди сегодняшний индекс качества воздуха в Лондоне. Представь данные в виде чистой иллюстрированной панели приборов в стиле UI смартфона. Используй простую систему иконок: зеленый — хорошо, янтарный — средне, красный — плохо. Включи названия районов и временные метки.»

Функция данных в реальном времени перспективна, но не безошибочна: известно, что даты и статистика могут быть устаревшими. Перед публикацией следует перепроверять.

Пятый — пишите промпты как креативный директор: можно указывать варианты освещения (мягкий заполняющий свет, драматический, естественный теплый, чистый предметный), язык камеры и объектива (например, «снято на Fujifilm X100V, естественная цветопередача»), сокращения для цветокоррекции (ностальгический, эмоциональный кинематографичный, чистый коммерческий), подсказки по материалам и текстурам (например, «джинсовая куртка оверсайз в винтажном стиле, предварительно выстиранный индиго, следы потертостей на швах»).

Что касается рендеринга текста, точность текста у Nano Banana 2 в настоящее время является одной из лучших среди всех моделей AI-изображений. Для максимального эффекта: всегда заключайте текст для рендеринга в кавычки; указывайте шрифт или описывайте его; указывайте цвет и соотношение размеров; используйте трюк с приоритетом текста — сначала попросите Gemini сгенерировать текстовую копию, а затем запросите изображение, содержащее эту копию; напрямую указывайте целевой язык для локализации; не рекомендуется полагаться на нее для генерации длинного основного текста.

Краткий справочник по соотношениям сторон: 1:1 — для постов в Instagram, фото профиля; 16:9 — для миниатюр YouTube, презентаций; 9:16 — для Reels, TikTok, историй, мобильной рекламы; 4:5 — для ленты Instagram (лучший формат для вовлечения); 21:9 — для широкоэкранного кино, баннеров на сайтах; 8:1 (только Nano Banana 2) — для сверхшироких шапок сайтов, баннеров в email-рассылках; 1:8 (только NB2) — для вертикальных мобильных креативов, боковых графиков; 3:2 — для стандарта печатной фотографии; 4:3 — для слайдов презентаций.

Руководство по выбору модели: выбирайте Nano Banana 2 для — быстрой итерации, социальных сетей, веб-графики, необходимости в читаемом тексте (ее точность текста выше, чем у Pro), чувствительности к стоимости (на 75% дешевле), необходимости в экстремальных соотношениях сторон, пакетной сборки; выбирайте Nano Banana Pro для — печати или крупноформатных дисплеев, сложных сцен с несколькими субъектами, требующих максимальной реалистичности, важности консистентности бренда в больших партиях изображений, высококлассной предметной фотосъемки, длинных и узкоспециализированных промптов.

Частые ошибки и способы их решения: слияние или искажение лиц (размытый референсный промпт, добавьте «сохранять каждого визуально уникальным»); слишком много пальцев (перегенерировать или кадрировать композицию); дрейф стиля (включайте в промпт консистентную фразу о стиле или ссылайтесь на предыдущий вывод); искаженный текст (используйте кавычки, указывайте шрифт, делайте текст коротким); устаревшие данные в реальном времени (проверяйте вручную); вывод игнорирует часть промпта (разбейте на последовательные промпты); размытое изображение (добавьте «четкий фокус, высокая резкость»); сброс соотношения сторон на значение по умолчанию (указывайте пропорцию в начале промпта).

Что касается водяных знаков и обнаружения AI, каждое изображение, сгенерированное Nano Banana, содержит два слоя: SynthID — невидимый попиксельный цифровой водяной знак, незаметный для человеческого глаза, но считываемый инструментами обнаружения. Функция верификации SynthID в приложении Gemini была использована более 20 миллионов раз; C2PA Content Credentials — стандарт метаданных, записывающий способ создания изображения, включая участие AI. Функция верификации внедряется в приложение Gemini. Это означает, что изображения, созданные AI, технически идентифицируемы при использовании правильных инструментов, но водяные знаки не видны при беглом просмотре в социальных сетях.

Быстрые стартовые промпты включают: промпты для предметных моделей, графика для соцсетей с текстом, слайды для инфографики, серии с консистентными персонажами, реставрация фото, локализованные маркетинговые материалы и т.д.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

США

Информация и коммуникация Искусственный интеллект

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com

Предыдущий：В китайской провинции Хэбэй начат сбор заявок на применение «Робот+» на 2026 год, охватывающий десять ключевых областей

Следующий：Американский разработчик инструментов для кодирования с ИИ Cursor открывает европейскую штаб-квартиру в Лондоне, планируя увеличить штат до около 200 сотрудников к концу года