Американская компания Google открыла исходный код текстовой диффузионной модели DiffusionGemma
2026-06-11 08:51
В избр.

Репортаж от Wedoany,10 июня американская компания Google выпустила экспериментальную модель с открытым исходным кодом DiffusionGemma. Модель использует архитектуру текстовой диффузии, распространяется по лицензии Apache 2.0 и предназначена для исследователей и разработчиков, желающих изучить сценарии локального быстрого вывода, интерактивной генерации текста и низкой конкурентной нагрузки. На специализированных GPU скорость генерации текста этой модели до 4 раз выше, чем у традиционных авторегрессионных больших языковых моделей.

Технический подход DiffusionGemma отличается от распространенных больших языковых моделей. Традиционные авторегрессионные модели обычно генерируют токены последовательно слева направо, и чем длиннее текст, тем заметнее задержка при ожидании следующего вывода; DiffusionGemma же пытается сгенерировать каркас текста за один раз, а затем итеративно корректирует содержимое. Google спроектировала ее как модель-эксперт с общим количеством параметров 26B, при выводе активируется около 3,8B параметров, и после квантизации она может работать на высокопроизводительных потребительских GPU с объемом видеопамяти 18 ГБ. Для локальных разработчиков это означает, что модель не предназначена исключительно для крупномасштабного развертывания в облаке, но также может выполнять задачи быстрого редактирования, дополнения кода, перестановки текста и экспериментальной генерации на одной высокопроизводительной видеокарте.

Преимущество модели в скорости в основном обусловлено механизмом параллельной генерации. При каждом прямом вычислении DiffusionGemma может параллельно генерировать 256 токенов, что позволяет токенам внутри выходного блока взаимодействовать друг с другом и постоянно корректироваться в последующих итерациях. Такая структура подходит для встроенного редактирования, заполнения пропусков в коде, нелинейных текстовых структур, математических графиков и некоторых задач, требующих совместного контекста. Google сообщает, что на одном NVIDIA H100 DiffusionGemma может выдавать более 1000 токенов в секунду; на NVIDIA GeForce RTX 5090 — более 700 токенов в секунду.

Однако она не является заменой Gemma 4.

Позиционирование DiffusionGemma от Google весьма четкое: это экспериментальная модель, в первую очередь ориентированная на скорость и интерактивные локальные рабочие процессы, общее качество вывода ниже, чем у стандартной Gemma 4. Для приложений, требующих максимального качества генерации, стабильности и готовности к промышленному использованию, Google по-прежнему рекомендует использовать стандартную Gemma 4. Преимущества DiffusionGemma также применимы не во всех средах развертывания; в высоконагруженных облачных сервисах авторегрессионные модели могут эффективно использовать вычислительные мощности за счет пакетной обработки, и выгода от параллельного декодирования текстовой диффузии может снизиться, что даже может увеличить стоимость обслуживания. Другими словами, она больше подходит для сценариев с низкой и средней нагрузкой, локального использования одним пользователем или для сред разработки и экспериментов, а не для прямой замены основных облачных архитектур больших языковых моделей.

Тем не менее, этот релиз имеет важное значение для экосистемы информационно-коммуникационных технологий и разработки ИИ. Ранее диффузионные модели были более известны пользователям в контексте генерации изображений и видео, в то время как генерация текста долгое время доминировалась авторегрессионными архитектурами. DiffusionGemma объединяет подход текстовой диффузии с открытой экосистемой моделей Gemma, предоставляя разработчикам альтернативную экспериментальную платформу, ориентированную на скорость. С ростом спроса на локальный ИИ, персональные рабочие станции, AI PC и периферийные устройства, разработчикам все чаще требуется выполнять быструю генерацию, мгновенное редактирование и задачи, чувствительные к конфиденциальности, без зависимости от удаленного облака. Открытая лицензия также способствует продолжению экспериментов исследовательских институтов, производителей инструментов и разработчиков над архитектурой модели, механизмами вывода, схемами квантизации и методами тонкой настройки.

Влияние на производственную цепочку будет сосредоточено в области локального вывода ИИ, потребительских GPU, инструментов для разработчиков и платформ для обслуживания моделей. DiffusionGemma уже поддерживает получение весов через Hugging Face и может использоваться с такими инструментами, как MLX, vLLM, Hugging Face Transformers; Google также оптимизирует производительность совместно с NVIDIA на аппаратном стеке, охватывая потребительские видеокарты RTX, RTX PRO, а также корпоративные платформы Hopper и Blackwell. Последующие этапы включают оценку эффективности тонкой настройки разработчиками, прогресс поддержки в экосистеме, такой как llama.cpp, реальный опыт использования модели в дополнении кода и редактировании в реальном времени, а также возможность архитектуры текстовой диффузии продолжать сокращать разрыв в качестве вывода с высококачественными авторегрессионными моделями. Если этот путь продолжит развиваться, локальные приложения ИИ могут получить более быстрый отклик при генерации, а также это приведет к появлению новой технической ветви в экосистеме открытых моделей.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Немецкая GIZ и город Дюссельдорф получили премию «Инновации создают преимущества»
2026-06-11
Американская компания Leaf привлекла $13 млн в рамках раунда B для продвижения ИИ-приложений в сельском хозяйстве
2026-06-11
Саммит по устойчивой упаковке 2026 года сосредоточится на PPWR, инновациях и искусственном интеллекте
2026-06-11
Венесуэльская компания LataMed AI сотрудничает с медицинским факультетом Центрального университета Венесуэлы для продвижения медицинских технологий и образования в области ИИ
2026-06-11
Американский AI-стартап по кодингу Niteshift привлёк $7 млн посевных инвестиций
2026-06-11
Американская Warner Music приобретает стартап по обеспечению соответствия ИИ Sureel
2026-06-11
Mitsubishi Electric представляет пятое поколение SiC MOSFET с пониженным на 25% сопротивлением в открытом состоянии
2026-06-11
Американская компания в сфере корпоративного ИИ Jedify завершила раунд финансирования серии A на сумму 24 миллиона долларов
2026-06-11
Американский разработчик инструментов для кодирования с ИИ Cursor открывает европейскую штаб-квартиру в Лондоне, планируя увеличить штат до около 200 сотрудников к концу года
2026-06-11
Американская компания Google выпустила три модели AI-генерации изображений Nano Banana
2026-06-11
Последние новости
1
Совет сообщества Ллангатток подал заявку на строительство кафе, магазина и общественного центра
2
Индийская Oberoi выплатила 2,47 млрд рупий в качестве первого взноса за аренду 11 акров земли в Мумбаи
3
Afcons выиграла тендер на строительство волнолома длиной 10,14 км в Индии
4
Земснаряд Jan De Nul отправится в Гайану для дноуглубительных работ в порту Джорджтауна
5
Liebherr поставит шесть морских кранов для проекта TenneT 2029 года в Нидерландах
6
T12 Engineering поставила 60-тонную подводную конструкцию для проекта в Норвежском море
7
Система парусного движителя Anemoi с роторными цилиндрами получила принципиальное одобрение для танкеров MR
8
H2DO запускает технико-экономическое обоснование морского «зеленого» водорода мощностью 30–50 МВт в голландском секторе Северного моря
9
В Торонто (Канада) составлен рейтинг пяти доступных сантехнических компаний
10
Два крупных государственных предприятия Индии планируют приобрести активы по добыче коксующегося угля в России