Американская компания Google открыла исходный код текстовой диффузионной модели DiffusionGemma_Глобальные новости

Американская компания Google открыла исходный код текстовой диффузионной модели DiffusionGemma

2026-06-11 08:51

В избр.

Репортаж от Wedoany，10 июня американская компания Google выпустила экспериментальную модель с открытым исходным кодом DiffusionGemma. Модель использует архитектуру текстовой диффузии, распространяется по лицензии Apache 2.0 и предназначена для исследователей и разработчиков, желающих изучить сценарии локального быстрого вывода, интерактивной генерации текста и низкой конкурентной нагрузки. На специализированных GPU скорость генерации текста этой модели до 4 раз выше, чем у традиционных авторегрессионных больших языковых моделей.

Технический подход DiffusionGemma отличается от распространенных больших языковых моделей. Традиционные авторегрессионные модели обычно генерируют токены последовательно слева направо, и чем длиннее текст, тем заметнее задержка при ожидании следующего вывода; DiffusionGemma же пытается сгенерировать каркас текста за один раз, а затем итеративно корректирует содержимое. Google спроектировала ее как модель-эксперт с общим количеством параметров 26B, при выводе активируется около 3,8B параметров, и после квантизации она может работать на высокопроизводительных потребительских GPU с объемом видеопамяти 18 ГБ. Для локальных разработчиков это означает, что модель не предназначена исключительно для крупномасштабного развертывания в облаке, но также может выполнять задачи быстрого редактирования, дополнения кода, перестановки текста и экспериментальной генерации на одной высокопроизводительной видеокарте.

Преимущество модели в скорости в основном обусловлено механизмом параллельной генерации. При каждом прямом вычислении DiffusionGemma может параллельно генерировать 256 токенов, что позволяет токенам внутри выходного блока взаимодействовать друг с другом и постоянно корректироваться в последующих итерациях. Такая структура подходит для встроенного редактирования, заполнения пропусков в коде, нелинейных текстовых структур, математических графиков и некоторых задач, требующих совместного контекста. Google сообщает, что на одном NVIDIA H100 DiffusionGemma может выдавать более 1000 токенов в секунду; на NVIDIA GeForce RTX 5090 — более 700 токенов в секунду.

Однако она не является заменой Gemma 4.

Позиционирование DiffusionGemma от Google весьма четкое: это экспериментальная модель, в первую очередь ориентированная на скорость и интерактивные локальные рабочие процессы, общее качество вывода ниже, чем у стандартной Gemma 4. Для приложений, требующих максимального качества генерации, стабильности и готовности к промышленному использованию, Google по-прежнему рекомендует использовать стандартную Gemma 4. Преимущества DiffusionGemma также применимы не во всех средах развертывания; в высоконагруженных облачных сервисах авторегрессионные модели могут эффективно использовать вычислительные мощности за счет пакетной обработки, и выгода от параллельного декодирования текстовой диффузии может снизиться, что даже может увеличить стоимость обслуживания. Другими словами, она больше подходит для сценариев с низкой и средней нагрузкой, локального использования одним пользователем или для сред разработки и экспериментов, а не для прямой замены основных облачных архитектур больших языковых моделей.

Тем не менее, этот релиз имеет важное значение для экосистемы информационно-коммуникационных технологий и разработки ИИ. Ранее диффузионные модели были более известны пользователям в контексте генерации изображений и видео, в то время как генерация текста долгое время доминировалась авторегрессионными архитектурами. DiffusionGemma объединяет подход текстовой диффузии с открытой экосистемой моделей Gemma, предоставляя разработчикам альтернативную экспериментальную платформу, ориентированную на скорость. С ростом спроса на локальный ИИ, персональные рабочие станции, AI PC и периферийные устройства, разработчикам все чаще требуется выполнять быструю генерацию, мгновенное редактирование и задачи, чувствительные к конфиденциальности, без зависимости от удаленного облака. Открытая лицензия также способствует продолжению экспериментов исследовательских институтов, производителей инструментов и разработчиков над архитектурой модели, механизмами вывода, схемами квантизации и методами тонкой настройки.

Влияние на производственную цепочку будет сосредоточено в области локального вывода ИИ, потребительских GPU, инструментов для разработчиков и платформ для обслуживания моделей. DiffusionGemma уже поддерживает получение весов через Hugging Face и может использоваться с такими инструментами, как MLX, vLLM, Hugging Face Transformers; Google также оптимизирует производительность совместно с NVIDIA на аппаратном стеке, охватывая потребительские видеокарты RTX, RTX PRO, а также корпоративные платформы Hopper и Blackwell. Последующие этапы включают оценку эффективности тонкой настройки разработчиками, прогресс поддержки в экосистеме, такой как llama.cpp, реальный опыт использования модели в дополнении кода и редактировании в реальном времени, а также возможность архитектуры текстовой диффузии продолжать сокращать разрыв в качестве вывода с высококачественными авторегрессионными моделями. Если этот путь продолжит развиваться, локальные приложения ИИ могут получить более быстрый отклик при генерации, а также это приведет к появлению новой технической ветви в экосистеме открытых моделей.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

США

Информация и коммуникация Искусственный интеллект

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com

Предыдущий：China Civil Engineering подписала контракт на проект центра обработки данных в Мадриде, Испания

Следующий：Amazon получила кредитную линию от Citigroup на 17,5 млрд долларов