Китайская команда завершила пост-тренировку полных параметров модели с триллионом параметров на основе отечественных вычислительных мощностей
2026-06-09 13:54
В избр.

Репортаж от Wedoany,Команда проекта платформы AI-тренировок Шэньчжэньского колледжа Хэтао совместно с Харбинским технологическим институтом (Шэньчжэнь), Шэньчжэньским институтом больших данных, Huawei GTS (Global Technical Services) и другими организациями провела совместные исследования по тренировке крупных моделей на отечественных вычислительных мощностях. На основе кластера отечественных вычислительных мощностей Ascend 910C в течение одного месяца была успешно реализована стабильная работа полной параметрической непрерывной тренировки и SFT (Supervised Fine-Tuning) модели DeepSeek-V4-Pro. Общее количество шагов тренировки превысило 1500, MFU (Model FLOPS Utilization) модели превысил 30%, а эффективность ключевых тренировочных операторов повысилась примерно на 14%.

Это первая в отрасли инженерная практика пост-тренировки полных параметров DeepSeek-V4-Pro, выполненная сторонней организацией на основе кластера отечественных вычислительных мощностей, что знаменует переход отечественной AI-инфраструктуры от этапа развертывания вывода и легковесной тонкой настройки к этапу пост-тренировки полных параметров сверхбольших моделей.

DeepSeek-V4-Pro — это флагманская модель с открытым исходным кодом MoE (Mixture of Experts) с 1,6 триллиона параметров, использующая инновационные механизмы, такие как гибридное разреженное внимание CSA+HCA и соединение mHC. По сравнению с предыдущим поколением DeepSeek-V3/R1, она предъявляет более высокие требования к отечественным тренировочным фреймворкам.

В ходе совместных исследований была достигнута стабильная работа пост-тренировки полных параметров DeepSeek-V4-Pro на кластере отечественных вычислительных мощностей Ascend 910C с тысячами карт. Модель прошла более 1500 шагов итерации без пропусков итераций или аномалий NaN. Эффективность ключевых тренировочных операторов повысилась примерно на 14% по сравнению с начальной версией, конечный MFU стабильно достиг 34,9%, а время одного шага тренировки стабильно составило 27 секунд. Команда также завершила полный конвейер непрерывной тренировки и SFT для DeepSeek-V4-Flash.

Результаты проекта обладают воспроизводимой и инженерно-реализуемой способностью стабильной тренировки триллионной MoE-модели на отечественных вычислительных мощностях. Уже завершена замкнутая проверка промышленного сценария автоматизированного операционного моделирования, что свидетельствует о способности отечественных вычислительных мощностей выполнять специализированное усиленное обучение отраслевых крупных моделей в короткие сроки и с низкими затратами.

На техническом уровне проект достиг трех прорывов: во-первых, успешно построена схема распределенного хранения, охватывающая состояния весов, градиентов, активаций и оптимизаторов, обеспечивающая совместную работу параллелизма данных, тензорного параллелизма, конвейерного параллелизма и параллелизма экспертов; во-вторых, оптимизированы операторы маршрутизации MoE и разреженного внимания, создан механизм балансировки нагрузки экспертов, эффективно смягчающий коммуникационные заторы и дисбаланс нагрузки; в-третьих, построена система долгосрочного мониторинга с полной визуализацией показателей, при этом в ходе многодневной непрерывной тренировки не наблюдалось потери управления Loss или значений NaN.

На этапе проверки возможностей проект разработал эксперимент по усилению способности крупной модели к математическому моделированию. Команда создала рабочий процесс генерации данных SFT-моделирования, получив 3000 высококачественных образцов SFT для задач математического моделирования, охватывающих 4 типа целевых задач и 3 формы постановки задач. Результаты тренировки показали: LM Loss модели сошелся к 0,2056, MTP 1 Loss сошелся к 0,2538, кривая градиента стабильна. Оценка Benchmark показала, что четыре ключевых показателя модели были полностью улучшены, при этом ORGEval WL повысился более чем на 5 процентных пунктов, а способности к сложным рассуждениям и моделированию значительно усилились.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Американская компания Lantronix совместно с британской Cherry & White представила платформу быстрого Wi-Fi
2026-06-10
Правительство Великобритании выделяет 20 миллионов фунтов стерлингов на цифровизацию офтальмологических направлений
2026-06-10
Американская компания FingerMotion и BlueFlare создают сеть вычислительных узлов для ИИ-выводов в Канаде
2026-06-10
Американская компания Skyworks демонстрирует новую технологию цепочки питания для стоек ИИ
2026-06-10
Китай опубликовал национальный стандарт по применению облачных вычислений в GLP-лабораториях
2026-06-10
В Монреале (Канада) на 100 перекрестках внедрена платформа безопасности дорожного движения на основе ИИ
2026-06-10
Министр внутренних дел и по делам сотрудничества Индии Амит Шах запускает единую цифровую платформу для сухопутных пунктов пропуска страны
2026-06-10
Китай построил первый в мире подводный центр обработки данных мощностью 24 МВт, работающий на энергии ветра, инвестиции составили 1,6 млрд юаней
2026-06-10
Министерство промышленности и информатизации Китая предложило повысить качество услуг выделенных линий для подключения к вычислительным мощностям искусственного интеллекта
2026-06-10
Китайская компания Moore Threads открыла исходный код модели MusaCoder для генерации кода GPU-операторов
2026-06-10
Последние новости
1
Американская компания Lantronix совместно с британской Cherry & White представила платформу быстрого Wi-Fi
2
Проект расширения производства Medline в Словакии планируется запустить в 2027 году
3
Правительство Великобритании выделяет 20 миллионов фунтов стерлингов на цифровизацию офтальмологических направлений
4
Американская компания Incyte инвестирует до 2 миллиардов долларов в расширение портфеля препаратов для лечения заболеваний крови
5
Новые правила оценки здравоохранения в Испании получили поддержку Sanofi и других компаний
6
Компания Waters Corporation (США) представляет платформу колонок для разработки GLP-1/LNP
7
Американская компания FingerMotion и BlueFlare создают сеть вычислительных узлов для ИИ-выводов в Канаде
8
Завод GMP-2 компании Chime Biologics в Ухане введен в эксплуатацию, планируется создание AI-управляемого суперзавода
9
FDA США присвоило lasme-cel статус передовой терапии регенеративной медицины
10
Рынок лечения пневмонии в США продолжает расширяться, в 2025 году его доля займет первое место в мире