Huawei и China Mobile Hubei завершили проверку коммерческой сети для ускорения вывода ИИ
2026-06-29 10:47
В избр.

Репортаж от Wedoany,Huawei совместно с China Mobile Hubei впервые в китайской телекоммуникационной отрасли завершила проверку коммерческой сети для решения по ускорению вывода ИИ (AI Inference Acceleration Solution). Этот результат был представлен на выставке MWC Shanghai 2026, проходившей с 24 по 26 июня в павильоне N1 Шанхайского нового международного выставочного центра (SNIEC).

Панорама мероприятия Huawei на MWC Shanghai 2026

С развитием ИИ-приложений в сторону агентного режима всё чаще возникают сценарии, требующие обработки длинного контекста, такие как генерация кода и многораундовые диалоги. Однако ограниченная ёмкость встроенной памяти и DRAM приводит к снижению частоты попаданий в KV-кэш (кэш ключ-значение), что влияет на производительность вывода.

Huawei построила решение на основе хранилища OceanStor A800, Ascend A3 SuperPOD и унифицированного менеджера кэша (UCM, Unified Cache Manager), выпущенного в 2025 году. UCM использует внешнее высокопроизводительное хранилище для реализации KV-кэша на уровне петабайт, преодолевая ограничения ёмкости встроенной памяти и DRAM. Система осуществляет многоуровневое управление и планирование KV-кэша на всём жизненном цикле, расширяет окно контекста одного диалога, а в многораундовых диалогах повторно использует исторический KV-кэш, устраняя повторные вычисления и снижая затраты на вывод.

Проверка проводилась в коммерческой сети China Mobile Hubei с использованием фреймворка vLLM-Ascend для тестирования моделей MiniMax M2.5 и GLM-5.1 при длинных последовательностях от 8K до 190K токенов. Время генерации первого токена (TTFT, Time To First Token) модели GLM-5.1 улучшилось на 51–93%, а количество токенов в секунду (TPS, Tokens Per Second) на каждый NPU увеличилось на 56–372%. По длине последовательности: при 64K TPS вырос на 313%, при 128K — на 372%. Для модели MiniMax M2.5 после применения UCM TTFT улучшилось на 26–62%, TPS при 64K вырос на 58%, при 128K — на 78%. С увеличением длины контекста эффект ускорения данного решения становится ещё более заметным.

Представитель China Mobile Hubei отметил, что провинция Хубэй находится в ключевом регионе с задержкой до восьми национальных вычислительных узлов всего 10 миллисекунд. В сценариях взаимодействия ИИ-агентов и генерации кода данное решение позволяет повысить пропускную способность более чем на 50%, закладывая основу для масштабного развёртывания ИИ-услуг. Майкл Цю, президент глобального отдела маркетинга и продаж решений для хранения данных Huawei, отметил, что с запуском операторами тарифов на токены массовое развёртывание ИИ-агентов вступает в новую фазу, и ожидается экспоненциальный рост потребления токенов.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Пятнадцатая пятилетка Китая в сфере образования предусматривает внедрение обучения ИИ на всех уровнях
2026-06-29
SK Telecom из Южной Кореи инвестирует 257 миллионов долларов в дочернюю компанию SK Hynix по производству NAND
2026-06-29
Китайская компания Huadong数控 впервые получила мелкосерийный заказ на круглошлифовальный станок для полупроводниковой промышленности
2026-06-29
Китайская академия информационных и коммуникационных технологий (CAICT) получила одобрение на совместное создание «Пекинской ключевой лаборатории космических интеллектуальных вычислительных систем»
2026-06-29
Китайская компания Yongshuo Electronics инвестирует 10,3 млрд юаней в расширение третьей фазы проекта по высококлассной упаковке и тестированию интегральных схем
2026-06-29
Китайская компания Neolix учредила компанию Zhida Technology в Цюаньчжоу
2026-06-29
Китайская компания Wujie Power выпустила воплощённую интеллектуальную модель MWA, заняв первое место в RoboCasa с результатом 75,2%
2026-06-29
Китайская Kunlun Chip, дочерняя компания Baidu, планирует IPO в Гонконге с оценкой в 50 миллиардов долларов
2026-06-29
AWS США повышает цены на Capacity Blocks EC2 с июля
2026-06-29
Китайская компания SpeedBot Robotics привлекла сотни миллионов юаней для развития промышленного воплощённого интеллекта
2026-06-29
Последние новости
1
Британский балтийский индекс сухих грузовых перевозок упал до 2524 пунктов по состоянию на 26 июня
2
Переговоры по контрактам на строительство HS2 в Великобритании нацелены на экономию 2 млрд фунтов стерлингов
3
Португальская TAP: выбранный инвестор возьмёт управление в 2026 году, вливание капитала в 2027 году
4
Министерство транспорта КНР впервые самостоятельно провело оценку профессиональной квалификации работников по обслуживанию навигационных знаков
5
В Гуанси-Чжуанском автономном районе началась цифровая трансформация 5081 км автомобильных и водных путей
6
Создание водородного кластера в Хамбере (Великобритания) может высвободить экономический потенциал в 17 миллиардов фунтов стерлингов
7
Axvik Group приобретает Pentaxia, расширяя производственные мощности по композитам в Великобритании
8
Португальская TML интегрирует информацию о дорожном движении в реальном времени в Большом Лиссабоне
9
В Великобритании началось строительство промышленного объекта площадью 10,5 тыс. кв. футов в Солфорде
10
Amey получила контракт на 700 миллионов фунтов стерлингов от лондонского транспорта на инфраструктурные работы с 2026 года