Репортаж от Wedoany,Huawei Cloud представил стек «Agentic Infra» (агентная инфраструктура), предлагающий полный набор продуктов для вычислений, хранения данных и сетевого взаимодействия, предназначенный для поддержки крупномасштабного выполнения AI-агентов на облачной платформе на базе NPU. Этот шаг рассматривается как наиболее прямая на сегодняшний день попытка облачного провайдера конкурировать с NVIDIA в сфере AI-инфраструктуры.

На мероприятии Inspire в Шанхае Huawei Cloud представила AICS (AI Cluster Service), заявив, что он поддерживает вычислительные платформы с кластерами до 100 000 карт. Кластер работает на базе собственного протокола взаимосвязи UnifiedBus (UB) от Huawei, обеспечивая пропускную способность в 5 миллионов токенов в секунду между 1000 картами, общую вычислительную мощность в 200 EFLOPS (экзафлопс) и задержку генерации токенов менее 10 миллисекунд.
Huawei также представила решение для хранения данных под названием AMS (Agentic Memory Storage), которое обеспечивает расширение памяти для NPU-чипов и снижает затраты на логический вывод для долгосрочных агентных задач за счет многоуровневого кэширования ключ-значение (KV).
Другие компоненты стека включают планировщик CCE Volcano Next, который, объединяя, а не изолируя рабочие нагрузки обучения и логического вывода, якобы повышает использование ресурсов более чем на 30%; и AgentSphere — безопасную изолированную среду (песочницу), где пользователи могут запускать сотни тысяч экземпляров агентов в минуту.
Стек был представлен во время выступления доктора Питера Чжоу, члена совета директоров Huawei и генерального директора Huawei Cloud. Он заявил, что агентный AI ведет к фундаментальному сдвигу парадигмы вычислений. Huawei демонстрирует стек инфраструктуры на Inspire в то время, когда Китай стремится создать отечественные альтернативы, и этот гигант удваивает свои усилия в области вычислительных мощностей, используя рыночные возможности после запрета на импорт американских чипов. Хотя генеральный директор Huawei Жэнь Чжэнфэй прошлым летом признал, что их чипы отстают от американских аналогов на одно поколение, компания стремится быстро сократить разрыв. Принцип масштабирования их полупроводниковых проектов, Tau (τ), фокусируется на улучшении конструкции за счет уменьшения задержки распространения сигнала в чипах, а не на дальнейшем уменьшении транзисторов. Huawei уже использовала эту концепцию для проектирования около 381 чипа и объединит ее с архитектурой LogicFolding, которая уже повысила производительность τ на нескольких уровнях и имеет решающее значение для разработки серии процессоров Kirin.
В области моделей и агентов Huawei выпустила платформу моделей ModelArts Next, добавив Reinforcement Learning as a Service (RLaaS) и уровень маршрутизации моделей, который может динамически отправлять запросы наиболее подходящей задаче из более чем 20 моделей партнеров, включая системы DeepSeek, Zhipu AI и MiniMax. Huawei утверждает, что точность планирования этого механизма маршрутизации превышает 95%, а стоимость логического вывода снижается примерно на 20%. Список партнеров был официально оформлен как «Программа партнерства по AI-моделям». Huawei также выпустила корпоративную агентную платформу AgentArts, предназначенную для производственных, долгосрочных агентных задач, с открытой версией, кодовая база которой более чем на 90% совпадает с коммерческой версией, а также портал AgentArts Orchard для создания и развертывания агентов через интерфейс командной строки.
Huawei представила для стека специальный уровень безопасности, включающий аппаратное шифрование с собственным ключом (HYOK) и поддержку конфиденциальных вычислений между виртуальными машинами, обучением и логическим выводом, и заявила, что уже более 1000 дней не было серьезных инцидентов в обслуживании.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









