Репортаж от Wedoany,Исследовательский отдел CITIC Securities опубликовал отчет 16 апреля 2026 года, в котором отмечается, что взрывной рост AI-приложений, таких как Agent и мультимодальные системы, привел к резкому увеличению вызовов Token, что, в свою очередь, вызвало дефицит вычислительных мощностей в Китае. Активная адаптация китайских больших моделей для задач логического вывода (inference) создает возможности для ускоренного роста объемов поставок для китайских производителей вычислительных мощностей. CITIC Securities прогнозирует, что в 2026 году поставки китайских чипов для вычислений вырастут как минимум вдвое, что обеспечит мощный импульс роста для компаний, занимающихся проектированием вычислительных мощностей, передовыми технологическими процессами, передовой упаковкой, передовой памятью и сопутствующими производственными цепочками.
Согласно анализу отчета, ажиотаж вокруг OpenClaw и распространение мультимодальных AI-приложений являются двумя ключевыми катализаторами ускорения роста спроса на вычислительные мощности. Потребление Token для одной задачи AI Agent, такого как OpenClaw, в 10-100 раз превышает потребление ChatBot. Китайские производители активно выходят на этот рынок, запуская продукты, аналогичные OpenClaw, что еще больше ускоряет их распространение и повышает спрос на соответствующие вычислительные мощности. Продолжают набирать популярность мультимодальные AI-приложения, такие как генерация изображений и видео по тексту. По сравнению с чисто текстовым диалогом, потребление Token для одного взаимодействия при вводе/генерации изображений и распознавании/генерации видео обычно увеличивается на порядок величины. Быстрое развитие китайских мультимодальных больших моделей, таких как Seedance от ByteDance, способствует ускоренному росту популярности мультимодальных AI-приложений в Китае. Данные OpenRouter, крупнейшей в мире платформы агрегации API, показывают, что совокупное еженедельное потребление Token в апреле 2026 года увеличилось примерно в 7-8 раз по сравнению с показателем годовой давности, причем основным драйвером этого роста стали китайские большие модели, чья доля на рынке в настоящее время составляет около 40%.
Взрывной рост вызовов Token привел к резкому всплеску спроса на вычислительные мощности, в то время как предложение, ограниченное различными факторами, имеет ограниченный краткосрочный потенциал роста. В настоящее время в Китае наблюдается серьезный дефицит вычислительных мощностей. В марте Tencent Cloud повысила цены на ключевые модели серии Hunyuan более чем на 430%, а в апреле увеличила опубликованные цены на продукты, такие как AI-вычисления, контейнерные сервисы и Elastic MapReduce, примерно на 5%. При использовании китайских больших моделей, таких как Kimi, часто появляется сообщение «Недостаточно вычислительных мощностей в часы пик». На рынке аренды вычислительных мощностей для бизнеса растут цены на аренду AI-чипов. По данным SemiAnalysis, цена годового контракта на аренду H100 выросла с минимума около 1,70 доллара США в час/GPU в октябре 2025 года до 2,35 доллара США в час/GPU в марте 2026 года, что составляет рост почти на 40%. С февраля ведущие китайские облачные провайдеры и разработчики моделей публично заявляют о нехватке вычислительных ресурсов.
Китайские вычислительные мощности получают возможность для ускоренного роста объемов поставок в сегменте логического вывода (inference). CITIC Securities отмечает, что спрос на AI-чипы можно разделить на обучение (training) и логический вывод (inference). В настоящее время взрывной рост приложений Agent и мультимодальных систем в значительной степени стимулирует спрос на вычислительные мощности для логического вывода. С точки зрения сложности внедрения китайских вычислительных решений, требования к общей производительности продуктов для задач логического вывода ниже по сравнению с задачами обучения. Китайские производители чипов для вычислений, благодаря тесному сотрудничеству с интернет-компаниями и оптимизации под конкретные потребности, могут предложить более подходящие чипы для логического вывода, соответствующие запросам интернет-компаний. Темпы импортозамещения в этом сегменте продвигаются быстрее, чем в сегменте обучения. В настоящее время китайские большие модели уже начали активно адаптироваться к использованию китайских чипов для вычислений в задачах логического вывода. Модель GLM-5 от Zhipu завершила глубокую адаптацию и оптимизацию на уровне операторов для основных китайских платформ, таких как Huawei Ascend, Moore Threads, Cambricon, Kunlunxin, MetaX, Enflame и Hygon. Модель DeepSeek V4 впервые реализовала глубокую адаптацию к китайским чипам, таким как Huawei Ascend.
На политическом уровне продолжается поддержка производственной цепочки китайских вычислительных мощностей. Управление промышленности и информатизации Шэньчжэня в марте 2026 года опубликовало «План действий по ускорению высококачественного развития производственной цепочки серверов искусственного интеллекта в Шэньчжэне (2026–2028 гг.)», который фокусируется на восьми ключевых областях. План поддерживает ускоренное внедрение и итерацию ключевых чипов, таких как китайские GPU, NPU, CPU и DPU, ускоряет прорывы в технологиях передовой упаковки чипов памяти, уделяет особое внимание развитию высококлассных продуктов памяти, таких как корпоративные SSD и модули оперативной памяти, а также усиливает исследования и разработки новых технологий, таких как упаковка рядом с памятью (near-memory packaging) и вычисления в памяти (compute-in-memory). По оценкам CCID Consulting, к 2026 году общий объем вычислительных мощностей Китая превысит 1200 EFLOPS, что прочно закрепит страну на втором месте в мире, при этом доля интеллектуальных вычислений (AI compute) приблизится к 90%.
Данные China Commercial Industry Research Institute показывают, что в период с 2026 по 2030 год китайский рынок GPU войдет в фазу быстрого роста объемов поставок, при этом ожидается, что размер рынка увеличится с 205 млрд юаней до 542 млрд юаней. Ожидается, что примерно к 2028 году доля китайских GPU на рынке логического вывода превысит 40%, а на рынке обучения — 25%. После 2027 года, с началом массового производства китайских GPU по 3-нм технологическому процессу и распространением технологии Chiplet, удельная стоимость вычислений снизится более чем на 30%, что будет способствовать превращению GPU из высокотехнологичного научного оборудования в универсальный инструмент производительности.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









