Репортаж от Wedoany,Китайская академия информационных и коммуникационных технологий (CAICT) отмечает, что облачные вычисления переходят от этапа «интеграции ИИ» к этапу «автономии ИИ». Технология агентов (Agent) стимулирует переход облачных сервисов от предоставления «ресурсов» к поставке «возможностей», порождая технологическую парадигму Agentic Cloud.
За последние 20 лет облачные вычисления прошли четыре этапа: виртуализация, платформизация, облачная нативность и интеграция ИИ. В основе этих этапов лежал принцип «пулинга ресурсов и предоставления по требованию», в рамках которого предоставлялись ресурсы инфраструктуры. Начиная с 2026 года, крупные языковые модели и технологии агентов вступили в фазу масштабного промышленного развертывания. Ведущие мировые облачные провайдеры пришли к консенсусу: основным потребителем облачных услуг становится не человек, а агент. В апреле-мае 2026 года Google на конференции Next‘26 представил стратегию Agentic Cloud, анонсировав Agent Engine и Agentic Data Cloud; Alibaba Cloud объявила о завершении полномасштабной модернизации своего стека в пользу агентов; Amazon запустила AgentCore для независимой от модели оркестрации агентов; сервис Foundry Agent Service от Microsoft поступил в коммерческую эксплуатацию. Такая высокая степень синхронизации действий разных вендоров из разных регионов свидетельствует о том, что Agentic Cloud перешел от стадии концептуального обсуждения к этапу промышленного внедрения.
Agentic Cloud — это новое поколение систем облачных вычислений, основанное на облачных вычислительных ресурсах, с возможностями больших языковых моделей в качестве ядра и сервисами агентов в качестве базовых единиц. Оно способно понимать намерения пользователя и самостоятельно выполнять сложные задачи. Его технологическая архитектура переходит от «контейнеризации» к AI-нативной облачной среде выполнения. Типичная задача агента представляет собой многораундовый замкнутый цикл взаимодействия «восприятие-рассуждение-действие-обратная связь», включающий десятки цепочечных вызовов моделей для рассуждений и множество раундов выполнения внешних инструментов. Время жизни задачи увеличивается с миллисекунд до минут, часов и даже дней. Это требует полномасштабной технологической переработки — от чипов до приложений: на уровне чипов TPU v6e от Google спроектированы специально для сценариев вывода, а Trainium2 от Amazon оптимизирует энергоэффективность для крупномасштабных кластеров вывода; на уровне облачной инфраструктуры ведущие провайдеры запускают управляемые среды выполнения агентов, такие как Agent Engine и AgentCore, поддерживающие автоматическое масштабирование, сохранение состояния и независимую от модели оркестрацию; на уровне облачной платформы, используя такие технологии, как квантование и сжатие, спекулятивное декодирование, разделение KV-кэша и конвейеры вывода, задержка одного вывода сокращается до миллисекунд.
Что касается модели обслуживания, Agentic Cloud способствует переходу облачных сервисов от «проектирования для человека» к «проектированию для агента». Логика взаимодействия смещается от технически-ориентированных API-вызовов к семантически-ориентированной инкапсуляции возможностей, позволяя пользователям автоматически выполнять сопоставление параметров, вызовы интерфейсов и оркестрацию процессов с помощью естественного языка. На уровне протоколов MCP, инициированный Anthropic, и A2A, продвигаемый Google совместно с Linux Foundation, становятся фактическими стандартами, обеспечивая бесшовное взаимодействие агентов между различными платформами. Роль человека меняется с «отдающего команды» на «постановщика целей и контролера результатов». Что касается экосистемной логики, Agentic Cloud переводит облачные вычисления от «экономии на масштабе» к «эффекту ценности». Создание ценности трансформируется от линейной передачи ресурсов к экспоненциальному интеллектуальному синергетическому приросту. Участники экосистемы переходят от однонаправленных отношений «ресурс-потребность» к двустороннему совместному созданию ценности. Промышленная конкуренция смещается от ценового соперничества, основанного на затратах, к интеллектуальной экосистемной гонке. Мера ценности облачных сервисов меняется с плотности ресурсов на плотность ценности.
Полноценные AI-облачные возможности охватывают всю цепочку от чипов и облачной инфраструктуры до больших моделей и приложений. Ключевые показатели оценки базовых вычислительных ресурсов для ИИ включают: способность к облачной адаптации гетерогенной матрицы чипов; интегрированную координацию вычислительных мощностей, памяти и сети, а также общую эффективность работы ИИ-кластеров; и способность к высокоэластичному планированию вывода. Платформенный уровень должен быть модернизирован до нативной платформы для агентов, предоставляя управляемую среду выполнения агентов, поддерживающую автономное выполнение задач, модернизацию облачных сервисов в пользу агентов и кроссплатформенную поддержку нативной памяти (например, постоянное хранилище памяти, предоставляемое Memory Bank от Google). Прикладной уровень должен обеспечивать корпоративные возможности всеобъемлющей безопасности и управления (например, встроенный полный спектр аутентификации MCP от Microsoft, функции защиты моделей от Google), возможности эксплуатации и мониторинга агентов, а также совместимость с открытыми экосистемами (например, независимая от модели оркестрация Amazon AgentCore).
В области стандартизации CAICT с 2019 года проводит исследования технологий облачных вычислений для ИИ. В 2020 году она успешно возглавила разработку стандарта технических спецификаций для платформ облачных вычислений ИИ (AICP) в ITU SG16. На сегодняшний день сформирован ряд отраслевых стандартов и международных стандартных предложений, включая базовую терминологию, эталонную архитектуру, функциональные требования, оценку производительности и т.д. По состоянию на текущий момент, серия AICP насчитывает более 7 опубликованных или находящихся в разработке стандартов, формируя двойную систему «китайские стандарты + международные стандарты». В настоящее время Agentic Cloud находится на ранней стадии развития, и подходы различных вендоров различаются: Google делает акцент на агентной трансформации платформ данных, Amazon фокусируется на независимой от модели открытой оркестрации, Microsoft создала относительно полную систему в области безопасности и управления, а китайские вендоры лидируют в области вертикальной интеграции полного стека. CAICT заявляет, что продолжит работу над созданием стандартизированной системы метрик и оценочной структуры, охватывающей полный стек, на основе скоординированного механизма «чип, облако, модель, применение», способствуя трансформации облачных вычислений от предоставления вычислительных мощностей к предоставлению интеллектуальных возможностей.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









