Репортаж от Wedoany,Недавно американская AI-нативная облачная инфраструктурная компания GMI Cloud объявила, что её платформа будет поддерживать строительство инфраструктуры нового поколения для агентных AI-фабрик, что соответствует направлению платформы Vera Rubin, продвигаемому NVIDIA в рамках GTC 2026 в Тайбэе. Компания создаёт облачную платформу, ориентированную на инференс, предоставляя разработчикам и предприятиям возможности развёртывания, масштабирования и выполнения производственных AI-нагрузок.
Подчёркиваемая GMI Cloud «агентная AI-фабрика» указывает на новые требования к базовой инфраструктуре, возникающие после перехода AI-приложений от одноразовых запросов к долгосрочной работе, автономному взаимодействию и мультимодальной обработке. Традиционные облачные AI-ресурсы в основном сосредоточены на обучении моделей, инференсе отдельных моделей или вызовах API; когда AI-агенты начинают выполнять планирование, вызывать инструменты, обрабатывать изображения, видео и аудио, сохранять контекстную память и работать непрерывно, платформа должна одновременно поддерживать высокопроизводительный инференс с низкой задержкой, динамическое масштабирование, многопользовательскую изоляцию, долгосрочное управление контекстом, оркестрацию рабочих процессов и безопасную среду выполнения. Платформенный портфель GMI Cloud включает инфраструктуру для обучения, инференса и производственного развёртывания, сервис низкозадержанного инференса Prime Inference, MaaS API для проприетарных и открытых моделей, корпоративные выделенные конечные точки, а также уровень оркестрации и оптимизации инфраструктуры для масштабируемых AI-операций.
Инфраструктура агентных рабочих процессов является ключевой частью данного анонса. Предлагаемые GMI Cloud возможности платформы охватывают песочницу, вызов инструментов, автономные AI-системы и поддерживают мультимодальную среду нативного развёртывания для AI-приложений следующего поколения. Для корпоративных клиентов такие возможности могут использоваться для создания непрерывно работающих агентов поддержки, агентов кода, агентов анализа данных, систем генерации контента, помощников промышленных процессов и рабочих процессов бизнес-автоматизации. По сравнению с обычными вызовами моделей, агентные AI-системы должны поддерживать состояние в течение более длительного времени, получать доступ к инструментам, читать и записывать внешние данные, а также распределять ресурсы между несколькими задачами, поэтому стабильность, изоляция и контролируемость затрат базовой облачной платформы напрямую влияют на качество производственного развёртывания.
Безопасность также поставлена в центр инфраструктуры AI-фабрики. GMI Cloud заявляет, что использует возможности конфиденциальных вычислений NVIDIA для обеспечения доверенной среды выполнения для AI-нагрузок нового поколения, требующих защиты моделей и конфиденциальности данных. Поскольку AI-фабрики обрабатывают корпоративные проприетарные данные, регулируемый контент, контекст моделей и память агентов, платформа инференса должна одновременно удовлетворять требованиям производительности, конфиденциальности, безопасности и соответствия нормативным требованиям. Платформа Vera Rubin рассматривается как важный узел эволюции инфраструктуры AI-фабрик, ориентированный на проектирование вычислительных систем, сетей, безопасности и стоечных систем следующего поколения для удовлетворения потребностей агентного AI в масштабном инференсе и непрерывной работе.
Этот анонс отражает, что конкуренция в облачной AI-инфраструктуре смещается от «предоставления GPU-вычислений» к «поддержке производственных интеллектуальных систем». После того как AI-приложения входят в основные бизнес-процессы предприятий, клиентов интересует не только возможность арендовать GPU, но и задержка сервиса моделей, стоимость токенов, доступность платформы, безопасная изоляция, оркестрация рабочих процессов, выделенные конечные точки, охват моделей и способность обрабатывать мультимодальные задачи. Выбор GMI Cloud в пользу позиционирования вокруг нативной архитектуры инференса и агентных AI-фабрик указывает на её стремление занять роль, более близкую к производственному уровню в цепочке AI-инфраструктуры. Ключевым последующим фактором является то, сможет ли GMI Cloud объединить экосистему Vera Rubin, возможности конфиденциальных вычислений и платформу инференса в масштабируемый продукт и привлечь больше разработчиков, стартапов и корпоративных клиентов для развёртывания сложных AI-агентов на своей облачной платформе.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









