Репортаж от Wedoany,25 мая японская компания SoftBank объявила о запуске сервиса «AI Data Center GPU Cloud» в октябре 2026 года. Этот сервис, работающий на программном стеке «Infrinia AI Cloud OS», является частью нового облачного бизнеса SoftBank и предназначен для таких рабочих нагрузок, как разработка AI-моделей, инференс и обработка данных. Он предоставляет интегрированную AI-вычислительную инфраструктуру и программные возможности, которые можно безопасно использовать на территории Японии.
Цель этого сервиса — перевести AI-вычисления от простой аренды GPU-ресурсов к комплексной поставке «вычислительная инфраструктура + программный стек AI-дата-центра». При развертывании больших моделей и отраслевых AI-приложений предприятиям часто требуются не только GPU, но и управление ресурсами для множества арендаторов, оркестрация контейнеров, API для инференса, системы хранения, сеть, безопасность и автоматизация эксплуатации. Ключевая идея запускаемого SoftBank облачного GPU-сервиса заключается в интеграции базовых вычислительных мощностей GPU, среды Kubernetes и сервисов инференса моделей через Infrinia AI Cloud OS, что снижает сложность самостоятельного создания среды для разработки и эксплуатации AI.
Сервис будет использовать AI-вычислительную инфраструктуру в дата-центрах SoftBank на территории Японии, включая платформы ускоренных вычислений, такие как NVIDIA GB200 NVL72. SoftBank заявляет, что клиенты смогут выполнять на этой платформе различные типы AI-рабочих нагрузок — от обучения моделей и инференса до обработки данных, осуществляя при этом управление данными и операциями внутри Японии. Для клиентов из финансового, производственного, телекоммуникационного секторов, государственных служб и крупных предприятий локализованное AI-облако помогает сочетать доступ к вычислительным мощностям, безопасность данных, низкую задержку и непрерывность бизнеса.
Infrinia AI Cloud OS является ключевой программной основой этого запуска. Данный программный стек поддерживает Kubernetes как сервис для мультитенантных сред, а также Inference as a Service в виде API для инференса больших языковых моделей. Благодаря автоматизированному развертыванию и эксплуатации инфраструктуры инференса предприятия могут быстрее создавать среду для инференса моделей, не начиная с поэтапного построения базовых кластеров, контейнеров, оркестрации сервисов и планирования ресурсов. SoftBank отмечает, что такой подход способствует снижению совокупной стоимости владения и эксплуатационной нагрузки, а также повышает эффективность предоставления облачных GPU-сервисов.
Конкуренция в сфере AI-дата-центров смещается от закупок оборудования к эффективности работы систем. NVIDIA GB200 NVL72 представляет собой новое поколение высокопроизводительных AI-вычислительных платформ, но раскрытие его ценности зависит от того, сможет ли облачная платформа стабильно управлять крупномасштабными GPU-ресурсами, обеспечивать изоляцию множества арендаторов, поддерживать смешанные нагрузки обучения и инференса, а также быстро масштабироваться при изменении бизнес-требований. Связывание SoftBank облачного GPU-сервиса с Kubernetes, сервисами инференса и унифицированными эксплуатационными возможностями указывает на то, что провайдеры AI-инфраструктуры начинают конкурировать в области «доступных, управляемых и предоставляемых вычислительных мощностей».
SoftBank также включает этот сервис в дорожную карту «Telco AI Cloud». Компания планирует использовать собственную телекоммуникационную инфраструктуру для объединения AI Data Center GPU Cloud с AI-RAN, создавая суверенную, распределенную AI-инфраструктуру для эпохи искусственного интеллекта, обеспечивающую низкую задержку и высокую надежность. Для телеком-операторов будущая AI-инфраструктура, вероятно, будет глубже интегрирована с сетями связи, граничными узлами, дата-центрами и сетями радиодоступа, где облачное обучение, граничный инференс и интеллектуальное управление сетью станут различными звеньями одной системы.
Последующие этапы проекта включают получение обратной связи по бета-версии, подготовку к официальному запуску в октябре, привлечение корпоративных клиентов, оценку производительности кластеров NVIDIA GB200 NVL72, а также дальнейшую интеграцию сервиса с дорожными картами AI-RAN и Telco AI Cloud. На данном этапе можно подтвердить, что SoftBank объявила о запуске AI Data Center GPU Cloud в октябре 2026 года и с 25 мая предоставляет бета-версию, начав ее использование внутри группы; публичная информация не раскрывает список клиентов, ценовую политику, масштаб GPU-кластеров, конкретное местоположение дата-центров или суммы контрактов, поэтому не следует делать выводы о наличии сформировавшейся коммерческой выручки или крупных клиентских заказов.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com










