Японская SoftBank запустит облачный сервис GPU для AI-дата-центров в октябре
2026-05-26 11:48
В избр.

Репортаж от Wedoany,25 мая японская компания SoftBank объявила о запуске сервиса «AI Data Center GPU Cloud» в октябре 2026 года. Этот сервис, работающий на программном стеке «Infrinia AI Cloud OS», является частью нового облачного бизнеса SoftBank и предназначен для таких рабочих нагрузок, как разработка AI-моделей, инференс и обработка данных. Он предоставляет интегрированную AI-вычислительную инфраструктуру и программные возможности, которые можно безопасно использовать на территории Японии.

Цель этого сервиса — перевести AI-вычисления от простой аренды GPU-ресурсов к комплексной поставке «вычислительная инфраструктура + программный стек AI-дата-центра». При развертывании больших моделей и отраслевых AI-приложений предприятиям часто требуются не только GPU, но и управление ресурсами для множества арендаторов, оркестрация контейнеров, API для инференса, системы хранения, сеть, безопасность и автоматизация эксплуатации. Ключевая идея запускаемого SoftBank облачного GPU-сервиса заключается в интеграции базовых вычислительных мощностей GPU, среды Kubernetes и сервисов инференса моделей через Infrinia AI Cloud OS, что снижает сложность самостоятельного создания среды для разработки и эксплуатации AI.

Сервис будет использовать AI-вычислительную инфраструктуру в дата-центрах SoftBank на территории Японии, включая платформы ускоренных вычислений, такие как NVIDIA GB200 NVL72. SoftBank заявляет, что клиенты смогут выполнять на этой платформе различные типы AI-рабочих нагрузок — от обучения моделей и инференса до обработки данных, осуществляя при этом управление данными и операциями внутри Японии. Для клиентов из финансового, производственного, телекоммуникационного секторов, государственных служб и крупных предприятий локализованное AI-облако помогает сочетать доступ к вычислительным мощностям, безопасность данных, низкую задержку и непрерывность бизнеса.

Infrinia AI Cloud OS является ключевой программной основой этого запуска. Данный программный стек поддерживает Kubernetes как сервис для мультитенантных сред, а также Inference as a Service в виде API для инференса больших языковых моделей. Благодаря автоматизированному развертыванию и эксплуатации инфраструктуры инференса предприятия могут быстрее создавать среду для инференса моделей, не начиная с поэтапного построения базовых кластеров, контейнеров, оркестрации сервисов и планирования ресурсов. SoftBank отмечает, что такой подход способствует снижению совокупной стоимости владения и эксплуатационной нагрузки, а также повышает эффективность предоставления облачных GPU-сервисов.

Конкуренция в сфере AI-дата-центров смещается от закупок оборудования к эффективности работы систем. NVIDIA GB200 NVL72 представляет собой новое поколение высокопроизводительных AI-вычислительных платформ, но раскрытие его ценности зависит от того, сможет ли облачная платформа стабильно управлять крупномасштабными GPU-ресурсами, обеспечивать изоляцию множества арендаторов, поддерживать смешанные нагрузки обучения и инференса, а также быстро масштабироваться при изменении бизнес-требований. Связывание SoftBank облачного GPU-сервиса с Kubernetes, сервисами инференса и унифицированными эксплуатационными возможностями указывает на то, что провайдеры AI-инфраструктуры начинают конкурировать в области «доступных, управляемых и предоставляемых вычислительных мощностей».

SoftBank также включает этот сервис в дорожную карту «Telco AI Cloud». Компания планирует использовать собственную телекоммуникационную инфраструктуру для объединения AI Data Center GPU Cloud с AI-RAN, создавая суверенную, распределенную AI-инфраструктуру для эпохи искусственного интеллекта, обеспечивающую низкую задержку и высокую надежность. Для телеком-операторов будущая AI-инфраструктура, вероятно, будет глубже интегрирована с сетями связи, граничными узлами, дата-центрами и сетями радиодоступа, где облачное обучение, граничный инференс и интеллектуальное управление сетью станут различными звеньями одной системы.

Последующие этапы проекта включают получение обратной связи по бета-версии, подготовку к официальному запуску в октябре, привлечение корпоративных клиентов, оценку производительности кластеров NVIDIA GB200 NVL72, а также дальнейшую интеграцию сервиса с дорожными картами AI-RAN и Telco AI Cloud. На данном этапе можно подтвердить, что SoftBank объявила о запуске AI Data Center GPU Cloud в октябре 2026 года и с 25 мая предоставляет бета-версию, начав ее использование внутри группы; публичная информация не раскрывает список клиентов, ценовую политику, масштаб GPU-кластеров, конкретное местоположение дата-центров или суммы контрактов, поэтому не следует делать выводы о наличии сформировавшейся коммерческой выручки или крупных клиентских заказов.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Ожидается, что 6G в Китае будет запущен в коммерческую эксплуатацию в 2030 году, уже получено первое в мире разрешение на использование тестовой частоты 6 ГГц
2026-05-26
Американская pSemi представит радиочастотные переключатели и широкополосные технологии на IMS 2026
2026-05-26
Канада запускает конкурс по созданию квантовых повторителей для поддержки разработки дальнодействующих квантовых сетей
2026-05-26
NTT и Kubota проверили связь для дистанционного управления сельхозтехникой в горной местности
2026-05-26
Google Cloud (США) запускает в Сингапуре коридор AI-стартапов в Юго-Восточной Азии
2026-05-26
Китайская компания H3C провела международный саммит NAVIGATE, продемонстрировав полный стек инфраструктуры для ИИ
2026-05-26
Американская компания Thunderbit запускает Web Data API и MCP-сервер для интеграции в AI-рабочие процессы
2026-05-26
Китайские компании SmartSens и Unisoc нацелены на высокоскоростные оптические соединения на базе MicroLED
2026-05-26
SK Hynix из Южной Кореи представляет решение для охлаждения iHBM, ориентированное на память для ИИ следующего поколения
2026-05-26
Японская SoftBank запустит облачный сервис GPU для AI-дата-центров в октябре
2026-05-26
Последние новости
1
Новый Южный Уэльс, Австралия, преобразует пилотный проект по электротягачам в постоянную меру
2
CRSC на высоком уровне представлен на Всемирной конференции беспилотных летательных аппаратов
3
Премьер Госсовета КНР Ли Цян: необходимо в полной мере задействовать эффект зоны свободной торговли между Китаем и Сербией, расширять и улучшать торгово-экономическое сотрудничество двух стран
4
Президент Южного Судана принял участие в церемонии ввода в эксплуатацию проекта компании CCCC
5
Китайская компания Dajin Heavy Industry и нидерландская Jumbo подписали контракт на строительство двух тяжелых крановых судов, поставка в третьем квартале 2028 года
6
Air Canada в июне открывает 7 новых дальнемагистральных маршрутов, включая Шанхай Пудун и Будапешт
7
CMA CGM Group назначает Эслу Бору управляющим директором контейнерной линии ANL
8
Китайская ракетная академия «Ханчжэн Цзисе» завершила локализацию высокотемпературных и высоконапорных плавающих шаровых кранов
9
Hengli Heavy Industry сдаст VLCC греческого судовладельца почти на полгода раньше срока
10
Ожидается, что 6G в Китае будет запущен в коммерческую эксплуатацию в 2030 году, уже получено первое в мире разрешение на использование тестовой частоты 6 ГГц