Американская OpenAI совместно с AMD, Broadcom, NVIDIA и другими представила открытый сетевой протокол MRC: многопутевая передача решает проблему простоя GPU
2026-05-07 11:47
В избр.

Репортаж от Wedoany,6 мая 2026 года американская компания OpenAI объявила о сотрудничестве с AMD, Broadcom, Intel, Microsoft и NVIDIA и официально представила новый открытый сетевой протокол под названием «Многопутевое надежное соединение» (Multipath Reliable Connection, MRC), нацеленный на решение широко распространенных в сверхмасштабных кластерах для обучения ИИ проблем простоя вычислительных мощностей GPU и узких мест, связанных с перегрузкой сети.

В официальном техническом блоге OpenAI указала прямую причину разработки этого протокола: «Перегрузка сети, отказы каналов и устройств являются наиболее распространенными источниками задержек и джиттера при передаче. С ростом масштаба кластеров эти проблемы возникают все чаще, а сложность их решения возрастает». При обучении больших моделей один шаг может включать миллионы синхронных передач данных между GPU, и одна задержка может привести к простою большого количества GPU в ожидании. MRC динамически распределяет поток данных одного RDMA-соединения по сотням сетевых путей и использует технологию маршрутизации от источника SRv6 для кодирования решений о пересылке в заголовок пакета. При возникновении отказа канала или перегрузки трафик автоматически перенаправляется в обход за микросекунды, что значительно сокращает перерывы в обучении и простои вычислительных мощностей.

Глубина отраслевого сотрудничества в рамках этого протокола также заслуживает внимания. AMD внесла в MRC технологию контроля перегрузок и уже реализовала ее развертывание на сетевых картах 400G, обеспечив плавный переход к своим Pensando «Vulcano» 800G AI NIC. NVIDIA впервые проверила и оптимизировала MRC на платформе Spectrum-X Ethernet, где ее технология обхода отказов способна обнаружить сбой пути за несколько микросекунд и автоматически перенаправить трафик на аппаратном уровне. Сетевой адаптер Broadcom Thor Ultra 800Gbps Ethernet добавил поддержку MRC, обеспечив аппаратную основу для многоплоскостных ИИ-сетевых архитектур. OpenAI публикует протокол MRC по открытой лицензии через Open Compute Project (OCP), что означает, что любой облачный провайдер или предприятие может бесплатно использовать эту технологию.

Руководитель направления промышленных вычислений OpenAI Сачин Катти (Sachin Katti) публично заявил в официальном блоге NVIDIA: «Мощное сотрудничество с NVIDIA сделало развертывание MRC на поколении Blackwell очень успешным». Старший вице-президент сетевого подразделения NVIDIA Гилад Шайнер (Gilad Shainer), в свою очередь, отметил, что развертывание MRC на Spectrum-X Ethernet уже помогло нескольким гиперскейлерам повысить эффективность и надежность крупномасштабного обучения.

Темпы развертывания синхронизированы с итерацией моделей. MRC уже полностью развернут во всех крупных суперкомпьютерах OpenAI, используемых для обучения передовых моделей, включая площадку облачной инфраструктуры Oracle в Абилине, штат Техас, США, а также кластер суперкомпьютеров Microsoft Fairwater. Эти кластеры выполняют задачи по обучению следующего поколения моделей для таких продуктов, как ChatGPT и Codex. В настоящее время MRC встроен в новейшие сетевые интерфейсы 800Gb/s, глубоко интегрирован с NVIDIA Spectrum-X Ethernet, проверен и оптимизирован на архитектуре GPU Blackwell.

Команда OpenAI в техническом решении привела характерный пример: недавно при обучении передовой большой модели для ChatGPT и Codex инженерной группе потребовалось перезагрузить четыре первичных коммутатора ядра сети. В традиционной сетевой архитектуре такие операции обычно требуют чрезвычайно тщательной координации с эксплуатационной командой. После внедрения MRC, благодаря наличию механизмов многопутевой передачи и быстрой перемаршрутизации, им даже не потребовалось заранее согласовывать перезагрузку с командой, отвечающей за задачи обучения кластера, и процесс обучения не пострадал.

Протокол построен на основе традиционного RoCEv2 (RDMA over Converged Ethernet). Традиционный RoCEv2 поддерживает только один сетевой путь на соединение и не может полностью использовать многопутевую топологию внутри центров обработки данных. При потере пакетов его механизм отката N требует повторной передачи всех последующих пакетов в окне, создавая дополнительные сетевые издержки. В крупномасштабных кластерах решение на основе无损ной сети с приоритетным управлением потоком (PFC) также вызывает распространение перегрузок и блокировку начала очереди (HOL blocking). MRC предлагает решения для каждого из этих недостатков — многопутевая балансировка нагрузки, выборочная повторная передача вместо отката N и явное управление маршрутизацией на основе SRv6, — что в совокупности формирует сетевой транспортный уровень для ИИ-фабрик гигаваттного масштаба.

В комментариях к официальному аккаунту OpenAI в социальных сетях многие отраслевые специалисты оценили MRC как «настоящий инфраструктурный прогресс», а некоторые отметили, что это знаменует переход конкуренции в области ИИ-инфраструктуры от простого наращивания количества GPU к стандартизации эффективности кластерных коммуникаций. По мере того как масштаб параметров ИИ-моделей продолжает расти до триллионов, сетевой уровень становится третьей ключевой переменной, ограничивающей эффективность обучения, после вычислительных мощностей и систем хранения. Открытая публикация MRC предоставляет всей отрасли переиспользуемую базовую сетевую структуру.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Американская OpenAI совместно с AMD, Broadcom, NVIDIA и другими представила открытый сетевой протокол MRC: многопутевая передача решает проблему простоя GPU
2026-05-07
Секретарь комитета КПК провинции Ляонин Сюй Куньлинь проинспектировал развитие цифровой экономики в Шэньяне, подчеркнув важность создания комплексной экспериментальной зоны факторов данных для ускорения интеграции цифровой и реальной экономики
2026-05-07
Американская Anthropic заключила соглашение о вычислительных мощностях со SpaceX, получив еще 300 мегаватт
2026-05-07
Министерство промышленности и информатизации КНР опубликовало данные по индустрии программного обеспечения за первый квартал 2026 года: доход составил 3 492 млрд юаней, увеличившись на 11,6% по сравнению с аналогичным периодом прошлого года
2026-05-07
Министерство промышленности и информатизации КНР опубликовало операционные данные по отрасли производства электронной информации за первый квартал 2026 года, объем производства интегральных схем вырос на 24,3% по сравнению с аналогичным периодом прошлого года
2026-05-07
Министерство промышленности и информатизации Китая опубликовало данные по интернет-отрасли за первый квартал 2026 года: выручка составила 502,7 млрд юаней, увеличившись на 10,6%, темпы роста прибыли подскочили до 60%
2026-05-07
Китайская компания SIAMC возглавила выпуск группового стандарта на изотропный пористый графит для производства пластин карбида кремния
2026-05-07
Бельгийская Collibra запускает AI Command Center и объединяется с французской Giskard для устранения «налога на галлюцинации» корпоративных ИИ-агентов
2026-05-07
Бессерверная векторная база данных Pinecone (США) запущена во Франкфурте, охватывая рынок Центральной Европы для содействия развертыванию ИИ
2026-05-07
Дочерняя компания ByteDance TikTok получила одобрение на проект расширения центра обработки данных в Таиланде стоимостью 25 миллиардов долларов
2026-05-07
Последние новости
1
Высокоскоростная камера немецкой компании Allied Vision EoSens в реальном времени выявляет дефекты при 3D-печати металлом
2
Шведская компания Atlas Copco представила в США воздушный компрессор высокого давления
3
Компания Zhenhong Co., Ltd. выходит на Пекинскую фондовую биржу: производитель поковок для ветроэнергетики привлекает средства для расширения производства
4
Chemetall (Германия) открывает лабораторию во Вьетнаме, углубляя присутствие в сфере обработки поверхностей в Азиатско-Тихоокеанском регионе
5
BASF представляет новую линейку компостируемой гибкой упаковки ecovio
6
Ford создает «Skunk Works» в Лонг-Бич для ускорения разработки электрических грузовиков
7
Основатель британской компании RYSE 3D снова получил Королевскую премию, британские предприятия аддитивного производства демонстрируют значительный рост экспорта
8
Президент Кении лично управлял краном Zoomlion на открытии жилищного проекта
9
Торжественное открытие Азиатско-Тихоокеанского центра впечатлений ZF Aftermarket в Германии
10
Британская компания CDE представила в США модульное моющее решение ModaLine «подключи и работай»