Репортаж от Wedoany,Google недавно опубликовала технический блог, в котором рассказывается о том, как рост ИИ меняет её сетевую архитектуру. В блоге отмечается, что по мере того, как базовые инфраструктуры таких сервисов, как Gemini, Veo, Поиск и Cloud AI, всё больше полагаются на тесно интегрированные сетевые системы, спроектированные для крупномасштабного трафика «восток-запад», низкой задержки и высокой эластичности, сеть становится базовым уровнем самой ИИ-системы. Амин Вахдат подробно описывает этот переход в своём блоге.

В настоящее время Google рассматривает ИИ-инфраструктуру как беспрецедентную распределённую вычислительную платформу. Рабочие нагрузки по обучению и выводу охватывают несколько кластеров, зданий и даже кампусов, требуя передачи огромных объёмов данных через взаимосвязанные структуры с предсказуемой задержкой. Google описывает архитектуру, которая может объединять ресурсы в разных местах, формируя то, что она называет крупномасштабным ИИ-«суперкомпьютером». Это требует тесной координации между кластерными сетями, региональной оптической передачей и глобальной WAN. Частная магистральная сеть Google уже охватывает более 7,75 млн км наземных и подводных кабельных систем, достигая более 200 стран и регионов, поддерживая глобально распределённые ИИ-нагрузки.
В блоге отмечается, что ИИ размывает традиционные границы между центрами обработки данных (ЦОД) и глобальными вычислительными сетями (WAN). Исторически структуры ЦОД оптимизировались для трафика «восток-запад» на короткие расстояния внутри здания, в то время как WAN отвечали за дальние соединения между регионами. Сегодня обучение больших моделей генерирует синхронный трафик между тысячами ускорителей, часто выходящий за пределы одного POD или кампуса, что требует, чтобы расширение полосы пропускания, управление перегрузками, планирование оптической ёмкости и инжиниринг трафика работали как единая система. Google рассматривает это как архитектурную конвергенцию между коммутацией, маршрутизацией, оптической передачей и программно-управляемым контролем.
Программное обеспечение играет ключевую роль в оркестровке этих сетей. Google отмечает, что размещение ИИ-нагрузок всё больше зависит от интеллектуального управления трафиком на нескольких уровнях инфраструктуры. Программно-определяемые сети используются для балансировки трафика, изоляции сбоев, оптимизации задержки и динамического распределения ёмкости между конкурирующими нагрузками. Это особенно важно для крупномасштабного распределённого обучения, где самое медленное звено в синхронизированном кластере может повлиять на общую производительность модели. Плоскость управления сетью Google всё чаще выступает в качестве уровня оркестровки между вычислениями и передачей.
В блоге также подчёркивается важность аппаратных инноваций в ИИ-сетях. Google упоминает инвестиции в пользовательские сетевые чипы, аппаратное ускорение и технологии прямого доступа к памяти для минимизации задержки и повышения пропускной способности между вычислительными ресурсами. Это соответствует тенденции среди гиперскейлеров к сетям на основе RDMA, оптическим структурам масштабирования и высокоразрядным коммутационным архитектурам, специально разработанным для ИИ-кластеров. Содержание блога остаётся на системном уровне, не вдаваясь в детали конкретных продуктов, но отражает отраслевой сдвиг в сторону совместного проектирования сетей с ускорителями, системами памяти и хранилищами.
Архитектура Google тесно согласуется с её более широкой инициативой ИИ-суперкомпьютера, включая структуру расширения Virgo, представленную на Cloud Next. Эта платформа соединяет ресурсы TPU и GPU в большом масштабе и позволяет распределять рабочие нагрузки по границам ЦОД. Аналогичные подходы наблюдаются и в отрасли, включая NVLink от NVIDIA и ИИ-структуры на базе InfiniBand, крупномасштабные сети ИИ-кластеров Meta, магистральную сеть Azure AI от Microsoft, а также работу AWS над EFA и пользовательскими оптическими сетями. Вклад Google демонстрирует, как эти концепции могут быть расширены от кластеров до городской и глобальной инфраструктуры.
Ключевые сообщения блога включают: Google позиционирует сеть как основной архитектурный компонент ИИ-системы, а не как вспомогательный транспортный уровень; ИИ-нагрузки всё чаще работают в нескольких кластерах и кампусах, требуя соединений чрезвычайно высокой ёмкости; по мере географического расширения ИИ-трафика «восток-запад» традиционное разделение между структурами ЦОД и архитектурой WAN сокращается; Google полагается на программно-определяемый инжиниринг трафика для оптимизации производительности и размещения нагрузок на сетевых уровнях; сетевая устойчивость остаётся ключевой, с встроенной избыточностью маршрутизации и изоляцией сбоев в инфраструктуре ЦОД, регионов и магистралей; компания продолжает инвестировать в пользовательское сетевое оборудование и высокопроизводительную передачу для поддержки низкозадержанной ИИ-связи; архитектура Google поддерживает как внутренние ИИ-нагрузки, так и внешних клиентов Google Cloud, использующих инфраструктуру ИИ-суперкомпьютера компании.
«ИИ-нагрузки меняют масштаб и форму требований к инфраструктуре на каждом уровне сети», — пишет инженерная команда Google, описывая среду, где сети ЦОД и глобальная магистральная инфраструктура всё чаще работают как единая распределённая система.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









