Google представила TPU восьмого поколения, впервые разделив обучение и вывод, эпоха AI-чипов вступает в эру двойной архитектуры_Глобальные новости

Google представила TPU восьмого поколения, впервые разделив обучение и вывод, эпоха AI-чипов вступает в эру двойной архитектуры

2026-04-23 11:08

В избр.

Репортаж от Wedoany，Google Cloud официально представила тензорные процессоры (TPU) восьмого поколения 22 апреля по местному времени на конференции Google Cloud Next 2026 в Лас-Вегасе, впервые разделив задачи обучения и вывода между двумя независимыми чипами: TPU 8t предназначен исключительно для обучения AI-моделей, а TPU 8i — для сервисов AI-вывода. Амин Вагдат, старший вице-президент Google и главный технический специалист по AI-инфраструктуре, в официальном блоге заявил, что это разделение архитектуры вызвано значительным расхождением рабочих нагрузок между обучением и выводом после появления AI-агентов: обучение требует максимальной пропускной способности и масштабируемости, в то время как вывод более чувствителен к задержкам и параллелизму.

TPU 8t позиционируется как вычислительный двигатель для крупномасштабного обучения, каждый чип оснащён высокоскоростной памятью объёмом 216 ГБ, пропускной способностью памяти 6,5 ТБ/с и 128 МБ SRAM на кристалле, пиковая производительность FP4 достигает 12,6 петафлопс, а максимальная пропускная способность межчипового соединения — 19,2 Тбит/с. Кластер TPU 8t может масштабироваться до 9600 чипов, с 2 ПБ общей высокоскоростной памяти, обеспечивая производительность 121 экзафлопс, что почти в 3 раза превышает вычислительную производительность предыдущего поколения Ironwood, а производительность на ватт повышается до двух раз. На сетевом уровне представлена новая архитектура Virgo, пропускная способность сети дата-центра увеличена в 4 раза, одна сеть может соединять более 134 тысяч чипов, а в сочетании с фреймворком Pathways распределённое обучение можно масштабировать до более чем 1 миллиона чипов в одном кластере. Google также представила технологии TPUDirect RDMA и TPUDirect Storage, позволяющие данным передаваться напрямую в память TPU или высокоскоростное хранилище, минуя CPU, что удваивает пропускную способность при передаче больших объёмов данных.

TPU 8i ориентирован на сценарии высокого параллелизма вывода, оснащён 288 ГБ высокоскоростной памяти и 384 МБ SRAM на кристалле, что в 3 раза больше, чем у предыдущего поколения Ironwood, позволяя активному рабочему набору модели полностью размещаться внутри чипа. Этот чип использует иерархическую сетевую топологию Boardfly, где связь между любыми двумя чипами проходит максимум через 7 переходов, и включает в себя ускоритель коллективных операций, снижающий задержку коллективных коммуникаций в 5 раз. Один Pod может масштабироваться до 1152 чипов, производительность FP8 достигает 11,6 экзафлопс, а объём HBM на Pod составляет 331,8 ТБ. По сравнению с предыдущим поколением, соотношение цена/производительность TPU 8i повысилось на 80%, а производительность на ватт — на 117%.

Оба чипа оснащены собственным хост-процессором Google на архитектуре ARM Axion, заменяющим предыдущую архитектуру x86, и поддерживаются системой охлаждения четвёртого поколения на основе жидкостного охлаждения. Что касается программной экосистемы, серия TPU 8 продолжает поддерживать основные фреймворки, такие как JAX, PyTorch, Keras и vLLM, а нативная поддержка PyTorch уже находится на этапе предварительного просмотра.

Генеральный директор Google Сундар Пичаи в предварительно записанном видео подтвердил, что капитальные расходы компании в 2026 году составят от 175 до 185 миллиардов долларов, что почти в 6 раз больше, чем 31 миллиард долларов в 2022 году, причём более половины вычислительных ресурсов машинного обучения будет направлено в облачный бизнес. Пичаи также раскрыл, что 75% нового кода внутри Google уже генерируется AI и проверяется инженерами, что значительно выше, чем 50% осенью прошлого года. Это разделение архитектуры TPU является серьёзным поворотом в стратегии Google в области AI-оборудования, знаменующим переход AI-чипов от «универсальности для обучения и вывода» к новой фазе «специализированных чипов для конкретных задач».

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com