Google представила TPU восьмого поколения, впервые разделив обучение и вывод, эпоха AI-чипов вступает в эру двойной архитектуры
2026-04-23 11:08
В избр.

Репортаж от Wedoany,Google Cloud официально представила тензорные процессоры (TPU) восьмого поколения 22 апреля по местному времени на конференции Google Cloud Next 2026 в Лас-Вегасе, впервые разделив задачи обучения и вывода между двумя независимыми чипами: TPU 8t предназначен исключительно для обучения AI-моделей, а TPU 8i — для сервисов AI-вывода. Амин Вагдат, старший вице-президент Google и главный технический специалист по AI-инфраструктуре, в официальном блоге заявил, что это разделение архитектуры вызвано значительным расхождением рабочих нагрузок между обучением и выводом после появления AI-агентов: обучение требует максимальной пропускной способности и масштабируемости, в то время как вывод более чувствителен к задержкам и параллелизму.

TPU 8t позиционируется как вычислительный двигатель для крупномасштабного обучения, каждый чип оснащён высокоскоростной памятью объёмом 216 ГБ, пропускной способностью памяти 6,5 ТБ/с и 128 МБ SRAM на кристалле, пиковая производительность FP4 достигает 12,6 петафлопс, а максимальная пропускная способность межчипового соединения — 19,2 Тбит/с. Кластер TPU 8t может масштабироваться до 9600 чипов, с 2 ПБ общей высокоскоростной памяти, обеспечивая производительность 121 экзафлопс, что почти в 3 раза превышает вычислительную производительность предыдущего поколения Ironwood, а производительность на ватт повышается до двух раз. На сетевом уровне представлена новая архитектура Virgo, пропускная способность сети дата-центра увеличена в 4 раза, одна сеть может соединять более 134 тысяч чипов, а в сочетании с фреймворком Pathways распределённое обучение можно масштабировать до более чем 1 миллиона чипов в одном кластере. Google также представила технологии TPUDirect RDMA и TPUDirect Storage, позволяющие данным передаваться напрямую в память TPU или высокоскоростное хранилище, минуя CPU, что удваивает пропускную способность при передаче больших объёмов данных.

TPU 8i ориентирован на сценарии высокого параллелизма вывода, оснащён 288 ГБ высокоскоростной памяти и 384 МБ SRAM на кристалле, что в 3 раза больше, чем у предыдущего поколения Ironwood, позволяя активному рабочему набору модели полностью размещаться внутри чипа. Этот чип использует иерархическую сетевую топологию Boardfly, где связь между любыми двумя чипами проходит максимум через 7 переходов, и включает в себя ускоритель коллективных операций, снижающий задержку коллективных коммуникаций в 5 раз. Один Pod может масштабироваться до 1152 чипов, производительность FP8 достигает 11,6 экзафлопс, а объём HBM на Pod составляет 331,8 ТБ. По сравнению с предыдущим поколением, соотношение цена/производительность TPU 8i повысилось на 80%, а производительность на ватт — на 117%.

Оба чипа оснащены собственным хост-процессором Google на архитектуре ARM Axion, заменяющим предыдущую архитектуру x86, и поддерживаются системой охлаждения четвёртого поколения на основе жидкостного охлаждения. Что касается программной экосистемы, серия TPU 8 продолжает поддерживать основные фреймворки, такие как JAX, PyTorch, Keras и vLLM, а нативная поддержка PyTorch уже находится на этапе предварительного просмотра.

Генеральный директор Google Сундар Пичаи в предварительно записанном видео подтвердил, что капитальные расходы компании в 2026 году составят от 175 до 185 миллиардов долларов, что почти в 6 раз больше, чем 31 миллиард долларов в 2022 году, причём более половины вычислительных ресурсов машинного обучения будет направлено в облачный бизнес. Пичаи также раскрыл, что 75% нового кода внутри Google уже генерируется AI и проверяется инженерами, что значительно выше, чем 50% осенью прошлого года. Это разделение архитектуры TPU является серьёзным поворотом в стратегии Google в области AI-оборудования, знаменующим переход AI-чипов от «универсальности для обучения и вывода» к новой фазе «специализированных чипов для конкретных задач».

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Группа аэропортов Западного Китая повысила пунктуальность рейсов до 93%, сократив время наземного обслуживания на 1,3 минуты
2026-06-12
Китайская компания Kunlun Robotics запускает проект по созданию команды в области воплощённого интеллекта в Пекинской экономико-технологической зоне развития
2026-06-12
Республика Корея и другие стороны 11-го числа совместно учредили Инновационный центр строительных роботов с ИИ
2026-06-12
Компания Hollysys представляет AI для интеллектуального предупреждения о режимах работы технологических процессов на основе XWorld
2026-06-12
Agile Robots демонстрирует силовое управление и воплощённый ИИ на выставке Robot Technology Japan 2026
2026-06-12
Китайский Alibaba Cloud выпустил Meoo CLI для однокликового развёртывания AI-проектов
2026-06-12
Китайская компания JD.com представила первый в Китае протокол автономных платежей для интеллектуальных агентов с уровнями от L0 до L5
2026-06-12
Международный художественный центр Лунган в Шэньчжэне совместно с Huawei создал первое в мире арт-пространство на базе HarmonyOS и ИИ
2026-06-12
Чемпионат мира по футболу 2026 года в США, Канаде и Мексике: робот Atlas от Boston Dynamics выполнит первый удар
2026-06-12
Умная аптека Galaxy General установила рекорд непрерывной автономной работы человекоподобного робота
2026-06-12
Последние новости
1
Немецкая Mubea Aviation получила контракт от Airbus Atlantic на поставку композитных компонентов для A350
2
Группа аэропортов Западного Китая повысила пунктуальность рейсов до 93%, сократив время наземного обслуживания на 1,3 минуты
3
Китайская компания Kunlun Robotics запускает проект по созданию команды в области воплощённого интеллекта в Пекинской экономико-технологической зоне развития
4
Singapore Airlines возобновляет рейсы в Мадрид с октября 2026 года
5
Balaena приобретает британские верфи группы APCL
6
Республика Корея и другие стороны 11-го числа совместно учредили Инновационный центр строительных роботов с ИИ
7
Японская компания Mazak представила оборудование FF-1250H L для обработки крупных деталей, изготовленных методом литья под давлением
8
Китайская компания Donghua Machinery представляет несколько серий термопластавтоматов для удовлетворения потребностей бытовой техники
9
Производственные мощности второго поколения аккумуляторов Blade от китайской BYD ограничены из-за узких мест в лазерной технологии
10
Немецкая компания Dürr представляет новое поколение системы ротационного погружения RoDip E^zy