Google представила TPU восьмого поколения, впервые разделив обучение и вывод, эпоха AI-чипов вступает в эру двойной архитектуры
2026-04-23 11:08
В избр.

Репортаж от Wedoany,Google Cloud официально представила тензорные процессоры (TPU) восьмого поколения 22 апреля по местному времени на конференции Google Cloud Next 2026 в Лас-Вегасе, впервые разделив задачи обучения и вывода между двумя независимыми чипами: TPU 8t предназначен исключительно для обучения AI-моделей, а TPU 8i — для сервисов AI-вывода. Амин Вагдат, старший вице-президент Google и главный технический специалист по AI-инфраструктуре, в официальном блоге заявил, что это разделение архитектуры вызвано значительным расхождением рабочих нагрузок между обучением и выводом после появления AI-агентов: обучение требует максимальной пропускной способности и масштабируемости, в то время как вывод более чувствителен к задержкам и параллелизму.

TPU 8t позиционируется как вычислительный двигатель для крупномасштабного обучения, каждый чип оснащён высокоскоростной памятью объёмом 216 ГБ, пропускной способностью памяти 6,5 ТБ/с и 128 МБ SRAM на кристалле, пиковая производительность FP4 достигает 12,6 петафлопс, а максимальная пропускная способность межчипового соединения — 19,2 Тбит/с. Кластер TPU 8t может масштабироваться до 9600 чипов, с 2 ПБ общей высокоскоростной памяти, обеспечивая производительность 121 экзафлопс, что почти в 3 раза превышает вычислительную производительность предыдущего поколения Ironwood, а производительность на ватт повышается до двух раз. На сетевом уровне представлена новая архитектура Virgo, пропускная способность сети дата-центра увеличена в 4 раза, одна сеть может соединять более 134 тысяч чипов, а в сочетании с фреймворком Pathways распределённое обучение можно масштабировать до более чем 1 миллиона чипов в одном кластере. Google также представила технологии TPUDirect RDMA и TPUDirect Storage, позволяющие данным передаваться напрямую в память TPU или высокоскоростное хранилище, минуя CPU, что удваивает пропускную способность при передаче больших объёмов данных.

TPU 8i ориентирован на сценарии высокого параллелизма вывода, оснащён 288 ГБ высокоскоростной памяти и 384 МБ SRAM на кристалле, что в 3 раза больше, чем у предыдущего поколения Ironwood, позволяя активному рабочему набору модели полностью размещаться внутри чипа. Этот чип использует иерархическую сетевую топологию Boardfly, где связь между любыми двумя чипами проходит максимум через 7 переходов, и включает в себя ускоритель коллективных операций, снижающий задержку коллективных коммуникаций в 5 раз. Один Pod может масштабироваться до 1152 чипов, производительность FP8 достигает 11,6 экзафлопс, а объём HBM на Pod составляет 331,8 ТБ. По сравнению с предыдущим поколением, соотношение цена/производительность TPU 8i повысилось на 80%, а производительность на ватт — на 117%.

Оба чипа оснащены собственным хост-процессором Google на архитектуре ARM Axion, заменяющим предыдущую архитектуру x86, и поддерживаются системой охлаждения четвёртого поколения на основе жидкостного охлаждения. Что касается программной экосистемы, серия TPU 8 продолжает поддерживать основные фреймворки, такие как JAX, PyTorch, Keras и vLLM, а нативная поддержка PyTorch уже находится на этапе предварительного просмотра.

Генеральный директор Google Сундар Пичаи в предварительно записанном видео подтвердил, что капитальные расходы компании в 2026 году составят от 175 до 185 миллиардов долларов, что почти в 6 раз больше, чем 31 миллиард долларов в 2022 году, причём более половины вычислительных ресурсов машинного обучения будет направлено в облачный бизнес. Пичаи также раскрыл, что 75% нового кода внутри Google уже генерируется AI и проверяется инженерами, что значительно выше, чем 50% осенью прошлого года. Это разделение архитектуры TPU является серьёзным поворотом в стратегии Google в области AI-оборудования, знаменующим переход AI-чипов от «универсальности для обучения и вывода» к новой фазе «специализированных чипов для конкретных задач».

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
TSMC планирует запустить передовой завод по упаковке в Аризоне к 2029 году, внедрив технологии CoWoS и 3D-IC на территории США
2026-04-23
SK Hynix: выручка в первом квартале впервые превысила 52 трлн вон, прогнозируется сохранение благоприятной ценовой конъюнктуры для DRAM и NAND
2026-04-23
Маск подтвердил запуск нового завода в Техасе по производству человекоподобных роботов в 2027 году, годовая мощность второй линии составит 10 миллионов единиц
2026-04-23
Публичное тестирование серии AI-моделей Xiaomi MiMo-V2.5: Pro-версия по производительности сопоставима с GPT-5.4 и является открытой
2026-04-23
Anker Innovation выпускает AI-чип Thus с архитектурой «память-вычисления», пиковая производительность AI в 150 раз выше, чем у традиционных Bluetooth-чипов
2026-04-23
В Пекине состоялось открытие первой в Китае компании, интегрирующей ИИ и квантовые технологии, «Лянчжи Кайу», представлены два достижения: «Догоняющий ветер» и «Бянь Цюэ»
2026-04-23
Google запускает корпоративную платформу AI-агентов Gemini со встроенным банком памяти и функциями симуляционного тестирования
2026-04-23
SEGGER расширяет поддержку инструментов J-Link и Flasher для серии OM662X компании OnMicro, ускоряя разработку IoT-устройств
2026-04-23
Google представила TPU восьмого поколения, впервые разделив обучение и вывод, эпоха AI-чипов вступает в эру двойной архитектуры
2026-04-23
Телекоммуникационный оператор GCI из Аляски планирует приобрести волоконно-оптическую сеть Quintillion
2026-04-23
Последние новости
1
Канадская ассоциация BILD Эдмонтонского столичного региона выпустила План действий по приоритетности застройки внутри существующих районов для стимулирования жилищного строительства в сообществах.
2
3120 тонн меди! Hillgrove Resources установила рекорд производства на медном руднике Канамму в Южной Австралии в первом квартале
3
«Стальное сердце» блока №3 АЭС «Чжанчжоу» в провинции Фуцзянь, Китай, точно установлено на место: успешно завершена инновационная подъёмная операция с реактором весом 316 тонн
4
В Дубае (ОАЭ) достигнута наивысшая структурная точка 86-этажного небоскреба Habtoor
5
Шведская компания Hexagon выпускает метрологическое ПО QUINDOS 2026.1, расширяющее возможности координатно-измерительных машин
6
Успешно завершены испытания парового ротора турбогенератора без ядерного запуска на энергоблоке №2 АЭС «Саньао» в Китае
7
Exactaform становится эксклюзивным партнером WIDIA в Великобритании по поставкам твердосплавного инструмента
8
«Росатом» представил Индонезии комплексное предложение по развитию ядерной энергетики
9
Компания ELEVATE из ОАЭ присудила Pinnacle Piling контракт на свайные работы стоимостью 13,6 млн долларов США
10
Китайская энергостроительная корпорация PowerChina успешно вышла на рынок строительства основных сооружений реакторных блоков АЭС