Репортаж от Wedoany,Компания Tensordyne (ранее Recogni, основанная в 2017 году) объявила о завершении этапа выпуска пластин (tape-out) своего AI-ускорителя «Napier». Этот чип назван в честь изобретателя логарифмов Джона Непера, а его ключевая инновация заключается в использовании логарифмической математики для преобразования большого количества операций умножения в AI-моделях в сложение.
Поскольку операции сложения более эффективны, Tensordyne утверждает, что производительность одной стойки Napier значительно превосходит AI-серверы на технологии GB300 от NVIDIA. В зависимости от модели AI, одна стойка Napier может обрабатывать до 13 раз больше токенов в секунду, чем NVIDIA GB300 NVL72. Эффективность, измеряемая в токенах в секунду на ватт, может быть увеличена до 17 раз.
Компания сообщила, что система Napier уже получила заказы на общую сумму более 200 миллионов долларов, однако точные сроки поставки первых модулей TDN72 Pod пока не объявлены. NVIDIA планирует выпустить свою систему Groq 3 LPX, оптимизированную для вывода (inference), к концу 2026 года, в то время как ранее анонсированный проект Rubin CPX, также ориентированный на вывод, по-видимому, был приостановлен.
Благодаря логарифмическому методу вычислений, фактические вычислительные блоки Napier могут быть спроектированы меньшего размера, что позволяет разместить на чипе больше ядер и вместить высокоскоростную SRAM. Каждый чип Napier оснащен 144 ГБ памяти HBM3E и интегрированным сверхскоростным межсоединением. Модуль TDN72 Pod состоит из четырех тесно связанных стоечных слотов, каждый из которых содержит 9 чипов Napier. Полная стойка Tensordyne Napier состоит из четырех модулей TDN72 Pod, объединяя в общей сложности 288 чипов Napier.

Одна стойка TDN обеспечивает вычислительную мощность 608 PFlops, оснащена 42 ТБ HBM3E, 78 ГБ SRAM и 256 ТБ RAM. Ее полное энергопотребление составляет 120 кВт, поддерживается воздушное охлаждение, а скорость передачи данных по внутренним межсоединениям стойки достигает 275 ТБ/с.
Чип Napier поддерживает форматы данных FP16, FP8, FP4 и Int8. По данным Tensordyne, чип подходит для таких популярных AI-моделей, как Kimi K2.6, DeepSeek-R1/V4 Pro, Llama3.1 405B, Mixtral 8x22B, GPT-OSS-120B и Qwen 80B. Для сравнения, NVIDIA планирует установить 256 чипов Groq-3-LPU в одной стойке Groq-3-LPX, каждый LPU оснащен 500 МБ SRAM, что дает одной стойке в общей сложности 128 ГБ SRAM и 12 ТБ DDR5 RAM.
Штаб-квартира Tensordyne находится в Кремниевой долине, у компании есть филиал в Мюнхене, а несколько старших разработчиков ранее работали в Juniper Networks (ныне входящей в HPE). В процессе разработки чипа Napier Tensordyne сотрудничала с Broadcom, которая также разрабатывает AI-чипы для нескольких поколений TPU от Google.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









