Китайская компания Zhonghao Xinying выпустила TPU-чип «Сюйюй» с вычислительной мощностью 896 TFLOPS Введение в технологии

Китайская компания Zhonghao Xinying выпустила TPU-чип «Сюйюй» с вычислительной мощностью 896 TFLOPS

2026-07-01 14:01

В избр.

30 июня китайская компания Zhonghao Xinying представила новое поколение полностью самостоятельно разработанного высокопроизводительного TPU-чипа для ИИ-вычислений «Сюйюй», а также одновременно запустила программно-аппаратную интегрированную платформу для интеллектуальных вычислений «Тайцзэ 2.0». Вычислительная мощность чипа «Сюйюй» с плавающей запятой смешанной точности достигает 896 TFLOPS, а производительность 8-битных логических выводов — 1792 TOPS, при номинальной потребляемой мощности одной карты 600 Вт.

Техническое позиционирование «Сюйюй» сосредоточено на обучении больших моделей, ускорении логических выводов и высокопроизводительных ИИ-вычислениях. TPU — это специализированный ускоритель для тензорных и матричных операций, основная задача которого — повышение эффективности вычислений при обучении, логических выводах и пакетной обработке задач в глубоком обучении. В отличие от GPU, ориентированных на универсальные вычисления, TPU больше внимания уделяет матричному умножению, тензорным операциям, планированию операторов и эффективности передачи данных в ИИ-моделях. Выпущенный компанией Zhonghao Xinying чип «Сюйюй» повышает вычислительную мощность с плавающей запятой смешанной точности до 896 TFLOPS, а 8-битную производительность логических выводов — до 1792 TOPS, что свидетельствует о модернизации вычислительных блоков и каналов передачи данных для сценариев больших языковых моделей, мультимодальных моделей и высоконагруженных логических выводов.

Этот чип является вторым поколением TPU-продуктов компании Zhonghao Xinying. Вычислительная мощность «Сюйюй» в три раза превышает мощность предыдущего поколения «Чана», с акцентом на повышение пропускной способности вычислений при обучении и логических выводах моделей.

Работа больших моделей зависит не только от пиковой вычислительной мощности, но и от объема видеопамяти, кэша на кристалле, межчипового соединения, пропускной способности связи, библиотеки операторов и программного фреймворка. Длинноконтекстные логические выводы, многораундовые диалоги, задачи с агентами и пакетная генерация создают большое количество KV-кэша, вызовов параметров и передачи промежуточных данных. Если возможности хранения и межсоединений недостаточны, вычислительные блоки будут замедлены передачей данных. Одновременный запуск «Тайцзэ 2.0» вместе с «Сюйюй» показывает, что технический подход компании заключается не в поставке отдельного чипа, а в создании комплексной платформы для интеллектуальных вычислений, включающей чип, ускорительную карту, сервер, системное ПО, библиотеку операторов, кластерное планирование и адаптацию моделей. Такая платформа напрямую влияет на стабильность работы ИИ-моделей в крупномасштабных вычислительных кластерах.

«Тайцзэ 2.0» предназначена для развертывания кластеров ИИ-вычислений и выполняет роль программно-аппаратной координации. Чип отвечает за базовые вычисления, а платформа — за загрузку моделей, планирование задач, управление ресурсами и эксплуатацию.

Адаптация экосистемы моделей — еще один ключевой момент этого запуска. Согласно открытой информации, «Тайцзэ 2.0» совместима с инструментами и фреймворками распределенного обучения и логических выводов, такими как PyTorch, vLLM, SGLang, DeepSpeed, Megatron-LM, а также адаптирована для больших языковых и мультимодальных моделей, включая Qwen, DeepSeek, GLM, MiniMAX. Для компаний, занимающихся ИИ-чипами, аппаратные параметры — это лишь первый уровень возможностей. Скорость, с которой разработчики могут перенести модели, стабильность работы операторов, эффективность вызова фреймворков логических выводов и возможность масштабирования кластера определяют скорость внедрения чипа в реальные проекты. Компания Zhonghao Xinying подчеркивает, что IP-ядро чипа, специализированный набор команд, библиотека ускорения базовых операторов и системное ПО всего устройства разработаны самостоятельно, с основной целью снижения затрат на адаптацию при переносе моделей и развертывании вычислительных мощностей.

Промышленный ИИ, научные вычисления, правительственные и корпоративные центры интеллектуальных вычислений, а также платформы для отраслевых больших моделей предъявляют к вычислительным системам требования, переходящие от «способности запускать модели» к «долгосрочной стабильной работе». Задачи, такие как распознавание состояния оборудования, промышленный визуальный контроль, ответы на вопросы на основе базы знаний, оптимизация технологических параметров, вспомогательные исследования и прогностическое обслуживание, требуют не только высокой пропускной способности логических выводов, но и стабильного отклика, контроля энергопотребления и поддерживаемой программной среды.

После выпуска «Сюйюй» TPU-направление компании Zhonghao Xinying выходит на этап более высокой вычислительной мощности. Дальнейшая техническая ценность будет в основном зависеть от возможностей массового производства чипов, эффективности межкластерного соединения, зрелости программного стека, диапазона адаптации моделей и реальных показателей работы в сценариях эксплуатации.

Китай

Информация и коммуникация

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com

Предыдущий：«Самый мощный мозг» для борьбы с наводнениями: модель GAST прогнозирует паводки с более чем 3 миллионами расчетных ячеек за 30 секунд

Следующий：Прорыв в решении проблемы пикового регулирования! Блок №6 электростанции Наньшань компании Хуанэн достиг «нулевого вмешательства» и «глубокой экономии энергии»