Репортаж от Wedoany,15 июня компания Sugon представила новое поколение универсальной платформы высокопроизводительных вычислений. Платформа оснащена первым отечественным 10-терафлопсным универсальным процессором, использующим архитектуру с 128 ядрами и 512 потоками, обеспечивающим производительность FP64 двойной точности на уровне 10 терафлопс на одном процессоре. По сравнению с предыдущим поколением, относительная производительность платформы в тесте HPL (двойная точность с плавающей запятой) увеличилась почти в 2 раза, производительность памяти STREAM — почти вдвое, а средняя производительность приложений — почти вдвое. В целом, характеристики впервые достигли флагманского уровня международных производителей. Данный релиз ориентирован на высокоточные вычислительные сценарии, такие как научные вычисления, промышленное моделирование, инженерное проектирование, метеорология и океанология, энергетическая разведка и AI for Science, что свидетельствует о выходе китайской универсальной платформы высокопроизводительных вычислений на новый инженерный этап с точки зрения производительности процессора, доступа к памяти и адаптации приложений.
Основная ценность универсальной платформы высокопроизводительных вычислений заключается в том, что она обслуживает не только отдельные задачи обучения ИИ, но и поддерживает множество научных и инженерных приложений, которые зависят от вычислений с двойной точностью и высокой пропускной способности памяти. HPL в основном используется для измерения пиковой производительности системы в высокоточных вычислениях с плавающей запятой, а STREAM отражает пропускную способность памяти и эффективность доступа к ней. Для климатического моделирования, гидродинамики, структурного моделирования, расчета материалов, поиска лекарств, нефтегазовой разведки и сложного промышленного дизайна производительность процессора в двойной точности, возможности доступа к памяти и совместимость с программной экосистемой напрямую влияют на стабильность выполнения задач, возможность сокращения вычислительных циклов, а также на возможность недорогой миграции существующего научного и промышленного программного обеспечения.
Установленный на данной платформе отечественный 10-терафлопсный универсальный процессор повышает производительность одного процессора в режиме FP64 двойной точности до уровня 10 терафлопс и использует многопоточную архитектуру с сотнями ядер. В отличие от вычислительных подходов, ориентированных исключительно на ускорители или специализированные чипы, универсальная процессорная платформа делает больший упор на совместимость экосистем, планирование задач, обработку сложных ветвлений и возможность запуска крупномасштабного инженерного программного обеспечения. Публичная информация также показывает, что данная платформа является первой отечественной универсальной вычислительной платформой, совместимой с набором инструкций AVX-512, и изначально совместима с экосистемой x86, что может снизить затраты на миграцию программных приложений и экосистем в соответствующих областях. Это означает, что при миграции приложений высокопроизводительных вычислений пользователям не придется полностью перестраивать программную среду, и им будет проще продолжить использование существующих библиотек алгоритмов, компиляторов и инженерных процессов.
С точки зрения системной инженерии, это обновление представляет собой не просто замену одного процессора, а платформенную совместную оптимизацию вокруг «вычислений, хранения и сети». Задачи высокопроизводительных вычислений часто требуют параллельной работы большого количества узлов, и узким местом может стать любой элемент: процессор, память, сеть взаимосвязей, ввод-вывод данных или система охлаждения. Если производительность одного процессора повышается, но доступ к памяти, взаимосвязи и охлаждение не поспевают за ним, реальная производительность приложений все равно не сможет раскрыться. Компания Sugon в этот раз подчеркивает синхронное повышение производительности HPL, STREAM и приложений, что указывает на то, что оптимизация платформы охватила несколько аспектов: вычислительное ядро, доступ к памяти, системные взаимосвязи и адаптацию прикладного программного обеспечения. Это является ключом к переходу универсальной платформы высокопроизводительных вычислений от параметров чипа к реальной инженерной пригодности.
Формы охлаждения также отражают потребности платформы в развертывании в вычислительных центрах различного масштаба. Как сообщает издание «Кэчубань жибао», платформа предлагает вычислительные узлы с тремя типами охлаждения: воздушным, жидкостным с холодной пластиной и иммерсионным жидкостным, что позволяет адаптироваться к строительству вычислительных центров различного масштаба. Для высокоплотных вычислительных систем возможности охлаждения напрямую ограничивают мощность стойки и стабильность непрерывной работы. Воздушное охлаждение подходит для некоторых традиционных серверных и средне-низкоплотных развертываний, в то время как жидкостное охлаждение с холодной пластиной и иммерсионное жидкостное охлаждение больше подходят для сред с высокой плотностью, высокой энергоэффективностью и крупномасштабными кластерами. По мере одновременного роста нагрузки научных вычислений и вычислений ИИ, вычислительным центрам необходимо заново балансировать между производительностью, энергопотреблением, пространством и сложностью эксплуатации. Платформенные решения для охлаждения станут важной опорой для крупномасштабного развертывания отечественных высокопроизводительных вычислительных систем.
Этот релиз также показывает, что ценность процессоров в высокопроизводительных вычислениях и ИИ-инфраструктуре переосмысливается. Графические процессоры и ускорители ИИ занимают центральное место в обучении и инференсе больших моделей, однако большое количество научных вычислений, промышленного моделирования и системного планирования по-прежнему полагаются на высокопроизводительные универсальные процессоры. Особенно в сценариях AI for Science, где традиционное численное моделирование, предварительная обработка данных, обучение моделей, анализ результатов и инженерная верификация часто выполняются в смешанном режиме, процессоры, ускорители, память и высокоскоростные взаимосвязи должны формировать единую платформенную возможность. Если новое поколение универсальной платформы высокопроизводительных вычислений компании Sugon сможет пройти непрерывную верификацию в области миграции приложений, совместимости экосистем и развертывания кластеров, это будет способствовать повышению способности Китая к самостоятельному обеспечению высокопроизводительной вычислительной инфраструктурой.
В дальнейшем необходимо наблюдать за реальной производительностью платформы в пользовательских сценариях. Лабораторные показатели производительности и параметры, объявленные на презентации, — это лишь отправная точка. Научно-вычислительные центры, платформы промышленного моделирования, энергетические компании, научно-исследовательские институты и центры интеллектуальных вычислений больше заинтересованы в стабильной работе в течение длительного времени, совместимости программного обеспечения, масштабируемости кластеров, энергопотреблении, сроках поставки и эксплуатационных расходах. Если данная платформа сможет поддерживать повышенную производительность вычислений с двойной точностью, доступа к памяти и приложений в сложных сценариях, а также поддерживать крупномасштабное развертывание с различными формами охлаждения, она предоставит новую универсальную вычислительную базу для высокопроизводительной вычислительной инфраструктуры Китая, а также обеспечит более мощную локализованную вычислительную поддержку для научных исследований, передового производства и цифровых инженерных приложений.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









