Репортаж от Wedoany,AWS объявила о запуске инстансов Amazon Elastic Compute Cloud (Amazon EC2) G7, оснащённых GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, которые обеспечивают ускорение для рабочих нагрузок, связанных с ИИ-инференсом, обработкой графики и анализом данных. AWS является первым крупным облачным провайдером, поддерживающим этот GPU.

Инстансы G7 работают в связке GPU NVIDIA RTX PRO 4500 Blackwell Server Edition с кастомными процессорами Intel Xeon Scalable шестого поколения. По сравнению с инстансами G6, производительность ИИ-инференса на G7 увеличена до 4,6 раз, а производительность графики — до 2,1 раза. Эти инстансы также обеспечивают более высокую производительность для ускоренного анализа данных на GPU в Amazon EMR на Amazon Elastic Kubernetes Service (Amazon EKS). Сферы применения включают ИИ-инференс, рендеринг графики, транскодирование и анализ видео, пространственные вычисления, инфраструктуру виртуальных рабочих столов (VDI) и анализ данных.
Инстансы G7 демонстрируют значительный прогресс в объёме видеопамяти. GPU NVIDIA RTX PRO 4500 Blackwell Server Edition оснащён 32 ГБ видеопамяти, а в сочетании с тензорными ядрами пятого поколения и RT-ядрами четвёртого поколения обеспечивает увеличение ёмкости видеопамяти в 1,33 раза и пропускной способности видеопамяти в 2,45 раза по сравнению с G6. В части сети и хранения данных инстансы G7 предлагают пропускную способность EFA до 700 Гбит/с, что в 7 раз выше, чем у G6, обеспечивая низкую задержку и высокую пропускную способность для ИИ-инференса и графических приложений. Максимальный объём локального NVMe SSD-хранилища составляет 7,6 ТБ, что снижает накладные расходы на передачу данных и повышает пропускную способность. В области видеокодирования девятое поколение NVENC и шестое поколение NVDEC поддерживают кодирование и декодирование 4:2:2, а количество одновременных видеопотоков увеличено в 1,5 раза по сравнению с G6.
Инстансы G7 могут быть оснащены до 8 GPU NVIDIA RTX PRO 4500 Blackwell Server Edition с общим объёмом видеопамяти до 256 ГБ (по 32 ГБ на каждый GPU). Инстансы оснащены кастомными процессорами Intel Xeon Scalable и предлагаются в 7 конфигурациях, поддерживая до 192 vCPU, пропускную способность сети до 700 Гбит/с, системную память до 768 ГиБ и локальное NVMe SSD-хранилище до 7,6 ТБ.
С точки зрения технических характеристик инстансы G7 поддерживают NVIDIA GPUDirect P2P для многопроцессорных конфигураций GPU, а также NVIDIA GPUDirect RDMA для EFA и Amazon FSx for Lustre, обеспечивая низкую задержку межпроцессорного взаимодействия GPU для многопроцессорных и многоузловых рабочих нагрузок.
Инстансы G7 можно быстро развернуть с помощью AWS Deep Learning AMI (DLAMI) или NVIDIA Workstation AMI, которые предварительно настроены с драйверами GPU для ИИ-инференса и графических рабочих нагрузок. В Amazon EKS пользователи могут использовать автоматизированные инструменты EKS для создания EKS AMI на основе драйвера NVIDIA версии R595. Инстансы совместимы с операционными системами Amazon Linux, Ubuntu, RHEL и Windows Server, а также поддерживают стандартные графические библиотеки DirectX, Vulkan и OpenGL. Инстансы Amazon EC2 G7 в настоящее время доступны в двух регионах AWS: Восток США (Огайо) и Запад США (Орегон).
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









