Репортаж от Wedoany,Amazon Web Services (AWS) представила вычислительно-оптимизированные экземпляры C9g на базе собственного процессора Graviton5, предназначенные для вычислительно-интенсивных рабочих нагрузок, которые теперь доступны в общем доступе.

Количество ядер процессора Graviton5 в экземплярах C9g вдвое превышает показатели предыдущего поколения, а задержка между ядрами снижена на 33%. В настоящее время эти экземпляры доступны в регионах Восточное побережье США, Западное побережье США и Европа (Франкфурт), с последующим расширением на другие регионы.
Это последнее обновление AWS в линейке вычислительно-оптимизированных продуктов после запуска экземпляров EC2 M9g и M9gd в июне. AWS сообщает, что по сравнению с экземплярами предыдущего поколения C8g, производительность каждого виртуального CPU (vCPU) в C9g повышена до 25%.
В плане применения эти экземпляры оптимизированы для агентских рабочих нагрузок. Главный разработчик-пропагандист AWS Sébastien Stormacq отмечает, что более высокая скорость обработки и увеличенный кэш сокращают время ожидания данных для рабочих нагрузок, тем самым повышая пропускную способность анализа памяти, ускоряя агентские циклы и улучшая скорость отклика в реальном времени. По мере того как ИИ переходит от ответов на вопросы к выполнению задач, запуску кода и оркестрации многошаговых рабочих процессов, растет потребность в вычислительных мощностях CPU, и экземпляры C9g спроектированы именно для таких задач.
Одновременно запущенные экземпляры C9gd оснащены локальными твердотельными накопителями NVMe (SSD) и подходят для сценариев, требующих низкой задержки хранения, таких как моделирование высокопроизводительных вычислений (HPC) и рекламные движки. По сравнению с предыдущим поколением экземпляров с локальным хранилищем, их высокоскоростное хранилище с низкой задержкой обеспечивает более высокую пропускную способность и количество операций ввода/вывода в секунду (IOPS).
C9g и C9gd — первые вычислительно-оптимизированные экземпляры AWS, оснащенные изолирующим движком Nitro. Этот компонент безопасности управляет доступом к памяти виртуальных машин, состоянию регистров CPU и устройствам ввода/вывода через минимальный набор API, обеспечивая математически подтвержденную изоляцию между виртуальными машинами. Ранее запущенные экземпляры M9g и M9gd также получили эту функцию.
Обе серии экземпляров предлагают 11 конфигураций от medium до 48xlarge, а также опцию bare metal. Данные AWS показывают, что по сравнению с предыдущим поколением средняя пропускная способность сети для разных конфигураций увеличена на 15%, а пропускная способность Elastic Block Store (EBS) — на 20%.
AWS продолжает расширять линейку экземпляров на базе собственных чипов, предоставляя облачным клиентам более широкий выбор базового оборудования помимо Nvidia. В марте этого года облачный провайдер заключил партнерство с чиповой компанией Cerebras, объединив свои серверы Trainium с пластинчатой системой CS-3; одновременно, усилия по оптимизации собственных чипов для ИИ привели к созданию Project Rainier — сверхмасштабного кластерного объекта для Anthropic, оснащенного более чем 500 000 чипов Trainium2.
Расширение AWS сопровождается корректировкой затрат. С 1 июля стоимость блоков емкости EC2 для зарезервированных услуг GPU машинного обучения вырастет примерно на 20%, что является вторым повышением цен за последние шесть месяцев.









