3-нм техпроцесс, 192 ядра: самый мощный процессор на архитектуре Arm официально запущен
2026-06-11 15:42
В избр.

10 июня по местному времени Amazon Web Services (AWS) официально объявила о запуске экземпляров Amazon EC2 M9g и M9gd на базе своего пятого поколения собственного процессора Arm — Graviton5, анонсированного в декабре прошлого года. Это не просто очередная аппаратная итерация, но и, по мнению отрасли, ключевой шаг AWS в преддверии эры «агентного ИИ» (Agentic AI).

3-нм техпроцесс, 192 ядра

С развитием агентного ИИ рабочая нагрузка ИИ претерпевает фундаментальные изменения: от простых «текстовых ответов на вопросы» к «автономным действиям» — рассуждениям в реальном времени, генерации кода, многошаговой оркестрации задач и вызовам межсистемных инструментов. Эти задачи предъявляют беспрецедентные требования к высокой степени параллелизма и низкой задержке к центральным процессорам (ЦП), отвечающим за логическое управление и планирование. AWS Graviton5, спроектированный с использованием больших ядер, большого кэша и высокой пропускной способности памяти, создан именно для удовлетворения потребностей «агентного ИИ».

Graviton5 производится по 3-нм техпроцессу TSMC, что позволяет разместить больше транзисторов в том же энергопотреблении, обеспечивая более высокую плотность схем и энергоэффективность.

Ядро Neoverse V3, установленное в Graviton5, было совместно разработано Arm и AWS Annapurna Labs. Хотя объем кэша первого уровня (64 КБ) и второго уровня (2 МБ) не является главной особенностью, кэш третьего уровня (L3 Cache) был увеличен в 5 раз, до 192 МБ, что позволяет хранить большие объемы «горячих» данных ближе к ядру. Кроме того, значительно улучшена способность предсказания ветвлений, что обеспечивает прирост производительности до 30% при выполнении сложного кода, такого как реальные базы данных, что недостижимо для простых синтетических тестов.

Что касается количества ядер, Graviton5 совершил скачок с 96 ядер у Graviton4 до 192 ядер, что представляет собой 100%-ный рост. Но что еще важнее, AWS отказалась от прежней архитектуры с одним кристаллом (Die) и перешла на передовую конструкцию с 4 чиплетами (Chiplet). Это означает, что 192 ядра равномерно распределены по 4 независимым чиплетам, каждый из которых содержит 48 ядер и интегрирует собственный контроллер памяти DRAM и контроллер ввода-вывода PCIe 6.0.

Такая конструкция дает два основных преимущества: во-первых, данным больше не нужно преодолевать большие расстояния по всему кристаллу для доступа к памяти или устройствам ввода-вывода, что значительно снижает задержки; во-вторых, благодаря технологии межчиплетного взаимодействия обеспечивается пропускная способность до 420 ГБ/с между четырьмя чиплетами, гарантируя эффективность совместной работы всей вычислительной сети.

Что еще более важно, Graviton5 стал первым процессором в облаке, поддерживающим память DDR5-8800 и PCIe Gen 6. AWS подчеркивает, что благодаря тесному сотрудничеству с производителями DRAM, Graviton5 обеспечивает самую высокую скорость памяти среди всех текущих облачных процессоров. Для приложений, чувствительных к пропускной способности памяти (например, крупные базы данных, аналитика в реальном времени), это означает значительное ослабление «узкого горла».

Кроме того, Graviton5 использует конструкцию без крышки (снятие металлической теплораспределительной крышки процессора для прямого контакта кристалла с системой охлаждения), что снижает энергопотребление вентилятора охлаждения на 33%.

Ранее AWS в своем заявлении прямо назвала Graviton5 «самым производительным и энергоэффективным собственным процессором на сегодняшний день» (our most powerful and energy efficient custom-designed chip yet). Хотя это утверждение ограничивается рамками собственных разработок AWS, учитывая рыночные позиции AWS в области серверных чипов на архитектуре Arm, оно имеет значительную справочную ценность.

Превосходство экземпляров M9g в различных сценариях

Улучшение аппаратных характеристик Graviton5 в конечном итоге должно проявиться в повышении производительности экземпляров. Как первый носитель Graviton5, экземпляры M9g продемонстрировали убедительные результаты по нескольким направлениям.

Согласно официальным данным AWS, экземпляры M9g по сравнению с предыдущим поколением M8g на базе Graviton4 обеспечивают: повышение общей вычислительной производительности на 25%; повышение производительности веб-приложений на 35%; повышение производительности логического вывода машинного обучения на 35%; повышение производительности баз данных на 30%.

В течение нескольких месяцев предварительного доступа ряд ведущих отраслевых клиентов подтвердили эти цифры в реальных производственных средах:

ClickHouse: прирост производительности на 36% без изменения кода.

Honeycomb: в ходе 6-месячного A/B-тестирования производственных рабочих нагрузок наблюдаемости пропускная способность на ядро увеличилась на 36%.

HubSpot: после миграции базы данных MySQL на M9g время выполнения запросов сократилось на 60%.

Meta: обязалась развернуть десятки миллионов ядер Graviton для своих проектов агентного ИИ, став одним из крупнейших клиентов Graviton в мире.

Для рабочих нагрузок, требующих локального высокоскоростного хранилища, AWS также представила экземпляры M9gd, предлагающие до 11,4 ТБ NVMe SSD с производительностью IOPS на 30% выше, чем у предыдущего поколения. Что касается сети, пропускная способность сети для максимального экземпляра увеличена до 100 Гбит/с, пропускная способность EBS — до 72 Гбит/с, а также поддерживается конфигурация пропускной способности экземпляра (IBC), позволяющая динамически распределять до 25% пропускной способности между сетью VPC и хранилищем EBS для адаптации к различным задачам, чувствительным к вводу-выводу.

Первая интеграция изолирующего движка Nitro

Помимо производительности, Graviton5 впервые включает еще одну веху в системе безопасности AWS — изолирующий движок Nitro.

Традиционная виртуализационная изоляция основана на ряде программных и аппаратных проверок и тестов, которые теоретически могут иметь необнаруженные уязвимости. Изолирующий движок Nitro использует технологию формальной верификации — метод, который с помощью математической логики доказывает, что поведение аппаратного или программного обеспечения полностью соответствует ожиданиям (а не просто проходит определенные тестовые сценарии). Этот движок, будучи специализированным компонентом, строго контролирует доступ ко всей памяти виртуальных машин, состоянию регистров ЦП и устройствам ввода-вывода через минимальный набор API.

Это делает AWS Nitro первым формально верифицированным облачным гипервизором. Это уже не «мы верим, что это безопасно», а «математически доказано, что это безопасно». Для финансовых, государственных и чувствительных к безопасности рабочих нагрузок это обеспечивает беспрецедентный уровень изоляции, подтвержденный математически.

Доступность и запуск

В настоящее время экземпляры M9g и M9gd официально доступны в регионах AWS US East (Северная Виргиния, Огайо), US West (Орегон) и Europe (Франкфурт). Клиенты могут приобрести их по запросу, в виде зарезервированных экземпляров или через планы Savings Plans. Чтобы помочь клиентам с плавным переходом, AWS также предлагает краткое руководство по началу работы с Graviton, панель мониторинга экономии средств и сервис преобразования кода на основе ИИ AWS Transform, который может автоматически переносить Java-приложения с архитектуры x86 на экземпляры Graviton.

Согласно данным AWS, в настоящее время более 120 000 клиентов используют процессоры Graviton, поддерживается более 350 типов экземпляров, охватывающих все области: от веб-приложений, микросервисов, контейнеров до автоматизации проектирования электроники (EDA), игр и кодирования видео. Бизнес по производству чипов с годовым доходом более 20 миллиардов долларов и трехзначным ростом доказывает, что стратегия собственных разработок AWS — это не просто технологическое исследование, но и стало основным источником прибыли и фактором дифференциации ее облачного бизнеса.

Запуск Graviton5 знаменует собой очередной решающий шаг AWS на пути создания собственных облачных чипов. Компания больше не довольствуется догонянием архитектуры x86 по соотношению цена/производительность, а, благодаря перспективной оптимизации для рабочих нагрузок агентного ИИ, пытается определить вычислительную основу следующего поколения облачных вычислений.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com