Американские технологические гиганты ускоряют разработку собственных ИИ-чипов, производительность AWS на ватт выросла в 4 раза_Глобальные новости

Американские технологические гиганты ускоряют разработку собственных ИИ-чипов, производительность AWS на ватт выросла в 4 раза

2026-06-30 09:48

В избр.

Репортаж от Wedoany，С наступлением эры «агентного ИИ», обладающего способностью к самостоятельному принятию решений и действиям, центр тяжести глобального рынка ИИ-инфраструктуры быстро смещается от масштабного «обучения» к «инференсу», необходимому для реальных сервисов. В этом процессе эффективность использования электроэнергии в центрах обработки данных и совокупная стоимость владения (TCO) становятся важнее абсолютной производительности отдельных чипов. Чтобы подорвать доминирование NVIDIA на рынке, мировые производители оборудования, технологические гиганты и южнокорейские компании, разрабатывающие K-AI полупроводники, ускоряют свои действия.

Резкий рост вычислительных потребностей и монопольное положение GPU от NVIDIA создают для компаний давление на издержки, побуждая мировых технологических гигантов начинать разработку собственных ИИ-полупроводников, оптимизированных для их центров обработки данных и сервисов. Эти компании стремятся создать полностековую инфраструктуру, охватывающую чипы, серверные архитектуры, сети и программное обеспечение, чтобы максимизировать «экономику токенов» и «энергоэффективность» в реальных условиях эксплуатации. Google Cloud обновил свой собственный ИИ-полупроводник TPU до шестого поколения «Trillium», значительно повысив вычислительную производительность и объем высокоскоростной памяти (HBM) по сравнению с предыдущим поколением. Он используется для обучения и инференса большой модели «Gemini», а также поставляется внешним клиентам через платформу Google Cloud Platform (GCP). Microsoft (MS) для оптимизации соотношения цены и производительности инфраструктуры Azure Cloud выпустила серию кастомных ИИ-ускорителей «Maia», разработанных в партнерстве с OpenAI по дизайну чипов, чтобы снизить эксплуатационные расходы на сервисы Azure OpenAI (например, ChatGPT). Meta внедряет собственный ускоритель обучения и инференса «MTIA» (Meta Training and Inference Accelerator), оптимизированный для алгоритмов рекомендации рекламы и механизма сортировки ленты новостей. Он обрабатывает масштабные вычисления с низким энергопотреблением и уже расширен на сервисный инференс серии ее открытых больших языковых моделей «Llama».

Среди технологических гигантов AWS придерживается двусторонней стратегии: с одной стороны, расширяет экосистему собственных чипов, с другой — сохраняет партнерство с NVIDIA. Бизнес ускорителей AWS достиг десятков миллиардов долларов и стал ключевым уровнем инфраструктуры. Более 50% токенов в полностью управляемом генеративном ИИ-сервисе «Amazon Bedrock» обрабатываются на инфраструктуре собственных ускорителей «Trainium» и «Inferentia». «Trainium2», оснащенный 16 чипами и способный обрабатывать модели с параметрами до 1 триллиона, обеспечивает на 30-40% лучшее соотношение цены и производительности по сравнению с аналогичными экземплярами универсальных GPU. Его квартальная выручка выросла на 150%, и он уже привлек таких партнеров, как Anthropic (для строительства тренировочного кластера «Project Rainier»), а также Apple, Uber, Databricks в качестве производственных партнеров. Специализированный чип для инференса «Inferentia» обеспечивает до 2,3 раза более высокую пропускную способность и до 70% более низкую стоимость инференса по сравнению с существующими экземплярами. AWS уже представила «Trainium3», оптимизированный для агентного ИИ и рабочих нагрузок по генерации видео. Его производительность на ватт выросла до 4 раз по сравнению с предыдущим поколением, а предварительные тесты показывают экономию до 50% затрат на обучение по сравнению с универсальными GPU. «EC2 Trn3 UltraServer», объединяющий до 144 чипов Trainium3, обеспечивает вычислительную производительность 362 FP8 PFLOPs и 20,7 ТБ памяти HBM3e. В сочетании с неблокирующей Petabit-сетью на основе эластичного структурного адаптера (EFA), образующей «EC2 UltraCluster 3.0», десятки тысяч чипов работают как единый ускоритель. Новая функция «Neuron Agentic Development», запущенная в 2026 году, позволяет ИИ-агентам по кодированию автоматически переносить существующие модели на Trainium и выполнять проверку числовой согласованности, устраняя барьеры для миграции оборудования.

Кроме того, лагерь технологических гигантов снижает зависимость от «CUDA» от NVIDIA через альянсы открытого программного обеспечения. AWS продвигает открытый «Neuron SDK», основанный на открытом стандарте XLA и интегрированный с отраслевыми стандартными фреймворками, такими как PyTorch, JAX, vLLM, Hugging Face, что позволяет разработчикам использовать эти библиотеки с минимальными изменениями кода. Глобальный рынок ускорителей переходит от монополии на универсальное оборудование к эпохе архитектурного разнообразия. Конкуренция технологических гигантов в области собственных кремниевых чипов и эффективности полностековой инфраструктуры будет усиливаться из-за резкого роста рабочих нагрузок агентного ИИ и генерации высокообъемного медиаконтента.

(Источник: Pixabay)

Архитектор решений AWS Ли Су Чжи, комментируя стратегию ИИ-инфраструктуры, отметил, что инвестиции AWS в разработку собственных ИИ-кремниевых чипов направлены не просто на замену конкретного оборудования, а на предоставление клиентам лучшего соотношения цены и производительности и более широкого выбора, создавая положительный цикл ускоренных вычислений. Только сосуществование множества архитектур на рынке позволит через конкуренцию добиться снижения цен и улучшения производительности. При оценке ИИ-инфраструктуры ключевым фактором является органично интегрированная полностековая система, включающая ускорители, поддерживающую их серверную архитектуру, сеть, объединяющую крупные кластеры, а также программное обеспечение и управляемые сервисы, максимально раскрывающие потенциал оборудования. Только так можно снизить TCO. В среде ИИ следующего поколения управление «экономикой токенов» и «энергоэффективностью» будет определять выживание бизнеса компаний. Агентный ИИ может планировать задачи, координировать их, реагировать в реальном времени, и его вычислительные характеристики постоянно меняются. Поскольку электроэнергия в центрах обработки данных является ограниченным ресурсом, производительность на ватт, то есть энергоэффективность, станет ключевым конкурентным преимуществом компаний.

США

Информация и коммуникация Проектирование интегральных микросхем Искусственный интеллект

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com

Предыдущий：Корейская ИКТ-альянс приветствует «Мегапроект Большого скачка Кореи», сосредоточенный на полупроводниках и ИИ

Следующий：Китайская Shengda Resources прогнозирует рост чистой прибыли в первом полугодии на 399%-471%