Американские технологические гиганты ускоряют разработку собственных ИИ-чипов, производительность AWS на ватт выросла в 4 раза
2026-06-30 09:48
В избр.

Репортаж от Wedoany,С наступлением эры «агентного ИИ», обладающего способностью к самостоятельному принятию решений и действиям, центр тяжести глобального рынка ИИ-инфраструктуры быстро смещается от масштабного «обучения» к «инференсу», необходимому для реальных сервисов. В этом процессе эффективность использования электроэнергии в центрах обработки данных и совокупная стоимость владения (TCO) становятся важнее абсолютной производительности отдельных чипов. Чтобы подорвать доминирование NVIDIA на рынке, мировые производители оборудования, технологические гиганты и южнокорейские компании, разрабатывающие K-AI полупроводники, ускоряют свои действия.

Резкий рост вычислительных потребностей и монопольное положение GPU от NVIDIA создают для компаний давление на издержки, побуждая мировых технологических гигантов начинать разработку собственных ИИ-полупроводников, оптимизированных для их центров обработки данных и сервисов. Эти компании стремятся создать полностековую инфраструктуру, охватывающую чипы, серверные архитектуры, сети и программное обеспечение, чтобы максимизировать «экономику токенов» и «энергоэффективность» в реальных условиях эксплуатации. Google Cloud обновил свой собственный ИИ-полупроводник TPU до шестого поколения «Trillium», значительно повысив вычислительную производительность и объем высокоскоростной памяти (HBM) по сравнению с предыдущим поколением. Он используется для обучения и инференса большой модели «Gemini», а также поставляется внешним клиентам через платформу Google Cloud Platform (GCP). Microsoft (MS) для оптимизации соотношения цены и производительности инфраструктуры Azure Cloud выпустила серию кастомных ИИ-ускорителей «Maia», разработанных в партнерстве с OpenAI по дизайну чипов, чтобы снизить эксплуатационные расходы на сервисы Azure OpenAI (например, ChatGPT). Meta внедряет собственный ускоритель обучения и инференса «MTIA» (Meta Training and Inference Accelerator), оптимизированный для алгоритмов рекомендации рекламы и механизма сортировки ленты новостей. Он обрабатывает масштабные вычисления с низким энергопотреблением и уже расширен на сервисный инференс серии ее открытых больших языковых моделей «Llama».

Среди технологических гигантов AWS придерживается двусторонней стратегии: с одной стороны, расширяет экосистему собственных чипов, с другой — сохраняет партнерство с NVIDIA. Бизнес ускорителей AWS достиг десятков миллиардов долларов и стал ключевым уровнем инфраструктуры. Более 50% токенов в полностью управляемом генеративном ИИ-сервисе «Amazon Bedrock» обрабатываются на инфраструктуре собственных ускорителей «Trainium» и «Inferentia». «Trainium2», оснащенный 16 чипами и способный обрабатывать модели с параметрами до 1 триллиона, обеспечивает на 30-40% лучшее соотношение цены и производительности по сравнению с аналогичными экземплярами универсальных GPU. Его квартальная выручка выросла на 150%, и он уже привлек таких партнеров, как Anthropic (для строительства тренировочного кластера «Project Rainier»), а также Apple, Uber, Databricks в качестве производственных партнеров. Специализированный чип для инференса «Inferentia» обеспечивает до 2,3 раза более высокую пропускную способность и до 70% более низкую стоимость инференса по сравнению с существующими экземплярами. AWS уже представила «Trainium3», оптимизированный для агентного ИИ и рабочих нагрузок по генерации видео. Его производительность на ватт выросла до 4 раз по сравнению с предыдущим поколением, а предварительные тесты показывают экономию до 50% затрат на обучение по сравнению с универсальными GPU. «EC2 Trn3 UltraServer», объединяющий до 144 чипов Trainium3, обеспечивает вычислительную производительность 362 FP8 PFLOPs и 20,7 ТБ памяти HBM3e. В сочетании с неблокирующей Petabit-сетью на основе эластичного структурного адаптера (EFA), образующей «EC2 UltraCluster 3.0», десятки тысяч чипов работают как единый ускоритель. Новая функция «Neuron Agentic Development», запущенная в 2026 году, позволяет ИИ-агентам по кодированию автоматически переносить существующие модели на Trainium и выполнять проверку числовой согласованности, устраняя барьеры для миграции оборудования.

Кроме того, лагерь технологических гигантов снижает зависимость от «CUDA» от NVIDIA через альянсы открытого программного обеспечения. AWS продвигает открытый «Neuron SDK», основанный на открытом стандарте XLA и интегрированный с отраслевыми стандартными фреймворками, такими как PyTorch, JAX, vLLM, Hugging Face, что позволяет разработчикам использовать эти библиотеки с минимальными изменениями кода. Глобальный рынок ускорителей переходит от монополии на универсальное оборудование к эпохе архитектурного разнообразия. Конкуренция технологических гигантов в области собственных кремниевых чипов и эффективности полностековой инфраструктуры будет усиливаться из-за резкого роста рабочих нагрузок агентного ИИ и генерации высокообъемного медиаконтента.

(Источник: Pixabay)

Архитектор решений AWS Ли Су Чжи, комментируя стратегию ИИ-инфраструктуры, отметил, что инвестиции AWS в разработку собственных ИИ-кремниевых чипов направлены не просто на замену конкретного оборудования, а на предоставление клиентам лучшего соотношения цены и производительности и более широкого выбора, создавая положительный цикл ускоренных вычислений. Только сосуществование множества архитектур на рынке позволит через конкуренцию добиться снижения цен и улучшения производительности. При оценке ИИ-инфраструктуры ключевым фактором является органично интегрированная полностековая система, включающая ускорители, поддерживающую их серверную архитектуру, сеть, объединяющую крупные кластеры, а также программное обеспечение и управляемые сервисы, максимально раскрывающие потенциал оборудования. Только так можно снизить TCO. В среде ИИ следующего поколения управление «экономикой токенов» и «энергоэффективностью» будет определять выживание бизнеса компаний. Агентный ИИ может планировать задачи, координировать их, реагировать в реальном времени, и его вычислительные характеристики постоянно меняются. Поскольку электроэнергия в центрах обработки данных является ограниченным ресурсом, производительность на ватт, то есть энергоэффективность, станет ключевым конкурентным преимуществом компаний.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Восемь китайских ведомств поощряют участие иностранного капитала в строительстве промышленного интернета
2026-06-30
Восемь ведомств Китая предложили углубить интеграцию искусственного интеллекта и промышленного интернета
2026-06-30
Восемь ведомств Китая поставили цель построить 50 000 частных промышленных сетей 5G к 2030 году
2026-06-30
Восемь ведомств Китая опубликовали рекомендации по синхронному развитию промышленного интернета и объектов интеллектуальных и суперкомпьютерных вычислений
2026-06-30
Китайская компания UBTech объявила стартовую цену на сверхбионического робота U1 от 119 800 юаней
2026-06-30
Южнокорейская SK Hynix досрочно зарезервировала заказы на оборудование для тестирования на сумму 400 млрд вон для завода HBM в Чхонджу
2026-06-30
Новая производственная линия шведской компании Hexatronic начнет работу в 2028 году, мощность по выпуску подводных кабелей превысит 500 миллионов крон
2026-06-30
Финская компания Metsä Group и Qutwo начинают сотрудничество по внедрению приложений искусственного интеллекта следующего поколения в лесной промышленности
2026-06-30
США выделяют I-Pulse 250 миллионов долларов на исследования и разработки в области полупроводников
2026-06-30
Cadence (США) и HPE ускоряют модернизацию центров обработки данных с помощью цифровых двойников
2026-06-30
Последние новости
1
Восемь китайских ведомств поощряют участие иностранного капитала в строительстве промышленного интернета
2
Совет Центрального побережья Австралии запускает проект по подпитке пляжа Джиммис-Бич
3
В районе Итакера (Сан-Паулу) продолжается реализация проекта по борьбе с наводнениями на ручье Риу-Верди
4
Восемь ведомств Китая предложили углубить интеграцию искусственного интеллекта и промышленного интернета
5
В Испании создан Совет по качеству архитектуры для продвижения качества и инноваций в строительстве
6
В Торонто (Канада) началось строительство трехбашенного проекта Canderel после получения финансирования от пяти банков
7
В Монреале (Канада) протестировали ИИ-инструмент WeDesign+ для помощи в планировании общественных пространств
8
Восемь ведомств Китая поставили цель построить 50 000 частных промышленных сетей 5G к 2030 году
9
Восемь ведомств Китая опубликовали рекомендации по синхронному развитию промышленного интернета и объектов интеллектуальных и суперкомпьютерных вычислений
10
Южнокорейская компания HD KSOE завершила сертификацию насоса высокого давления для СПГ-судов и получила заказы на около 70 судов