Три ведущие южнокорейские компании в сфере ИИ-полупроводников ускоряют коммерческое развертывание в области логического вывода
2026-07-01 10:28
В избр.

Репортаж от Wedoany,По мере того как фокус рынка инфраструктуры ИИ смещается от крупномасштабного обучения к области логического вывода, отечественные южнокорейские компании-производители ИИ-полупроводников, используя уникальные архитектуры и практические примеры, ускоряют расширение своего присутствия, пытаясь найти уязвимые места Nvidia на глобальном рынке инфраструктуры следующего поколения.

К числу ведущих компаний южнокорейского лагеря ИИ-полупроводников относятся Rebellions, Mobilint и HyperAccel, каждая из которых конкурирует на основе различных целевых рынков и технологических путей. Rebellions утвердила свою независимую позицию благодаря массовому производству высокопроизводительных чипов и крупномасштабной коммерциализации. Ее флагманский продукт следующего поколения 'REBEL100' использует передовую архитектуру Chiplet, объединяющую 4 чипа, и оснащен памятью HBM3E пятого поколения, обеспечивая высокопроизводительные вычисления, сопоставимые с существующими флагманскими GPU, при отличной энергоэффективности. Rebellions уже внедрила свои NPU в сервис 'A.' от SK Telecom для расшифровки телефонных разговоров, который генерирует до 50 миллионов вызовов API в день. В настоящее время, при среднемесячном объеме в 20 миллионов и среднесуточном в 700 тысяч вызовов, связанных с логическим выводом, NPU Rebellions заменили существующие GPU и стабильно обрабатывают нагрузку. Кроме того, их продукция используется в сервисе AI-диагностики для домашних животных 'Excalibur', который применяется в более чем 1000 ветеринарных клиниках по всей стране.

NPU Rebellions (Источник изображения: Rebellions)

Mobilint с самого начала нацелилась на рынок логического вывода как в центрах обработки данных, так и на оконечных устройствах, разрабатывая высокопроизводительные и энергоэффективные NPU. Ее флагманский продукт 'ARIES' обеспечивает производительность до 80 TOPS при энергопотреблении всего около 25 Вт. Mobilint сотрудничает с компанией MetaM, специализирующейся на AI-контакт-центрах, для эксплуатации платформы AI-консультаций на базе NPU, а с промышленными AI-компаниями, такими как POSCO DX, — для создания и технической проверки индивидуальной AI-инфраструктуры для производственных площадок. Компания также поставила универсальный AI-продукт 'MLX-A1' университету Йонсе (Yonsei University). Недавно Mobilint успешно завершила проект, поддержанный Министерством науки и информационно-коммуникационных технологий Республики Корея (MSIT), по внедрению и распространению периферийных AI-сервисов. В рамках проекта NPU 'ARIES' и 'REGULUS' были установлены на камеры лесного пожаротушения и дроны, создав инфраструктуру управления катастрофами, способную в реальном времени обнаруживать пожары и прогнозировать пути их распространения с помощью 3D-карт. Mobilint планирует выпустить во втором полугодии этого года первый среди южнокорейских NPU-компаний универсальный AI SoC 'REGULUS'.

HyperAccel с самого начала разработала 'LPU (LLM Processing Unit)', специально предназначенный для рабочих нагрузок генеративного ИИ и логического вывода LLM. Он использует относительно недорогую и энергоэффективную память LPDDR5x, одновременно максимизируя использование пропускной способности, что обеспечивает экономическую эффективность с точки зрения задержки, энергоэффективности и совокупной стоимости владения (TCO). Начиная с сервера 'Orion', HyperAccel продвигает продуктовую дорожную карту, ориентированную на центры обработки данных и периферийные вычисления. Компания сотрудничает с Naver Cloud для создания AI-инфраструктуры логического вывода, оптимизированной для среды центров обработки данных, и с LG Electronics для применения технологий логического вывода в различных устройствах. Благодаря сотрудничеству с такими глобальными ключевыми партнерами, как Samsung Electronics, SemiFive, Advantech, INVENTEC и HPE, компания одновременно доказывает свою технологическую конкурентоспособность и масштабируемость коммерциализации.

LPU HyperAccel (Источник изображения: HyperAccel)

Все три компании уловили изменение эпохи, когда фокус инфраструктуры смещается от обучения к логическому выводу и AI-агентам, и разрабатывают эффективные архитектуры для рабочих нагрузок логического вывода, чтобы максимизировать ценность TCO. Чтобы разрушить барьеры аппаратной и программной блокировки, созданные вокруг Nvidia, они полностью приняли открытые экосистемы с открытым исходным кодом, активно поддерживая собственные программные стеки или SDK, что позволяет разработчикам напрямую использовать такие фреймворки, как PyTorch, Hugging Face, vLLM, Triton, без необходимости сложного портирования или изменения кода. Все три компании стремятся накопить практические примеры и создать глобальные альянсы, начиная глобальную экспансию на основе таких примеров, как крупномасштабный сервис расшифровки звонков, AI-консультации и совместная разработка с Naver Cloud, накопленных на внутреннем рынке.

По мере смещения фокуса рынка AI-инфраструктуры в сторону логического вывода, отечественные NPU-облачные сервисы (NPUaaS), сочетающие соотношение цены и производительности с технологическим суверенитетом, привлекают внимание. Более 55% глобальных расходов на AI-инфраструктуру приходится на логический вывод, а от 80% до 90% затрат на весь жизненный цикл составляют затраты на логический вывод, что увеличивает спрос на альтернативы дорогим GPU. Gabia в апреле этого года официально запустила NPUaaS на базе чипа Rebellions 'ATOM-Max', который на глобальном конкурсе оценки производительности ИИ 'MLPerf' показал скорость обработки в 1,5–3 раза выше, чем у GPU того же класса, при повышении энергоэффективности в 3–4,5 раза. KT Cloud официально представила продукт 'NPU-сервер', соответствующий требованиям безопасности, для государственных учреждений и поставщиков решений для государственных AI-агентов. В настоящее время компания обеспечила и ввела в эксплуатацию около 300 NPU-ускорителей и планирует дополнительно внедрить чип следующего поколения Rebellions 'REBEL100' после начала его массового производства в третьем квартале этого года. Samsung SDS планирует запустить NPUaaS на базе NPU второго поколения 'RNGD' от FuriosaAI, интегрируя серверы RNGD непосредственно с уровнем виртуализации облачной платформы Samsung (SCP) с помощью технологии аппаратной виртуализации.

CSP единодушны во мнении, что будущая AI-инфраструктура перейдет в гетерогенную вычислительную среду, где будут сосуществовать GPU, NPU, TPU и другие процессоры. 'Суверенные облака', направленные на поддержание суверенитета данных, также являются положительным сигналом для отечественных NPU. Чтобы NPU могли обеспечить опыт разработчика, сопоставимый с 'CUDA' от Nvidia, текущая государственная поддержка проекта K-Cloud сочетается с программными инвестициями производителей полупроводников. Отраслевые эксперты подчеркивают, что роль CSP как конечного передатчика, реализующего технологическую ценность отечественных ИИ-полупроводников на местах, трансформируется в сторону интеграции проектирования сервисов, консультирования по оптимизации логического вывода, автоматизации платформ и обеспечения безопасности.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Bouygues Telecom завершила модернизацию оптоволоконной сети по всей Франции до 8 Гбит/с
2026-07-02
Чад сотрудничает с американской Cybastion для запуска национального центра обработки данных
2026-07-02
Индийская Bharti Airtel планирует открыть вторую штаб-квартиру в Хайдарабаде
2026-07-02
Британская компания nLighten инвестирует более 100 миллионов фунтов стерлингов в модернизацию дата-центра в Бристоле
2026-07-02
Компания Cadence (США) расширяет сотрудничество с HPE, сосредоточившись на цифровых двойниках центров обработки данных
2026-07-02
Samsung Electronics публикует дорожную карту 2-нм техпроцесса и совместно с правительством Кореи разрабатывает чипы ИИ для периферийных устройств
2026-07-02
VK запускает нейропоиск Discovery AI в России
2026-07-02
В Китае создан фонд акционерного капитала в сфере ИИ при CETC (Сучжоу) с уставным капиталом 2 млрд юаней
2026-07-02
Ilkari приобретает хорватского оператора DC North, расширяя свою европейскую сеть центров обработки данных
2026-07-02
Рынок инвестиций в центры обработки данных в Африке, по прогнозам, достигнет 8,76 млрд долларов США к 2031 году
2026-07-02
Последние новости
1
BYD продвигает планы по строительству заводов в Европе, Испания и Франция стали кандидатами
2
Liebherr получил заказ на 7 кранов для терминала Sparrows Point в Балтиморе, США
3
Британская компания RGM Cranes установила 10-тонный кран для производителя из Южного Йоркшира
4
Bouygues Telecom завершила модернизацию оптоволоконной сети по всей Франции до 8 Гбит/с
5
Чад сотрудничает с американской Cybastion для запуска национального центра обработки данных
6
Индийская Bharti Airtel планирует открыть вторую штаб-квартиру в Хайдарабаде
7
Заместитель председателя Китайской федерации машиностроения выступил на 12-м Международном симпозиуме по резанию и измерительной технике
8
Управление портов Тасмании (Австралия) завершило дноуглубительные работы объемом более 250 000 кубометров на две недели раньше срока
9
Британская компания nLighten инвестирует более 100 миллионов фунтов стерлингов в модернизацию дата-центра в Бристоле
10
Компания Cadence (США) расширяет сотрудничество с HPE, сосредоточившись на цифровых двойниках центров обработки данных