Репортаж от Wedoany,Американский производитель чипов Qualcomm переносит архитектуру ИИ-чипов для центров обработки данных обратно в конечные устройства, такие как смартфоны, ПК и автомобили. 27 июня Дурга Маллади, исполнительный вице-президент Qualcomm, заявил, что компания планирует применить технологию чипов для центров обработки данных, представленную на этой неделе, в смартфонах для повышения производительности локального ИИ на мобильных устройствах. Qualcomm ведет переговоры с производителями смартфонов, ПК и автомобилей о соответствующей технологии. Первое поколение продуктов с архитектурой высокопроизводительных вычислений (HBC) будет запущено в центрах обработки данных в следующем году, а коммерческие поставки ожидаются к 2028 году.
Ключевая технология, предложенная Qualcomm, — это архитектура высокопроизводительных вычислений, или HBC. Она отличается от традиционных чипов, где вычислительные блоки и память располагаются рядом, используя вертикальное расположение чипов, что позволяет разместить память ближе к вычислительным блокам и снизить расстояние передачи данных за счет вычислений вблизи памяти. При работе ИИ-моделей производительность — не единственное узкое место; параметры модели, контекстные данные и промежуточные результаты должны часто перемещаться между вычислительными блоками и памятью. Чем больше расстояние передачи данных, тем выше нагрузка на пропускную способность, задержки и энергопотребление — это так называемая «проблема стены памяти» в индустрии ИИ-чипов.
Архитектура HBC как раз и направлена на решение этого узкого места. В дорожной карте для центров обработки данных Qualcomm описывает HBC как архитектуру вычислений вблизи памяти для ИИ-нагрузок, которая объединяет вычислительную мощность с высокопроизводительной памятью через 3D-стекинг кремния, чтобы снизить энергопотребление на каждый токен и повысить эффективность пропускной способности данных при ИИ-инференсе. Согласно опубликованной дорожной карте, AI250 с первым поколением HBC начнет коммерческую рассылку образцов в середине 2027 года, а второе поколение HBC будет использоваться в AI300, с коммерческой рассылкой образцов, ожидаемой в 2028 году.
В отличие от центров обработки данных, смартфоны имеют более строгие ограничения по энергопотреблению, размеру, охлаждению и времени автономной работы. Если большие модели долгое время полагаются на облачную работу, пользователям приходится отправлять запросы на сервер, что создает проблемы с задержками, сетевым подключением, конфиденциальностью и затратами на облачные вычисления. Цель периферийного ИИ — запускать больше моделей непосредственно на самом устройстве, включая голосовых помощников, генерацию изображений, перевод в реальном времени, обобщение документов, персональных агентов и мультимодальное понимание. Для реализации этих возможностей чипы смартфонов должны обрабатывать более крупные модели и более частые задачи инференса при ограниченном энергопотреблении.
Перенос технологии HBC из центров обработки данных в смартфоны означает, что Qualcomm стремится обеспечить более высокую пропускную способность и более низкое энергопотребление при передаче данных на конечные устройства. Раньше чипы смартфонов делали упор на комплексные возможности CPU, GPU, NPU, ISP и коммуникационного модема, но в эпоху ИИ требуется постоянная работа локальных моделей, даже когда пользователь не открывает приложения активно, для выполнения задач восприятия, анализа и уведомлений. Такие «постоянные агенты» предъявляют более высокие требования к управлению батареей, и чипам необходимо поддерживать непрерывную способность к инференсу без значительного увеличения энергопотребления.
Маллади отметил: «Технология, зародившаяся в центрах обработки данных, не остановится на этом». Эта фраза отражает оценку Qualcomm пути переноса технологий: сначала центры обработки данных берут на себя интенсивный ИИ-инференс и проверку архитектуры, а после того, как процессы, упаковка, координация памяти и программный стек станут зрелыми, технология постепенно расширяется на смартфоны, ПК и автомобили. Вместо того чтобы внедрять новую высокорисковую архитектуру непосредственно в смартфоны, сначала проверка HBC в продуктах для центров обработки данных позволяет Qualcomm накопить опыт в проектировании, производстве, охлаждении и адаптации программного обеспечения.
Этот путь также соответствует бизнес-структуре самой Qualcomm. Qualcomm долгое время специализировалась на чипах для смартфонов, накопив глубокий опыт в области низкопотребляющих SoC, координации памяти LPDDR, коммуникационных соединений и ускорения периферийного ИИ. На этот раз бизнес центров обработки данных не полностью отделен от бизнеса смартфонов; скорее, возможности энергоэффективного проектирования, сформированные в эпоху мобильных чипов, расширяются на ИИ-инфраструктуру, а затем новая архитектура памяти и вычислений, сформированная в центрах обработки данных, возвращается в конечные устройства. Для Qualcomm смартфоны, ПК, автомобили и центры обработки данных превращаются из разных рынков в разные узлы одной и той же системы ИИ-вычислений.
На стороне центров обработки данных Qualcomm уже включила HBC в дорожную карту Dragonfly и одновременно представила CPU C1000, ускоритель инференса AI300 и набор продуктов для подключения, ориентированные на ИИ-инфраструктуру. Компания заявляет, что HBC Gen 1 в сочетании с AI250 может обеспечить эффективную пропускную способность памяти 133 ТБ/с на карту, что в 18 раз больше по сравнению с решением LPDDR5X для AI200; HBC Gen 2, используемый в AI300, обеспечивает 54-кратное улучшение по сравнению с AI200. Qualcomm также утверждает, что HBC обеспечивает в 6 раз большую пропускную способность на ватт по сравнению с HBM на уровне карты и в 200 раз большую емкость на ватт по сравнению с SRAM на уровне стойки.
Будут ли эти показатели полностью перенесены на мобильные устройства, зависит от бюджета энергопотребления, стоимости упаковки, возможностей охлаждения и программной экосистемы конечных продуктов. Смартфоны не могут просто скопировать спецификации чипов центров обработки данных, но могут перенять идеи вычислений вблизи памяти, вертикального стекирования и более плотной пропускной способности памяти. Если будущие чипы смартфонов будут обладать более эффективными возможностями передачи данных, они смогут запускать более сложные ИИ-модели локально, уменьшая частоту обращений к облаку и обеспечивая более быструю реакцию ИИ-помощников в голосе, изображениях, офисной работе, управлении вождением и личными данными.
Это заявление Qualcomm также показывает, что конкуренция в области периферийного ИИ переходит на архитектурный уровень. Раньше ИИ в смартфонах больше полагался на пиковую производительность NPU, сжатие моделей и оптимизацию программного обеспечения, но на следующем этапе больше внимания будет уделяться пропускной способности памяти, структуре упаковки, плотности энергопотребления и системной координации. Если HBC сможет перейти из центров обработки данных в конечные устройства, чипы смартфонов превратятся из «интегрированных ИИ-ускорителей» в «вычислительные платформы, перепроектированные для постоянных ИИ-моделей». Ключевым вопросом в дальнейшем является то, когда Qualcomm объявит сроки внедрения на мобильных устройствах и будут ли производители смартфонов, ПК и автомобилей готовы нести затраты на эту новую упаковку и архитектуру памяти.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









