Репортаж от Wedoany,Американская компания по разработке чипов для ИИ d-Matrix объявила о начале полномасштабного производства своей платформы ускорения логических выводов Corsair для искусственного интеллекта и начале массовых отгрузок приоритетным клиентам. Штаб-квартира компании находится в Санта-Кларе, Калифорния, США. В число получателей входят поставщики гипермасштабируемых облачных услуг, провайдеры Neocloud и ведущие лаборатории ИИ. Продукт в первую очередь предназначен для сценариев логических выводов ИИ в центрах обработки данных.
Corsair не является чипом для обучения, его основное внимание уделяется логическим выводам больших языковых моделей.
В приложениях генеративного ИИ после завершения обучения модели каждый запрос пользователя, голосовое взаимодействие, генерация кода и создание мультимодального контента требуют выполнения логических вычислений на серверной стороне. d-Matrix утверждает, что Corsair ориентирован на задачи логических выводов с низкой задержкой и может формировать гетерогенные, развязанные вычислительные системы с GPU, позволяя различным вычислительным блокам выполнять более подходящие задачи. Компания рассматривает начало полномасштабного производства как этап коммерческой поставки, означающий переход Corsair от ранней верификации с клиентами к этапу массовых поставок.
Цепочка поставок является предпосылкой для масштабирования отгрузок. d-Matrix заявляет, что компания уже получила многолетние гарантии поставок и производственных услуг и на этой основе будет продвигать отгрузку продукции. Компания Alchip Technologies участвовала в проектировании и поддержке массового производства Corsair. Ее руководство отмечает, что стороны начали сотрудничество на ранних этапах проектирования Corsair и продолжат поддерживать масштабирование платформы.
Продуктовый портфель d-Matrix не ограничивается одной платой ускорения. Согласно описанию компании, Corsair может работать в связке с ускорителем ввода-вывода JetStream, программным стеком Aviator и другими компонентами, образуя платформу для логических выводов, предназначенную для развертывания в стойках центров обработки данных. Эталонные решения, представленные на веб-сайте компании, включают несколько серверов, несколько плат ускорения и различные конфигурации памяти, с целью снижения накладных расходов на перемещение данных при логических выводах больших моделей, а также повышения скорости отклика и производительности на единицу энергопотребления.
Этот этап отгрузок приходится на период изменения фокуса в строительстве ИИ-инфраструктуры. За последние два года рыночные инвестиции были в основном сосредоточены на расширении вычислительных мощностей для обучения и GPU; с ростом частоты использования чат-ботов, приложений на основе агентов, голосовых агентов реального времени и корпоративных ИИ-инструментов, задержка, способность к параллельной обработке и эксплуатационные расходы на стороне логических выводов стали важными показателями при закупках клиентов. После начала полномасштабного производства Corsair, d-Matrix необходимо доказать, что ее платформа может стабильно работать под реальной нагрузкой центров обработки данных и быть совместимой с серверами, сетями, моделями и программной экосистемой.
Последующие этапы будут сосредоточены на масштабах развертывания у клиентов, проверке производительности на уровне стоек и долгосрочных ритмах поставок. Если массовое использование приоритетными клиентами пройдет успешно, d-Matrix получит более четкую позицию в коммерческой конкуренции американских чипов для логических выводов ИИ.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









