Репортаж от Wedoany,Китайская интернет-компания ByteDance ведет переговоры с шанхайским производителем чипов искусственного интеллекта Tianshu Zhixin о закупке не менее 50 000 чипов ИИ для логического вывода, в основном для рабочих нагрузок по логическому выводу больших моделей. Обсуждаемый продукт соответствует серии облачных GPU для логического вывода «Zhikai» от Tianshu Zhixin, а для сценариев обучения в основном используется серия «Tiāngāi». В случае заключения сделки Tianshu Zhixin станет одним из важных поставщиков отечественных GPU для ByteDance после Huawei и Cambricon.
Эта потенциальная закупка указывает на новый прогресс в строительстве центров обработки данных ByteDance и развертывании отечественных вычислительных мощностей. По сравнению с обучением моделей, этап логического вывода соответствует процессу генерации ответов на запросы пользователей, обработки многораундовых диалогов и выполнения задач по созданию контента большими моделями. Он характеризуется высокой частотой вызовов, большим параллельным давлением и более высокой чувствительностью к масштабу поставок чипов и удельной стоимости. По мере расширения пользовательской базы продуктов ИИ, таких как Doubao, стабильное обеспечение чипами для логического вывода становится ключевым звеном в инфраструктуре вычислительных мощностей крупных интернет-компаний.
Tianshu Zhixin, основанная в 2015 году со штаб-квартирой в Шанхае, специализируется на универсальных GPU и ускорителях ИИ. Ее линейка продуктов охватывает обучение, логический вывод и оконечные устройства. Серия «Tiāngāi» предназначена для сценариев обучения, серия «Zhikai» — для облачного и периферийного логического вывода, а серия «Tongyang» — для роботов, интеллектуальных терминалов и других оконечных приложений. Если ByteDance в конечном итоге внедрит серию «Zhikai», это будет означать дальнейшее продвижение масштабного развертывания отечественных чипов для логического вывода на крупных интернет-платформах.
С точки зрения цепочки поставок, увеличение закупок отечественных чипов ByteDance — это не просто дополнение к единственному источнику поставок. Спрос на вычислительные мощности для бизнеса ИИ смещается от периодических задач обучения к долгосрочным, высокочастотным и малозатратным по времени услугам логического вывода. Компаниям необходимо одновременно настраивать ресурсы для чипов обучения, чипов логического вывода, сетей, хранения данных и центров обработки данных. Стратегия с несколькими поставщиками помогает снизить влияние колебаний от одного источника чипов на непрерывность бизнеса, а также позволяет подобрать более подходящие аппаратные решения для различных моделей и бизнес-сценариев.
Крупные интернет-компании соревнуются в создании «рва» вычислительных мощностей. Раньше инвестиции в вычислительные мощности были больше сосредоточены на облачных серверах и универсальных центрах обработки данных; теперь приложения больших моделей требуют от компаний более высокой способности управлять чипами ИИ для логического вывода, адаптировать модели и обслуживать кластеры. Тот, кто сможет поддерживать более высокий параллельный логический вывод с меньшими затратами, получит более стабильное пространство для итераций продуктов в чат-ботах, генерации видео, поиске и рекомендациях, рекламе и корпоративных интеллектуальных услугах.
Детали сделки пока окончательно не определены; объем закупок, график поставок, фактические сценарии развертывания и последующие масштабы расширения могут измениться. Для Tianshu Zhixin попадание в основную цепочку поставок вычислительных мощностей ByteDance станет важным этапом перехода от государственных закупок и корпоративных клиентов к крупным интернет-клиентам; для ByteDance то, смогут ли отечественные вычислительные мощности стабильно работать в реальных нагрузках логического вывода, напрямую повлияет на структуру затрат и возможности обслуживания ее продуктов ИИ.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









