Репортаж от Wedoany,22 июня по местному времени американская компания Groq, занимающаяся разработкой чипов для ИИ-инференса, объявила о завершении очередного раунда финансирования роста на сумму $650 млн. Раунд возглавили Disruptive и Infinitum, при участии некоторых существующих инвесторов. Средства будут направлены на ускоренное расширение инфраструктуры облака ИИ-инференса Groq.
В настоящее время основной фокус бизнеса Groq сместился в сторону крупномасштабных облачных сервисов ИИ-инференса. Компания управляет 13 центрами обработки данных в Северной Америке, Европе, на Ближнем Востоке и в Азиатско-Тихоокеанском регионе, обслуживая более 5 миллионов разработчиков и тысячи нативных ИИ-компаний, еженедельно обрабатывая триллионы токенов. Новые средства будут использованы для модернизации существующей инфраструктуры ЦОД и развертывания новейших технологий инференса Groq, включая системы NVIDIA LPX.
Согласно планам компании, Groq намерена расширить общую установленную мощность облака ИИ-инференса до 200 МВт к концу 2027 года. Эта цель обусловлена быстрым ростом спроса на вычислительные мощности на стороне инференса. По мере перехода ИИ-приложений от этапа обучения моделей и экспериментальной проверки к этапу производственного развертывания, растет потребность предприятий в низколатентных, высокопроизводительных и экономически эффективных вычислительных мощностях для инференса. Облако инференса превращается из вспомогательного сервиса в важный компонент ИИ-инфраструктуры.
Основой технологий Groq является архитектура процессора LPU, оптимизированная в первую очередь для задач последовательных вычислений, таких как большие языковые модели. В отличие от этапа обучения, сервисы инференса требуют непрерывной работы, быстрого отклика, низкой стоимости за единицу, стабильности сервиса и способности к масштабному планированию. Продолжающееся расширение облачной платформы после этого раунда финансирования указывает на то, что коммерческий фокус Groq смещается от простой демонстрации возможностей чипов к предоставлению устойчивых облачных сервисов инференса.
Управленческая команда также претерпела изменения. Алан Райс (Alan Rice) присоединился к Groq в качестве главного операционного директора; ранее он занимал должности, связанные с ЦОД в xAI и Meta, и имеет опыт управления крупной инфраструктурой. Синклер Шуллер (Sinclair Schuller) и Ракеш Малхотра (Rakesh Malhotra) с июля займут посты главного технического директора и главного директора по продуктам соответственно, отвечая за развитие платформенных технологий и корпоративных продуктов.
Этот раунд финансирования состоялся после того, как Groq заключила неэксклюзивное лицензионное соглашение с NVIDIA. Groq заявила, что платформа NVIDIA LPX следующего поколения уже интегрирует технологии инференса Groq. Для Groq параллельное развитие технологического лицензирования и расширения облачного бизнеса означает, что компания больше не полагается исключительно на продажи собственных чипов, а опирается на облачную платформу инференса, лицензирование технологий и возможности эксплуатации ЦОД для поддержки роста бизнеса.
Рынок ИИ-вычислений переходит от вопроса «кто сможет обучить более крупную модель» к вопросу «кто сможет стабильно запускать модели с меньшими затратами». Обучение определяет верхнюю границу возможностей модели, а инференс определяет, может ли приложение быть масштабировано. Направляя средства финансирования на глобальные ЦОД и расширение облака инференса до 200 МВт, Groq демонстрирует, что конкуренция в сфере ИИ-инфраструктуры вступает в фазу непрерывной эксплуатации.
Однако давление на Groq очевидно: достижение цели в 200 МВт требует синхронного соответствия по электроэнергии, машинным залам, жидкостному охлаждению, сетям, поставкам чипов и загрузке клиентов. Сможет ли облако инференса генерировать долгосрочный доход, зависит не только от масштаба вычислительных мощностей, но и от ценовой конкурентоспособности, экосистемы моделей, лояльности корпоративных клиентов и стабильности сервиса. Для компаний, разрабатывающих ИИ-приложения, по-настоящему ценна не пиковая производительность, а способность к долгосрочному, стабильному и недорогому вызову вычислительных мощностей для инференса.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









