Репортаж от Wedoany,Backblaze и поставщик AI-облачной инфраструктуры CoreWeave подписали пятилетнее соглашение на сумму 335 миллионов долларов о предоставлении многопетабайтного хранилища, добавив недорогой уровень на базе HDD к своей платформе управляемого хранения. Это партнерство позволяет клиентам CoreWeave получить доступ к новому уровню объектного хранения без изменения кода, одновременно подчеркивая ключевое ограничение в AI-инфраструктуре: фактическое местоположение всех данных во время производственных рабочих нагрузок.

Для CoreWeave основное внимание в этой сделке уделяется не емкости GPU, а архитектуре хранения вокруг этой емкости. AI-облака часто воспринимаются как движимые вычислительной мощностью, но тренировочные запуски, контрольные точки, выходные данные моделей, генерация с дополнением поиска (RAG), подготовка данных и конвейеры вывода генерируют огромные объемы данных. Часть этих рабочих нагрузок требует производительности на уровне флэш-памяти, но большинство не предъявляет высоких требований к производительности хранения. Именно такой спрос открыл возможности для Backblaze.
Backblaze будет поддерживать уровень хранения на базе HDD в рамках AI-объектного хранилища CoreWeave, включая среду с использованием технологии распределенного кэширования LOTA от CoreWeave. Ожидается, что существующие клиенты смогут получить доступ к новому уровню хранения без переписывания приложений, что имеет важное коммерческое значение.
С экономической точки зрения CoreWeave стремится оставить высокопроизводительное хранение для AI-рабочих нагрузок, которые действительно в нем нуждаются, одновременно перемещая данные, нечувствительные к задержкам, на более дешевый емкостный уровень. При правильной реализации этот шаг может повысить эффективность использования инфраструктуры и снизить общую стоимость эксплуатации AI-сервисов. AI-рабочие нагрузки не имеют единой модели хранения: контрольные точки моделей, тренировочные наборы данных, журналы подсказок и корпусы RAG ведут себя по-разному. Хранение всего на высокопроизводительном уровне дорого, а полное перемещение в холодный архив не удовлетворяет потребностям использования.
Бизнес Backblaze сосредоточен на крупномасштабном, экономически эффективном облачном хранении, и, по заявлениям, компания обслуживает более 100 000 клиентов. CoreWeave, в свою очередь, представляет спрос со стороны AI-облака, включая разработчиков моделей, предприятия и исследовательские институты. Компания утверждает, что ее платформа обслуживает девять из десяти крупнейших поставщиков AI-моделей.
Это соглашение также отражает созревание стека AI-инфраструктуры. Первая волна расходов пришлась на компании, обладающие GPU, электроэнергией и емкостью центров обработки данных. Следующий этап более сложен и включает размещение хранилищ, кэширование, сети, оркестрацию, энергоэффективность и контроль затрат. Операторам необходимо, чтобы AI-инфраструктура работала как сервисный бизнес, а не как научный проект.
Масштаб многопетабайтного соглашения также вызывает ряд практических вопросов: какой объем емкости будет развернут немедленно? Как будет корректироваться ценообразование, если спрос на AI-хранение изменится? Как будет развиваться ситуация, когда клиенты потребуют большего регионального контроля над данными? Регуляторы и корпоративные группы по управлению рисками будут все больше обращать внимание на места хранения тренировочных данных AI, сгенерированных выходных данных и информации о клиентах.
Backblaze получила важного клиента в сфере AI-инфраструктуры и повысила свою роль на рынке, который по-прежнему доминируется нарративом о вычислениях. CoreWeave, в свою очередь, добавила новый уровень хранения в свою платформу управляемого хранения, не требуя от клиентов изменений в приложениях. Теперь начинается более сложная для количественной оценки работа: заполнение емкости, поддержание предсказуемости затрат и обеспечение такой прозрачности хранения, чтобы разработчикам больше не нужно было о нем думать.
Значение этого соглашения для покупателей AI заключается в том, что оно может снизить стоимость хранения AI-рабочих нагрузок за счет сопоставления типов данных с более дешевыми емкостными уровнями, без необходимости внесения изменений на уровне приложений. Клиенты CoreWeave смогут получить доступ к дополнительным уровням хранения, сохраняя при этом существующие рабочие процессы и пути кода. HDD-хранение актуально для AI, поскольку многие AI-наборы данных, выходные данные, журналы и контрольные точки не требуют высокой производительности хранения. Командам по инфраструктуре следует оценить задержки, шаблоны извлечения, местонахождение данных, устойчивость, сложность интеграции, а также то, соответствует ли стратегия многоуровневого хранения поведению производственных AI-рабочих нагрузок. Основной риск выполнения соглашения заключается в том, что экономическая эффективность зависит от уровня использования, предсказуемой производительности и тщательного размещения данных между уровнями.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









