Репортаж от Wedoany,29 июня 2026 года в Редвуд-Сити, Калифорния, компания Zilliz выпустила новый движок хранения Loon, который лежит в основе Zilliz Vector Lakebase и работает на Milvus 3.0. Loon использует озерно-ориентированную архитектуру, позволяя использовать один набор векторных данных одновременно для поиска в реальном времени, масштабного обнаружения и пакетного анализа, становясь основой слоя хранения для эволюции Zilliz Cloud из векторной базы данных в единую платформу данных для AI.

Концепция Vector Lakebase основана на том, что один логический набор векторных данных должен обслуживать все AI-нагрузки, включая производственный поиск, обнаружение и пакетный анализ, без необходимости копирования или перемещения данных между системами. Перед слоем хранения стоит задача: один и тот же набор данных должен одновременно обеспечивать быстрый доступ на уровне записей для обслуживания и широкое сканирование для анализа, при этом работая на недорогом объектном хранилище. Система также должна обрабатывать постоянно изменяющиеся данные, так как команды могут повторно встраивать, перемаркировать и переиндексировать одни и те же записи при улучшении моделей.
Джеймс Луань, сооснователь и технический директор Zilliz, отметил, что векторный поиск — это не вся проблема; Vector Lakebase — это ответ на вопрос, что будет после успеха векторных баз данных. Победившая система сделает так, что непрерывное обслуживание и обнаружение будут ощущаться как часть одной машины, что возможно только если слой хранения может обслуживать каждую нагрузку с помощью единой копии данных. Loon и есть этот слой хранения.
Для достижения этой цели Loon рассматривает набор векторных данных как его физически гетерогенную реальную форму и строится на трех принципах. Гибридный формат файлов позволяет хранить каждый тип столбца в наиболее подходящем формате: скалярные поля и поля фильтрации используют Parquet для эффективного сканирования; плотные и разреженные векторы используют открытый формат Vortex для быстрого, побайтово точного чтения на уровне строк из объектного хранилища; исходные видео, PDF и изображения остаются в объектном хранилище, ссылаясь на них, а не копируя в базу данных. Выравнивание идентификаторов строк позволяет столбцам, разделенным по разным форматам, работать как единая логическая таблица, позволяя добавлять новые модели встраивания в качестве собственных столбцов без перезаписи уже сохраненных данных. Версионированный манифест определяет текущую версию набора данных, включая файлы, индексы, журналы удаления и статистику, позволяя кластерам обслуживания, вычислениям по требованию и внешним движкам, таким как Spark и Ray, читать и обновлять один и тот же набор данных без поддержки отдельных копий.
Эти принципы позволяют одной копии данных на объектном хранилище одновременно питать несколько движков. Во внутренних тестах Zilliz на объектном хранилище, по сравнению с Parquet, макет Loon на основе Vortex сократил объем извлекаемых данных при чтении каждой записи примерно в 135 раз. Добавление новой модели встраивания становится легковесным обновлением версии, а не массовой перезаписью. Архитектура Vector Lakebase включает кластеры обслуживания в реальном времени, эластичные вычисления по требованию и индексы External Collections, все операции основаны на одной семантической основе, без необходимости в дублирующих конвейерах или ETL. Более 10 000 предприятий и AI-команд уже работают на базе Milvus и Zilliz Cloud, включая MiniMax, OpenEvidence, Filevine, Exa и Salesforce.
Loon теперь питает Milvus 3.0 и служит слоем хранения для Zilliz Vector Lakebase на Zilliz Cloud, доступен в более чем 30 регионах на AWS, Google Cloud и Microsoft Azure, с опциями развертывания Serverless, Dedicated и BYOC. Команды, которые распределяют онлайн-обслуживание, офлайн-анализ, обратное заполнение и рабочие процессы внешних озер данных по нескольким системам, могут создать бесплатную учетную запись; регистрация с новым рабочим email дает 100 долларов бесплатного кредита, или связаться с командой Zilliz для обсуждения конкретных случаев использования.
Zilliz — ведущая компания в области AI-инфраструктуры данных, создатель наиболее широко используемой в мире открытой векторной базы данных Milvus, которая имеет более 44 000 звезд на GitHub и более 100 миллионов загрузок Docker. Zilliz помогает предприятиям и AI-стартапам делать их неструктурированные данные доступными для поиска, анализа и управления, превращая текст, изображения, аудио, видео и другое в стратегические активы для производственного AI. Технология Zilliz основана на Milvus и Zilliz Cloud, а Zilliz Cloud расширяет эту основу до полностью управляемой платформы Vector Lakebase, сочетающей высокую пропускную способность и низкую задержку векторной базы данных с открытостью, масштабируемостью и экономичностью мультимодального озера данных.









