Репортаж от Wedoany,Поставщик облачных инфраструктурных платформ Mirantis 14 мая в Кэмпбелле, штат Калифорния, официально объявил о добавлении в свою платформу k0rdent AI трех ключевых функций: реестра моделей, сетки инференса и среды выполнения инференса. Это впервые объединяет безопасное распространение моделей ИИ, применение политик управления, маршрутизацию нагрузки инференса и эффективное использование ресурсов GPU в единую операционную плоскость, охватывающую весь цикл от разработки до производства. Этот выпуск является прямым ответом на фрагментированную ситуацию, с которой в настоящее время сталкиваются операторы GPU-облаков и команды корпоративных ИИ-платформ при переводе рабочих нагрузок ИИ из экспериментальной стадии в промышленную эксплуатацию.
Вице-президент Mirantis по разработке продуктов Кевин Камель в официальном заявлении указал на суть проблемы: «По мере того как организации переводят проекты ИИ с экспериментальной стадии в производственную среду, инфраструктурные команды все чаще сталкиваются с операционными и управленческими проблемами в области распространения моделей, видимости инференса, обеспечения соответствия требованиям и экономики GPU. Предприятия и операторы GPU вынуждены собирать из разрозненных частей хрупкие рабочие процессы и разрозненные инструменты для эксплуатации ИИ». Он также подчеркнул, что модели ИИ принципиально отличаются от контейнеров — модели имеют уникальные требования к управлению, суверенитету, соответствию нормативным требованиям и жизненному циклу, и к ним нельзя просто применять парадигму эксплуатации, ориентированную на контейнеры, принятую в эпоху облачных технологий.
k0rdent AI Model Registry оптимизирован для рабочих процессов хранения и распространения больших языковых моделей и их производных. Этот компонент предоставляет безопасный, соответствующий стандартам Open Container Initiative (OCI) нативный реестр, который может управлять базовыми большими языковыми моделями, точно настроенными вариантами, квантованными сборками и связанными артефактами ИИ, охватывая распределенные инфраструктурные среды, что напрямую снижает операционную сложность и риски в цепочке поставок при безопасном распространении моделей ИИ. Управление версиями моделей, отслеживание происхождения и контроль доступа встроены в реестр, что позволяет предприятиям применять согласованные процессы CI/CD к моделям ИИ так же, как и к образам контейнеров.
k0rdent AI Inference Mesh берет на себя обязанности по маршрутизации и управлению нагрузкой инференса между кластерами. Этот компонент способен осуществлять интеллектуальную маршрутизацию запросов инференса, контроль доступа и учет использования в рамках федеративных вычислительных ресурсов, абстрагируя логику обратного проксирования, балансировки нагрузки и API-шлюзов, которые ранее настраивались разными командами вручную, в единый уровень, управляемый политиками. Благодаря этому организации могут превратить необработанную инфраструктуру GPU в управляемую платформу инференса ИИ, одновременно получая централизованную видимость объема вызовов моделей, распределения задержек и потребленных затрат. Для операторов, одновременно управляющих несколькими кластерами GPU или использующих смешанные собственные центры обработки данных и экземпляры GPU в публичных облаках, Inference Mesh предоставляет единую точку контроля в различных средах.
Выпущенная совместно с Inference Mesh среда выполнения k0rdent AI Inference Runtime фокусируется на эффективности выполнения рабочих нагрузок инференса. Эта среда выполнения, спроектированная с целью максимизации количества токенов, генерируемых в секунду на один GPU, повышает использование инфраструктуры GPU за счет квантования моделей, оптимизации пакетной обработки и динамического планирования ресурсов. В условиях сохраняющегося дефицита предложения GPU и высоких затрат на вычислительные мощности, предельное улучшение эффективности инференса может напрямую конвертироваться в значительное снижение операционных расходов, что является особенно актуальным требованием на современном рынке инфраструктуры ИИ.
Три компонента, представленные Mirantis на этот раз, являются не самостоятельными продуктами, а расширением функционального уровня платформы k0rdent AI. Сама платформа k0rdent позиционируется как облачная платформа управления инфраструктурой для эпохи ИИ, поддерживающая унифицированную оркестровку в средах bare-metal, виртуальных машин и контейнеров, с совместимостью на нижнем уровне с различными ускорителями, такими как NVIDIA GPU и AMD GPU. С помощью этой платформы Mirantis пытается распространить свои возможности управления инфраструктурой корпоративного уровня, накопленные в области OpenStack и Kubernetes, на полный жизненный цикл рабочих нагрузок ИИ.
Штаб-квартира Mirantis находится в Кэмпбелле, штат Калифорния, США. Компания основана в 1999 году, ранее была компанией облачной инфраструктуры, долгое время поддерживавшей OpenStack, а в настоящее время фокус ее бизнеса сместился на предоставление облачных инфраструктурных решений для рабочих нагрузок AI/ML. Выпущенная компанией в апреле этого года версия MOSK 26.1 уже добавила ИИ-ассистента для платформы OpenStack, использующего техническую документацию и базу знаний для предоставления автоматизированных операционных рекомендаций по высокопроизводительным вычислениям и рабочим нагрузкам ИИ. Путь трансформации Mirantis от OpenStack к k0rdent AI демонстрирует четкое стратегическое намерение: глубоко интегрировать традиционные возможности управления облачной инфраструктурой с нативным инструментарием ИИ, чтобы закрепить свои позиции в период быстрого расширения рынка инфраструктуры ИИ.
Рынок инструментов управления и инференса ИИ вступает в фазу ускоренной консолидации. Предприятия больше не удовлетворяются изолированным доступом к вычислительным мощностям GPU, а требуют полной платформенной поддержки всего цикла — от хранения моделей, безопасного распространения и управления соответствием требованиям до развертывания инференса и управления затратами. Пакет NVIDIA AI Enterprise, Google Vertex AI и AWS SageMaker продвигают аналогичную интеграцию на разных уровнях. Mirantis выбирает точку входа на уровне инфраструктуры, расширяясь вверх до управления моделями и инференсом, пытаясь найти дифференцированную позицию между облачными провайдерами и ИИ-платформами. По мере того как все больше предприятий внедряют генеративный ИИ в основные бизнес-процессы, соответствие нормативным требованиям при управлении моделями, наблюдаемость цепочек инференса и экономичность ресурсов GPU станут тремя ключевыми показателями, определяющими конкурентоспособность платформы.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com










