Американская компания Mirantis представила инструменты управления и инференса ИИ для промышленного развертывания GPU-облаков_Глобальные новости

Американская компания Mirantis представила инструменты управления и инференса ИИ для промышленного развертывания GPU-облаков

2026-05-20 11:55

В избр.

Репортаж от Wedoany，Поставщик облачных инфраструктурных платформ Mirantis 14 мая в Кэмпбелле, штат Калифорния, официально объявил о добавлении в свою платформу k0rdent AI трех ключевых функций: реестра моделей, сетки инференса и среды выполнения инференса. Это впервые объединяет безопасное распространение моделей ИИ, применение политик управления, маршрутизацию нагрузки инференса и эффективное использование ресурсов GPU в единую операционную плоскость, охватывающую весь цикл от разработки до производства. Этот выпуск является прямым ответом на фрагментированную ситуацию, с которой в настоящее время сталкиваются операторы GPU-облаков и команды корпоративных ИИ-платформ при переводе рабочих нагрузок ИИ из экспериментальной стадии в промышленную эксплуатацию.

Вице-президент Mirantis по разработке продуктов Кевин Камель в официальном заявлении указал на суть проблемы: «По мере того как организации переводят проекты ИИ с экспериментальной стадии в производственную среду, инфраструктурные команды все чаще сталкиваются с операционными и управленческими проблемами в области распространения моделей, видимости инференса, обеспечения соответствия требованиям и экономики GPU. Предприятия и операторы GPU вынуждены собирать из разрозненных частей хрупкие рабочие процессы и разрозненные инструменты для эксплуатации ИИ». Он также подчеркнул, что модели ИИ принципиально отличаются от контейнеров — модели имеют уникальные требования к управлению, суверенитету, соответствию нормативным требованиям и жизненному циклу, и к ним нельзя просто применять парадигму эксплуатации, ориентированную на контейнеры, принятую в эпоху облачных технологий.

k0rdent AI Model Registry оптимизирован для рабочих процессов хранения и распространения больших языковых моделей и их производных. Этот компонент предоставляет безопасный, соответствующий стандартам Open Container Initiative (OCI) нативный реестр, который может управлять базовыми большими языковыми моделями, точно настроенными вариантами, квантованными сборками и связанными артефактами ИИ, охватывая распределенные инфраструктурные среды, что напрямую снижает операционную сложность и риски в цепочке поставок при безопасном распространении моделей ИИ. Управление версиями моделей, отслеживание происхождения и контроль доступа встроены в реестр, что позволяет предприятиям применять согласованные процессы CI/CD к моделям ИИ так же, как и к образам контейнеров.

k0rdent AI Inference Mesh берет на себя обязанности по маршрутизации и управлению нагрузкой инференса между кластерами. Этот компонент способен осуществлять интеллектуальную маршрутизацию запросов инференса, контроль доступа и учет использования в рамках федеративных вычислительных ресурсов, абстрагируя логику обратного проксирования, балансировки нагрузки и API-шлюзов, которые ранее настраивались разными командами вручную, в единый уровень, управляемый политиками. Благодаря этому организации могут превратить необработанную инфраструктуру GPU в управляемую платформу инференса ИИ, одновременно получая централизованную видимость объема вызовов моделей, распределения задержек и потребленных затрат. Для операторов, одновременно управляющих несколькими кластерами GPU или использующих смешанные собственные центры обработки данных и экземпляры GPU в публичных облаках, Inference Mesh предоставляет единую точку контроля в различных средах.

Выпущенная совместно с Inference Mesh среда выполнения k0rdent AI Inference Runtime фокусируется на эффективности выполнения рабочих нагрузок инференса. Эта среда выполнения, спроектированная с целью максимизации количества токенов, генерируемых в секунду на один GPU, повышает использование инфраструктуры GPU за счет квантования моделей, оптимизации пакетной обработки и динамического планирования ресурсов. В условиях сохраняющегося дефицита предложения GPU и высоких затрат на вычислительные мощности, предельное улучшение эффективности инференса может напрямую конвертироваться в значительное снижение операционных расходов, что является особенно актуальным требованием на современном рынке инфраструктуры ИИ.

Три компонента, представленные Mirantis на этот раз, являются не самостоятельными продуктами, а расширением функционального уровня платформы k0rdent AI. Сама платформа k0rdent позиционируется как облачная платформа управления инфраструктурой для эпохи ИИ, поддерживающая унифицированную оркестровку в средах bare-metal, виртуальных машин и контейнеров, с совместимостью на нижнем уровне с различными ускорителями, такими как NVIDIA GPU и AMD GPU. С помощью этой платформы Mirantis пытается распространить свои возможности управления инфраструктурой корпоративного уровня, накопленные в области OpenStack и Kubernetes, на полный жизненный цикл рабочих нагрузок ИИ.

Штаб-квартира Mirantis находится в Кэмпбелле, штат Калифорния, США. Компания основана в 1999 году, ранее была компанией облачной инфраструктуры, долгое время поддерживавшей OpenStack, а в настоящее время фокус ее бизнеса сместился на предоставление облачных инфраструктурных решений для рабочих нагрузок AI/ML. Выпущенная компанией в апреле этого года версия MOSK 26.1 уже добавила ИИ-ассистента для платформы OpenStack, использующего техническую документацию и базу знаний для предоставления автоматизированных операционных рекомендаций по высокопроизводительным вычислениям и рабочим нагрузкам ИИ. Путь трансформации Mirantis от OpenStack к k0rdent AI демонстрирует четкое стратегическое намерение: глубоко интегрировать традиционные возможности управления облачной инфраструктурой с нативным инструментарием ИИ, чтобы закрепить свои позиции в период быстрого расширения рынка инфраструктуры ИИ.

Рынок инструментов управления и инференса ИИ вступает в фазу ускоренной консолидации. Предприятия больше не удовлетворяются изолированным доступом к вычислительным мощностям GPU, а требуют полной платформенной поддержки всего цикла — от хранения моделей, безопасного распространения и управления соответствием требованиям до развертывания инференса и управления затратами. Пакет NVIDIA AI Enterprise, Google Vertex AI и AWS SageMaker продвигают аналогичную интеграцию на разных уровнях. Mirantis выбирает точку входа на уровне инфраструктуры, расширяясь вверх до управления моделями и инференсом, пытаясь найти дифференцированную позицию между облачными провайдерами и ИИ-платформами. По мере того как все больше предприятий внедряют генеративный ИИ в основные бизнес-процессы, соответствие нормативным требованиям при управлении моделями, наблюдаемость цепочек инференса и экономичность ресурсов GPU станут тремя ключевыми показателями, определяющими конкурентоспособность платформы.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

США

Информация и коммуникация Производство коммуникационного оборудования Искусственный интеллект

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта：news@wedoany.com

Предыдущий：Американская компания Lightpath добавила 265 маршрутных миль оптоволокна, соединив более 2400 макросайтов в столичном регионе Нью-Йорка для предоставления беспроводного транзитного соединения (backhaul)

Следующий：Ассоциация оптоволоконной широкополосной связи США совместно с AARP запускает программу цифрового обучения для пожилых людей, обновляет сертификацию OpTIC Path и публикует технический документ о миграции MSO на FTTH