Американская компания Mirantis представила инструменты управления и инференса ИИ для промышленного развертывания GPU-облаков
2026-05-20 11:55
В избр.

Репортаж от Wedoany,Поставщик облачных инфраструктурных платформ Mirantis 14 мая в Кэмпбелле, штат Калифорния, официально объявил о добавлении в свою платформу k0rdent AI трех ключевых функций: реестра моделей, сетки инференса и среды выполнения инференса. Это впервые объединяет безопасное распространение моделей ИИ, применение политик управления, маршрутизацию нагрузки инференса и эффективное использование ресурсов GPU в единую операционную плоскость, охватывающую весь цикл от разработки до производства. Этот выпуск является прямым ответом на фрагментированную ситуацию, с которой в настоящее время сталкиваются операторы GPU-облаков и команды корпоративных ИИ-платформ при переводе рабочих нагрузок ИИ из экспериментальной стадии в промышленную эксплуатацию.

Вице-президент Mirantis по разработке продуктов Кевин Камель в официальном заявлении указал на суть проблемы: «По мере того как организации переводят проекты ИИ с экспериментальной стадии в производственную среду, инфраструктурные команды все чаще сталкиваются с операционными и управленческими проблемами в области распространения моделей, видимости инференса, обеспечения соответствия требованиям и экономики GPU. Предприятия и операторы GPU вынуждены собирать из разрозненных частей хрупкие рабочие процессы и разрозненные инструменты для эксплуатации ИИ». Он также подчеркнул, что модели ИИ принципиально отличаются от контейнеров — модели имеют уникальные требования к управлению, суверенитету, соответствию нормативным требованиям и жизненному циклу, и к ним нельзя просто применять парадигму эксплуатации, ориентированную на контейнеры, принятую в эпоху облачных технологий.

k0rdent AI Model Registry оптимизирован для рабочих процессов хранения и распространения больших языковых моделей и их производных. Этот компонент предоставляет безопасный, соответствующий стандартам Open Container Initiative (OCI) нативный реестр, который может управлять базовыми большими языковыми моделями, точно настроенными вариантами, квантованными сборками и связанными артефактами ИИ, охватывая распределенные инфраструктурные среды, что напрямую снижает операционную сложность и риски в цепочке поставок при безопасном распространении моделей ИИ. Управление версиями моделей, отслеживание происхождения и контроль доступа встроены в реестр, что позволяет предприятиям применять согласованные процессы CI/CD к моделям ИИ так же, как и к образам контейнеров.

k0rdent AI Inference Mesh берет на себя обязанности по маршрутизации и управлению нагрузкой инференса между кластерами. Этот компонент способен осуществлять интеллектуальную маршрутизацию запросов инференса, контроль доступа и учет использования в рамках федеративных вычислительных ресурсов, абстрагируя логику обратного проксирования, балансировки нагрузки и API-шлюзов, которые ранее настраивались разными командами вручную, в единый уровень, управляемый политиками. Благодаря этому организации могут превратить необработанную инфраструктуру GPU в управляемую платформу инференса ИИ, одновременно получая централизованную видимость объема вызовов моделей, распределения задержек и потребленных затрат. Для операторов, одновременно управляющих несколькими кластерами GPU или использующих смешанные собственные центры обработки данных и экземпляры GPU в публичных облаках, Inference Mesh предоставляет единую точку контроля в различных средах.

Выпущенная совместно с Inference Mesh среда выполнения k0rdent AI Inference Runtime фокусируется на эффективности выполнения рабочих нагрузок инференса. Эта среда выполнения, спроектированная с целью максимизации количества токенов, генерируемых в секунду на один GPU, повышает использование инфраструктуры GPU за счет квантования моделей, оптимизации пакетной обработки и динамического планирования ресурсов. В условиях сохраняющегося дефицита предложения GPU и высоких затрат на вычислительные мощности, предельное улучшение эффективности инференса может напрямую конвертироваться в значительное снижение операционных расходов, что является особенно актуальным требованием на современном рынке инфраструктуры ИИ.

Три компонента, представленные Mirantis на этот раз, являются не самостоятельными продуктами, а расширением функционального уровня платформы k0rdent AI. Сама платформа k0rdent позиционируется как облачная платформа управления инфраструктурой для эпохи ИИ, поддерживающая унифицированную оркестровку в средах bare-metal, виртуальных машин и контейнеров, с совместимостью на нижнем уровне с различными ускорителями, такими как NVIDIA GPU и AMD GPU. С помощью этой платформы Mirantis пытается распространить свои возможности управления инфраструктурой корпоративного уровня, накопленные в области OpenStack и Kubernetes, на полный жизненный цикл рабочих нагрузок ИИ.

Штаб-квартира Mirantis находится в Кэмпбелле, штат Калифорния, США. Компания основана в 1999 году, ранее была компанией облачной инфраструктуры, долгое время поддерживавшей OpenStack, а в настоящее время фокус ее бизнеса сместился на предоставление облачных инфраструктурных решений для рабочих нагрузок AI/ML. Выпущенная компанией в апреле этого года версия MOSK 26.1 уже добавила ИИ-ассистента для платформы OpenStack, использующего техническую документацию и базу знаний для предоставления автоматизированных операционных рекомендаций по высокопроизводительным вычислениям и рабочим нагрузкам ИИ. Путь трансформации Mirantis от OpenStack к k0rdent AI демонстрирует четкое стратегическое намерение: глубоко интегрировать традиционные возможности управления облачной инфраструктурой с нативным инструментарием ИИ, чтобы закрепить свои позиции в период быстрого расширения рынка инфраструктуры ИИ.

Рынок инструментов управления и инференса ИИ вступает в фазу ускоренной консолидации. Предприятия больше не удовлетворяются изолированным доступом к вычислительным мощностям GPU, а требуют полной платформенной поддержки всего цикла — от хранения моделей, безопасного распространения и управления соответствием требованиям до развертывания инференса и управления затратами. Пакет NVIDIA AI Enterprise, Google Vertex AI и AWS SageMaker продвигают аналогичную интеграцию на разных уровнях. Mirantis выбирает точку входа на уровне инфраструктуры, расширяясь вверх до управления моделями и инференсом, пытаясь найти дифференцированную позицию между облачными провайдерами и ИИ-платформами. По мере того как все больше предприятий внедряют генеративный ИИ в основные бизнес-процессы, соответствие нормативным требованиям при управлении моделями, наблюдаемость цепочек инференса и экономичность ресурсов GPU станут тремя ключевыми показателями, определяющими конкурентоспособность платформы.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Малайзийская группа Kuok планирует инвестировать 5,3 млрд евро в строительство центра обработки данных мощностью 300 МВт в Милане, Италия
2026-07-05
Доля доходов Airtel в Индии составляет 36%: компания расширяет 5G и углубляет финансовые услуги
2026-07-05
Израильская компания по кибербезопасности Dream привлекла $260 млн и планирует выход на рынок Латинской Америки
2026-07-05
Индийская Bharti Airtel расширяет покрытие сети на пути паломничества Амарнатх
2026-07-05
Авиакомпания United Airlines впервые развернула облачную развлекательную систему на борту Boeing 787-9
2026-07-05
В AIRI разработали нейросеть Genatator для аннотации генов
2026-07-05
Vodafone Ireland завершила первую в Европе демонстрацию экстренной связи с прямым подключением устройств к спутнику
2026-07-05
Третий OSAT-завод в Индии запущен в производство, CG Semiconductor — 300 миллионов чипов в год
2026-07-05
Южнокорейский Naver раскрыл ключевые технологии AI Tab, уровень сервиса достиг 108 баллов
2026-07-05
SK Telecom из Южной Кореи продвигает строительство AI-центров обработки данных мощностью 15 ГВт
2026-07-05
Последние новости
1
Малайзийская группа Kuok планирует инвестировать 5,3 млрд евро в строительство центра обработки данных мощностью 300 МВт в Милане, Италия
2
Доля доходов Airtel в Индии составляет 36%: компания расширяет 5G и углубляет финансовые услуги
3
Израильская компания по кибербезопасности Dream привлекла $260 млн и планирует выход на рынок Латинской Америки
4
Индийская Bharti Airtel расширяет покрытие сети на пути паломничества Амарнатх
5
Запасы железной руды в портах Китая достигли рекордного уровня, фьючерсы упали ниже 740 юаней за тонну
6
Refined Energy объявляет окончательные результаты зимнего бурения 2026 года на участке Dufferin West в Канаде
7
Компания McLaren Resources завершила беспилотную магнитную съемку на золоторудном проекте МакКул в Онтарио
8
В Южной Корее возобновлена добыча вольфрама на руднике Сан-Донг с годовой мощностью 4600 тонн
9
Китай доминирует в переработке минералов, горно-обогатительная отрасль к 2035 году может внести 34 триллиона долларов в мировой ВВП
10
Проекты на миллиарды долларов застопорились из-за отсутствия дорог к критически важным полезным ископаемым на Крайнем Севере Канады