Американская компания Mirantis представила инструменты управления и инференса ИИ для промышленного развертывания GPU-облаков
2026-05-20 11:55
В избр.

Репортаж от Wedoany,Поставщик облачных инфраструктурных платформ Mirantis 14 мая в Кэмпбелле, штат Калифорния, официально объявил о добавлении в свою платформу k0rdent AI трех ключевых функций: реестра моделей, сетки инференса и среды выполнения инференса. Это впервые объединяет безопасное распространение моделей ИИ, применение политик управления, маршрутизацию нагрузки инференса и эффективное использование ресурсов GPU в единую операционную плоскость, охватывающую весь цикл от разработки до производства. Этот выпуск является прямым ответом на фрагментированную ситуацию, с которой в настоящее время сталкиваются операторы GPU-облаков и команды корпоративных ИИ-платформ при переводе рабочих нагрузок ИИ из экспериментальной стадии в промышленную эксплуатацию.

Вице-президент Mirantis по разработке продуктов Кевин Камель в официальном заявлении указал на суть проблемы: «По мере того как организации переводят проекты ИИ с экспериментальной стадии в производственную среду, инфраструктурные команды все чаще сталкиваются с операционными и управленческими проблемами в области распространения моделей, видимости инференса, обеспечения соответствия требованиям и экономики GPU. Предприятия и операторы GPU вынуждены собирать из разрозненных частей хрупкие рабочие процессы и разрозненные инструменты для эксплуатации ИИ». Он также подчеркнул, что модели ИИ принципиально отличаются от контейнеров — модели имеют уникальные требования к управлению, суверенитету, соответствию нормативным требованиям и жизненному циклу, и к ним нельзя просто применять парадигму эксплуатации, ориентированную на контейнеры, принятую в эпоху облачных технологий.

k0rdent AI Model Registry оптимизирован для рабочих процессов хранения и распространения больших языковых моделей и их производных. Этот компонент предоставляет безопасный, соответствующий стандартам Open Container Initiative (OCI) нативный реестр, который может управлять базовыми большими языковыми моделями, точно настроенными вариантами, квантованными сборками и связанными артефактами ИИ, охватывая распределенные инфраструктурные среды, что напрямую снижает операционную сложность и риски в цепочке поставок при безопасном распространении моделей ИИ. Управление версиями моделей, отслеживание происхождения и контроль доступа встроены в реестр, что позволяет предприятиям применять согласованные процессы CI/CD к моделям ИИ так же, как и к образам контейнеров.

k0rdent AI Inference Mesh берет на себя обязанности по маршрутизации и управлению нагрузкой инференса между кластерами. Этот компонент способен осуществлять интеллектуальную маршрутизацию запросов инференса, контроль доступа и учет использования в рамках федеративных вычислительных ресурсов, абстрагируя логику обратного проксирования, балансировки нагрузки и API-шлюзов, которые ранее настраивались разными командами вручную, в единый уровень, управляемый политиками. Благодаря этому организации могут превратить необработанную инфраструктуру GPU в управляемую платформу инференса ИИ, одновременно получая централизованную видимость объема вызовов моделей, распределения задержек и потребленных затрат. Для операторов, одновременно управляющих несколькими кластерами GPU или использующих смешанные собственные центры обработки данных и экземпляры GPU в публичных облаках, Inference Mesh предоставляет единую точку контроля в различных средах.

Выпущенная совместно с Inference Mesh среда выполнения k0rdent AI Inference Runtime фокусируется на эффективности выполнения рабочих нагрузок инференса. Эта среда выполнения, спроектированная с целью максимизации количества токенов, генерируемых в секунду на один GPU, повышает использование инфраструктуры GPU за счет квантования моделей, оптимизации пакетной обработки и динамического планирования ресурсов. В условиях сохраняющегося дефицита предложения GPU и высоких затрат на вычислительные мощности, предельное улучшение эффективности инференса может напрямую конвертироваться в значительное снижение операционных расходов, что является особенно актуальным требованием на современном рынке инфраструктуры ИИ.

Три компонента, представленные Mirantis на этот раз, являются не самостоятельными продуктами, а расширением функционального уровня платформы k0rdent AI. Сама платформа k0rdent позиционируется как облачная платформа управления инфраструктурой для эпохи ИИ, поддерживающая унифицированную оркестровку в средах bare-metal, виртуальных машин и контейнеров, с совместимостью на нижнем уровне с различными ускорителями, такими как NVIDIA GPU и AMD GPU. С помощью этой платформы Mirantis пытается распространить свои возможности управления инфраструктурой корпоративного уровня, накопленные в области OpenStack и Kubernetes, на полный жизненный цикл рабочих нагрузок ИИ.

Штаб-квартира Mirantis находится в Кэмпбелле, штат Калифорния, США. Компания основана в 1999 году, ранее была компанией облачной инфраструктуры, долгое время поддерживавшей OpenStack, а в настоящее время фокус ее бизнеса сместился на предоставление облачных инфраструктурных решений для рабочих нагрузок AI/ML. Выпущенная компанией в апреле этого года версия MOSK 26.1 уже добавила ИИ-ассистента для платформы OpenStack, использующего техническую документацию и базу знаний для предоставления автоматизированных операционных рекомендаций по высокопроизводительным вычислениям и рабочим нагрузкам ИИ. Путь трансформации Mirantis от OpenStack к k0rdent AI демонстрирует четкое стратегическое намерение: глубоко интегрировать традиционные возможности управления облачной инфраструктурой с нативным инструментарием ИИ, чтобы закрепить свои позиции в период быстрого расширения рынка инфраструктуры ИИ.

Рынок инструментов управления и инференса ИИ вступает в фазу ускоренной консолидации. Предприятия больше не удовлетворяются изолированным доступом к вычислительным мощностям GPU, а требуют полной платформенной поддержки всего цикла — от хранения моделей, безопасного распространения и управления соответствием требованиям до развертывания инференса и управления затратами. Пакет NVIDIA AI Enterprise, Google Vertex AI и AWS SageMaker продвигают аналогичную интеграцию на разных уровнях. Mirantis выбирает точку входа на уровне инфраструктуры, расширяясь вверх до управления моделями и инференсом, пытаясь найти дифференцированную позицию между облачными провайдерами и ИИ-платформами. По мере того как все больше предприятий внедряют генеративный ИИ в основные бизнес-процессы, соответствие нормативным требованиям при управлении моделями, наблюдаемость цепочек инференса и экономичность ресурсов GPU станут тремя ключевыми показателями, определяющими конкурентоспособность платформы.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Ассоциация оптоволоконной широкополосной связи США совместно с AARP запускает программу цифрового обучения для пожилых людей, обновляет сертификацию OpTIC Path и публикует технический документ о миграции MSO на FTTH
2026-05-20
Американская компания Mirantis представила инструменты управления и инференса ИИ для промышленного развертывания GPU-облаков
2026-05-20
Американская компания Lightpath добавила 265 маршрутных миль оптоволокна, соединив более 2400 макросайтов в столичном регионе Нью-Йорка для предоставления беспроводного транзитного соединения (backhaul)
2026-05-20
Американская Lumos назначает бывшего топ-менеджера Frontier Скотта Миспагеля новым CEO для достижения цели по охвату оптоволоконной сетью 3,5 млн домохозяйств
2026-05-20
Квантовые лидеры Калифорнии собрались в Калифорнийском университете в Сан-Диего для обсуждения узких мест масштабирования и общештатной стратегии, государственно-частное партнерство нацелено на создание глобального центра квантовой индустрии
2026-05-20
Семья Окампо из США учредила фонд в размере 100 миллионов долларов для целевой поддержки университетских исследований в области радиочастотной, микроволновой и фотонной инженерии
2026-05-20
OpenAI обновляет механизм отслеживания происхождения ИИ-контента: внедрение двухуровневой верификации с невидимыми водяными знаками Google SynthID и метаданными C2PA
2026-05-20
Google в США открывает API CodeMender для внешних разработчиков, укрепляя экосистему инструментов безопасности кода на основе ИИ
2026-05-20
Израильский стартап Ocean привлёк $28 млн на защиту от фишинга с помощью агентного ИИ
2026-05-20
В документах FCC раскрыт Wi-Fi роутер для спутникового интернета Amazon Leo: оснащён чипами Qualcomm и поддерживает протоколы умного дома
2026-05-20
Последние новости
1
Китайская компания Ensign Heavy Industries представила электрический погрузчик YX665EV с батареей CTB
2
Роботизированные сварочные клещи и линейные сервопрессы с прямым приводом от компании TECNA
3
Smiley Monroe представит линейку конвейерных лент на выставке Hillhead 2026 для горнодобывающей, строительной и перерабатывающей отраслей Великобритании
4
Чилийская компания THS Ingeniería представила беспилотный надводный аппарат iBoat BS12 для высокоточной гидрографической съемки
5
Отчет Fortune Business Insights: мировой рынок автомобильной 3D-печати достигнет 14,66 млрд долларов к 2034 году
6
На Горном саммите SANY Group получены заказы на сумму свыше 10 млрд юаней
7
Texarkana Aluminum запускает четырехклетьевой стан горячей прокатки в Техасе
8
Американская компания OZ Lifting представляет консольные краны из нержавеющей стали грузоподъемностью 850 и 1500 фунтов
9
OnRobot и Telabotics представляют первое готовое к использованию решение для ЧПУ в Северной Америке
10
Vecow представит экосистему роботизированных вычислений с производительностью 2070 TFLOPS на саммите робототехники в США в 2026 году