Репортаж от Wedoany,Компания HPE значительно расширила свою AI-платформу на конференции HPE Discover в Лас-Вегасе. Ранее платформа поддерживала до 64 GPU, теперь верхний предел увеличен до 256 GPU. Клиенты могут начинать с меньших конфигураций и впоследствии наращивать производительность, добавляя стойки. Помимо серверов ProLiant с ускорителями Nvidia, система включает хранилище, Data Fabric, а также программное обеспечение для моделей, AI-приложений и агентов, где Morpheus отвечает за управление, а OpsRamp — за мониторинг.
Услуги по установке и интеграции уже включены в стоимость. HPE предлагает готовую среду по фиксированной цене, цель — избавить предприятия от необходимости самостоятельно собирать AI-фабрику из отдельных аппаратных, программных и других компонентов. Private Cloud AI от HPE интегрирует Nvidia AI Enterprise, отобранные модели и инструменты разработки, а также Nvidia Agent Toolkit, модели Nemotron, NemoClaw и OpenShell. Агенты могут регистрироваться, развёртываться и настраивать правила доступа с помощью этих инструментов. В части вычислений продукт дополнен системами с Nvidia RTX Pro 6000 Blackwell Server Edition.
Кроме того, HPE выпустила ProLiant DL394 Gen12 на базе процессора Nvidia Vera с архитектурой Arm. Этот процессор обрабатывает задачи, интенсивно использующие память и контроллеры в агентных приложениях, и тесно взаимодействует с GPU Nvidia. Таким образом, Private Cloud AI от HPE в основном построен на аппаратном и программном стеке Nvidia, что снижает объём интеграционных работ, но также означает меньшую гибкость в выборе ускорителей и сред выполнения.
Alletra Storage MP X10000 играет ключевую роль в новой AI-платформе. Платформа предоставляет файловое и объектное хранилище в единой архитектуре и напрямую интегрирована в Private Cloud AI. HPE также использует его как расширенное хранилище для производительного KV-кэша. Языковые модели хранят в KV-кэше информацию об обработанном тексте, контексте и промежуточных результатах. При получении последующих запросов модель обращается к этому контексту, а не пересчитывает его каждый раз заново.
Это особенно важно для длинных подсказок, большого количества документов и нескольких параллельных агентов. Чем длиннее контекст и чем больше одновременных запросов, тем быстрее растут потребности в хранилище. Если старая контекстная информация удаляется, модель вынуждена пересчитывать её при последующих запросах, что увеличивает задержку, энергопотребление и затраты. В агентной среде проблема усугубляется, поскольку агенты не просто отвечают один раз, а многократно проверяют, планируют, извлекают данные и готовят операции.
Поэтому HPE выгружает часть KV-кэша на X10000 с помощью удалённого прямого доступа к памяти (Remote Direct Memory Access). В этом процессе данные передаются напрямую между хранилищем и памятью, минуя несколько уровней обработки операционной системы. Таким образом, блок хранения берёт на себя часть памяти GPU и становится частью процесса вывода. По данным HPE, в их тестовой конфигурации с GPU Nvidia H200 и моделью Nemotron 70B время до первого токена сократилось в двадцать раз, а пропускная способность увеличилась в 17 раз.
Новая Data Fabric 8.2 может захватывать и каталогизировать распределённые источники данных. Глобальный каталог показывает, какая информация существует и где она находится. Метаданные, идентификация и политики доступа определяют, какие приложения или агенты могут получить доступ к конкретным ресурсам. Data Fabric также поставляется в виде предварительно настроенного устройства на серверах ProLiant. Во всём технологическом стеке X10000 отвечает за быстрый доступ к данным, а Data Fabric делает ресурсы данных обнаруживаемыми и контролируемыми.
Однако только техническая организация данных не делает их пригодными для AI. Для обучения и агентов данные сначала необходимо классифицировать, очистить, описать и установить права доступа. Несмотря на наличие автоматизированных инструментов, этот процесс частично требует ручного выполнения. Например, бизнес-подразделения должны объяснять значение, актуальность и назначение определённых данных.
Для эксплуатации интегрированной AI-среды HPE полагается на Morpheus, OpsRamp и GreenLake Intelligence. Morpheus предоставляет вычислительные ресурсы, хранилище и среду выполнения, а также оркестрирует частную облачную инфраструктуру. OpsRamp собирает телеметрию и отслеживает зависимости между приложениями, моделями и базовой инфраструктурой. В настоящее время связь между этими операционными функциями и AI-управляемой автоматизацией стала более тесной. Morpheus Central предназначен для отображения нескольких установленных экземпляров в центрах обработки данных, регионах и на периферийных узлах.
Это важно для AI-сред, поскольку модели, данные и сервисы вывода часто работают не в одном месте. OpsRamp не только собирает сбои, но и коррелирует их, а также выявляет первопричины в инфраструктуре. HPE расширила этот уровень с помощью функций Copilot и интерфейса MCP. Morpheus Copilot может создавать сценарии и автоматизацию на основе инструкций на естественном языке. OpsRamp Copilot, в свою очередь, должен анализировать инциденты и поддерживать меры по их устранению. Серверы MCP предоставляют стандартизированные интерфейсы, через которые агенты могут получать доступ к функциям управления и автоматизации. GreenLake Intelligence объединяет эти функции в единую панель управления.
HPE дополнила технологический стек функциями управления AI-агентами. Эти агенты имеют собственные идентификаторы и работают в изолированной среде. Политики определяют, какие данные, интерфейсы и инструменты они могут использовать. Для критически важных операций может потребоваться одобрение человека. Zerto обеспечивает дополнительный уровень отката: это программное обеспечение записывает изменения и при необходимости восстанавливает затронутые системы до предыдущего состояния. Однако оно не может определить, является ли решение технически ошибочным или нормативно недопустимым.
Для HPE управление в первую очередь означает технический контроль доступа и соблюдение политик. Валидация бизнес-моделей, обнаружение отклонений, нормативная классификация и распределение ответственности остаются задачами за пределами платформы. В этом заключается слабое место многих частных AI-стратегий. Хотя собственная инфраструктура увеличивает контроль над данными и операциями, она не заменяет управление. IBM и Red Hat недавно отметили, что многие предприятия не полностью понимают свои зависимости от AI-поставщиков, моделей и инфраструктуры. Частное облако может сделать эти зависимости более прозрачными, но не может их устранить.
Продукты AI-фабрик на рынке заметно различаются. Например, Dell использует декомпозированную инфраструктуру, где вычисления и хранение могут масштабироваться независимо. Напротив, HPE более тесно связывает оборудование, платформу данных и операционное ПО в единую определённую систему. Это переносит интеграционную работу с клиента на производителя, но уменьшает степень свободы, особенно увеличивая зависимость от Nvidia, поскольку HPE, помимо GPU, интегрирует процессоры, модели, среды выполнения и инструменты для агентов от партнёра. Преимущество заключается в хорошей координации компонентов; недостаток — в том, что при попытке заменить отдельный компонент быстрее достигаются архитектурные ограничения.
Предложение HPE AI-продуктов в виде частного облака соответствует текущим тенденциям. По мере перехода AI от пилотных проектов к производственной эксплуатации меняется и способ расчёта инфраструктуры: публичные облачные сервисы по-прежнему привлекательны для тестирования, гибких нагрузок и быстрого доступа к новым моделям; для постоянного вывода, агентских рабочих процессов и конфиденциальных данных на первый план выходят контроль затрат и доступ к данным. Deloitte считает, что при постоянных высоких AI-нагрузках существует экономическая точка перелома: когда затраты на облако достигают значительной части стоимости сопоставимой собственной системы, частное облако может оказаться дешевле. Forrester также прогнозирует, что из-за роста затрат на AI, блокировки данных и операционных рисков предприятия будут чаще использовать частные AI-облака. Private Cloud AI от HPE позиционируется не как альтернатива публичному облаку, а как операционная платформа для AI-нагрузок, которые должны быть ближе к данным и процессам. Стоит отметить, что полный технологический стек ещё не полностью готов: некоторые объявленные функции и интеграции появятся на рынке в ближайшие кварталы.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









