Американская компания MinIO представила в Редвуд-Сити MemKV — контекстное хранилище петабайтного масштаба с микросекундным доступом, призванное преодолеть «налог на повторные вычисления» в GPU-кластерах
2026-05-13 11:39
В избр.

Репортаж от Wedoany,Американская компания MinIO 12 мая 2026 года в Редвуд-Сити представила систему контекстной памяти хранения данных MemKV, созданную специально для инференса ИИ. Она впервые выводит возможности микросекундного поиска контекста на петабайтный уровень, заполняя критический пробел между высокопропускной памятью в GPU-кластерах и объектным хранилищем. Согласно глобальному пресс-релизу компании, MemKV является второй опорой в портфеле продуктов MinIO после объектного хранилища AIStor и специально ориентирована на рабочие нагрузки инференса агентного ИИ. Обеспечивая постоянный общий контекст между GPU-кластерами, она полностью устраняет проблему повторных вычислений, вызванную потерей контекста.

В сценариях инференса ИИ объем высокопропускной памяти внутри GPU крайне ограничен. Когда запросы на инференс с длинным контекстом или мультиагентной координацией выходят за пределы ее возможностей, GPU вынужден отбрасывать уже вычисленные данные кэша пар «ключ-значение» и пересчитывать их заново. Эти потери, называемые в отрасли «налогом на повторные вычисления», приводят к бесполезной трате огромных вычислительных мощностей, времени и электроэнергии. Соучредитель и согенеральный директор MinIO АБ Периясами отметил, что в масштабе кластеров из тысячи GPU-карт такие потери являются уже не просто проблемой эффективности, а структурным тормозом. MemKV спроектирован специально для тракта данных инференса и «точечно устраняет» этот хронический недостаток.

Ключевой прорыв MemKV заключается в одновременном достижении высокой скорости и масштаба. Продукт интегрирован с архитектурой NVIDIA BlueField-4 STX и нативно взаимодействует с программными стеками NVIDIA Dynamo и NIXL. Посредством передачи RDMA данные кэша «ключ-значение» напрямую перемещаются между NVMe-накопителями и памятью GPU, минуя HTTP-протокол, файловую систему или отдельные серверы хранения. Размер блоков данных оптимизирован под пропускную способность GPU и составляет от 2 МБ до 16 МБ. Контрольные тесты при корпоративном развертывании показывают, что в типичном производственном кластере со 128 GPU и длиной контекста 128K токенов MemKV повышает утилизацию GPU примерно с 50% до более чем 90%, а сокращение потерь вычислительной мощности трансформируется в прямую экономию около 2 миллионов долларов США в год. Что касается задержек, внутренние бенчмарки демонстрируют 75-кратное улучшение задержки генерации первого токена, сжимая базовый показатель в 53 секунды до миллисекунд.

Долгое время основные инвестиции в исследования и разработки в области ИИ-инфраструктуры были сосредоточены на обучении моделей. По мере того как большие модели переходят от ответов на простые вопросы к выполнению сложных многошаговых задач, с конца 2025 года фокус отрасли начал ускоренно смещаться в сторону инференса. Опрос, проведенный ECI Research на саммите AI Builders Summit 2025 года, показал, что уже две трети руководителей предприятий в сфере ИИ внедрили пилотные проекты или полноценные рабочие процессы мультиагентной координации. Мультиагентная координация — это как раз тот сценарий, где ценность общего KV-кэша максимальна: различные агенты взаимодействуют между GPU, совместно используя контекст. Если бы при каждом взаимодействии требовался пересчет, задержки и затраты возрастали бы многократно. Общий постоянный пул контекста MemKV — это прямой ответ на данный структурный недостаток.

С точки зрения продуктовой логики индустрии хранения данных, MemKV не заменяет существующее объектное хранилище AIStor, а дополняет определенную NVIDIA архитектуру многоуровневой памяти STX новым уровнем кэша, называемым в отрасли «G3.5». Как самостоятельный продукт, он образует стек с разделением на верхний и нижний уровни вместе с AIStor. Штаб-квартира MinIO находится в Редвуд-Сити, штат Калифорния, США. Компания основана в 2014 году и закрепилась на рынке благодаря высокопроизводительному S3-совместимому объектному хранилищу, а в последние годы ведет непрерывную итерационную разработку в области инфраструктуры данных для ИИ.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Microsoft тестирует «профиль низкой задержки» для Windows 11: мгновенный разгон увеличивает скорость запуска на 40%
2026-05-13
Google анонсировала Gemini Intelligence на мероприятии I/O 2026 для обновления интеллектуального ассистента Android
2026-05-13
Google подтвердила 13 мая, что Adobe Premiere выйдет на Android летом 2026 года
2026-05-13
13 мая американская компания Google объявила об усилении защиты от кражи в Android 17, добавив биометрическую блокировку «Отметить как утерянное»
2026-05-13
Американский спутник Viasat F2 полностью развернул отражатель, в этом месяце в Северной и Южной Америке запускается сервис со скоростью более 100 Мбит/с
2026-05-13
Google США представила «родной» ИИ-ноутбук Googlebook, премьера от Acer, ASUS, Dell, HP и Lenovo состоится этой осенью
2026-05-13
Американская компания Lonestar подписала соглашение Space Act с NASA, сосредоточив внимание на хранении данных на Луне и внеземных суперкомпьютерах
2026-05-13
Американская компания Scale AI и Министерство энергетики подписали меморандум о поддержке «Миссии Genesis» для продвижения научных открытий с помощью ИИ
2026-05-13
Американская компания MinIO представила в Редвуд-Сити MemKV — контекстное хранилище петабайтного масштаба с микросекундным доступом, призванное преодолеть «налог на повторные вычисления» в GPU-кластерах
2026-05-13
Американская компания Hewlett Packard Enterprise представила в Хьюстоне новые инновации в области HPE Private Cloud и защиты данных в системах хранения
2026-05-13
Последние новости
1
Проект холодной прокатки в Алжире: испытание линии цинкования на герметичность прошло успешно с первой попытки
2
Финская ABB представляет первый в мире сверхвысокоэффективный двигатель IE6, снижающий энергопотребление и выбросы углерода во взрывоопасных зонах
3
Китайская компания China First Heavy Industries успешно отковала цилиндрическую поковку 9-метрового класса
4
Итальянская компания Comau и Omron Robotics подписали соглашение о стратегическом сотрудничестве для ускорения внедрения промышленной автоматизации
5
Американская компания Cognex представила систему технического зрения In-Sight 3900, скорость контроля которой увеличена в 4 раза
6
Проект DIAMOnD в штате Мичиган (США) помогает участникам открыть свой бизнес с помощью обучения аддитивному производству
7
Американская компания Axtra3D, специализирующаяся на технологиях 3D-печати, назначила Dynamism своим дилером в Северной Америке
8
Японская Panasonic представила в Северной Америке защищенный модульный ноутбук TOUGHBOOK 56
9
Американская компания Physik Instrumente представила в Массачусетсе, США, систему фотонного совмещения F-572
10
Немецкая компания ROLEC представляет литой алюминиевый корпус profiCASE для сенсорных экранов в кабинах тракторов и строительной техники