Американская компания MinIO представила в Редвуд-Сити MemKV — контекстное хранилище петабайтного масштаба с микросекундным доступом, призванное преодолеть «налог на повторные вычисления» в GPU-кластерах
2026-05-13 11:39
В избр.

Репортаж от Wedoany,Американская компания MinIO 12 мая 2026 года в Редвуд-Сити представила систему контекстной памяти хранения данных MemKV, созданную специально для инференса ИИ. Она впервые выводит возможности микросекундного поиска контекста на петабайтный уровень, заполняя критический пробел между высокопропускной памятью в GPU-кластерах и объектным хранилищем. Согласно глобальному пресс-релизу компании, MemKV является второй опорой в портфеле продуктов MinIO после объектного хранилища AIStor и специально ориентирована на рабочие нагрузки инференса агентного ИИ. Обеспечивая постоянный общий контекст между GPU-кластерами, она полностью устраняет проблему повторных вычислений, вызванную потерей контекста.

В сценариях инференса ИИ объем высокопропускной памяти внутри GPU крайне ограничен. Когда запросы на инференс с длинным контекстом или мультиагентной координацией выходят за пределы ее возможностей, GPU вынужден отбрасывать уже вычисленные данные кэша пар «ключ-значение» и пересчитывать их заново. Эти потери, называемые в отрасли «налогом на повторные вычисления», приводят к бесполезной трате огромных вычислительных мощностей, времени и электроэнергии. Соучредитель и согенеральный директор MinIO АБ Периясами отметил, что в масштабе кластеров из тысячи GPU-карт такие потери являются уже не просто проблемой эффективности, а структурным тормозом. MemKV спроектирован специально для тракта данных инференса и «точечно устраняет» этот хронический недостаток.

Ключевой прорыв MemKV заключается в одновременном достижении высокой скорости и масштаба. Продукт интегрирован с архитектурой NVIDIA BlueField-4 STX и нативно взаимодействует с программными стеками NVIDIA Dynamo и NIXL. Посредством передачи RDMA данные кэша «ключ-значение» напрямую перемещаются между NVMe-накопителями и памятью GPU, минуя HTTP-протокол, файловую систему или отдельные серверы хранения. Размер блоков данных оптимизирован под пропускную способность GPU и составляет от 2 МБ до 16 МБ. Контрольные тесты при корпоративном развертывании показывают, что в типичном производственном кластере со 128 GPU и длиной контекста 128K токенов MemKV повышает утилизацию GPU примерно с 50% до более чем 90%, а сокращение потерь вычислительной мощности трансформируется в прямую экономию около 2 миллионов долларов США в год. Что касается задержек, внутренние бенчмарки демонстрируют 75-кратное улучшение задержки генерации первого токена, сжимая базовый показатель в 53 секунды до миллисекунд.

Долгое время основные инвестиции в исследования и разработки в области ИИ-инфраструктуры были сосредоточены на обучении моделей. По мере того как большие модели переходят от ответов на простые вопросы к выполнению сложных многошаговых задач, с конца 2025 года фокус отрасли начал ускоренно смещаться в сторону инференса. Опрос, проведенный ECI Research на саммите AI Builders Summit 2025 года, показал, что уже две трети руководителей предприятий в сфере ИИ внедрили пилотные проекты или полноценные рабочие процессы мультиагентной координации. Мультиагентная координация — это как раз тот сценарий, где ценность общего KV-кэша максимальна: различные агенты взаимодействуют между GPU, совместно используя контекст. Если бы при каждом взаимодействии требовался пересчет, задержки и затраты возрастали бы многократно. Общий постоянный пул контекста MemKV — это прямой ответ на данный структурный недостаток.

С точки зрения продуктовой логики индустрии хранения данных, MemKV не заменяет существующее объектное хранилище AIStor, а дополняет определенную NVIDIA архитектуру многоуровневой памяти STX новым уровнем кэша, называемым в отрасли «G3.5». Как самостоятельный продукт, он образует стек с разделением на верхний и нижний уровни вместе с AIStor. Штаб-квартира MinIO находится в Редвуд-Сити, штат Калифорния, США. Компания основана в 2014 году и закрепилась на рынке благодаря высокопроизводительному S3-совместимому объектному хранилищу, а в последние годы ведет непрерывную итерационную разработку в области инфраструктуры данных для ИИ.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные продукты
Связанные рекомендации
Salam открывает второй центр исследований и технологических инноваций в Эль-Хасе, Саудовская Аравия
2026-07-05
Samsung Galaxy S27 Ultra от Южной Кореи может получить аккумулятор на 5600–5800 мАч
2026-07-05
Starlink ускоряет цифровую трансформацию сельского хозяйства Бразилии
2026-07-05
Малайзийская группа Kuok планирует инвестировать 5,3 млрд евро в строительство центра обработки данных мощностью 300 МВт в Милане, Италия
2026-07-05
Доля доходов Airtel в Индии составляет 36%: компания расширяет 5G и углубляет финансовые услуги
2026-07-05
Израильская компания по кибербезопасности Dream привлекла $260 млн и планирует выход на рынок Латинской Америки
2026-07-05
Индийская Bharti Airtel расширяет покрытие сети на пути паломничества Амарнатх
2026-07-05
Авиакомпания United Airlines впервые развернула облачную развлекательную систему на борту Boeing 787-9
2026-07-05
В AIRI разработали нейросеть Genatator для аннотации генов
2026-07-05
Vodafone Ireland завершила первую в Европе демонстрацию экстренной связи с прямым подключением устройств к спутнику
2026-07-05
Последние новости
1
Японская компания Axelspace получила контракт JAXA на услуги по орбитальной демонстрации технологий на 2026 финансовый год
2
WSP оказывает консультационные услуги по первому этапу обоснования продления Шотландской пограничной железной дороги
3
Почта Японии с октября корректирует тарифы на посылки, средний рост составит около 10%
4
Frontier Airlines в июле прекращает все рейсы в Спокан, США
5
Программа NASA «Артемида» продвигает строительство базы на южном полюсе Луны
6
CMA CGM корректирует пиковую надбавку на маршруте Китай – Западная Африка (северный регион) до 200 долларов США за TEU
7
В Великобритании HS2 открывает центр найма на 30 000 рабочих мест в центре занятости Актона
8
Стоимость топлива для душа на A380 Emirates составляет около 100–400 долларов за рейс
9
Филиппинская авиакомпания Cebu Pacific в 2026 году доведет плотность кресел в экономклассе до 460 мест
10
Stellantis представит в Бразилии гибридный пикап с запасом хода 170 км