NVIDIA и AWS ускоряют индексацию векторов в 10 раз_Глобальные новости

NVIDIA и AWS ускоряют индексацию векторов в 10 раз

2026-06-26 09:52

В избр.

Репортаж от Wedoany，25 июня 2026 года компании NVIDIA и Amazon Web Services (AWS) объявили о сотрудничестве, направленном на решение ключевых ограничений при создании крупномасштабных систем ИИ, таких как низкая задержка вывода, быстрый векторный поиск, соотношение цены и производительности GPU, а также масштабирование инфраструктуры. Благодаря Amazon OpenSearch и Amazon EC2, ИИ-инфраструктура NVIDIA предоставляет предприятиям практические пути для развертывания ИИ в промышленных масштабах.

Экземпляры EC2 G7 на базе NVIDIA RTX PRO 4500 Blackwell Server Edition GPU расширяют вычислительный уровень для рабочих нагрузок ИИ, графики, видео и анализа данных. Библиотека NVIDIA cuVS ускоряет уровень поиска, делая векторные индексы на GPU стандартным вариантом в OpenSearch Serverless. Кроме того, AWS получила статус NVIDIA Exemplar Cloud на базе NVIDIA GB300, что гарантирует клиентам пиковую оптимизированную производительность для тренировочных рабочих нагрузок.

Экземпляры Amazon EC2 G7 внедряют NVIDIA RTX PRO 4500 Blackwell Server Edition GPU в AWS для вывода ИИ, графики, пространственных вычислений и ускоренного анализа данных на GPU. Это новый тип экземпляров, предназначенный для производственных рабочих нагрузок, обеспечивающий производительность без необходимости управления платформой GPU со стороны клиента. По сравнению с экземплярами G6, G7 обеспечивают до 4,6 раз более высокую производительность вывода ИИ и до 2,1 раза более высокую графическую производительность. При использовании библиотеки NVIDIA cuDF для рабочих нагрузок Apache Spark эти экземпляры обеспечивают более быстрый анализ данных на GPU в Amazon EMR. Экземпляры G7 поддерживают до 8 GPU с общим объемом памяти 256 ГБ, сетевое подключение EFA со скоростью 700 Гбит/с и до 7,6 ТБ локального хранилища NVMe SSD, включая конфигурации с 1, 2, 4 и 8 GPU, а также предстоящие голые металлические экземпляры, что позволяет клиентам масштабировать инфраструктуру в соответствии с рабочими нагрузками.

Следующее поколение Amazon OpenSearch Serverless поддерживает агентный ИИ и динамические рабочие нагрузки без необходимости управления инфраструктурой. Этот сервис использует ускоренные GPU векторные индексы на базе NVIDIA cuVS в качестве стандартного вычислительного решения для всех векторных коллекций. Для команд, создающих приложения с дополненной генерацией (RAG), семантическим поиском, рекомендательными системами и агентным ИИ, это изменение превращает векторный поиск на GPU из специализированного проекта оптимизации в стандартную возможность AWS. Влияние на клиентов проявляется в следующем: скорость индексации векторов увеличивается до 10 раз по сравнению с чисто CPU-решениями, а стоимость составляет лишь четверть от прежней, что позволяет создавать миллиардные векторные базы данных менее чем за час.

AWS получила статус NVIDIA Exemplar Cloud на базе NVIDIA GB300 для тренировочных рабочих нагрузок. Это означает, что AWS соответствует строгим порогам производительности, установленным NVIDIA для бенчмаркинга рабочих нагрузок ИИ по сравнению с эталонной архитектурой. Это достижение стало результатом глубокой совместной инженерии команд AWS и NVIDIA. Благодаря программе NVIDIA Exemplar Cloud разработчики и лидеры ИИ могут быть уверены, что используют согласованную, высокопроизводительную облачную инфраструктуру для крупномасштабного обучения, что помогает командам с большей уверенностью оценивать облачных провайдеров, улучшать совокупную стоимость владения и более эффективно переводить проекты ИИ от планирования к производству.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com