Репортаж от Wedoany,1 июня американская компания Micron Technology на выставке COMPUTEX 2026 представила оптимизированный для ИИ сквозной портфель продуктов памяти и хранения данных, охватывающий приложения от центров обработки данных до интеллектуальных периферийных устройств. В этот портфель входят HBM4, SOCAMM2, DDR5 RDIMM, SSD для центров обработки данных, а также решения для хранения данных, ориентированные на ИИ-ПК, автомобильные и встраиваемые системы. Основное внимание уделяется вычислительным потребностям, связанным с переходом от обучения моделей к крупномасштабному инференсу, длинному контексту и рабочим нагрузкам интеллектуальных агентов.
Ключевой посыл анонса Micron заключается в том, что узким местом ИИ-инфраструктуры становится не просто расширение вычислительной мощности, а координация пропускной способности памяти, емкости, энергопотребления и иерархии хранения данных. Компания сообщила, что HBM4 36GB 12H при двукратном увеличении пропускной способности позволяет повысить пропускную способность инференса больших языковых моделей в 2,6 раза; 256GB SOCAMM2, предназначенный для приложений памяти в центрах обработки данных с низким энергопотреблением, имеет емкость 256 ГБ и по сравнению со стандартными RDIMM позволяет сократить энергопотребление и занимаемое пространство примерно на треть; 256GB DDR5 RDIMM на базе технологии 1γ уже отправлен на семплирование, его скорость достигает 9200 МТ/с, что на 40% быстрее текущих серийных модулей, а рабочее энергопотребление более чем на 40% ниже по сравнению с комбинацией двух модулей по 128 ГБ.
SSD для центров обработки данных также являются важной частью этого портфеля. Micron заявляет, что Micron 9650 SSD — это первый в мире коммерческий SSD с интерфейсом PCIe Gen6, предназначенный для рабочих нагрузок инференса и обучения ИИ; Micron 6600 ION теперь доступен с максимальной емкостью 245 ТБ, что позволяет сократить занимаемое пространство в стойке на 82% и вдвое снизить энергопотребление по сравнению с развертыванием на основе жестких дисков. Для центров обработки данных ИИ уровень хранения данных перестает быть просто статическим местом размещения моделей и данных, а превращается в активный рабочий уровень, тесно связанный с KV-кэшем, озерами данных, подготовкой обучающих данных и непрерывной работой сервисов инференса.
Этот набор продуктов показывает, что строительство ИИ-инфраструктуры вступает в этап «полноценной реструктуризации памяти и хранения данных». На ранних этапах развития ИИ основное внимание уделялось количеству GPU и пиковой вычислительной мощности, но по мере масштабирования задач инференса предприятиям требуется обрабатывать более длинный контекст, большее количество одновременных запросов, более сложные задачи интеллектуальных агентов и выдерживать более высокую нагрузку на доступ к данным. Недостаточная пропускная способность памяти ограничивает скорость отклика моделей, недостаточная емкость влияет на обработку длинного контекста и многозадачное планирование, а низкая производительность хранилища замедляет загрузку данных, вызов кэша и конвейер инференса. Демонстрируя HBM, LPDDR, DDR, SOCAMM и SSD в рамках единого уровня ИИ-инфраструктуры, Micron отражает переход производителей памяти от поставщиков отдельных компонентов к ключевым участникам оптимизации производительности ИИ-систем.
Изменения происходят и на периферии. Micron отмечает, что по мере распространения инференса ИИ из центров обработки данных на ПК, смартфоны, автомобили и встраиваемые системы, локальным устройствам требуется DRAM большей плотности для постоянного размещения и работы моделей и агентов, а также более быстрые и надежные хранилища для поддержки локального кэширования моделей, внутриавтомобильной сенсорной интеграции в реальном времени и отклика на стороне устройства. Для индустрии информационных и коммуникационных технологий это означает, что ИИ-инфраструктура будет одновременно расширяться как в облако, так и на периферию, а выбор хранилищ и памяти будет напрямую влиять на скорость отклика, уровень энергопотребления и стоимость развертывания ИИ-приложений.
Micron проведет закрытые демонстрации продуктов в своем офисе в TFC Plaza в Тайбэе с 2 по 4 июня. Дальнейшие переменные факторы сосредоточены на темпах внедрения HBM4, SOCAMM2 и высокоемких SSD у клиентов, масштабах производства, скорости адаптации к платформам GPU и серверов, а также на способности клиентов центров обработки данных повысить общую эффективность генерации токенов за счет модернизации памяти и хранилищ. По мере перехода ИИ-приложений от обучающих кластеров к непрерывным сервисам инференса, память и хранилища становятся еще одной ключевой линией конкуренции наряду с сетевыми ресурсами, вычислительной мощностью и энергопотреблением в центрах обработки данных.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









