Репортаж от Wedoany,Искусственный интеллект предъявляет к центрам HPC ряд новых требований: исследователи больше не сосредоточены исключительно на обучении моделей, многие начинают использовать сервисы вывода и ИИ-агентов как часть своей повседневной работы. Для центров HPC это означает необходимость разобраться, как предоставлять такие услуги в масштабе и обеспечить их совместимость с существующей HPC-инфраструктурой.
Эти вопросы стали основной темой сессии TPC26 «Платформы научного ИИ: вывод, агенты и ИИ-сервисы в HPC-объектах». В ходе обсуждения собрались докладчики из национальных лабораторий, суперкомпьютерных центров, промышленности и исследовательских институтов, которые поделились опытом создания и эксплуатации ИИ-сервисов для исследователей. Среди участников были: главный специалист по науке о данных Суперкомпьютерного центра Сан-Диего (San Diego Supercomputer Center) и главный исследователь Национальной платформы данных (National Data Platform) д-р İlkay Altıntaş; руководитель направления ИИ в Вычислительном центре лидерства Аргонна (Argonne Leadership Computing Facility) д-р Venkat Vishwanath; д-р Jason Haga из Национального института передовых промышленных наук и технологий (National Institute of Advanced Industrial Science and Technology, AIST) Японии; Samantha Sury из HPE; д-р Paola Buitrago из Питтсбургского суперкомпьютерного центра (Pittsburgh Supercomputing Center); д-р Shoaja Fan; а также исполнительный директор Техасского передового вычислительного центра (Texas Advanced Computing Center, TACC) д-р Dan Stanzione.

Д-р Altıntaş открыл дискуссию обзором Национальной исследовательской платформы (National Research Platform), которая предоставляет исследователям доступ к ИИ-моделям через общие сервисы. Д-р Altıntaş отметил, что платформу необходимо рассматривать на трёх различных уровнях, включая уровень инфраструктуры, охватывающий вычисления, хранение данных и всё сопутствующее, что напоминает HPC-сервисы, но вместо ядро-часов учитываются токены. В настоящее время Национальная исследовательская платформа предлагает девять открытых моделей, позволяя исследователям получать возможности ИИ без необходимости развёртывания и управления собственной инфраструктурой. Эта тема неоднократно поднималась на конференции: докладчики обсуждали, как центры HPC адаптируются к растущему спросу на сервисы вывода и инструменты ИИ.
Создание таких сервисов также требует инфраструктуры, специально предназначенной для вывода. В своём выступлении д-р Haga сосредоточился на обзоре усилий Японии по оценке ряда ИИ-ускорителей и технологий вывода в рамках национальной программы тестовых платформ. По словам Haga, программа оценивает разнообразные передовые ИИ-ускорители и разрабатывает технологии для предоставления высокопроизводительных сервисов вывода, а также практических способов доступа к этим различным вычислительным ресурсам. Для исследователей само оборудование часто имеет второстепенное значение; важно, чтобы сервис был доступен, хорошо работал и вписывался в их рабочий процесс, не требуя от них стать экспертами. Проект направлен на то, чтобы помочь исследователям опробовать различные аппаратные платформы ИИ, предоставить фреймворк для развёртывания сервисов вывода и изучить, как более широкий набор ускорителей может поддерживать будущие научные ИИ-нагрузки.
Выступления подчеркнули проблему, с которой сталкиваются HPC-объекты: исследователям всё равно, какое оборудование работает под капотом, но они всё чаще ожидают, что ИИ-сервисы будут доступны в любой момент.

Хотя обсуждение в основном касалось инфраструктуры и технологий, д-р Stanzione предположил, что экономические вопросы в конечном итоге могут стать более серьёзной проблемой. Stanzione отметил, что токены на самом деле стоят денег, и когда люди начинают активно их использовать, многие лаборатории за последние несколько месяцев обсуждали отказ от их применения. По мере того как ИИ-сервисы становятся более широко доступными, объём их использования быстро растёт, создавая иной набор нагрузок по сравнению с традиционными HPC-задачами, особенно когда учреждения пытаются сбалансировать растущие потребности в условиях ограниченного бюджета. По словам Stanzione, долгосрочная проблема может заключаться не в создании платформ вывода, а в поиске устойчивых способов их эксплуатации. Он отметил, что среди множества технических вопросов в долгосрочной перспективе финансовый аспект может влиять на действия сильнее, чем любой другой фактор.
Дискуссия продемонстрировала, как HPC-объекты адаптируются к следующему этапу применения ИИ. Хотя основное внимание отрасли по-прежнему сосредоточено на моделях и оборудовании, докладчики неоднократно возвращались к практическим и неизбежным реалиям предоставления ИИ как услуги. От общих платформ вывода и тестовых площадок для ускорителей до экономики потребления токенов — проблемы, обсуждавшиеся в выступлениях, показывают, что будущее научного ИИ может в равной степени зависеть от эксплуатации и инфраструктуры, а также от прогресса в самих моделях.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









