Репортаж от Wedoany,Национальное агентство по развитию информационного общества (NIA) Южной Кореи инвестирует около 2,9 млрд вон в создание «Единой системы предоставления данных для обучения ИИ», направленной на формирование единой платформы для предоставления данных, используемых для обучения искусственного интеллекта (ИИ), которые в настоящее время распределены на государственном уровне.

С быстрым распространением новых поколений технологий ИИ, таких как генеративный ИИ, мультимодальный ИИ и агентный ИИ, получение крупномасштабных, высококачественных данных для обучения становится ключевой задачей. Однако в настоящее время данные, собранные и обработанные в рамках проектов, финансируемых из государственного бюджета, часто не могут быть открыты или повторно использованы извне, а данные, принадлежащие частным компаниям и исследовательским институтам, из-за недостаточной процедуры открытия и системы поддержки, в основном ограничиваются использованием внутри организаций. Данный проект направлен на решение этой проблемы.
Основная цель проекта — создание системы, всесторонне поддерживающей поиск и регистрацию данных для обучения ИИ, управление качеством и деидентификацию, открытие и предоставление, а также поиск и связанное использование. Бюджет проекта составляет 2 879,18 млн вон, срок выполнения — 120 дней с даты подписания контракта.
Что касается конкретных функций, система будет включать в себя полный процесс управления регистрацией от приема заявок на регистрацию данных для обучения, проверки соответствия, утверждения, дополнения до аннулирования. Для зарегистрированных данных также будет реализовано отслеживание состояния, версий и истории изменений на протяжении всего жизненного цикла: от создания, разметки, распространения, обновления до аннулирования.
В части функций поиска данных будет разработана семантическая поисковая система на естественном языке на основе векторной базы данных, а также обеспечен доступ через единое окно для интеграции поиска по внешним общедоступным и частным каталогам данных. Кроме того, будет предоставлен машиночитаемый сервисный интерфейс, позволяющий внешним порталам или ИИ-агентам запрашивать и использовать метаинформацию и условия использования наборов данных.
Функции и данные платформы AI Hub, в настоящее время управляемой NIA, также будут перенесены в новую систему. Объекты миграции включают данные, метаданные, историческую информацию и статистическую информацию, управляемые в системе AI Hub и связанных проектах. В процессе миграции будет проводиться проверка согласованности, устранение дублирования и исправление ошибок.
Согласно плану, эта система будет не просто порталом для предоставления данных, а общей базовой платформой экосистемы использования данных, позволяющей осуществлять поиск, импорт, комбинирование, обучение и управление результатами. Долгосрочная цель NIA — создать ключевую инфраструктуру, охватывающую полный жизненный цикл экосистемы ИИ-индустрии, с участием частных компаний, исследовательских институтов, государственных органов и других сторон.









