Репортаж от Wedoany,Исследовательский институт LG AI (LG AI Research) на семинаре «Невидимые юридические риски данных для обучения ИИ», прошедшем в Сеуле, обнародовал стратегию управления юридическими рисками данных для обучения ИИ и представил бета-версию платформы для отслеживания и анализа источников данных и лицензий «Exaone Nexus».
С усилением регулирования искусственного интеллекта управление юридическими рисками данных для обучения становится всё более важным. Управляющий директор LG AI Research Ли Хваён (Lee Hwa-young) на семинаре отметил, что при построении генеративных моделей ИИ более 99% данных для обучения поступает из открытых наборов данных, а данные, созданные вручную или полученные по лицензии, на практике часто составляют лишь от 1 до 2%. Он указал, что открытые наборы данных содержат вложенные поднаборы данных нескольких уровней, которые могут включать данные, непригодные для коммерческого использования, и определить фактическую пригодность только по лицензии верхнего уровня сложно. Вероятность смешивания данных с ограничениями на коммерческое использование или проблемами с персональными данными высока, что может порождать юридические риски на каждом этапе копирования, модификации и распространения.
Три года назад LG AI Research начал сотрудничество с юридической фирмой Yulchon для решения правовых вопросов, связанных с данными, и стороны совместно представили платформу «Exaone Nexus». Платформа предназначена для оценки юридических рисков открытых наборов данных, поддержки процессов разработки и внедрения моделей ИИ, а её коммерциализация запланирована на сентябрь этого года.
«Exaone Nexus» способен выявлять поднаборы данных, содержащиеся в наборе данных, и подтверждать фактические источники данных и условия лицензирования. Его особенность заключается не только в просмотре информации о наборе данных верхнего уровня, но и в отслеживании всей структуры данных для проверки загрязнения лицензий. Платформа включает три ИИ-агента: один отвечает за поиск данных и лицензионных документов, другой оценивает 18 пунктов (включая коммерческую доступность, проблемы с персональными данными, ограничения по региону и времени использования и т.д.), а оставшийся агент проверяет результаты анализа.
На основе результатов оценки LG AI Research делит наборы данных на три уровня: A, B и C. Данные с крайне низким юридическим риском относятся к уровню A, данные, по которым возможны споры, управляются как уровень B, а данные с высоким юридическим риском относятся к уровню C и исключаются из процесса обучения. Модели ИИ также управляются по уровням A, B и C, поскольку после обучения могут возникнуть юридические споры или изменения в регулировании, требующие постоянной оценки рисков.
Управляющий директор Ли Хваён отметил, что платформой могут пользоваться не только компании, занимающиеся ИИ, но и компании, внедряющие ИИ, а также инвестиционные компании. Компании, внедряющие ИИ, могут проверять законность данных, на которых обучалась модель, а инвестиционные компании — предварительно оценивать юридические риски портфельных компаний. Директор LG AI Research Им Ухён (Im Woo-hyung) подчеркнул, что конкуренция в сфере ИИ смещается от ориентации на производительность к ориентации на доверие и ответственность, и управление источниками данных для обучения и лицензиями стало неотложной задачей. «Exaone Nexus» позволяет отслеживать источники данных для обучения на всём протяжении и проверять соответствие лицензиям, помогая компаниям более чётко управлять рисками данных. Представляющий юридическую фирму Yulchon адвокат Кан Сокхун (Kang Seok-hoon) указал, что с распространением генеративного ИИ возрастают юридические риски, такие как нарушение авторских прав, права на использование данных, споры между правообладателями и ИИ-компаниями, и компаниям необходимо одновременно проверять источники данных и права, лицензионную систему, ведение записей процесса разработки и внутренний контроль, а также систему реагирования на споры.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









