KT и Университет Корё разработали корейский AI-бенчмарк безопасности
2026-06-16 13:41
В избр.

Репортаж от Wedoany,Компания KT 16-го числа объявила о совместной с Университетом Корё разработке мультимодального бенчмарка безопасности для больших языковых моделей под названием «KSAFE-MM», предназначенного для оценки безопасности моделей искусственного интеллекта в социокультурном контексте Южной Кореи.

Данный бенчмарк, учитывающий социальные проблемы и культурный контекст Южной Кореи, состоит из двух подмножеств: «KSAFE-MM-G» преобразует глобальные общие риски в корейский культурный контекст для оценки; «KSAFE-MM-C» специально ориентирован на уникальные для южнокорейского общества темы, такие как мошенничество с чонсе (арендной платой) и спор о скалах Токто. Весь набор данных включает в общей сложности 14 135 оценочных образцов, что делает его крупнейшим на сегодняшний день в Южной Корее мультимодальным набором данных для оценки безопасности на корейском языке. На данный момент бенчмарк прошёл валидацию на 12 глобальных мультимодальных больших языковых моделях, включая Gemma и HyperCLOVA X.

Сотрудники KT разрабатывают «KSAFE-MM». (Фото: KT)

Данный бенчмарк реализован с помощью автоматизированного универсального процесса. «KSAFE-MM» обеспечивает четырёхэтапный автоматизированный процесс, охватывающий весь цикл, включая сбор чувствительных тем на основе местного сообщества, генерацию запросов на основе шаблонов, генерацию синтетических изображений, а также генерацию «джейлбрейк»-запросов, направленных на обход механизмов безопасности или этических ограничений ИИ. В KT заявили, что этот процесс позволяет быстро создавать бенчмарки безопасности, отражающие местные особенности, без привлечения экспертов в конкретной культурной области, тем самым снижая затраты и повышая эффективность.

Совместная исследовательская группа KT и Университета Корё, применив тот же процесс в пилотном эксперименте на японском языке, доказала, что данный бенчмарк может быть немедленно применён в любой культурной среде по всему миру. Результаты исследования могут быть использованы для проверки безопасности в реальных средах сервисов ИИ, тестирования «красных команд» (red teaming), оценки моделей-ограничителей (guardrails) и других целей. Результаты исследования и сам бенчмарк будут опубликованы на платформах arXiv и Hugging Face.

Пак Чжэ Хён, руководитель Frontier AI Lab в Институте будущих технологий AX компании KT, отметил, что публикация бенчмарка — это не просто распространение данных, а стремление заложить основу для совместного развития всей экосистемы исследований в области безопасности ИИ. Он выразил надежду, что KSAFE-MM станет универсальным стандартом для проверки безопасности ИИ в контексте корейского языка и корейской культуры как в академических, так и в промышленных кругах.

Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com

Связанные продукты
Связанные рекомендации
Австралийская компания Sharon AI заключила с VAST соглашение о развертывании суверенного AI-хранилища объемом 600 ПБ
2026-06-16
Австралийская Swoop подписывает оптовое соглашение с TPG для укрепления своего мобильного бизнеса
2026-06-16
Китайская компания Meituan запускает открытое бета-тестирование сообщества агентов «觅游» (Miyou)
2026-06-16
В Алжире запущен центр реагирования на инциденты в почтовом и телекоммуникационном секторах
2026-06-16
Немецкая компания firstcolo инвестирует 250 миллионов евро в строительство AI-центра обработки данных мощностью 24 МВт
2026-06-16
Американская компания SailPoint намерена приобрести израильскую компанию по кибербезопасности в сфере ИИ Entro за 200 миллионов долларов
2026-06-16
Американская компания Hewlett Packard Enterprise (HPE) объявила о партнёрстве с восемью компаниями для продвижения гибридных квантовых вычислений
2026-06-16
Американская компания по управлению GPU Hydra Host привлекла 100 миллионов долларов
2026-06-16
Американская компания Mavenir получила первую сертификацию BSI NESAS для функций 5G-ядра в Германии
2026-06-16
В семи провинциях и городах Китая приняты планы действий по направлению «Искусственный интеллект + производство»
2026-06-16
Последние новости
1
Итальянская компания Energy Dome развернёт в Аризоне аккумуляторную систему хранения энергии на углекислом газе мощностью 19 МВт
2
В Румынии введена в эксплуатацию первая очередь проекта Gura по хранению энергии мощностью 150 МВт
3
Правительство Нидерландов повысило верхний предел цен на двух морских ветропарках мощностью 1 ГВт каждый
4
Австралийский энергетический узел оснащается ветроэнергетическим проектом мощностью 850 МВт
5
Министерство природных ресурсов Китая развернуло новый раунд стратегической кампании по прорыву в геологоразведке на период «Пятнадцатой пятилетки»
6
Южноафриканский проект по производству устойчивого авиационного топлива Phelan Green планирует выпуск 140 000 тонн в год
7
Во французском морском ветропарке мощностью 500 МВт установлена первая ветротурбина
8
Китайская ByteDance выделяет подразделение по разработке лекарств с помощью ИИ в отдельную компанию и ищет независимое финансирование
9
Гданьск (Польша) получил 42 млн евро на строительство мусоросжигательного завода
10
Британский бренд персонализированного питания Nourished, материнская компания Rem3dy Health, привлек около 14 миллионов фунтов стерлингов финансирования для ускорения глобальной экспансии