Репортаж от Wedoany,Министерство науки и информационно-коммуникационных технологий Республики Корея (MSIT) продвигает разработку отечественной мировой модели (World Model), планируя использовать от 100 тысяч до 1 миллиона часов видеоданных, чтобы войти в число лидеров рынка физического искусственного интеллекта. Для сравнения, модели физического ИИ таких компаний, как NVIDIA, обучаются около 100 тысяч часов, обычно используя 600 тысяч одноминутных видеороликов для обучения в течение 10 тысяч часов.

1 числа Министерство науки и ИКТ провело семинар «Стратегия обеспечения ключевых конкурентных преимуществ в области физического ИИ» в здании KT Gwanghwamun WEST в районе Чонно, Сеул. Ким Ук (김욱), руководитель PM по физическому ИИ и инновациям Министерства, представил текущее состояние развития отечественного физического ИИ. В настоящее время модели физического ИИ, такие как NVIDIA «Isaac GR00T», обучаются около 100 тысяч часов, при этом большинство базовых моделей обучаются на синтетических и реальных данных в соотношении 50:50. Ожидается, что в будущем доля синтетических данных значительно возрастет до 90%, поэтому правительство ставит своей ключевой задачей создание системы для точной генерации синтетических данных.
Для базовых моделей роботов, выполняющих конкретные задачи, обычно используются от 10 до 20 тысяч часов видеоданных, а при масштабном обучении — до 100 тысяч часов, при этом для обучения в течение 10 тысяч часов обычно используется 600 тысяч одноминутных видеороликов. Мировая модель требует прогнозирования будущего в более разнообразных средах, что повышает глубину и сложность технологий, а необходимый объем данных как минимум в 10–100 раз превышает объем данных для базовых моделей роботов. Поэтому для разработки требуется от 100 тысяч до более 1 миллиона часов данных. Министерство науки и ИКТ планирует сначала обеспечить ключевые технологии для разработки мировой модели, а в области симуляторов создать систему, позволяющую настраивать среду в соответствии с промышленными условиями и извлекать данные.
Министерство науки и ИКТ поставило цель стать мировым лидером в области физического ИИ, что обусловлено структурными различиями с рынком больших языковых моделей (LLM). В области LLM Республика Корея значительно отстает от мировых пионеров, и как догоняющая сторона имеет ограничения в конкуренции с США и Китаем, которые вложили огромные средства в капитал и инфраструктуру графических процессоров (GPU). Поэтому Министерство установило цель для LLM — создание специализированных моделей, соответствующих внутренним условиям страны. В то же время физический ИИ находится на стадии зарождения в глобальном масштабе, и Министерство считает, что сейчас подходящее время для выхода на лидирующие позиции в мире. Кроме того, учитывая возможность утечки эксплуатационных данных ключевых объектов безопасности, таких как атомные электростанции, передовые полупроводники и оборона, через зарубежные платформы, Министерство считает необходимым обеспечить разработку отечественной мировой модели.
В сборе данных крупные предприятия, такие как Samsung и Hyundai, крайне чувствительны к утечке технологических данных, и правительство сталкивается с трудностями при сборе данных, ориентированных на крупные компании. В то же время региональные малые и средние предприятия, испытывающие острую нехватку рабочей силы и кадровый голод, проявляют открытость к предоставлению данных, поскольку внедрение роботов на основе физического ИИ для решения проблемы нехватки кадров становится актуальной задачей. Ли До Гю (이도규), руководитель Департамента политики в области информационно-коммуникационных технологий Министерства науки и ИКТ, заявил: «Физический ИИ будет применяться во многих областях, но наибольшую добавленную стоимость он принесет в первую очередь в обрабатывающей промышленности», и «не так много стран, обладающих такой производственной конкурентоспособностью, как Республика Корея».









