Репортаж от Wedoany,8 июня 5D-модель мира EvoPhys-World, разработанная командой EvoPhys Пекинского университета, заняла первое место в категории «Генерация мира» в открытом рейтинге WorldScore Стэнфордского университета. Эта модель, ориентированная на человека, предназначена для задач контролируемой генерации сцен и физического взаимодействия. Весь процесс её нативного обучения был выполнен с использованием GPU Moore Threads MTT S5000 и программного стека MUSA.
Технический акцент EvoPhys-World заключается в продвижении модели мира от «генерации наблюдаемых сцен» к «созданию интерактивных, управляемых и эволюционирующих сценарных систем». Согласно информации на странице проекта, модель использует данные взаимодействия от первого лица и память сцен для построения человеко-центрированного цифрового двойника мира, дополнительно внедряя механизмы контролируемого взаимодействия и самоэволюции. Это позволяет одному состоянию сцены предсказывать различные варианты будущего в зависимости от разных ветвей действий. Её основная модель включает две формы: World Engine, которая подчеркивает возможность создания цифровых двойников всего и физического взаимодействия, и World Policy, которая акцентирует предсказуемость мира и выбор действий. Вместе они образуют замкнутый цикл от генерации сцен, прогнозирования состояний и действий до обратной связи и эволюции. Для воплощённого интеллекта, обучения роботов, виртуального моделирования и генерации сложных сцен ценность таких моделей заключается в том, что ИИ может не только понимать пространственные отношения в изображениях, но и связи между действиями, причинно-следственными связями, физической обратной связью и результатами задач.
WorldScore — это унифицированный эталон для оценки задач генерации мира, охватывающий способности 3D, 4D и видеомоделей генерировать миры по инструкциям. Ключевые показатели включают управляемость, качество и динамику. Открытый рейтинг показывает, что EvoPhys-World занимает лидирующие позиции по таким показателям, как WorldScore-Static.
Этот прогресс также выводит на более высокий уровень видимости адаптационные возможности китайских GPU и программных стеков при обучении передовых моделей. Обучение моделей мира предъявляет высокие требования к пропускной способности длинных временных рядов данных, стабильности распределённого обучения, многомодальному пространственно-временному моделированию, поддержке операторов и эффективности совместной работы программного и аппаратного обеспечения. Нативное обучение EvoPhys-World, полностью выполненное на GPU Moore Threads MTT S5000 и программном стеке MUSA, означает, что команда разработчиков модели использовала отечественные вычислительные мощности не только на этапе вывода или последующей адаптации, но и провела валидацию всего процесса — от аппаратного и программного обеспечения до рабочего процесса модели — на основном этапе обучения. Для китайской индустрии инфраструктуры ИИ такие примеры сложнее, чем просто запуск обучения языковых моделей, поскольку модели мира включают множество типов нагрузок, таких как генерация видео, физическое взаимодействие, прогнозирование состояний и стратегии действий, что предъявляет более высокие требования к кластерам GPU, эффективности коммуникации и совместимости с фреймворками обучения.
Применение EvoPhys-World также ближе к физическому миру. Сцены, представленные на странице проекта, включают манипуляции руками человека, взаимодействие на рабочем столе, перемещение чашек, складские помещения, химические заводы, города и древние поселения, что указывает на попытку модели охватить многоуровневые задачи генерации — от локальных движений рук до навигации по большим сценам, от контакта с объектами до развёртывания задач. Если эта траектория продолжится, модель мира может стать важной основой для обучения воплощённого интеллекта, предоставляя роботам недорогую, высококонтролируемую и многократно эволюционирующую виртуальную среду обучения до реального развёртывания. Она также может использоваться в промышленном моделировании, цифровых двойниках, предварительных репетициях сложных операций и сценариях проверки взаимодействия человека и машины.
В дальнейшем влияние EvoPhys-World будет зависеть от степени открытости возможностей модели, развития экосистемы разработчиков, результатов валидации на большем количестве реальных задач, а также от постоянной стабильности китайского программного стека GPU при обучении на более крупных масштабах. Нынешнее лидерство в рейтинге WorldScore, по крайней мере, показывает, что команды из китайских университетов уже вышли в число лидеров международных открытых оценок в направлении моделей мира, а также предоставляет наблюдаемый пример поддержки обучения передовых многомодальных моделей с помощью отечественных вычислительных мощностей ИИ.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









