Репортаж от Wedoany,Компания Galaxy General Robot недавно представила базовую модель управления движениями человекоподобного робота в реальном времени AstraBrain-WBC 0.5. Эта модель является важной частью технологической системы Galaxy Brain (AstraBrain), обучена на примерно 2 миллиардах кадров данных о движениях человека, имеет 80,4 миллиона параметров и ориентирована на развитие способностей «универсального мозжечка» робота.
Для обучения этой модели объединённая исследовательская группа Galaxy General Robot создала крупнейший в отрасли набор данных для обучения движениям человекоподобных роботов общей продолжительностью около 20 000 часов, охватывающий такие разнообразные сценарии, как танцы, спорт, повседневное поведение, промышленные операции, совместное перемещение грузов и другие. Данные показывают, что диапазон движений модели примерно в 4–5 раз превышает диапазон широко используемого в отрасли набора данных AMASS.
AstraBrain-WBC 0.5 впервые в области управления движениями человекоподобных роботов в реальном времени внедряет парадигму масштабного обучения, аналогичную GPT. Модель использует каузальную архитектуру трансформера в стиле GPT, переопределяя управление всем телом робота как задачу прогнозирования непрерывной последовательности. Исследовательская группа также создала библиотеку априорных знаний о движениях, состоящую из 384 экспертов по движениям, и объединила их в единую модель управления с помощью дистилляционного обучения, совершив переход от «набора экспертных навыков» к «универсальной базовой модели движений».
Что касается производительности, модель обеспечивает совместное управление всем телом робота с 29 степенями свободы, выполняя сложные действия, такие как координация рук и ног, смена центра тяжести и согласование движений тела.
В тестах на реальных роботах модель способна выполнять высокодинамичные действия, такие как баскетбол, бокс, танцы, перевороты и вставание, совместное перемещение грузов, без предварительного обучения. После инженерной оптимизации модель достигает сквозной задержки вывода менее 1,5 миллисекунды на одной видеокарте RTX 4090, а общая задержка оборудования для захвата движений составляет менее 20 миллисекунд, что удовлетворяет требованиям управления в реальном времени с частотой 50 Гц.
Данные из статьи показывают, что по мере увеличения объёма обучающих данных с 200 миллионов до 2 миллиардов кадров ошибка отслеживания модели без предварительного обучения постоянно снижается, а уровень успешности повышается с 83,26% до 92,58%, что подтверждает значительные преимущества масштабного обучения.
Что касается применения, AstraBrain-WBC 0.5 может служить базовой моделью управления движениями, предоставляя исследовательским институтам и разработчикам возможность генерировать высококачественные данные о движениях, а также использоваться для генерации сложных движений в реальном времени, таких как танцы, выступления и интерактивные демонстрации. Модель поддерживает дистанционное управление всем телом в реальном времени и отслеживание сложных движений, что имеет потенциал для применения в таких сценариях, как аварийно-спасательные работы и действия в опасных средах.
В настоящее время соответствующие статьи, код и технические результаты AstraBrain-WBC 0.5 полностью открыты и доступны для экосистемы.
Компания Galaxy General Robot заявила, что благодаря сочетанию крупномасштабных данных и архитектуры в стиле GPT эта модель позволяет управлению движениями человекоподобных роботов начать приобретать способности базовой модели, обеспечивая фундаментальную основу для масштабного внедрения роботов в сценарии розничной торговли, промышленности и услуг.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









