Репортаж от Wedoany,2 июня китайская шэньчжэньская компания по воплощённому интеллекту Dobot представила собственную разработанную мировую модель действий Kongyi DobotWAM — большую модель воплощённого интеллекта. Эта модель прошла тестирование по четырём стандартным наборам задач на эталонном бенчмарке воплощённого интеллекта LIBERO, охватывающим такие ключевые аспекты, как понимание пространственных отношений, обобщение объектов, понимание целевых инструкций и выполнение долгосрочных задач, со средним уровнем успешности 99,25%.
Четыре группы задач, выполненных Kongyi DobotWAM, — это LIBERO-Spatial, LIBERO-Object, LIBERO-Goal и LIBERO-10. Понимание пространственных отношений проверяет, может ли робот выполнять операции на основе положения, направления и взаимосвязи объектов; обобщение объектов оценивает способность модели адаптироваться к различным внешним видам, категориям и экземплярам; понимание целевых инструкций фокусируется на том, может ли робот преобразовывать естественный язык или цели задач в выполнимые действия; долгосрочные задачи требуют от модели поддержания состояния задачи и непрерывности действий на нескольких этапах. Согласно открытой информации, Kongyi DobotWAM достиг 100% успешности в наборе задач обобщения объектов LIBERO-Object, а в остальных трёх наборах — 99%, средний результат опережает такие открытые модели, как π0.5, π0, GR00T-N1.5, π0+FAST.
Ценность таких больших моделей воплощённого интеллекта заключается в переходе роботов от «понимания среды» к «выполнению действий». Ранее интеллект роботов в значительной степени зависел от предустановленных программ, фиксированных приспособлений и структурированных сцен. На заводах, складах или в сервисных пространствах при изменении объектов, их расположения или порядка задач системе требовалась перенастройка или вмешательство человека. Мировая модель действий подчёркивает объединение прогнозирования среды, генерации действий и выполнения задач в единую структуру, позволяя роботам непрерывно корректировать стратегию операций на основе визуальной информации, целевых инструкций и результатов предыдущих действий. Для коллаборативных роботов, человекоподобных роботов и роботов различных форм это означает, что способность к координации «рука-глаз-мозг» становится ключевым конкурентным преимуществом.
Промышленная база Dobot основана на коллаборативных роботах и продуктах воплощённого интеллекта различных форм. Согласно официальному сайту компании, её линейка продуктов охватывает коллаборативные манипуляторы, паллетайзеры, сварочные роботы, настольные манипуляторы, роботы воплощённого интеллекта и другие направления, сформировав серии продуктов CRA, CRAS, Nova, MG400, Magician и другие. С выпуском Kongyi DobotWAM компания Dobot ещё больше интегрирует аппаратное обеспечение, управление движением, сенсорные системы и модели воплощённого интеллекта. Если возможности модели смогут стабильно переноситься в реальные промышленные среды, это поможет роботам выполнять задачи по соединению, сортировке и захвату, сборке, перемещению, контролю и многошаговым сервисным операциям, снижая зависимость от фиксированных процессов и единичных сценариев.
После выхода воплощённого интеллекта на этап инженерии результаты тестирования — лишь первый шаг. LIBERO предоставляет стандартизированную основу для сравнения, но в реальных заводских и коммерческих пространствах возникают такие сложные ситуации, как изменения освещения, затенения, различия в деталях, вмешательство персонала, износ оборудования, границы безопасности и аварийные остановки. Чтобы большие модели воплощённого интеллекта действительно вошли в производственные системы, необходимо одновременно удовлетворять требованиям к точности действий, стабильности выполнения, скорости реакции, безопасности, ограничениям по стоимости и долгосрочному обслуживанию. Выход Dobot с мировой моделью действий показывает, что китайские робототехнические компании переходят от производства аппаратного обеспечения и управления отдельными машинами к системной конкуренции, объединяющей модели, данные, алгоритмы и аппаратное обеспечение.
Последующие переменные сосредоточены на способности модели к обобщению, воспроизводимости в реальных сценариях и темпах коммерциализации. Если Kongyi DobotWAM сможет непрерывно интегрироваться в существующую линейку манипуляторов, человекоподобных роботов и продуктов воплощённого интеллекта Dobot, а также формировать воспроизводимые кейсы в промышленном производстве, коммерческих услугах, научных исследованиях и образовании, воплощённый интеллект приблизится к переходу от экспериментальных демонстраций к масштабному применению. Центр конкуренции в робототехнической отрасли также сместится от простого сравнения грузоподъёмности, скорости и точности к комплексной способности «аппаратное обеспечение + модель воплощённого интеллекта + данные сценариев + инженерная реализация».
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









