Репортаж от Wedoany,6 июня компания Daxiao Robot совместно с Китайским университетом Гонконга и Шэньчжэньским колледжем Хэтао представила результаты исследования модели мира Kairos-HomeWorld, а также открыла исходный код трёхмерного набора данных для всего дома, ориентированного на китайские семьи. Эта разработка позволяет осуществлять сквозную генерацию трёхмерной сцены всего дома на основе текстовых инструкций, решая давнюю проблему «нехватки реальных домашних сцен» в обучении воплощённого интеллекта и домашних роботов.
Технологический прорыв этой разработки заключается не только в более детальном моделировании интерьеров, но и в объединении «генерации всего дома» и «интерактивности объектов» в единую унифицированную структуру. Ранее многие системы генерации внутренних сцен были лучше приспособлены для создания отдельных комнат, статичных демонстраций или локальных планировок, позволяя генерировать, например, спальню, гостиную или кухню. Однако при расширении до целого жилища часто возникали проблемы: несогласованность структуры между комнатами, нелогичные маршруты, разрозненность мебели и отсутствие физической согласованности сцены. Kairos-HomeWorld расширяет гранулярность генерации с одной комнаты до целого дома, позволяя модели напрямую организовывать пространственную структуру, распределять функциональные зоны и размещать объекты в масштабе всего дома, а также обеспечивать полную интерактивность отдельных объектов. Это означает, что создаётся не просто «визуально приятная» трёхмерная картина дома, а домашний мир, более понятный, управляемый и пригодный для обучения роботов. Для воплощённого интеллекта этот шаг крайне важен, поскольку робот, попадая в дом, должен не просто распознавать несколько объектов в гостиной, а понимать взаимосвязи комнат, расположение мебели, пространственные ограничения и непрерывную логику взаимодействия с объектами во всём жилище.
Открытая командой база данных также значительно усиливает значимость этой разработки. Представленный набор трёхмерных данных для всего дома включает 300 000 реальных планов китайских квартир, а также 5000 полных симуляционных сцен с интерактивной мебелью и объектами, охватывающих типичные жилые планировки китайских семей. По сравнению с многими наборами данных, основанными на зарубежных жилых структурах, образцах отдельных комнат или статичных моделях интерьеров, этот набор данных более точно отражает типы квартир, пространственные привычки и способы организации мебели, характерные для китайских семей.
Для сектора технологических инноваций эта новость действительно заслуживает внимания, поскольку она восполняет самый сложный пробел в процессе внедрения воплощённого интеллекта. Большие языковые модели решают часть проблем, связанных с пониманием языка, рассуждением и планированием, но для того, чтобы робот действительно вошёл в дом, он должен выполнять восприятие, навигацию, захват, взаимодействие и выполнение задач в сложной, перегруженной, персонализированной и крайне нестандартизированной среде. Домашнее пространство не так упорядочено, как заводской цех, и не имеет столь развитой системы сбора данных, как дороги для автономного вождения. Оно включает множество мелких объектов, а также сильные различия в бытовых привычках и использовании. Обучить робота работать в китайской семье, полагаясь только на зарубежные данные о планировках или небольшое количество реальных образцов методом проб и ошибок, невозможно. Комбинация Kairos-HomeWorld и сопутствующего набора данных предоставляет роботам «цифровой домашний тренировочный полигон», который можно массово генерировать, многократно использовать для обучения и постоянно расширять. Это напрямую повлияет на эффективность обучения роботов в симуляционной среде, их способность к обобщению задач и переносу сценариев, а также обеспечит более реалистичные базовые условия для обучения таких приложений, как домашние сервисные роботы, роботы-компаньоны, роботы для уборки и сортировки, а также интеллектуальные мобильные терминалы, приближенные к реальным китайским семьям.
С точки зрения индустрии, ценность таких мировых моделей не ограничивается научными демонстрациями. С одной стороны, они связаны с данными, с другой — с симуляционным обучением, алгоритмами воплощённого интеллекта, пониманием сцен, планированием задач роботов и последующим реальным развёртыванием. Тот, кто сможет раньше построить качественную, локализованную и интерактивную модель домашнего мира, получит больше шансов занять фундаментальное преимущество в долгосрочной гонке домашних роботов. Для китайской индустрии воплощённого интеллекта выпуск Kairos-HomeWorld показывает, что конкуренция больше не ограничивается механическими компонентами, отдельными алгоритмами или демонстрационными видео, а переходит на уровень полной технологической системы «мировая модель + база данных + симуляционный тренировочный полигон + реальный сценарий внедрения». В дальнейшем наиболее важным будет наблюдать, сможет ли эта структура расширить сложность взаимодействия, повысить разнообразие сценариев и быстрее интегрироваться в реальное обучение роботов и процессы коммерциализации.
Данный материал скомпилирован платформой Wedoany. При цитировании материалов, созданных с помощью искусственного интеллекта (ИИ), необходимо обязательно указывать источник — «Wedoany». В случае выявления нарушения прав или иных проблем просим своевременно информировать нас. Сайт оперативно внесёт изменения или удалит материал.Электронная почта: news@wedoany.com









