Стэнфордский университет выпустил новую модель ИИ, способствующую роботам распознаванию и миграции функций инструментов
2025-11-04 10:23
Источник:Стэнфордский университет
В избр.

Исследователи Стэнфордского университета разработали инновационную модель компьютерного зрения, способную распознавать функции различных частей объекта в реальном мире и способствовать повышению эффективности выбора и использования автономных роботизированных инструментов. В области искусственного интеллекта традиционные модели компьютерного зрения реализовали распознавание объектов двумерного изображения, но понимание функций различных частей объекта все еще остается сложной проблемой. Новая модель, представленная Стэнфордским университетом, не только распознает части объекта, но и различает его реальное использование и выполняет функциональное отображение между объектами в пикселях.

Суть модели заключается в достижении «функционального соответствия», то есть распознавании и отображении областей пикселей с одинаковой функцией по категориям объектов. Например, модель может распознавать стеклянные бутылки и насадки чайника и понять их функцию налива воды. «Мы хотим создать систему зрения, которая поддерживает обобщение и позволяет передавать навыки от одного объекта к другому», — объясняет первый автор Стивен Стожанов. Этот прорыв позволяет роботу отличать мясо от хлебного ножа, или лопату от лопаты, и выбирать правильный инструмент для выполнения задачи.

Традиционный метод полагается на ручную аннотацию для достижения разреженного функционального соответствия, в то время как новая модель использует схему слабого надзора и использует модель визуального языка для генерации тегов, требуя только от человеческих экспертов для контроля качества данных. Этот метод более эффективен и экономичен, говорит Линан « Фрэнк » Чжао: « Задачи, которые несколько лет назад требовали большого количества рабочей силы, теперь могут быть выполнены с меньшими ресурсами ». Например, в случае чайника и бутылки модель может точно выравнивать пиксели в горловине и горловине бутылки для интенсивного отображения функций.

В настоящее время эффективность системы была проверена в тестировании изображений, и хотя она не была проверена в экспериментах с реальными роботами, команда считает, что она принесет огромный прогресс в робототехнике и компьютерном зрении. Плотное функциональное соответствие знаменует собой переход искусственного интеллекта от распознавания образов к рассуждению объектов, и новая система может выводить намерения, а не просто распознавать пиксели.

Эта новость является результатом компиляции и перепечатки информации из глобального Интернета и стратегических партнеров. Она предназначена только для читателей. Если у вас возникнут какие-либо нарушения или другие проблемы, пожалуйста, своевременно сообщите нам. Этот сайт изменить или удалить ее. Перепечатка этой статьи без официального разрешения строго запрещена.электронная почта:news@wedoany.com
Связанные технологические инновации
Прогресс в исследованиях фотострикционного эффекта и разработка неограниченных сегнетоэлектрических тонкопленочных устройств
2025-11-08
Технология регулирования температуры повышает рост кристаллов и эффективность переноса заряда солнечных элементов селенида сурьмы
2025-11-08
Новая циклодекстриновая нановолокнистая мембрана повышает эффективность удаления микрозагрязнителей при очистке воды
2025-11-05
Шеффилдский университет и Институт Алана Тьюринга представили новую структуру для построения мультимодального искусственного интеллекта
2025-11-05
Применение данных наблюдения Земли в Европе помогает общественному здравоохранению и реагированию на стихийные
2025-11-05
Команда Хэфэйского научно-исследовательского института Академии наук Китая разработала ультракомпактный
2025-11-05
Стэнфордский университет выпустил новую модель ИИ, способствующую роботам распознаванию и миграции функций инструментов
2025-11-04
ЕКА открывает новую антенну для дальнего космоса в Австралии для расширения возможностей связи
2025-11-04
Университет штата Вашингтон разрабатывает 3D-печатные антенные решетки и чиповые
2025-11-04
Исследовательская группа Университета Монаша раскрывает генетический код сплайсинга мРНК
2025-11-04