Исследователи представили фреймворк RGMP для управления гуманоидными роботами, который достиг 87% успеха в тестах на обобщение. При этом эффективность использования данных в 5 раз превысила показатели современных моделей.
Современные подходы к управлению роботами опираются на данные и требуют обширных датасетов для обучения. Такие методы игнорируют геометрическое рассуждение в новых сценариях и неэффективно моделируют взаимодействия робота с объектами.
Для решения этих проблем в RGMP используется селектор навыков с геометрическими приоритетами. Компонент встраивает геометрические индуктивные смещения в мультимодальную языковую модель, создавая адаптивные последовательности навыков для новых сцен. Настройка требует минимального объема пространственных знаний.
Для синтеза движений роботов разработана адаптивная рекуррентная гауссовская сеть. Она параметризует взаимодействия робота с объектами как иерархию гауссовских процессов, рекурсивно кодируя многомасштабные пространственные отношения. Это обеспечивает точный синтез движений даже при малом количестве демонстраций.
Фреймворк оценивали на гуманоидном роботе и настольном роботе с двумя манипуляторами. Результаты показали 87% успеха в задачах обобщения и эффективность использования данных в 5 раз выше по сравнению с современными моделями.
Источник новости и обложки: arxiv.org