Исследователи из Чжэцзянского университета разработали фреймворк, который обучает роботов контактным манипуляциям исключительно на симуляции — без сбора реальных данных. На четырех задачах в реальном мире их метод достиг 91% общего успеха, тогда как лучший бейзлайн показал лишь 67%.
Главная проблема sim-to-real переноса в контактных задачах — разрыв динамики: силы, которые робот применяет в симуляции, не совпадают с реальными из-за различий в моделях трения и контакта. Существующие подходы либо требуют дорогостоящего сбора данных в реальном мире, либо страдают от «слепого» комплаенса — контроллер не знает, куда именно нужно давить.
Ключевой инсайт авторов: направление контактной силы определяется геометрией задачи, а не динамикой симуляции — то есть его можно надежно выучить в симуляторе и перенести в реальный мир. Политика предсказывает направление нормальной силы и состояние контакта вместе с позой манипулятора, а реальная величина силы задается вручную одним скаляром на каждую фазу контакта. Полный пайплайн: 2000 демонстраций в IsaacLab на задачу, инференс на 10 FPS, контроллер работает на 1000 Гц.
Метод доказывает: для контактных манипуляций не нужно собирать дорогие реальные данные — достаточно правильно выбрать, что именно учить в симуляторе. Авторы открыто называют ограничения: фреймворк пока работает только с трансляционными силами и не охватывает крутящие моменты, а добавление силовых предсказаний незначительно снижает точность позиционирования.
Источник новости и обложки: arxiv.org

