Исследователи из RAI Institute разработали систему управления роботом, которая позволяет ему манипулировать тяжелыми объектами, используя координацию рук, ног и всего корпуса. Робот успешно поднимает покрышки весом 15 кг — это в три раза превышает его обычную грузоподъемность 5 кг при работе только захватом.
Ключ к успеху — двухуровневая архитектура управления. На нижнем уровне обученная через reinforcement learning система поддерживает равновесие и контролирует движения, обрабатывая десятки степеней свободы. Верхний уровень планирует стратегию манипуляций: для задач вроде переворачивания шин используется sampling-based контроль с 32 параллельными потоками, а для катания покрышек — специально обученная нейросеть.
Система демонстрирует впечатляющую скорость: переворачивание покрышки занимает в среднем 5.9 секунды, а лучший результат составил 3.7 секунды — почти как у человека. Это достигается благодаря динамическому взаимодействию, когда робот использует инерцию и импульс объектов, а не полагается только на статическое удержание.
Обучение верхнеуровневой политики для катания шин заняло 24 часа на одной GPU с использованием алгоритма PPO в симуляторе IsaacLab. Для преодоления разрыва между симуляцией и реальностью исследователи рандомизировали параметры объектов — массу, трение и форму — во время тренировки, что сделало систему устойчивой к вариациям в реальном мире.
Пока что система имеет ограничения: требует систему motion capture для определения положения объектов и внешние вычисления. В будущем исследователи планируют интегрировать компьютерное зрение и расширить возможности на разные типы объектов — это откроет путь к роботам, способным работать на стройках, перемещать мебель и выполнять сложные промышленные задачи.
Источник новости и обложки: rai-inst.com