Исследователи из UC San Diego разработали ACE-F — кросс-платформенную складную телеоперационную систему с интегрированной силовой обратной связью. Система использует инверсную кинематику в сочетании с человеко-роботным интерфейсом для сбора высококачественных демонстраций. ACE-F интерпретирует отклонения позиции рабочего органа как виртуальные силовые сигналы, что устраняет необходимость в дополнительных сенсорах.
Существующие телеоперационные платформы имеют три основных ограничения. Они либо не предоставляют тактильных сигналов, либо полагаются на дорогие датчики силы и крутящего момента. Схемы копирования суставов должны быть переработаны для каждой новой морфологии робота, а громоздкое оборудование затрудняет быстрое развертывание.
ACE-F использует 3-DoF структуру для минимизации сложности управления при сохранении широкого диапазона движений. Система вычисляет отклонение между целевой и фактической позицией рабочего органа, которое служит индикатором величины силы обратной связи. Для предотвращения дестабилизирующих эффектов на высоких скоростях величина обратной связи регулируется картезианской скоростью робота. Пайплайн объединяет PD-контроль с инверсной динамикой для обеспечения стабильности и безопасности на разных роботах.
Систему оценивали в экспериментах с роботом Franka Emika Panda и вариациями UFactory XArm в виртуальных и реальных условиях. В задаче виртуального складирования коробок ACE-F показал успешность 90% против 70% у бейзлайна Gello. В задаче перетаскивания коробки ACE-F выполнил задание за 16.7 секунды, в то время как Gello потребовалось 21.9 секунды. В реальном складировании банок ACE-F достиг успешности 83.3% по сравнению с 66.7% у Gello.
Политики обучения с подкреплением тренировались на данных, собранных с помощью ACE-F с включенной и выключенной силовой обратной связью. В задаче симулированного складирования политика с силовой обратной связью показала успешность 95.8% при сборе данных. Политика, обученная с силовой обратной связью, достигла успешности 52.6% при полном выполнении задачи, в то время как политика без обратной связи показала 30%. В задаче протирания стола политика с силовой обратной связью продемонстрировала успешность 100% при сборе данных и 75% при оценке.
Источник новости и обложки: arxiv.org