Гуманоидный робот научился переносить коробки и ложиться на кровать с человеческой грацией

Гуманоидный робот научился переносить коробки и ложиться на кровать с человеческой грацией

Китайские исследователи из Shanghai AI Laboratory представили PhysHSI — первую полноценную систему для автономного взаимодействия гуманоидных роботов с реальным окружением. Робот на базе Unitree G1 научился выполнять 4 сложные задачи: переносить коробки, садиться на стулья, ложиться на кровати и вставать — причем движения выглядят максимально естественно, как у человека.

Основа успеха — технология Adversarial Motion Priors (AMP), которая обучает робота имитировать человеческие движения из базы данных захвата движений AMASS. В симуляции система достигает успешности до 81.34% в самой сложной задаче переноса коробок, включающей четыре этапа: подход, захват, перенос и размещение объекта.

Для работы в реальном мире разработана двухуровневая система локализации объектов: грубая навигация через LiDAR на расстояниях до 2.4 метров, затем точное позиционирование через камеру с ошибкой всего 0.05 метра. Такой подход решает проблему ограниченного поля зрения камеры при долгосрочных задачах — представьте, что робот должен дойти до коробки в 5.7 метрах от него, взять ее и донести в другое место.

Обзор PhysHSI. (a) Подготовка набора данных: движения человека из набора данных MoCap переадресуются на движения гуманоида, а объекты аннотируются путем идентификации ключевых кадров контакта. (b) Обучение политики AMP: дискриминатор различает сгенерированные политикой и эталонные движения, чтобы способствовать изучению естественного поведения и выполнению задачи. (c) Развертывание в реальном мире: грубое положение объекта вручную задается с использованием лидарной визуализации и объединяется с одометрией для грубой локализации, когда объект находится вне поля зрения камеры. Как только объект оказывается в поле зрения, для точной автоматической локализации используется обнаружение AprilTag в сочетании с одометрией.
Анализ системы локализации в реальных условиях. (a) Зависимость ошибки локализации от расстояния между роботом и объектом, со статистикой перехода от грубой к точной локализации и распределением ошибок. (b) Репрезентативная траектория локализации объекта, выделяющая три этапа: (i) грубая локализация, (ii) точная локализация и (iii) захват.

В реальных испытаниях PhysHSI показал впечатляющие результаты: успешность 8/10 в поднятии коробок и 6/10 в полном цикле переноса с точностью размещения менее 20 сантиметров. Система работает с коробками весом от 0.6 до 3.6 килограммов и высотой до 60 сантиметров, используя только встроенные сенсоры без внешней инфраструктуры.

Особенность PhysHSI — естественность движений, унаследованная от человеческих демонстраций. В отличие от роботов, обученных с нуля через награды, система может даже имитировать стилизованную походку — от элегантной подиумной до комичной «динозавровой». Это открывает путь к созданию роботов-компаньонов, которые не будут пугать людей механическими движениями.

Источник новости и обложки: arxiv.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров