Экзоскелет HumanoidExo обучил гуманоидного робота Unitree новым навыкам всего за 5 демонстраций

Исследователи из Китайского университета национальной обороны и компании Midea представили систему HumanoidExo — носимый экзоскелет, который переносит человеческие движения на данные для обучения гуманоидных роботов. Система решает ключевую проблему нехватки качественных данных для обучения роботов: вместо дорогостоящего телеуправления роботом теперь достаточно надеть легкий экзоскелет и показать нужные движения. Результат впечатляет — робот осваивает сложные задачи всего по 5 реальным демонстрациям против 200 при традиционном подходе.

В основе HumanoidExo лежит умная комбинация железа и ИИ. Легкий экзоскелет с 7 степенями свободы для каждой руки точно считывает движения оператора, а LiDAR-сенсор на спине отслеживает перемещения всего тела в пространстве. Все это работает как продвинутый «захват движения» для роботов — система записывает, как человек выполняет задачу, и переводит эти данные в понятный роботу формат. Представьте, что вы учите робота готовить кофе: вместо программирования каждого движения вы просто делаете кофе сами в экзоскелете.

Для обработки собранных данных команда разработала HE-VLA — гибридную модель, которая объединяет имитационное обучение с обучением с подкреплением. Это как дать роботу двух учителей: первый показывает «что делать» (копирует движения человека), а второй учит «как не упасть» (поддерживает баланс). Модель тренируется 50 000 итераций с размером батча 128, используя начальную скорость обучения 2e-5. Такой подход позволяет роботу не просто повторять заученные движения, но и адаптироваться к неожиданным ситуациям.

Тестирование проводилось на гуманоидном роботе Unitree G1 высотой 1.3 метра с 29 степенями свободы в теле и 41 активной степенью свободы во всей системе. Робот успешно освоил три сложные задачи: манипуляции на столе, ходьбу с последующими манипуляциями и работу с бельем (приседание, захват одежды, размещение в стиральной машине). Самое удивительное — робот научился ходить исключительно по данным экзоскелета, без единой реальной демонстрации этого навыка.

Практические результаты впечатляют: смешанное обучение (5 реальных + 195 экзоскелетных демонстраций) дает 80% успешности против жалких 5% при обучении только на реальных данных. Более того, робот демонстрирует устойчивость к помехам — даже если его физически оттащить от рабочего места, он самостоятельно возвращается и продолжает выполнение задачи. Это открывает новую эру в обучении роботов, где человеческий опыт можно масштабировать без astronomical затрат на реальные демонстрации.

Источник новости и обложки: arxiv.org


Работаю главным редактором proglib.io — опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры владею Python, с его помощью автоматизирую повседневные задачи.

Аватар пользователя Мирослав Кунгуров