ResMimic: как нейросеть научила гуманоида переносить 5-килограммовые коробки всем телом

Исследователи из Amazon FAR, Stanford и UC Berkeley представили ResMimic — новый подход для обучения гуманоидных роботов сложным задачам, которые требуют одновременного движения и манипуляции объектами. Ключевая особенность: робот Unitree G1 теперь может поднимать коробки весом до 5.5 кг, используя не только руки, но и все тело — торс, бедра и плечи. Это превышает стандартную грузоподъемность запястий робота в 2.5 кг более чем в два раза.

Секрет ResMimic заключается в двухэтапном подходе обучения. Сначала нейросеть изучает общие человеческие движения на датасете из 15 000 видеозаписей движений человека (около 42 часов данных). Это как изучение базовой «грамматики» движений — ходьбы, приседаний, наклонов. Затем добавляется «остаточная» политика, которая учится корректировать эти базовые движения для работы с конкретными объектами. Представьте это как изучение языка: сначала основы, потом специализация.

В экспериментах ResMimic показал впечатляющие результаты. Коэффициент успешности выполнения задач достиг 92.5% против 10% у базовой политики без адаптации. При переносе из симуляции Isaac Gym в более реалистичную MuJoCo система сохранила стабильность, в то время как обучение «с нуля» полностью проваливалось. Время обучения сократилось в разы благодаря использованию предобученной основы.

Для обучения взаимодействию с объектами исследователи разработали три ключевых компонента. Награда за отслеживание объектов использует облако точек вместо простых координат, что создает более плавный градиент для оптимизации. Награда за контакт явно поощряет робота использовать правильные части тела для взаимодействия с объектами. Виртуальный контроллер объектов стабилизирует начальное обучение, постепенно передавая управление от вспомогательных сил к самому роботу.

Реальные испытания на роботе Unitree G1 (29 степеней свободы, высота 1.3 м) продемонстрировали разнообразные навыки: подъем коробки стоя на одном колене, перенос груза на спине, приседания с подъемом тяжелых предметов и даже работа со стульями неправильной формы. Робот может работать как в «слепом» режиме (без данных о положении объекта), так и с обратной связью от системы захвата движения OptiTrack.

ResMimic открывает путь к более универсальным гуманоидным роботам, способным выполнять сложные задачи в человеческой среде. Подход показывает, что предобучение на больших датасетах с последующей адаптацией может стать стандартом в робототехнике, аналогично тому, как это произошло с языковыми моделями. Следующий шаг — масштабирование на еще более сложные задачи и различные типы роботов.

Источник новости и обложки: arxiv.org


Работаю главным редактором proglib.io — опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры владею Python, с его помощью автоматизирую повседневные задачи.

Аватар пользователя Мирослав Кунгуров