Исследователи из Amazon FAR представили OmniRetarget — систему, которая превращает человеческие движения в высококачественные траектории для гуманоидных роботов. В отличие от предыдущих методов, новая технология сохраняет естественные взаимодействия с объектами и окружением, генерируя более 8 часов безартефактных траекторий движения.
Главная проблема существующих подходов — они создают физически невозможные движения с проскальзыванием ног и проникновением сквозь объекты. Представьте, что вы учите робота поднимать коробку, а он в итоге засовывает руки внутрь неe вместо того, чтобы взять снаружи. OmniRetarget решает это через «сетку взаимодействий» — виртуальную структуру, которая следит за пространственными связями между роботом, объектами и поверхностями.

Система умеет создавать вариации из одной демонстрации: из одного показанного движения она генерирует множество тренировочных примеров для разных размеров объектов, высот платформ и конфигураций робота. Это как научить человека садиться на стул, а он потом сможет сесть на табуретку, кресло или скамейку — принцип тот же, а детали адаптируются.
В тестах на роботе Unitree G1 политики обучения с подкреплением, натренированные на данных OmniRetarget, выполняли сложные 30-секундные последовательности: переноска 4.6-килограммового стула, залезание на 0.9-метровую платформу (это 70% роста робота) и паркур-элементы с кувырками.
Ключевое преимущество — минимальная настройка обучения. Там где конкуренты требуют десятки параметров вознаграждения и месяцы тонкой настройки, OmniRetarget использует всего 5 простых критериев оценки и стандартную рандомизацию. Это значительно упрощает процесс: вместо починки плохих данных сложными алгоритмами, система сразу создаeт качественные траектории.
Источник новости и обложки: arxiv.org