Unitree Go2 освоил 15 стратегий передвижения по 13-метровому качающемуся мосту

Четвероногий робот научился ходить по качающемуся мосту с точностью до 0.3π

Немецкие исследователи из Дармштадтского технического университета разработали метод обучения четвероногого робота Unitree Go2 передвижению по нестабильным поверхностям. Робот тренировался на специальном мосту HUMVIB длиной 13.24 метра с собственной частотой колебаний 2.0 Гц, предназначенному для исследования вертикальных возмущений опоры.

Схема четвероногого робота Unitree Go2, пересекающего мост HUMVIB длиной 13,24 метра.

Ключевая особенность подхода — использование алгоритма Proximal Policy Optimization (PPO) в симуляторе MuJoCo с 48 параллельными средами для быстрого сбора данных. Исследователи обучили 15 различных стратегий передвижения, комбинируя пять типов походок (рысь, иноходь, галоп, свободный стиль и стандартный) с тремя условиями тренировки. Робот управлялся на частоте 50 Гц и мог двигаться со скоростями от -1.0 до 1.0 м/с по всем осям.

Физическая модель моста воспроизводила реальную конструкцию: стальные балки с бетонными плитами, колебания с амплитудой ±0.1 метра и ограничением ускорения до 9.81 м/с². Во время тренировки частота колебаний варьировалась от 0.75 до 7.5 Гц. Две стратегии высотного регулирования позволяли роботу либо поддерживать постоянную высоту 0.325 метра относительно поверхности моста, либо относительно земли.

Робота Unitree Go2 обучают в симуляторе, а затем без дообучения переносят освоенные стратегии на реальный мост HUMVIB, который совершает колебания, чтобы исследовать влияние вертикальных возмущений опоры на устойчивость передвижения.

Результаты показали, что политики, обученные на колебающемся мосту, значительно превосходят те, что тренировались на жесткой поверхности. При тестировании на реальном мосту роботы демонстрировали адаптацию к колебаниям с фазовым сдвигом около 0.3π из-за инерции. Походка рысью оказалась особенно эффективной на высоких скоростях, а её частота шагов около 4.0 Гц даже возбуждала вторую гармонику конструкции.

Практические испытания проводились с постоянной скоростью 0.5 м/с и контролем сил в лапах робота через датчики Delsys Trigno Wireless. Политики, обученные на колебаниях, показывали самые низкие силовые нагрузки, что указывает на лучшую адаптацию к динамическим условиям. Исследование открывает путь к созданию роботов, способных работать в зонах бедствий и на промышленных объектах с нестабильными поверхностями.

Источник новости и обложки: arxiv.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров