Исследователи разработали фреймворк SafeFall для защиты гуманоидных роботов от повреждений при падениях. Система снизила пиковые контактные силы на 68.3%, пиковые моменты в суставах на 78.4% и устранила 99.3% коллизий с уязвимыми компонентами. Фреймворк валидирован на полноразмерном гуманоиде Unitree G1 в реальных условиях.
Двуногая локомоция делает гуманоидных роботов склонными к падениям, вызывающим катастрофические повреждения дорогих сенсоров, актуаторов и структурных компонентов. Для полноразмерных гуманоидных платформ весом 30-80 кг одно неконтролируемое падение может уничтожить дорогие сенсоры, повредить актуаторы без возможности ремонта и сделать всю систему неработоспособной. Люди инстинктивно защищают жизненно важные органы при падениях через выученные рефлективные поведения, однако гуманоидные роботы в настоящее время не имеют аналогичных защитных механизмов.
Фреймворк состоит из двух синергетических компонентов: легковесного предиктора падений на основе GRU, который непрерывно мониторит состояния робота, и политики обучения с подкреплением для снижения ущерба. Защитная политика остается неактивной до тех пор, пока предиктор не идентифицирует падение как неизбежное, после чего она активируется для выполнения реакции, минимизирующей ущерб. Политика обучена с использованием функции награды, которая явно моделирует гетерогенность компонентов для защиты уязвимых областей, одновременно ограничивая внутренние моменты в суставах для предотвращения механической перегрузки и электрического насыщения актуаторов. Во время развертывания предиктор падений работает вместе с номинальной политикой, достигая частоты ложных срабатываний ниже 0.1% и времени инференса на борту ниже 0.5 мс.
Валидация SafeFall проводилась через обширные эксперименты на платформе Unitree G1, демонстрируя существенные снижения в пиковых моментах суставов, контактных силах и полное предотвращение повреждений сенсоров в разнообразных сценариях падений. Эксперименты в реальном мире подтверждают, что подход бесшовно интегрируется с существующими номинальными контроллерами, активируя защитные поведения только когда необходимо. Во время реальных экспериментов с толчками в разных направлениях во время ходьбы, неправильными шагами с платформы высотой 30 см и спотыканиями на высокой скорости 3 м/с, робот научился использовать локти для упора о землю и выполнял маневры переориентации запястий для избегания контакта рук с землей.
Источник новости и обложки: arxiv.org