SoftMimic: как MIT создал фреймворк для податливого управления всем телом роботов

SoftMimic от MIT обучил гуманоидного робота Unitree G1 безопасно взаимодействовать с людьми и объектами

Исследователи из MIT представили SoftMimic — фреймворк для обучения гуманоидных роботов податливому управлению всем телом на основе примеров движений. Технология решает ключевую проблему современной робототехники: роботы, обученные жестко копировать движения, применяют непредсказуемо большие силы при неожиданных контактах, что делает их опасными для людей и хрупкими предметами.

Устойчивость к рассогласованию в условиях zero-shot: захват крупной коробки при номинальном выравнивании (слева) и при боковом/вращательном смещении исходного положения (в центре и справа). Всё поведение достигается без моделирования коробок или задания априорного распределения их местоположения; устойчивость обеспечивается обучением по методу SoftMimic с использованием обобщённых внешних сил.

Главная инновация SoftMimic заключается в использовании решателя обратной кинематики для создания расширенного датасета податливых движений. Вместо того чтобы заставлять робота агрессивно исправлять любые отклонения от эталонного движения, система обучает его контролируемо отклоняться от траектории в ответ на внешние силы. Пользователь может задавать уровень жесткости от 40 до 1000 Н/м для линейных перемещений и от 0.1 до 10 Н⋅м/рад для поворотов.

В экспериментах по подъему коробок разного размера податливый контроллер поддерживал значительно меньшие силы сжатия по сравнению со стандартным методом имитации движений, который демонстрировал большие и непредсказуемые силы при работе с объектами вне области обучения. При тестах на устойчивость к возмущениям (робот поднимает руку у стены, проходит мимо стола, работает со смещенной коробкой) очень податливая политика оказывала существенно меньшие силы на окружающую среду.

Команда протестировала систему как в симуляции, так и на реальном роботе Unitree G1. SoftMimic способен генерировать 40 минут дополненных данных для одноминутного клипа примерно за одну минуту реального времени при параллельной обработке. В отличие от традиционных подходов, где низкие коэффициенты усиления PD-регулятора не гарантируют податливость, SoftMimic контролирует жесткость на уровне задач через функцию вознаграждения и обучающие данные.

Исследование открывает путь к безопасному развертыванию гуманоидов рядом с людьми, решая фундамальную проблему изоляции современных роботов. Авторы отмечают, что определение оптимальной жесткости для конкретных задач остается ключевой областью для будущих исследований — например, использование высокой жесткости для подъема тяжелых предметов против низкой жесткости для деликатной передачи объектов человеку.

Источник новости и обложки: arxiv.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров