Исследователи из Университета Пенсильвании создали систему Push Anything, которая позволяет роботу толкать объекты с общей точностью 98% за 928 испытаний. Система способна одновременно манипулировать до 4 объектами, используя новый алгоритм Consensus Complementarity Control Plus (C3+), который работает в 4-5 раз быстрее предшественника.
Ключевое отличие C3+ от предыдущего алгоритма C3 заключается в том, что он превращает сложные вычисления проекции в простые аналитические операции. Представьте: раньше система решала экспоненциально сложную задачу для каждого контакта, а теперь каждый контакт обрабатывается независимо по простой формуле. Это как разность между решением системы из 19 связанных уравнений и решением 19 отдельных простых уравнений.
Среднее время достижения цели составило примерно 0.5, 1.6, 3.2 и 5.3 минуты для задач с 1, 2, 3 и 4 объектами соответственно. При этом робот достигает целевых позиций с точностью до 2 см по положению и 0.1 радиана (5.7°) по ориентации.
Push Anything включает полный конвейер: сканирование объектов камерой RealSense D455, создание 3D-мешей через BundleSDF, отслеживание позиций с помощью FoundationPose и XMem. Робот Franka Panda со сферическим манипулятором может работать с 33 различными объектами — от 3D-печатных букв до бытовых предметов.
Алгоритм одновременно учитывает до 19 контактов между объектами и средой, планируя движения на несколько шагов вперед. Это решает проблему многообъектных сценариев, которые раньше были неразрешимы для методов контактно-имплицитного управления из-за экспоненциального роста сложности.
Основные ограничения системы связаны с точностью отслеживания объектов, особенно когда они перекрывают друг друга. Также все объекты моделируются с одинаковой массой и инерцией. Видимо, физику пока что не обманешь — для масштабирования на более разнообразные объекты потребуется онлайн-обучение моделей.
Источник новости и обложки: arxiv.org