Роботизированные руки хватают объекты в сотни раз быстрее: 1090 захватов/сек против существующих методов

Роботизированные руки хватают объекты в сотни раз быстрее: 1090 захватов/сек против существующих методов

Исследователи из UC Berkeley разработали Lightning Grasp — алгоритм, который генерирует захваты для роботизированных рук в сотни раз быстрее существующих методов. На видеокарте A100 система создает от 1000 до 10000 разнообразных захватов за 2-5 секунд, в зависимости от сложности объекта.

Главный прорыв — это разделение геометрических вычислений и процесса поиска через структуру данных под названием «поле контакта» (Contact Field). Поле контакта характеризует пространственные контакты, которые рука может потенциально создать, и представляется как 6-мерный геометрический объект, кодирующий позицию и нормаль. Исследователи организовали это поле через иерархию ограничивающих объемов, где пространство разбито на небольшие ячейки, каждая из которых содержит набор векторов нормалей контакта.

Идея. Алгоритм Lightning Grasp выполняет три шага для захвата объекта. (Слева) Сначала определяются контактные области каждого пальца на поверхности объекта, где каждая область представляет собой достижимую зону для пальца. (В центре) Затем осуществляется поиск оптимального набора точек контакта в пределах этих областей. (Справа) В завершение захват реализуется путем позиционирования пальцев в вычисленных точках контакта.

Алгоритм работает в три этапа: сначала определяются области контакта для каждого пальца на поверхности объекта, затем внутри этих областей ищется оптимальный набор точек контакта, и наконец пальцы позиционируются в найденных точках. Для оптимизации точек контакта используется блочная оптимизация нулевого порядка, которая оказывается очень эффективной, поскольку каждая область контакта представляет собой двумерное многообразие. Задача реализации контактов решается через оптимизацию двух подзадач картезианского совмещения позиций — совмещаются как сами точки контакта, так и точки, смещенные вдоль нормалей.

Систему протестировали на роботизированных руках Shadow (22 степени свободы), LEAP (16 степеней свободы), Allegro (16 степеней свободы) и захвате DClaw (9 степеней свободы). Метод генерирует разнообразные и надежные захваты для широкого спектра объектов — от маленьких капсул и плоских ножниц до больших невыпуклых мисок. Для руки Allegro средняя производительность составляет около 1090 эффективных захватов в секунду, для LEAP — около 420, для Shadow — около 560.

Метод устраняет необходимость в ручной настройке энергетических функций и чувствительной инициализации, которые требовались в предыдущих подходах. Производительность на старой видеокарте TITAN X в 20-100 раз выше, чем у существующих методов на современной A100. Наиболее сложные случаи — объекты с сильно невыпуклой геометрией, такие как чашки, где могут возникать глобальные проникновения. Авторы открыли исходный код системы, чтобы ускорить инновации в области роботизированной манипуляции.

Источник новости и обложки: arxiv.org


Главред proglib.io. Опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры пишу Python.

Аватар пользователя Мирослав Кунгуров