Исследователи из UC Berkeley разработали Lightning Grasp — алгоритм, который генерирует захваты для роботизированных рук в сотни раз быстрее существующих методов. На видеокарте A100 система создает от 1000 до 10000 разнообразных захватов за 2-5 секунд, в зависимости от сложности объекта.
Главный прорыв — это разделение геометрических вычислений и процесса поиска через структуру данных под названием «поле контакта» (Contact Field). Поле контакта характеризует пространственные контакты, которые рука может потенциально создать, и представляется как 6-мерный геометрический объект, кодирующий позицию и нормаль. Исследователи организовали это поле через иерархию ограничивающих объемов, где пространство разбито на небольшие ячейки, каждая из которых содержит набор векторов нормалей контакта.
Алгоритм работает в три этапа: сначала определяются области контакта для каждого пальца на поверхности объекта, затем внутри этих областей ищется оптимальный набор точек контакта, и наконец пальцы позиционируются в найденных точках. Для оптимизации точек контакта используется блочная оптимизация нулевого порядка, которая оказывается очень эффективной, поскольку каждая область контакта представляет собой двумерное многообразие. Задача реализации контактов решается через оптимизацию двух подзадач картезианского совмещения позиций — совмещаются как сами точки контакта, так и точки, смещенные вдоль нормалей.
Систему протестировали на роботизированных руках Shadow (22 степени свободы), LEAP (16 степеней свободы), Allegro (16 степеней свободы) и захвате DClaw (9 степеней свободы). Метод генерирует разнообразные и надежные захваты для широкого спектра объектов — от маленьких капсул и плоских ножниц до больших невыпуклых мисок. Для руки Allegro средняя производительность составляет около 1090 эффективных захватов в секунду, для LEAP — около 420, для Shadow — около 560.
Метод устраняет необходимость в ручной настройке энергетических функций и чувствительной инициализации, которые требовались в предыдущих подходах. Производительность на старой видеокарте TITAN X в 20-100 раз выше, чем у существующих методов на современной A100. Наиболее сложные случаи — объекты с сильно невыпуклой геометрией, такие как чашки, где могут возникать глобальные проникновения. Авторы открыли исходный код системы, чтобы ускорить инновации в области роботизированной манипуляции.
Источник новости и обложки: arxiv.org