NVIDIA представила три нейросетевые технологии для обучения роботов человеческим навыкам

Современные роботы отлично справляются с задачами в контролируемых условиях, но все еще с трудом адаптируются к непредсказуемости реального мира. NVIDIA Research представила три прорывные нейросетевые технологии на конференции CoRL 2025, которые кардинально меняют подход к обучению роботов: NeRD для симуляции динамики, Dexplore для освоения человеческой ловкости и VT-Refine для точных задач сборки с использованием зрения и осязания.

NeRD (Neural Robot Dynamics) решает проблему традиционных симуляторов, которые не могут точно воспроизвести сложность современных роботов. Система использует легковесную реализацию трансформера GPT-2 и обучается на 100 000 случайных траекторий по 100 временных шагов каждая. Результат впечатляет: точность модели составляет менее 0.1% ошибки в накопленной награде при оценке политики на 1000 шагов для четвероногого робота ANYmal.

Технология Dexplore tackle проблему обучения роботизированных рук человеческой ловкости через данные захвата движений (MoCap). Вместо строгого следования демонстрациям человека, система использует их как мягкое руководство, позволяя роботу самостоятельно находить движения, совместимые с его конструкцией. На роботизированной руке Inspire подход показал почти на 20% больший процент успеха по сравнению с базовыми методами.

VT-Refine комбинирует зрение и тактильные ощущения для точных задач двуручной сборки через инновационный подход real-to-sim-to-real. Система начинает с 30 эпизодов реальных демонстраций, затем дообучается в параллелизованной симуляции и возвращается в реальный мир. Результаты показывают улучшение успешности на 20% для варианта только со зрением и на 40% для визуально-тактильного варианта.

Все три технологии объединяет использование GPU-ускоренных симуляций и масштабируемого обучения. NeRD интегрирован с NVIDIA Warp и планируется к включению в Newton Physics Engine, VT-Refine использует библиотеку TacSL в Isaac Lab, а Dexplore демонстрирует успешный перенос из симуляции в реальность с минимальным падением производительности всего в 5-10%. Эти разработки значительно сокращают разрыв между возможностями роботов и людей в сложных манипуляционных задачах.

Источник новости и обложки: developer.nvidia.com


Работаю главным редактором proglib.io — опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры владею Python, с его помощью автоматизирую повседневные задачи.

Аватар пользователя Мирослав Кунгуров