Тактильный сенсор состоит из пьезорезистивной пленки, расположенной между проводящими электродами из проводящей ткани
Обучение с подкреплением
Защитная политика остается неактивной до тех пор, пока предиктор не идентифицирует падение как неизбежное, после чего она активируется для выполнения реакции, минимизирующей ущерб
PhysWorld учит роботов выполнять задачи через генерацию видео и физическое моделирование мира, достигая 82% успешности без реальных демонстраций
Оптимальная эффективность обучения достигается при ненулевом уровне забывания, где модель балансирует адаптацию и сохранение знаний
@ИИОбъединив зрение и движение в единый контроллер вместо разделенных модулей
Система достигла 99% успешности выполнения задач на бенчмарке LIBERO и показала рост производительности более 50% в SimplerEnv
Исследователи создали метод TARC, позволяющий роботам автономно адаптировать частоту управления под текущую ситуацию. Тестирование на RC-автомобиле и четвероногом роботе показало значительное снижение частоты управления при сохранении производительности
GSWorld объединяет 3D Gaussian Splatting с физическими движками для создания замкнутого цикла обучения роботизированных политик
Новая система сочетает vision-language модели и reinforcement learning для автономной прокладки кабелей. 92.5% общий успех в длительных сценариях прокладки, превосходя лучший базовый метод почти на 50%
RISE позволяет роботам обучаться на неидеальных данных, используя бинарные награды и липшицеву непрерывность для восстановления до экспертных состояний
UrbanVerse: система UCLA превращает городские видео в интерактивные 3D-симуляции для обучения роботов. База данных 102 530 объектов, +30.1% улучшение навигации в реальном мире
@ИИУченые создали систему VT-Refine для обучения роботов двуручной сборке с улучшением производительности через визуально-тактильную обратную связь и симуляцию
Исследователи создали фреймворк для обучения роботов навигации, сочетающий data-driven награды с правилами безопасности для движения среди людей
Новая система позволяет роботам планировать физические контакты, обучаясь всего на 0.5 миллиона шагов данных против значительно большего объема у традиционных методов