VLM-агент динамически компонует модули и учится на ошибках в реальном времени
VLA-модели
Система достигла 99% успешности выполнения задач на бенчмарке LIBERO и показала рост производительности более 50% в SimplerEnv
Ученые создали виртуальный полигон для роботов, который переводит реальные видео в симуляцию и тестирует более 7000 вариантов поведения
Исследователи обучили робота ловким манипуляциям, анализируя 26 миллионов кадров обычных человеческих видео
Исследователи из Гарвардского университета представили MoTVLA — модель с 14B параметров, которая переключается между быстрым и медленным рассуждением. Архитектура показала высокую эффективность в сложных задачах
Новый метод SF ускоряет обучение до 3.8 раз, позволяя им понимать 3D-пространство без датчиков глубины. Превосходит 2D и 3D VLA-модели
@ИИ