ХМ-ХМ
ЧТО ЗА ФАК*

VLA-модели

Робот Xiaomi складывает полотенца за 50 секунд — в реальном времени
Модель показала рекордные 98,7% успеха на бенчмарке LIBERO и достигла пропускной способности 1,2 полотенца в минуту при сложной бимануальной манипуляции
@Железо, ИИ
16.02.2026
0.5B вместо 3B: компактная VLA-модель показала 94,1% в бенчмарке LIBERO
В ближайших планах команды — перенос экспериментов на реальную платформу SO100 ARM для проверки работы в условиях шума и переменного освещения
@Железо, ИИ
07.01.2026
Робот обучился без реальных данных: симуляция + видео людей = 25% прирост
Ключевая идея — взаимная имитация: робот учится предсказывать действия человека по своим движениям, а человеческие жесты конвертируются в команды робота через кинематические правила
@Железо, ИИ
18.12.2025
VLM вместо скриптов: робот собирает предметы по тексту с рейтингом 90,6%
Для решения задачи используется модель Gemini 2.5 pro, которая выполняет мультимодальное zero-shot рассуждение над геометрией и функциональностью
@Железо, ИИ
17.12.2025
Maestro планирует движения роботов в реальном времени через замкнутый цикл VLM
VLM-агент динамически компонует модули и учится на ошибках в реальном времени
@Железо, ИИ
04.11.2025
Робот работал час без остановки: метод PLD достиг 99% успешности на бенчмарке LIBERO
Система достигла 99% успешности выполнения задач на бенчмарке LIBERO и показала рост производительности более 50% в SimplerEnv
@Железо, ИИ
01.11.2025
RobotArena: 7000+ тестов роботов в симуляции с VLM и краудсорсингом
Ученые создали виртуальный полигон для роботов, который переводит реальные видео в симуляцию и тестирует более 7000 вариантов поведения
@Железо, ИИ
29.10.2025
Microsoft создала VLA-модель VITRA, которая обучает роботов манипуляциям на видео человеческих действий
Исследователи обучили робота ловким манипуляциям, анализируя 26 миллионов кадров обычных человеческих видео
@Железо, ИИ
27.10.2025
MoTVLA: 14B-параметрическая модель с унифицированным быстрым-медленным рассуждением для роботов
Исследователи из Гарвардского университета представили MoTVLA — модель с 14B параметров, которая переключается между быстрым и медленным рассуждением. Архитектура показала высокую эффективность в сложных задачах
@Железо, ИИ
22.10.2025
Spatial Forcing учит роботов понимать 3D-пространство без датчиков глубины
Новый метод SF ускоряет обучение до 3.8 раз, позволяя им понимать 3D-пространство без датчиков глубины. Превосходит 2D и 3D VLA-модели
@ИИ
15.10.2025