Новый ИИ научил роботов «думать вслух» и достиг рекордной точности выполнения задач

Исследователи из Physical Intelligence разработали систему Hi Robot, которая позволяет роботам «размышлять» подобно людям при выполнении сложных задач. Система использует двухуровневый подход: базовая модель π0 отвечает за автоматические действия (System 1), а продвинутая языковая модель выступает в роли «внутреннего голоса» (System 2), разбивающего сложные задачи на простые шаги.

В тестах на реальных задачах Hi Robot продемонстрировала впечатляющие результаты. При уборке стола, приготовлении сэндвичей и покупке продуктов система показала на 40% более высокую точность выполнения инструкций по сравнению с GPT-4o. Средняя точность выполнения задач составила 76%, что значительно превосходит показатели конкурентов.

Важной особенностью системы стала возможность обработки контекстной обратной связи в реальном времени. Например, если пользователь говорит роботу «это не мусор», система правильно интерпретирует команду и корректирует свои действия. Общий прогресс выполнения задач достиг 81% от уровня эксперта-человека, чей показатель составляет 89%.

Для обучения Hi Robot исследователи использовали синтетические данные, имитирующие реальные взаимодействия. Это позволило системе освоить сложные многоэтапные инструкции и научиться адаптироваться к различным ситуациям. В будущем такой подход может помочь роботам лучше понимать контекст и проявлять здравый смысл при взаимодействии с окружающим миром.

Источник новости и обложки: www.physicalintelligence.company