Навигатор Шрёдингера: робот Go2 выбирает из трех вариантов будущего

Робот видит будущее: навигация с точностью 72.5% через окклюзии

Исследователи из Fudan University разработали Schrödinger’s Navigator — фреймворк для навигации роботов в незнакомых помещениях с тяжелыми окклюзиями. Система моделирует необследованное пространство как набор вероятных будущих миров и анализирует их перед принятием решения. Это позволяет роботу «видеть» сквозь препятствия и предвидеть риски в невидимых зонах без построения плотных глобальных карт.

Существующие методы zero-shot навигации часто проваливаются в реалистичных захламленных средах, особенно при тяжелых окклюзиях, неизвестных рисках или движущихся целевых объектах. Они не умеют явно рассуждать о множественных возможных конфигурациях необследованного пространства перед действием. В результате их легко вводят в заблуждение локальные наблюдения в захламленных средах с тяжелыми окклюзиями.

Обзор нашего конвейера Navigator. Слева: система получает на вход целевую инструкцию, RGB-D наблюдения и позу робота. Внизу по центру: сэмплер траекторий детерминированно выбирает три кандидатные траектории и кондиционирует 3D-модель мира. Модель предсказывает будущие 3DGS-наблюдения вдоль этих траекторий — левый обход, правый обход и поверх препятствия — чтобы вывести информацию о скрытых и ненаблюдаемых областях. Справа вверху: предсказанные ключи объединяются с текущими наблюдениями для построения и обновления многоканальных карт и обеспечения анализа с учетом будущего. Этот процесс создает итоговую карту аффордансов, используемую для выбора промежуточных путевых точек. Справа внизу: блок исполнения следует к выбранной путевой точке и генерирует управляющие команды для непрерывного навигации робота к цели.

В основе Schrödinger’s Navigator лежит trajectory-conditioned 3D world model, которая получает эгоцентрические визуальные наблюдения и кандидатные траектории. Модель генерирует предсказанные будущие наблюдения вдоль каждой траектории и производит гипотетические 3D-виды, представляющие то, что агент воспринял бы, следуя этому пути. Система сэмплирует три кандидатные траектории на каждом шаге планирования, балансируя покрытие пространства действий с вычислительной эффективностью.

Эксперименты на роботе Go2 quadruped проводились в трех сценариях: тяжелые статические окклюзии, неизвестные риски и динамически движущиеся цели. Schrödinger’s Navigator стабильно превосходит сильные бейзлайны zero-shot навигации в self-localization, object localization и общем Success Rate в средах с тяжелыми окклюзиями. Результаты показывают эффективность trajectory-conditioned 3D imagination для робастной zero-shot навигации.

Источник новости и обложки: arxiv.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров