Исследователи из Fudan University разработали Schrödinger’s Navigator — фреймворк для навигации роботов в незнакомых помещениях с тяжелыми окклюзиями. Система моделирует необследованное пространство как набор вероятных будущих миров и анализирует их перед принятием решения. Это позволяет роботу «видеть» сквозь препятствия и предвидеть риски в невидимых зонах без построения плотных глобальных карт.
Существующие методы zero-shot навигации часто проваливаются в реалистичных захламленных средах, особенно при тяжелых окклюзиях, неизвестных рисках или движущихся целевых объектах. Они не умеют явно рассуждать о множественных возможных конфигурациях необследованного пространства перед действием. В результате их легко вводят в заблуждение локальные наблюдения в захламленных средах с тяжелыми окклюзиями.


В основе Schrödinger’s Navigator лежит trajectory-conditioned 3D world model, которая получает эгоцентрические визуальные наблюдения и кандидатные траектории. Модель генерирует предсказанные будущие наблюдения вдоль каждой траектории и производит гипотетические 3D-виды, представляющие то, что агент воспринял бы, следуя этому пути. Система сэмплирует три кандидатные траектории на каждом шаге планирования, балансируя покрытие пространства действий с вычислительной эффективностью.
Эксперименты на роботе Go2 quadruped проводились в трех сценариях: тяжелые статические окклюзии, неизвестные риски и динамически движущиеся цели. Schrödinger’s Navigator стабильно превосходит сильные бейзлайны zero-shot навигации в self-localization, object localization и общем Success Rate в средах с тяжелыми окклюзиями. Результаты показывают эффективность trajectory-conditioned 3D imagination для робастной zero-shot навигации.
Источник новости и обложки: arxiv.org

