ResAD: как предсказание отклонений от инерции помогло Horizon Robotics достичь 88.6 баллов в автономном вождении

ResAD: новый подход к планированию траекторий для беспилотников показал рекордные результаты

Исследователи из Уханьского университета и компании Horizon Robotics разработали ResAD — систему автономного вождения, которая достигла 88.6 баллов PDMS на бенчмарке NAVSIM. Вместо традиционного предсказания полной траектории движения, ResAD учится предсказывать только отклонения от базовой инерциальной траектории — как если бы автомобиль просто продолжал движение по инерции.

Главная проблема существующих систем — пространственно-временная неравномерность данных траекторий. Представьте: при обучении модель пытается предсказать, где будет автомобиль через 1, 2, 3 секунды. Но чем дальше прогноз, тем больше ошибка, и эти большие ошибки «забивают» обучение более важным ближним точкам. ResAD решает это через точечную нормализацию остатков, которая выравнивает вес каждой временной точки в процессе обучения.

Предлагаемая структура ResAD. Многовидовые изображения и данные лидара сначала обрабатываются и объединяются с помощью энкодера с взаимодействием признаков. Генерируется инерциальная система отсчета на основе состояния эго-транспортного средства, которая затем возмущается, формируя кластер для обеспечения устойчивости и получения многомодальных прогнозов. В заключение диффузионные декодеры, управляемые этим кластером систем отсчета, объединяют закодированные признаки с помощью перекрестного внимания для вывода планируемых траекторий

Для создания мультимодальных траекторий (то есть нескольких вариантов поведения) система использует возмущение инерциальной траектории — добавляет небольшой шум к начальной скорости автомобиля и генерирует 200 вариантов траекторий во время тестирования. Это как если бы водитель рассматривал разные сценарии: «а что если я поеду чуть левее/правее/быстрее». Затем специальный ранжировщик выбирает лучший вариант.

На более сложном бенчмарке NAVSIM v2 ResAD показал 85.5 баллов EPDMS, обогнав предыдущий рекорд DiffusionDrive на 1.0 балл. Особенно впечатляет показатель соблюдения границ полосы движения — 97.2 против 95.9 у конкурента. Главное преимущество подхода в том, что он заставляет модель понимать причины изменения траектории (светофоры, препятствия), а не просто запоминать паттерны движения.

Визуальное сравнение метода ResAD. DiffusionDrive использует статический, не учитывающий контекст словарь, часто предлагая невыполнимые траектории (обведены красным). В отличие от него, предложенный метод ResAD динамически генерирует учитывающие контекст траектории за счёт возмущения скорости экипажа, устраняя ограничения статических подходов

Интересно, что для финального предсказания ResAD использует всего 2 шага денойзинга вместо обычных сотен в диффузионных моделях — это делает систему гораздо быстрее. Исследователи обещают выложить код в открытый доступ, что может ускорить развитие всей области автономного вождения.

Источник новости и обложки: arxiv.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров