Представьте дирижера, который меняет темп в зависимости от сложности музыкального пассажа — именно так работает новая система TACO для квадрокоптеров. Исследователи создали алгоритм, который в реальном времени подстраивает параметры управления дрона под предстоящий участок траектории, позволяя одному и тому же квадрокоптеру одинаково уверенно выполнять как плавные повороты, так и резкие петли.
Классическая проблема управления дронами — это компромисс между универсальностью и производительностью. Обычно инженеры вручную настраивают параметры контроллера один раз, получая средние результаты на разных задачах. Эксперимент показал, что для каждой из четырех траекторий наилучшие результаты достигались именно с теми настройками, которые были специально подобраны для этой конкретной траектории. TACO решает эту проблему, автоматически адаптируя управление к каждому сегменту пути.
Сердце системы — нейросеть, которая предсказывает качество управления на основе трех входов: предстоящего сегмента траектории на определенном горизонте времени, текущего состояния квадрокоптера и кандидатов на параметры контроллера. Модель выдает восемь метрик производительности: ошибки отслеживания по осям X, Y, Z, ошибку скорости, угловую скорость, затраты энергии и финальную ошибку в конце горизонта. Для оптимизации параметров используется итерационный случайный поиск с важностной выборкой — алгоритм генерирует случайные варианты параметров, оценивает их через нейросеть за один проход и выбирает лучший. Система пересчитывает параметры через регулярные интервалы времени. Для обучения модели создали датасет из 8 миллионов примеров на трех типах траекторий: MinSnap-полиномы с постоянной и переменной скоростью, случайные полиномиальные траектории и зигзагообразные пути с разрывами скорости.
Тестирование на пяти типах траекторий показало убедительное превосходство TACO. На всех типах траекторий TACO показала наилучшие результаты после Oracle (Adaptive). Система значительно превзошла номинальные настройки и показала улучшение по сравнению с Oracle (Static), который работает офлайн. Особенно впечатляюще TACO справилась с траекториями Лиссажу, которые не встречались при обучении — это демонстрирует способность системы к обобщению. Для сравнения мы также протестировали MPC-контроллер на наших наборах траекторий. Единственный метод, превзошедший TACO — это Oracle (Adaptive), но он требует доступа к истинному симулятору и работает 45 минут, тогда как TACO оптимизирует параметры за доли секунды. На реальном квадрокоптере CrazyFlie 2.0 система уменьшила среднюю ошибку слежения на 5 сантиметров по сравнению с ручными настройками, причем без каких-либо техник адаптации из симуляции в реальность.
Но исследователи пошли дальше оптимизации управления. Та же предсказательная модель может адаптировать сами траектории, делая их более выполнимыми для квадрокоптера, сохраняя при этом гладкость и прохождение через ключевые точки. Тестирование показало снижение ошибки в ключевых точках с 0.31 до 0.21 метра (улучшение на 32%) при фиксированных параметрах контроллера, а комбинация адаптации траектории и параметров дала 0.15 метра. Это открывает путь к системам, где дрон и траектория непрерывно подстраиваются друг под друга, выжимая максимум из физических возможностей платформы.
Источник новости и обложки: arxiv.org