Преобразование без запаха - Unscented transform

В преобразование без запаха (UT) - математическая функция, используемая для оценки результата применения заданного нелинейного преобразования к распределению вероятностей, которое характеризуется только конечным набором статистических данных. Чаще всего безцентированное преобразование используется для нелинейной проекции оценок среднего и ковариационных значений в контексте нелинейных расширений Фильтр Калмана. Его создатель Джеффри Ульманн объяснил, что «без запаха» - это произвольное название, которое он взял, чтобы избежать упоминания о нем как «фильтр Ульмана».[1]

Фон

Многие методы фильтрации и управления представляют оценки состояния системы в виде среднего вектора и связанной с ним ковариационной матрицы ошибок. В качестве примера предполагаемое двумерное положение интересующего объекта может быть представлено вектором среднего положения, , с неопределенностью, представленной в форме ковариационной матрицы 2x2, дающей дисперсию в , дисперсия , и перекрестная ковариация между ними. Ковариация, равная нулю, означает, что нет никакой неопределенности или ошибки и что положение объекта точно такое, как указано в векторном среднем значении.

Представление среднего значения и ковариации дает только первые два момента основного, но в остальном неизвестного распределения вероятностей. В случае движущегося объекта неизвестное распределение вероятностей может представлять неопределенность положения объекта в данный момент времени. Среднее и ковариационное представление неопределенности математически удобно, поскольку любое линейное преобразование может применяться к среднему вектору и ковариационная матрица в качестве и . Это свойство линейности не выполняется для моментов, превышающих первый исходный момент (среднее значение) и второй центральный момент (ковариация), поэтому обычно невозможно определить среднее значение и ковариацию в результате нелинейного преобразования, поскольку результат зависит от всех факторов. моменты, и даны только первые два.

Хотя ковариационная матрица часто рассматривается как ожидаемая квадратичная ошибка, связанная со средним значением, на практике матрица поддерживается как верхняя граница фактической квадратичной ошибки. В частности, среднее значение и оценка ковариации консервативно поддерживается так, чтобы ковариационная матрица больше или равно фактической квадратуре ошибки, связанной с . Математически это означает, что результат вычитания ожидаемой квадратичной ошибки (которая обычно не известна) из полуопределенное или положительно определенная матрица. Причина сохранения консервативной оценки ковариации заключается в том, что большинство алгоритмов фильтрации и управления будут иметь тенденцию расходиться (терпеть неудачу), если ковариация недооценена. Это связано с тем, что ложно малая ковариация подразумевает меньшую неопределенность и заставляет фильтр придавать больший вес (достоверность), чем оправдано с точки зрения точности среднего.

Возвращаясь к приведенному выше примеру, когда ковариация равна нулю, тривиально определить положение объекта после его перемещения в соответствии с произвольной нелинейной функцией. : просто примените функцию к среднему вектору. Когда ковариация не равна нулю, преобразованное среднее будет нет обычно быть равным и невозможно даже определить среднее значение преобразованного распределения вероятностей только по его априорному среднему значению и ковариации. Учитывая эту неопределенность, нелинейно преобразованное среднее и ковариация могут быть только аппроксимированы. Самое раннее приближение заключалось в линеаризации нелинейной функции и применении полученного Матрица якобиана к заданному среднему значению и ковариации. Это основа расширенный фильтр Калмана (EKF), и хотя было известно, что во многих случаях он дает плохие результаты, в течение многих десятилетий не существовало практической альтернативы.

Мотивация для трансформации без запаха

В 1994 г. Джеффри Ульманн отметил, что EKF принимает нелинейную функцию и информацию о частичном распределении (в форме среднего и ковариационной оценки) состояния системы, но применяет приближение к известной функции, а не к неточно известному распределению вероятностей. Он предположил, что лучшим подходом было бы использование точной нелинейной функции, применяемой к приближенному распределению вероятностей. Обоснование такого подхода дано в его докторской диссертации, где термин преобразование без запаха был впервые определен:[2]

Рассмотрим следующую интуицию: При фиксированном количестве параметров аппроксимировать данное распределение должно быть проще, чем аппроксимировать произвольную нелинейную функцию / преобразование.. Следуя этой интуиции, цель состоит в том, чтобы найти параметризацию, которая фиксирует среднее значение и информацию о ковариации, в то же время позволяя прямое распространение информации через произвольный набор нелинейных уравнений. Это может быть выполнено путем генерации дискретного распределения, имеющего одинаковые первый и второй (и, возможно, более высокие) моменты, где каждая точка в дискретном приближении может быть преобразована напрямую. Среднее значение и ковариация преобразованного ансамбля затем могут быть вычислены как оценка нелинейного преобразования исходного распределения. В более общем смысле, применение заданного нелинейного преобразования к дискретному распределению точек, вычисляемому таким образом, чтобы захватить набор известной статистики неизвестного распределения, называется преобразование без запаха.

Другими словами, данное среднее значение и информация о ковариации может быть точно закодирована в наборе точек, называемых сигма точки, которое, если рассматривать его как элементы дискретного распределения вероятностей, имеет среднее значение и ковариацию, равные заданному среднему значению и ковариации. Это распределение можно распространять точно применяя нелинейную функцию к каждой точке. Среднее значение и ковариация преобразованного набора точек затем представляют желаемую преобразованную оценку. Основным преимуществом этого подхода является то, что полностью используется нелинейная функция, в отличие от EKF, который заменяет ее линейной. Устранение необходимости в линеаризации также дает преимущества, не зависящие от какого-либо улучшения качества оценки. Одним из непосредственных преимуществ является то, что UT может применяться с любой заданной функцией, тогда как линеаризация может быть невозможна для функций, которые не являются дифференцируемыми. Практическое преимущество состоит в том, что UT может быть проще реализовать, поскольку он позволяет избежать необходимости выводить и реализовывать линеаризирующую матрицу Якоби.

Сигма точки

Чтобы вычислить преобразование без запаха, сначала нужно выбрать набор сигма-точек. Со времени основополагающей работы Ульмана в литературе было предложено много различных наборов сигма-точек. Подробный обзор этих вариантов можно найти в работе Menegaz et. al.[3] В целом, сигма-точки необходимы и достаточны для определения дискретного распределения, имеющего заданное среднее значение и ковариацию в размеры.[2]

Канонический набор сигма-точек - это симметричный набор, первоначально предложенный Ульманном. Рассмотрим следующий симплекс точек в двух измерениях:

Можно проверить, что указанный выше набор точек имеет среднее и ковариация (единичная матрица). Учитывая любое двумерное среднее и ковариацию, , желаемые сигма-точки можно получить, умножив каждую точку на матричный квадратный корень из и добавление . Подобный канонический набор сигма-точек может быть сгенерирован в любом количестве измерений. путем взятия нулевого вектора и точек, составляющих строки единичной матрицы, вычисления среднего значения набора точек, вычитания среднего из каждой точки так, чтобы результирующий набор имел среднее значение нуля, а затем вычисления ковариации нулевого значения. средний набор точек и применение его обратного к каждой точке так, чтобы ковариация набора была равна идентичности.

Ульманн показал, что можно удобно сгенерировать симметричный набор сигма-точки из столбцов и нулевой вектор, где является заданной ковариационной матрицей, без необходимости вычислять обратную матрицу. Он эффективен в вычислительном отношении и, поскольку точки образуют симметричное распределение, улавливает третий центральный момент (перекос), когда базовое распределение оценки состояния известно или может считаться симметричным.[2] Он также показал, что веса, в том числе отрицательные, могут использоваться для влияния на статистику набора. Жюлье также разработал и изучил методы генерации сигма-точек для фиксации третьего момента (перекоса) произвольного распределения и четвертого момента (эксцесса) симметричного распределения.[4][5]

Пример

Преобразование без запаха определяется для применения данной функции к любой частичной характеристике неизвестного в противном случае распределения, но его наиболее распространенное использование - для случая, когда заданы только среднее значение и ковариация. Типичным примером является преобразование из одной системы координат в другую, например, из декартовой системы координат в полярные координаты.[4]

Предположим, что 2-мерное среднее и ковариационная оценка, , дается в декартовых координатах с:

и функция преобразования в полярные координаты, , является:

Умножая каждую из канонических симплексных сигма-точек (указанных выше) на и добавив среднее, , дает:

Применение функции преобразования к каждому из вышеперечисленных пунктов дает:

Среднее значение этих трех преобразованных точек, , является UT-оценкой среднего в полярных координатах:

Оценка ковариации UT:

где каждый квадрат суммы является векторным внешним произведением. Это дает:

Это можно сравнить с линеаризованным средним значением и ковариацией:

Абсолютная разница между UT и линеаризованными оценками в этом случае относительно невелика, но в приложениях фильтрации кумулятивный эффект малых ошибок может привести к неустранимому расхождению оценки. Влияние ошибок усугубляется, когда ковариация недооценивается, поскольку это приводит к чрезмерной уверенности фильтра в точности среднего. В приведенном выше примере можно увидеть, что линеаризованная оценка ковариации меньше, чем оценка UT, предполагая, что линеаризация, вероятно, привела к недооценке фактической ошибки в ее среднем.

В этом примере нет способа определить абсолютную точность UT и линеаризованных оценок без базовой истины в форме фактического распределения вероятностей, связанного с исходной оценкой, а также среднего и ковариационного значения этого распределения после применения нелинейного преобразования (например, , как определено аналитически или путем численного интегрирования). Такой анализ был выполнен для преобразований координат в предположении гауссовости для лежащих в основе распределений, и оценки UT имеют тенденцию быть значительно более точными, чем оценки, полученные из линеаризации.[6][7]

Эмпирический анализ показал, что использование минимального симплексного набора сигма-точек значительно менее точен, чем использование симметричного набора указывает, когда базовое распределение является гауссовым.[7] Это говорит о том, что использование симплексного набора в приведенном выше примере не будет лучшим выбором, если базовое распределение, связанное с симметрично. Даже если базовое распределение не является симметричным, симплексный набор все равно будет менее точным, чем симметричный набор, потому что асимметрия симплексного набора не соответствует асимметрии фактического распределения.

Возвращаясь к примеру, минимальный симметричный набор сигма-точек может быть получен из ковариационной матрицы просто как средний вектор, плюс и минус столбцы :

Эта конструкция гарантирует, что среднее значение и ковариация вышеуказанных четырех сигма-точек равны , который можно проверить напрямую. Применение нелинейной функции каждой из сигма-точек дает:

Среднее значение этих четырех преобразованных сигма-точек, , является UT-оценкой среднего в полярных координатах:

Оценка ковариации UT:

где каждый квадрат суммы является векторным внешним произведением. Это дает:

Разница между оценками UT и линеаризованного среднего дает меру влияния нелинейности преобразования. Когда преобразование является линейным, например, UT и линеаризованные оценки будут идентичными. Это мотивирует использование квадрата этой разницы для добавления к ковариации UT для защиты от недооценки фактической ошибки среднего. Этот подход не улучшает точность среднего, но может значительно улучшить точность фильтра с течением времени за счет снижения вероятности недооценки ковариации.[2]

Оптимальность трансформации без запаха

Ульманн отметил, что, учитывая только среднее значение и ковариацию неизвестного в противном случае распределения вероятностей, проблема преобразования не определена, поскольку существует бесконечное количество возможных основных распределений с одинаковыми первыми двумя моментами. Без какой-либо априорной информации или предположений о характеристиках основного распределения любой выбор распределения, используемый для вычисления преобразованного среднего и ковариации, является таким же разумным, как и любой другой. Другими словами, не существует выбора распределения с заданным средним значением и ковариацией, превосходящим то, которое обеспечивается набором сигма-точек, поэтому преобразование без оценки является тривиально оптимальным.

Это общее заявление об оптимальности, конечно, бесполезно для каких-либо количественных заявлений о производительности UT, например, по сравнению с линеаризацией; следовательно, он, Жюлье и другие провели анализ при различных предположениях о характеристиках распределения и / или форме функции нелинейного преобразования. Например, если функция является дифференцируемой, что важно для линеаризации, эти анализы подтверждают ожидаемое и подтвержденное эмпирически превосходство преобразования без запаха.[6][7]

Приложения

Преобразование без запаха можно использовать для разработки нелинейного обобщения фильтра Калмана, известного как Фильтр Кальмана без запаха (UKF). Этот фильтр в значительной степени заменил EKF во многих приложениях нелинейной фильтрации и управления, в том числе для подводных,[8] наземная и аэронавигация,[9] и космический корабль.[10] Преобразование без запаха также использовалось в качестве вычислительной основы для оптимального управления Римана-Стилтьеса.[11] Этот вычислительный подход известен как оптимальный контроль без запаха.[12][13]

Фильтр Калмана без запаха

Ульманн и Саймон Жюльер опубликовал несколько статей, показывающих, что использование неароматизированного преобразования в Фильтр Калмана, который называется фильтр Калмана без запаха (UKF), обеспечивает значительное улучшение производительности по сравнению с EKF в различных приложениях.[14][4][6]Джулиер и Ульманн опубликовали статьи, в которых использовалась конкретная параметризованная форма преобразования без запаха в контексте UKF, в котором для сбора предполагаемой информации о распределении использовались отрицательные веса.[14][6] Эта форма UT подвержена множеству числовых ошибок, которые не допускаются в исходных формулировках (симметричный набор, первоначально предложенный Ульманном). Впоследствии Жюлье описал параметризованные формы, которые не используют отрицательные веса и также не подвержены этим проблемам.[15]

Смотрите также

Рекомендации

  1. ^ «Из первых рук: трансформация без запаха - вики по истории инженерии и технологий».
  2. ^ а б c d Ульманн, Джеффри (1995). Построение и локализация динамической карты: новые теоретические основы (Кандидатская диссертация). Оксфордский университет.
  3. ^ Menegaz, Henrique M.T .; Жоао, Й. Исихара; Borges, Geovany A .; Варгас, Алессандро Н. (16 февраля 2015 г.). "Систематизация теории фильтра Кальмана без запаха". IEEE Transactions по автоматическому контролю. 60 (10): 2583–2598. Дои:10.1109 / TAC.2015.2404511. HDL:20.500.11824/251.
  4. ^ а б c Julier, S .; Дж. Ульманн (1997). «Последовательный метод без смещения для преобразования между полярными и декартовыми системами координат». Материалы конференции SPIE 1997 г. по приобретению, отслеживанию и наведению. 3086. ШПИОН.
  5. ^ Жюльер, Саймон (1998). «Искаженный подход к фильтрации». Материалы 12-го Междунар. Symp. По аэрокосмическому / оборонному зондированию, моделированию и контролю. 3373. ШПИОН.
  6. ^ а б c d Жюльер, Саймон; Ульманн, Джеффри (2000). «Новый метод нелинейного преобразования средних и ковариаций в нелинейных фильтрах». IEEE Transactions по автоматическому контролю. 45 (3): 477–482. Дои:10.1109/9.847726.
  7. ^ а б c Zhang, W .; М. Лю; З. Чжао (2009). «Анализ точности бесценной трансформации нескольких стратегий выборки». Proc. 10-го Междунар. Конф. по программной инженерии, искусственному интеллекту, сетям и параллельным / распределенным вычислениям. ACIS.
  8. ^ Wu, L .; J. Ma; Дж. Тиан (2010). "Самоадаптивная фильтрация Калмана без запаха для подводной гравитационной навигации". Proc. планов IEEE / ION.
  9. ^ Эль-Шейми, N; Шин, EH; Ню, X (2006). "Противодействие фильтру Калмана: расширенные фильтры Калмана по сравнению с фильтрами Калмана без запаха для интегрированного инерционного GPS и MEMS". Внутри GNSS: инженерные решения для сообщества глобальных навигационных спутниковых систем. 1 (2).
  10. ^ Crassidis, J .; Маркли, Ф. (2003). «Фильтрация без запаха для оценки положения космического корабля». Журнал AIAA по руководству, контролю и динамике. 26 (4): 536–542. Дои:10.2514/2.5102.
  11. ^ И. М. Росс, Р. Дж. Пру, М. Карпенко, К. Гонг, "Задачи оптимального управления Римана – Стилтьеса для неопределенных динамических систем". Журнал по наведению, контролю и динамике, Vol. 38, No. 7 (2015), pp. 1251-1263. Doi: 10.2514 / 1.G000505.
  12. ^ Росс И. М., Пру Р. Дж., Карпенко М. "Оптимальное управление космическим полетом без запаха". Материалы 24-го Международного симпозиума по динамике космического полета (ISSFD), 5–9 мая 2014 г., Laurel, MD. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpenko.pdf
  13. ^ И. М. Росс, Р. Дж. Пру, М. Карпенко, «Руководство без запаха», Американская конференция по контролю, 2015, стр. 5605-5610, 1–3 июля 2015 г. doi: 10.1109 / ACC.2015.7172217.
  14. ^ а б Julier, S .; Дж. Ульманн (1997). «Новое расширение фильтра Калмана на нелинейные системы». Материалы конференции SPIE 1997 г. по обработке сигналов, слиянию датчиков и распознаванию целей. 3068.
  15. ^ Жюльер, Саймон (2002). «Масштабная трансформация без запаха». Труды Американской конференции по контролю. 6. IEEE.