Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Преобразование без запаха (UT) - это математическая функция, используемая для оценки результата применения заданного нелинейного преобразования к распределению вероятностей, которое характеризуется только в терминах конечного набора статистических данных. Чаще всего безцентированное преобразование используется для нелинейного проецирования оценок среднего и ковариационных значений в контексте нелинейных расширений фильтра Калмана . Его создатель Джеффри Ульманн объяснил, что «без запаха» - это произвольное название, которое он взял, чтобы его не называли «фильтром Ульмана». [1]

Фон [ править ]

Многие методы фильтрации и управления представляют оценки состояния системы в виде среднего вектора и связанной с ним ковариационной матрицы ошибок. В качестве примера предполагаемое двумерное положение интересующего объекта может быть представлено вектором среднего положения , с неопределенностью, заданной в форме ковариационной матрицы 2x2, дающей дисперсию , дисперсию и перекрестную ковариацию. между двумя. Ковариация, равная нулю, означает, что нет никакой неопределенности или ошибки, и что положение объекта точно такое, как задано средним вектором.

Представление среднего и ковариационного значений дает только первые два момента основного, но в остальном неизвестного распределения вероятностей. В случае движущегося объекта неизвестное распределение вероятностей может представлять неопределенность положения объекта в данный момент времени. Среднее и ковариационное представление неопределенности математически удобно, потому что любое линейное преобразование может быть применено к вектору среднего и ковариационной матрице как и. Это свойство линейности не выполняется для моментов, выходящих за пределы первого исходного момента (среднего) и второго центрального момента (ковариация), поэтому, как правило, невозможно определить среднее значение и ковариацию в результате нелинейного преобразования, поскольку результат зависит от всех факторов. моменты, и даны только первые два.

Хотя ковариационная матрица часто рассматривается как ожидаемая квадратичная ошибка, связанная со средним значением, на практике матрица поддерживается как верхняя граница фактической квадратичной ошибки. В частности, среднее значение и оценка ковариации консервативно поддерживаются, так что матрица ковариаций больше или равна фактической квадратичной ошибке, связанной с . Математически это означает, что результат вычитания ожидаемой квадратичной ошибки (которая обычно не известна) из является полуопределенной или положительно определенной матрицей.. Причина сохранения консервативной оценки ковариации заключается в том, что большинство алгоритмов фильтрации и управления будут иметь тенденцию расходиться (терпеть неудачу), если ковариация недооценена. Это связано с тем, что ложно малая ковариация подразумевает меньшую неопределенность и заставляет фильтр придавать больший вес (достоверность), чем оправдано с точки зрения точности среднего.

Возвращаясь к приведенному выше примеру, когда ковариация равна нулю, тривиально определить местоположение объекта после его перемещения в соответствии с произвольной нелинейной функцией : просто примените функцию к среднему вектору. Когда ковариация не равна нулю, преобразованное среднее значение обычно не будет равно, и невозможно даже определить среднее значение преобразованного распределения вероятностей только по его априорному среднему значению и ковариации. Учитывая эту неопределенность, нелинейно преобразованное среднее значение и ковариация могут быть только аппроксимированы. Самое раннее приближение заключалось в линеаризации нелинейной функции и применении полученной матрицы Якоби к заданному среднему значению и ковариации. Это основа расширенного фильтра Калмана. (EKF), и хотя было известно, что он дает плохие результаты во многих обстоятельствах, в течение многих десятилетий не существовало практической альтернативы.

Мотивация для трансформации без запаха [ править ]

В 1994 году Джеффри Ульманн заметил, что EKF принимает нелинейную функцию и информацию о частичном распределении (в форме среднего и ковариационной оценки) состояния системы, но применяет приближение к известной функции, а не к неточно известному распределению вероятностей. . Он предположил, что лучшим подходом было бы использование точной нелинейной функции, применяемой к аппроксимирующему распределению вероятностей. Мотивация для этого подхода дана в его докторской диссертации, где впервые был определен термин « преобразование без запаха» : [2]

Рассмотрим следующую интуицию: с фиксированным числом параметров должно быть легче аппроксимировать данное распределение, чем аппроксимировать произвольную нелинейную функцию / преобразование.. Следуя этой интуиции, цель состоит в том, чтобы найти параметризацию, которая фиксирует среднее значение и информацию о ковариации, в то же время позволяя прямое распространение информации через произвольный набор нелинейных уравнений. Это может быть достигнуто путем создания дискретного распределения, имеющего одинаковые первый и второй (и, возможно, более высокие) моменты, где каждая точка в дискретном приближении может быть преобразована напрямую. Среднее значение и ковариация преобразованного ансамбля затем могут быть вычислены как оценка нелинейного преобразования исходного распределения. В более общем смысле, применение заданного нелинейного преобразования к дискретному распределению точек, вычисляемому таким образом, чтобы захватить набор известной статистики неизвестного распределения, называется преобразованием без запаха..

Другими словами, данное среднее значение и информация о ковариации может быть точно закодирована в наборе точек, называемых сигма-точками , которые, если их рассматривать как элементы дискретного распределения вероятностей, имеют среднее значение и ковариацию, равные заданному среднему значению и ковариации. Это распределение можно точно размножитьприменяя нелинейную функцию к каждой точке. Среднее значение и ковариация преобразованного набора точек затем представляют желаемую преобразованную оценку. Основным преимуществом этого подхода является то, что нелинейная функция используется полностью, в отличие от EKF, который заменяет ее линейной. Устранение необходимости в линеаризации также дает преимущества, не зависящие от какого-либо улучшения качества оценки. Одним из непосредственных преимуществ является то, что UT может применяться с любой заданной функцией, тогда как линеаризация может быть невозможна для недифференцируемых функций. Практическое преимущество состоит в том, что UT может быть проще реализовать, поскольку он позволяет избежать необходимости выводить и реализовывать линеаризирующую матрицу Якоби.

Сигма-точки [ править ]

Чтобы вычислить преобразование без запаха, сначала нужно выбрать набор сигма-точек. Со времени основополагающей работы Ульмана в литературе было предложено много различных наборов сигма-точек. Подробный обзор этих вариантов можно найти в работе Menegaz et. al. [3] В общем, сигма-точки необходимы и достаточны для определения дискретного распределения, имеющего заданное среднее значение и ковариацию в измерениях. [2]

Канонический набор сигма-точек - это симметричный набор, первоначально предложенный Ульманном. Рассмотрим следующий симплекс точек в двух измерениях:

Можно проверить, что указанный выше набор точек имеет среднее значение и ковариацию (единичную матрицу). Принимая во внимание любую 2-мерное среднее и ковариации, желаемые точки сигма могут быть получены путем умножения каждой точки на матрицу квадратного корня из и добавления . Подобный канонический набор сигма-точек может быть сгенерирован в любом количестве измерений, если взять нулевой вектор и точки, составляющие строки единичной матрицы, вычислить среднее значение набора точек, вычесть среднее значение из каждой точки, чтобы полученный результат set имеет нулевое среднее значение, затем вычисляется ковариация набора точек с нулевым средним и применяется его обратное значение к каждой точке, так что ковариация набора будет равна единице.

Ульманн показал, что можно удобно сгенерировать симметричный набор сигма-точек из столбцов и нулевого вектора, где - заданная ковариационная матрица, без необходимости вычислять обратную матрицу. Он эффективен в вычислительном отношении и, поскольку точки образуют симметричное распределение, улавливает третий центральный момент (перекос) всякий раз, когда основное распределение оценки состояния известно или может считаться симметричным. [2] Он также показал, что веса, в том числе отрицательные, могут использоваться для воздействия на статистику набора. Жюлье также разработал и изучил методы генерации сигма-точек для фиксации третьего момента (перекоса) произвольного распределения и четвертого момента (эксцесса) симметричного распределения.[4] [5]

Пример [ править ]

Преобразование без запаха определяется для применения данной функции к любой частичной характеристике неизвестного в противном случае распределения, но его наиболее часто используют для случая, когда задаются только среднее значение и ковариация. Типичным примером является преобразование из одной системы координат в другую, например, из декартовой системы координат в полярные координаты. [4]

Предположим, что двумерное среднее и ковариационная оценка задаются в декартовых координатах с:

а функция преобразования в полярные координаты :

Умножение каждой из канонических симплексных сигма-точек (указанных выше) на и сложение среднего , дает:

Применение функции преобразования к каждой из вышеперечисленных точек дает:

Среднее значение этих трех преобразованных точек является оценкой UT среднего в полярных координатах:

Оценка ковариации UT:

где каждый квадрат суммы является векторным внешним произведением. Это дает:

Это можно сравнить с линеаризованным средним и ковариацией:

Абсолютная разница между UT и линеаризованными оценками в этом случае относительно невелика, но в приложениях фильтрации совокупный эффект небольших ошибок может привести к неустранимому расхождению оценки. Влияние ошибок усугубляется, когда ковариация недооценивается, потому что это приводит к чрезмерной уверенности фильтра в точности среднего. В приведенном выше примере можно увидеть, что линеаризованная оценка ковариации меньше, чем оценка UT, предполагая, что линеаризация, вероятно, привела к недооценке фактической ошибки ее среднего значения.

В этом примере нет способа определить абсолютную точность UT и линеаризованных оценок без наземной истины в форме фактического распределения вероятностей, связанного с исходной оценкой, а также среднего и ковариации этого распределения после применения нелинейного преобразования (например, , как определено аналитически или посредством численного интегрирования). Такой анализ был выполнен для преобразований координат в предположении гауссовости для лежащих в основе распределений, и оценки UT имеют тенденцию быть значительно более точными, чем оценки, полученные из линеаризации. [6] [7]

Эмпирический анализ показал, что использование минимального симплексного набора сигма-точек значительно менее точно, чем использование симметричного набора точек, когда основное распределение является гауссовым. [7] Это говорит о том, что использование симплексного набора в приведенном выше примере не будет лучшим выбором, если базовое распределение, связанное с, является симметричным. Даже если базовое распределение не является симметричным, симплексный набор все равно будет менее точным, чем симметричный набор, потому что асимметрия симплексного набора не соответствует асимметрии фактического распределения.

Возвращаясь к примеру, минимальный симметричный набор сигма-точек может быть получен из ковариационной матрицы просто как средний вектор, плюс и минус столбцы :

Эта конструкция гарантирует, что среднее значение и ковариация вышеупомянутых четырех сигма-точек равны , что поддается непосредственной проверке. Применение нелинейной функции к каждой из сигма-точек дает:

Среднее значение этих четырех преобразованных сигма-точек является оценкой UT среднего в полярных координатах:

Оценка ковариации UT:

где каждый квадрат суммы является векторным внешним произведением. Это дает:

Разница между оценками UT и линеаризованного среднего дает меру влияния нелинейности преобразования. Когда преобразование является линейным, например, UT и линеаризованные оценки будут идентичными. Это мотивирует использование квадрата этой разницы для добавления к ковариации UT для защиты от недооценки фактической ошибки среднего. Этот подход не улучшает точность среднего, но может значительно повысить точность фильтра с течением времени за счет снижения вероятности недооценки ковариации. [2]

Оптимальность трансформации без запаха [ править ]

Ульманн отметил, что, учитывая только среднее значение и ковариацию иначе неизвестного распределения вероятностей, проблема преобразования не определена, поскольку существует бесконечное количество возможных основных распределений с одинаковыми первыми двумя моментами. Без какой-либо априорной информации или предположений о характеристиках основного распределения любой выбор распределения, используемый для вычисления преобразованного среднего и ковариации, является таким же разумным, как и любой другой. Другими словами, не существует выбора распределения с заданным средним значением и ковариацией, превосходящим то, которое обеспечивается набором сигма-точек, поэтому преобразование без запаха является тривиально оптимальным.

Это общее заявление об оптимальности, конечно, бесполезно для каких-либо количественных заявлений о производительности UT, например, по сравнению с линеаризацией; следовательно, он, Жюлье и другие выполнили анализ при различных предположениях о характеристиках распределения и / или форме функции нелинейного преобразования. Например, если функция является дифференцируемой, что важно для линеаризации, эти анализы подтверждают ожидаемое и подтвержденное эмпирически превосходство преобразования без запаха. [6] [7]

Приложения [ править ]

Преобразование без запаха можно использовать для разработки нелинейного обобщения фильтра Калмана, известного как фильтр Калмана без запаха (UKF) . Этот фильтр в значительной степени заменил EKF во многих приложениях нелинейной фильтрации и управления, в том числе для подводной [8] наземной и воздушной навигации [9] и космических аппаратов. [10] Преобразование без запаха также использовалось в качестве вычислительной основы для оптимального управления Римана-Стилтьеса. [11] Этот вычислительный подход известен как оптимальное управление без запаха . [12] [13]

Фильтр Калмана без запаха [ править ]

Ульманн и Саймон Джулиер опубликовали несколько статей, показывающих, что использование преобразования без запаха в фильтре Калмана , называемом фильтром Калмана без запаха (UKF), обеспечивает значительное улучшение производительности по сравнению с EKF в различных приложениях. [14] [4] [6] Джулиер и Ульманн опубликовали статьи, в которых использовалась конкретная параметризованная форма преобразования без запаха в контексте UKF, в котором для сбора предполагаемой информации о распределении использовались отрицательные веса. [14] [6]Эта форма UT подвержена множеству численных ошибок, которые не допускаются в исходных формулировках (симметричный набор, первоначально предложенный Ульманном). Впоследствии Жюлье описал параметризованные формы, которые не используют отрицательные веса и также не подвержены этим проблемам. [15]

См. Также [ править ]

  • Фильтр Калмана
  • Ковариация пересечения
  • Ансамблевый фильтр Калмана
  • Расширенный фильтр Калмана
  • Нелинейный фильтр
  • Оптимальный контроль без запаха

Ссылки [ править ]

  1. ^ «Из первых рук: Преобразование без запаха - Вики по истории инженерии и технологий» .
  2. ^ a b c d Ульманн, Джеффри (1995). Построение и локализация динамической карты: новые теоретические основы (кандидатская диссертация). Оксфордский университет.
  3. ^ Менегаз, Энрике MT; Жоао, Й. Исихара; Borges, Geovany A .; Варгас, Алессандро Н. (16 февраля 2015 г.). "Систематизация теории фильтра Кальмана без запаха". IEEE Transactions по автоматическому контролю . 60 (10): 2583–2598. DOI : 10.1109 / TAC.2015.2404511 . ЛВП : 20.500.11824 / 251 . S2CID 12606055 . 
  4. ^ a b c Julier, S .; Дж. Ульманн (1997). «Последовательный метод без смещения для преобразования между полярными и декартовыми системами координат». Материалы конференции SPIE 1997 г. по сбору, отслеживанию и наведению . 3086 . ШПИОН.
  5. ^ Julier, Саймон (1998). «Искаженный подход к фильтрации». Материалы 12-го Междунар. Symp. На аэрокосмическом / оборонном зондировании, моделировании и управлении . 3373 . ШПИОН.
  6. ^ a b c d Жюльер, Саймон; Ульманн, Джеффри (2000). «Новый метод нелинейного преобразования средних и ковариаций в нелинейных фильтрах». IEEE Transactions по автоматическому контролю . 45 (3): 477–482. DOI : 10.1109 / 9.847726 .
  7. ^ a b c Zhang, W .; М. Лю; З. Чжао (2009). «Анализ точности бесценной трансформации нескольких стратегий выборки». Proc. 10-го Междунар. Конф. по программной инженерии, искусственному интеллекту, сетям и параллельным / распределенным вычислениям . ACIS.
  8. ^ Wu, L .; J. Ma; Дж. Тиан (2010). "Самоадаптивная фильтрация Калмана без запаха для подводной навигации с помощью гравитации". Proc. планов IEEE / ION .
  9. ^ Эль-Шейми, N; Шин, EH; Ню, X (2006). "Противодействие фильтру Калмана: расширенные фильтры Калмана по сравнению с фильтрами Калмана без запаха для интегрированного инерционного GPS и MEMS". Внутри GNSS: инженерные решения для сообщества глобальных навигационных спутниковых систем . 1 (2).
  10. ^ Crassidis, J .; Маркли, Ф. (2003). «Фильтрация без запаха для оценки положения космического корабля». Журнал наведения, управления и динамики . 26 (4): 536–542. Bibcode : 2003JGCD ... 26..536C . DOI : 10.2514 / 2.5102 .
  11. ^ Росс, И. Майкл; Proulx, Ronald J .; Карпенко, Марк; Гун, Ци (июль 2015 г.). «Задачи оптимального управления Римана – Стилтьеса для неопределенных динамических систем» . Журнал наведения, управления и динамики . 38 (7): 1251–1263. Bibcode : 2015JGCD ... 38.1251R . DOI : 10.2514 / 1.G000505 .
  12. IM Ross, RJ Proulx и M. Karpenko, «Оптимальное управление без запаха для космического полета», Труды 24-го Международного симпозиума по динамике космического полета (ISSFD) , 5–9 мая 2014 г., Laurel, MD. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpenko.pdf
  13. ^ Росс, И. Майкл; Proulx, Ronald J .; Карпенко, Марк (июль 2015). «Руководство без запаха». Американская конференция по контролю 2015 г. (ACC) . С. 5605–5610. DOI : 10,1109 / ACC.2015.7172217 . ISBN 978-1-4799-8684-2. S2CID  28136418 .
  14. ^ a b Julier, S .; Дж. Ульманн (1997). «Новое расширение фильтра Калмана на нелинейные системы». Труды конференции SPIE 1997 г. по обработке сигналов, слиянию датчиков и распознаванию целей . 3068 .
  15. ^ Julier, Саймон (2002). «Масштабная трансформация без запаха». Труды Американской конференции по контролю . 6 . IEEE.