Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В математике , то Вассерстины расстояние или метрика Канторович-Рубинштейн является функцией расстояния , определенной между вероятностными распределениями на заданном метрическом пространстве .

Интуитивно, если каждое распределение рассматривать как единицу количества насыпанной земли (грунта) , метрика представляет собой минимальную «стоимость» превращения одной сваи в другую, которая, как предполагается, представляет собой количество земли, которое необходимо переместить раз. среднее расстояние, на которое он должен быть перемещен. Из-за этой аналогии метрика известна в информатике как расстояние движителя земли .

Название «расстояние Вассерштейна» было придумано Р.Л. Добрушиным в 1970 году в честь русского математика Леонида Васерштейна, который представил это понятие в 1969 году. В большинстве англоязычных публикаций используется немецкое написание «Wasserstein» (приписывается немецкому названию «Vaseršteĭn»). источник).

Определение [ править ]

Позвольте быть метрическим пространством, для которого каждая вероятностная мера на является мерой Радона (так называемое пространство Радона ). Для , пусть обозначает совокупность всех вероятностных мер на с конечным моментом . Тогда существует некоторые в таких , что:

Расстояние Вассерштейна между двумя вероятностными мерами и in определяется как

где обозначает совокупность всех мер по с маргинальными и на первые и вторые факторах соответственно. (Множество также называется множество всех соединений из и .)

Вышеуказанное расстояние обычно обозначается (обычно среди авторов, предпочитающих написание «Вассерштейн») или (как правило, среди авторов, предпочитающих написание «Васерштейн»). В оставшейся части статьи будут использоваться обозначения.

Метрика Вассерштейна может быть эквивалентно определена следующим образом:

где обозначает ожидаемую величину в виде случайной величины , а нижняя грань берется по всем совместным распределениям случайных величин и с маргинальными и соответственно.

Интуиция и подключение к оптимальному транспорту [ править ]

Два одномерных распределения и , нанесенные на оси x и y, и одно возможное совместное распределение, которое определяет транспортный план между ними. Совместный план распределения / транспортировки не уникален

Один из способов понять мотивацию приведенного выше определения - рассмотреть оптимальную транспортную задачу . То есть для распределения массы в пространстве мы хотим транспортировать массу таким образом, чтобы она преобразовывалась в распределение в том же пространстве; превращая «груду земли» в груду . Эта проблема имеет смысл только в том случае, если создаваемая свая имеет ту же массу, что и перемещаемая свая; поэтому без ограничения общности предположим, что и - распределения вероятностей, содержащие общую массу 1. Предположим также, что задана некоторая функция стоимости.

что дает стоимость транспортировки единицы массы от точки к точке . Транспортный план переезда в может быть описана функцией , которая дает величину массы , чтобы перейти от к . Вы можете представить себе задачу как необходимость переместить груду земли определенной формы в отверстие в земле такой формы , чтобы в конце и куча земли, и отверстие в земле полностью исчезли. Чтобы этот план был значимым, он должен удовлетворять следующим свойствам

То есть общая масса, перемещенная из бесконечно малой области вокруг, должна быть равна, а общая масса, перемещенная в область вокруг, должна быть равна . Это эквивалентно требованию, представлять собой совместное распределение вероятностей с маргинальными и . Таким образом, бесконечно малая масса транспортируется из в это , а стоимость перемещения является , после определения функции затрат. Таким образом, общая стоимость транспортного плана составляет

План не уникален; Оптимальный транспортный план - это план с минимальной стоимостью из всех возможных транспортных планов. Как уже упоминалось, требование плана действительным является то , что это совместное распределение с маргинальными и ; позволяя обозначать множество всех таких мер , как и в первой части, стоимость плана оптимальной является

Если стоимость перемещения - это просто расстояние между двумя точками, тогда оптимальная стоимость идентична определению расстояния.

Примеры [ править ]

Точечные массы (вырожденные распределения) [ править ]

Позвольте и быть два вырожденных распределения (т. Е. Дельта-распределения Дирака ), расположенные в точках и в . Есть только одна возможная связь этих двух мер, а именно точечная масса, расположенная в . Таким образом, используя обычную функцию абсолютного значения в качестве функции расстояния для любого , расстояние -Вассерштейна между и равно

По аналогичным соображениям, если и - точечные массы, расположенные в точках и в , и мы используем обычную евклидову норму на в качестве функции расстояния, то

Нормальные распределения [ править ]

Позвольте и быть двумя невырожденными гауссовскими мерами (т.е. нормальными распределениями ) на , с соответствующими ожидаемыми значениями и и симметричными положительными полуопределенными ковариационными матрицами и . Тогда [1] относительно обычной евклидовой нормы на 2-расстояние Вассерштейна между и равно

Этот результат обобщает предыдущий пример расстояния Вассерштейна между двумя точечными массами (по крайней мере, в данном случае ), поскольку точечную массу можно рассматривать как нормальное распределение с ковариационной матрицей, равной нулю, и в этом случае следовой член исчезает, и только термин, включающий евклидово расстояние между средствами, остается.

Приложения [ править ]

Метрика Вассерштейна - это естественный способ сравнить распределения вероятностей двух переменных X и Y , где одна переменная выводится из другой посредством небольших неоднородных возмущений (случайных или детерминированных).

В компьютерной науке, например, метрика W - широко используется для сравнения дискретных распределений, например , в цветовых гистограммах двух цифровых изображений ; см . расстояние землечерпалки для получения более подробной информации.

В своей статье «Вассерштейн ГАН» Арджовский и др. [2] используют метрику Вассерштейна-1 как способ улучшить исходную структуру Generative Adversarial Networks (GAN), чтобы уменьшить исчезающий градиент и проблемы коллапса режима.

Метрика Вассерштейна имеет формальную связь с анализом Прокруста в применении к мерам хиральности [3] и анализу формы. [4]

Свойства [ править ]

Метрическая структура [ править ]

Можно показать , что W р удовлетворяет все аксиомы матрицы А метрики на Р р ( М ). Более того, сходимость по W p эквивалентна обычной слабой сходимости мер плюс сходимость первых p -х моментов. [5]

Двойное представление W 1 [ править ]

- Следующее двойственное представление W 1 является частным случаем теоремы двойственности Канторовича и Рубинштейна (1958): когда μ и ν имеют ограниченный носитель ,

где Lip ( f ) обозначает минимальную константу Липшица для f .

Сравните это с определением метрики Радона :

Если метрика d ограничена некоторой константой C , то

и поэтому сходимость в метрике Радона (идентичная сходимости с полной вариацией, когда M - польское пространство ) подразумевает сходимость в метрике Вассерштейна, но не наоборот.

Эквивалентность W 2 и соболевской норме отрицательного порядка [ править ]

При подходящих предположениях расстояние Вассерштейна второго порядка липшицево эквивалентно однородной соболевской норме отрицательного порядка . [6] Более точно, если мы возьмем , чтобы быть подключен римановом многообразия оснащен положительной мерой , то мы можем определить для полунормя

а для знаковой меры по двойственной норме

Тогда любые две вероятностные меры и на удовлетворяют верхней оценке

В другом направлении, если и каждый имеет плотности по отношению к стандартной мере объема на , которые оба ограничены выше некоторого , и имеют неотрицательную кривизну Риччи , то

Разделимость и полнота [ править ]

Для любого p ≥ 1 метрическое пространство ( P p ( M ), W p ) сепарабельно и полно, если ( M , d ) сепарабельно и полно. [7]

См. Также [ править ]

  • Метрика Леви
  • Метрика Леви – Прохорова
  • Общее расстояние вариации вероятностных мер
  • Теория транспорта
  • Дистанция движителя земли

Ссылки [ править ]

  1. ^ Olkin, И. и Pukelsheim, F. (1982). «Расстояние между двумя случайными векторами с заданными матрицами дисперсии» . Линейная алгебра Appl . 48 : 257–263. DOI : 10.1016 / 0024-3795 (82) 90112-4 . ISSN  0024-3795 .CS1 maint: multiple names: authors list (link)
  2. ^ Arjovski (2017). "Генеративные состязательные сети Вассерштейна". ICML .
  3. ^ Petitjean, М. (2002). «Хиральные смеси» (PDF) . Журнал математической физики . 43 (8): 4147–4157. DOI : 10.1063 / 1.1484559 .
  4. ^ Petitjean, М. (2004). «От подобия формы к дополнительности форм: к теории стыковки». Журнал математической химии . 35 (3): 147–158. DOI : 10,1023 / Б: JOMC.0000033252.59423.6b . S2CID 121320315 . 
  5. ^ Климент, Филипп; Деш, Вольфганг (2008). «Элементарное доказательство неравенства треугольника для метрики Вассерштейна» . Труды Американского математического общества . 136 (1): 333–339. DOI : 10.1090 / S0002-9939-07-09020-X .
  6. ^ Пейр, Реми (2018). «Сравнение между расстоянием W 2 и нормой −1 и локализация расстояния Вассерштейна» . ESAIM Control Optim. Расчет. Вар . 24 (4): 1489–1501. DOI : 10.1051 / cocv / 2017050 . ISSN 1292-8119 .  (См. Теоремы 2.1 и 2.5.)
  7. Богачев В.И.; Колесников, А.В. (2012). «Проблема Монжа – Канторовича: достижения, связи, перспективы». Русская математика. Обзоры . 67 (5): 785–890. DOI : 10.1070 / RM2012v067n05ABEH004808 .
  • Виллани, Седрик (2008). Оптимальный транспорт, старый и новый . Springer. ISBN 978-3-540-71050-9.
  • Амбросио, Л., Джильи, Н. и Саваре, Г. (2005). Градиентные потоки в метрических пространствах и в пространстве вероятностных мер . Базель: ETH Zürich, Birkhäuser Verlag. ISBN 3-7643-2428-7.CS1 maint: multiple names: authors list (link)
  • Джордан, Ричард; Киндерлерер, Дэвид; Отто, Феликс (1998). «Вариационная формулировка уравнения Фоккера – Планка». SIAM J. Math. Анальный . 29 (1): 1–17 (в электронном виде). CiteSeerX  10.1.1.6.8815 . DOI : 10.1137 / S0036141096303359 . ISSN  0036-1410 . Руководство по ремонту  1617171 .
  • Рюшендорф, Л. (2001) [1994], "Метрика Вассерштейна" , Энциклопедия математики , EMS Press

Внешние ссылки [ править ]

  • «Каковы преимущества метрики Вассерштейна по сравнению с расхождением Кульбака – Лейблера?» . Обмен стеками . 1 августа 2017 года.