Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску


В теории вероятностей , ƒ -расходимость является функция Д е  ( Р   ||  Q ) , что измеряет разность между двумя распределениями вероятностей P и Q . Это помогает интуиции думать о расхождении как о среднем, взвешенном по функции f , отношения шансов, заданном P и Q [ необходима цитата ] .

Эти расходимости были введены Альфредом Реньи [1] в той же статье, где он ввел хорошо известную энтропию Реньи . Он доказал, что эти расходимости уменьшаются в марковских процессах . F были изучены -divergences далее независимо друг от друга Csiszár (1963) , Моримото (1963) и Ali & Силвей (1966) , и иногда известны как Csiszár ƒ -divergences, Csiszár-Моримото дивергенции или Али-Силвей расстояния.

Определение [ править ]

Пусть P и Q две вероятностные распределения над пространством Q , такой , что P является абсолютно непрерывна относительно Q . Тогда для выпуклой функции f такой, что f (1) = 0, f -расходимость P от Q определяется как

Если P и Q абсолютно непрерывны относительно эталонного распределения μ на Ω, то их плотности вероятности p и q удовлетворяют условиям dP = p dμ и dQ = q dμ . В этом случае f -расходимость можно записать как

F-расходимости можно выразить с помощью ряда Тейлора и переписать с использованием взвешенной суммы расстояний типа хи ( Nielsen & Nock (2013) ).

Примеры f -расходов [ править ]

Многие обычные расходимости, такие как KL-дивергенция , Hellinger расстояние , и общее расстояние вариации , являются частными случаями ф -дивергенции, совпадающие с конкретным выбором е . В следующей таблице перечислены многие общие расхождения между распределениями вероятностей и функцией f, которой они соответствуют (см. Liese & Vajda (2006) ).

Функция определена с точностью до слагаемого , где - любая постоянная.

Свойства [ править ]

  • Неотрицательность : ƒ -расхождение всегда положительно; он равен нулю тогда и только тогда, когда меры P и Q совпадают. Это сразу следует из неравенства Дженсена :
  • Монотонность : если κ - произвольная вероятность перехода, которая преобразует меры P и Q в P κ и Q κ соответственно, то
    Равенство здесь выполняется тогда и только тогда, когда переход индуцируется достаточной статистикой относительно { P , Q }.
  • Совместная выпуклость : для любого 0 ≤ λ ≤ 1
    Это следует из выпуклости отображения на .

В частности, монотонность означает, что если марковский процесс имеет положительное равновесное распределение вероятностей, то это монотонная (невозрастающая) функция времени, где распределение вероятностей является решением прямых уравнений Колмогорова (или главного уравнения ), используемых для описывают временную эволюцию распределения вероятностей в марковском процессе. Это означает, что все f- расходимости являются функциями Ляпунова прямых уравнений Колмогорова. Верно и обратное утверждение: если - функция Ляпунова для всех цепей Маркова с положительным равновесием и имеет форму следа ( ), то, для некоторой выпуклой функции f . [2] [3] Например, расходимости Брегмана вообще не обладают таким свойством и могут увеличиваться в марковских процессах. [4]

См. Также [ править ]

  • Дивергенция Кульбака – Лейблера.
  • Дивергенция Брегмана

Ссылки [ править ]

  1. ^ Рение, Alfréd (1961). О мерах энтропии и информации (PDF) . 4-й симпозиум по математике, статистике и теории вероятностей в Беркли, 1960. Беркли, Калифорния: Калифорнийский университет Press. С. 547–561.Уравнение (4.20)
  2. Горбань, Павел А. (15 октября 2003 г.). «Монотонно эквивалентные энтропии и решение уравнения аддитивности». Physica . 328 (3–4): 380–390. arXiv : cond-mat / 0304131 . DOI : 10.1016 / S0378-4371 (03) 00578-8 .
  3. ^ Amari, Shun'ichi (2009). Люнг, CS; Ли, М .; Чан, JH (ред.). Дивергенция, Оптимизация, Геометрия . 16-я Международная конференция по обработке нейронной информации (ICONIP 20009), Бангкок, Таиланд, 1-5 декабря 2009 г. Конспект лекций по информатике, том 5863. Берлин, Гейдельберг: Springer. С. 185–193. DOI : 10.1007 / 978-3-642-10677-4_21 .
  4. Горбань, Александр Н. (29 апреля 2014 г.). «Общая H-теорема и энтропии, нарушающие второй закон». Энтропия . 16 (5): 2408–2432. arXiv : 1212,6767 . DOI : 10.3390 / e16052408 .
  • Цисар, И. (1963). "Eine informationstheoretische Ungleichung und ihre Anwendung auf den Beweis der Ergodizitat von Markoffschen Ketten". Мадьяр. Туд. Акад. Мат. Kutato Int. Козл . 8 : 85–108.
  • Моримото, Т. (1963). «Марковские процессы и H-теорема». J. Phys. Soc. Jpn . 18 (3): 328–331. Bibcode : 1963JPSJ ... 18..328M . DOI : 10,1143 / JPSJ.18.328 .
  • Али, С.М.; Сильви, SD (1966). «Общий класс коэффициентов отклонения одного распределения от другого». Журнал Королевского статистического общества , Series B . 28 (1): 131–142. JSTOR  2984279 . MR  0196777 .
  • Цисар, И. (1967). «Информационные меры различия распределений вероятностей и косвенного наблюдения». Studia Scientiarum Mathematicarum Hungarica . 2 : 229–318.
  • Csiszár, I .; Шилдс, П. (2004). «Теория информации и статистика: Учебное пособие» (PDF) . Основы и тенденции в теории коммуникации и информации . 1 (4): 417–528. DOI : 10.1561 / 0100000004 . Проверено 8 апреля 2009 .
  • Liese, F .; Вайда, И. (2006). «О расхождениях и сведениях в статистике и теории информации». IEEE Transactions по теории информации . 52 (10): 4394–4412. DOI : 10.1109 / TIT.2006.881731 .
  • Nielsen, F .; Нок, Р. (2013). «О хи-квадрате и расстояниях Хи более высокого порядка для аппроксимации f-расходимостей». Письма об обработке сигналов IEEE . 21 : 10–13. arXiv : 1309.3029 . Bibcode : 2014ISPL ... 21 ... 10N . DOI : 10,1109 / LSP.2013.2288355 .
  • Coeurjolly, JF .; Друйе, Р. (2006). «Нормализованные информационные расхождения». arXiv : math / 0604246 .