Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Распространение убеждений , также известное как передача сообщений суммы-произведения , представляет собой алгоритм передачи сообщений для выполнения логических выводов на графических моделях , таких как байесовские сети и марковские случайные поля . Он вычисляет предельное распределение для каждого ненаблюдаемого узла (или переменной), обусловленного любыми наблюдаемыми узлами (или переменными). Распространение убеждений обычно используется в искусственном интеллекте и теории информации и продемонстрировало эмпирический успех во многих приложениях, включая коды с низкой плотностью проверки четности , турбокоды и т. Д.приближение свободной энергии и выполнимость . [1]

Алгоритм был впервые предложен Джудеей Перлом в 1982 г. [2], который сформулировал его как алгоритм точного вывода на деревьях , который позже был расширен на многодеревья . [3] Хотя он не является точным для общих графиков, было показано, что это полезный приближенный алгоритм. [4]

Если X = { X i } представляет собой набор дискретных случайных величин с совместной функцией масс p , предельное распределение одного X i представляет собой просто суммирование p по всем другим переменным:

Однако это быстро становится недопустимым с точки зрения вычислений: если имеется 100 двоичных переменных, то необходимо суммировать более 2 99  ≈ 6,338 × 10 29 возможных значений. Используя структуру многодерева, распространение убеждений позволяет гораздо более эффективно вычислять маргинальные значения.

Описание алгоритма сумм-произведений [ править ]

Варианты алгоритма распространения убеждений существуют для нескольких типов графических моделей (в частности, для байесовских сетей и марковских случайных полей [5] ). Мы описываем здесь вариант, который работает на факторном графе . Факторный граф - это двудольный граф, содержащий узлы, соответствующие переменным V и факторам F , с ребрами между переменными и факторами, в которых они появляются. Мы можем записать совместную функцию масс:

где x a - вектор соседних переменных узлов к факторному узлу a . Любую байесовскую сеть или марковское случайное поле можно представить в виде факторного графа, используя коэффициент для каждого узла с его родителями или коэффициент для каждого узла с его окрестностями соответственно. [6]

Алгоритм работает, передавая функции с действительным знаком, называемые сообщениями, вместе с ребрами между скрытыми узлами. Точнее, если v - переменный узел, а a - факторный узел, связанный с v в факторном графе, сообщения от v к a (обозначены ) и от a к v ( ) являются действительными функциями, область определения которых Dom ( v ), набор значений, которые может принимать случайная величина, связанная с v. Эти сообщения содержат «влияние», которое одна переменная оказывает на другую. Сообщения вычисляются по-разному в зависимости от того, является ли узел, получающий сообщение, узлом переменной или узлом фактора. Сохраняя те же обозначения:

  • Сообщение от переменного узла v к факторному узлу a является продуктом сообщений от всех других соседних факторных узлов (кроме получателя; в качестве альтернативы можно сказать, что получатель отправляет как сообщение постоянную функцию, равную «1»):
где N ( v ) - множество соседних (факторных) узлов к v . Если пусто, то устанавливается равномерное распределение.
  • Сообщение от узла фактора a к узлу переменной v является произведением фактора с сообщениями от всех других узлов, маргинальными по всем переменным, кроме той, которая связана с v :
где N ( a ) - множество соседних (переменных) узлов к a . Если пусто, то , поскольку в этом случае .

Как показывает предыдущая формула: полная маргинализация сводится к сумме произведений более простых условий, чем те, которые фигурируют в полном совместном распределении. По этой причине он называется алгоритмом сумм-произведений.

При обычном запуске каждое сообщение будет обновляться итеративно из предыдущего значения соседних сообщений. Для обновления сообщений можно использовать различное расписание. В случае, когда графическая модель представляет собой дерево, оптимальное планирование позволяет достичь сходимости после вычисления каждого сообщения только один раз (см. Следующий подраздел). Когда факторный граф имеет циклы, такого оптимального расписания не существует, и типичный выбор - обновлять все сообщения одновременно на каждой итерации.

После сходимости (если сходимость произошла) предполагаемое маржинальное распределение каждого узла пропорционально произведению всех сообщений от смежных факторов (без учета константы нормализации):

Точно так же предполагаемое совместное предельное распределение набора переменных, принадлежащих одному фактору, пропорционально произведению фактора и сообщений от переменных:

В случае, когда фактор-граф является ациклическим (т.е. является деревом или лесом), эти оцененные маргиналы фактически сходятся к истинным маргиналам за конечное число итераций. Это можно показать с помощью математической индукции .

Точный алгоритм для деревьев [ править ]

В случае, когда факторный граф является деревом , алгоритм распространения убеждений вычислит точные маргиналы. Кроме того, при правильном планировании обновлений сообщения оно прекратится после 2 шагов. Это оптимальное расписание можно описать следующим образом:

Перед началом работы граф ориентируется путем обозначения одного узла в качестве корня ; любой некорневой узел, который связан только с одним другим узлом, называется листом .

На первом этапе сообщения передаются внутрь: начиная с листьев, каждый узел передает сообщение вдоль (уникального) края к корневому узлу. Древовидная структура гарантирует, что можно получить сообщения от всех других смежных узлов до передачи сообщения. Это продолжается до тех пор, пока корень не получит сообщения от всех своих соседних узлов.

Второй шаг включает передачу сообщений обратно: начиная с корня, сообщения передаются в обратном направлении. Алгоритм завершается, когда все листья получили свои сообщения.

Примерный алгоритм построения общих графиков [ править ]

Любопытно, что хотя изначально он был разработан для ациклических графических моделей, было обнаружено, что алгоритм распространения веры может использоваться в общих графах . Затем алгоритм иногда называют зацикленным распространением убеждений , потому что графы обычно содержат циклы., или петли. Инициализация и планирование обновлений сообщений должны быть немного скорректированы (по сравнению с ранее описанным расписанием для ациклических графов), потому что графы могут не содержать листьев. Вместо этого каждый инициализирует все сообщения переменных в 1 и использует те же определения сообщений, что и выше, обновляя все сообщения на каждой итерации (хотя сообщения, поступающие из известных листьев или подграфов с древовидной структурой, могут больше не нуждаться в обновлении после достаточного количества итераций). Легко показать, что в дереве определения сообщений этой модифицированной процедуры сходятся к набору определений сообщений, приведенных выше, в течение количества итераций, равных диаметру дерева.

Точные условия, при которых будет сходиться неуместное распространение убеждений, все еще не совсем понятны; известно, что на графах, содержащих один цикл, он в большинстве случаев сходится, но полученные вероятности могут быть неверными. [7] Существует несколько достаточных (но не необходимых) условий для сходимости зацикленного распространения убеждений к единственной фиксированной точке. [8] Существуют графы, которые не могут сойтись или которые будут колебаться между несколькими состояниями при повторении итераций. Такие методы, как диаграммы EXIT, могут обеспечить приблизительную визуализацию прогресса распространения убеждений и приблизительный тест на сходимость.

Существуют и другие приближенные методы маргинализации, включая вариационные методы и методы Монте-Карло .

Один из методов точной маргинализации в общих графах называется алгоритмом дерева соединений , который представляет собой простое распространение убеждений на модифицированном графе, который, как гарантируют, является деревом. Основная предпосылка состоит в том, чтобы исключить циклы путем их кластеризации в отдельные узлы.

Связанные вопросы алгоритма и сложности [ править ]

Подобный алгоритм обычно называют алгоритмом Витерби , но также известен как частный случай алгоритма максимального произведения или минимальной суммы, который решает связанную проблему максимизации или наиболее вероятного объяснения. Вместо попытки решить маргинальное значение здесь цель состоит в том, чтобы найти значения, которые максимизируют глобальную функцию (т.е. наиболее вероятные значения в вероятностной настройке), и это может быть определено с помощью arg max :

Алгоритм, который решает эту проблему, почти идентичен распространению убеждений, с суммами, замененными максимумами в определениях. [9]

Стоит отметить, что задачи вывода, такие как маргинализация и максимизация, NP-сложно решить точно и приблизительно (по крайней мере, для относительной ошибки ) в графической модели. Точнее, проблема маргинализации, определенная выше, является # P-полной, а максимизация NP-полной .

Использование памяти для распространения убеждений может быть уменьшено за счет использования алгоритма Island (с небольшими затратами по времени).

Отношение к свободной энергии [ править ]

Алгоритм сумм-произведений связан с расчетом свободной энергии в термодинамике . Пусть Z - статистическая сумма . Распределение вероятностей

(согласно представлению факторного графа) можно рассматривать как меру внутренней энергии, присутствующей в системе, вычисляемой как

Тогда свободная энергия системы равна

Затем можно показать, что точки сходимости алгоритма суммы-произведения представляют собой точки, в которых свободная энергия в такой системе минимизирована. Точно так же можно показать, что фиксированная точка итеративного алгоритма распространения уверенности в графах с циклами является стационарной точкой приближения свободной энергии. [10]

Распространение обобщенных убеждений (GBP) [ править ]

Алгоритмы распространения убеждений обычно представляются в виде уравнений обновления сообщений на факторном графе, включая сообщения между переменными узлами и их соседними факторными узлами и наоборот. Рассмотрение сообщений между регионами в графе - это один из способов обобщения алгоритма распространения убеждений. [10] Существует несколько способов определения набора регионов в графе, которые могут обмениваться сообщениями. Один метод использует идеи, представленные Кикучи в физической литературе [11] [12] [13], и известен как метод кластерной вариации Кикучи . [14]

Улучшения в производительности алгоритмов распространения убеждений также достижимы путем нарушения симметрии реплик в распределении полей (сообщений). Это обобщение приводит к новому виду алгоритма, называемому распространением обзора (SP), который оказался очень эффективным в NP-полных задачах, таких как выполнимость [1] и раскраска графов .

Кластерный вариационный метод и алгоритмы распространения опроса - это два разных улучшения распространения убеждений. Название обобщенное распространение обзора (GSP) ожидает присвоения алгоритму, объединяющему оба обобщения.

Распространение веры по Гауссу (GaBP) [ править ]

Распространение веры по Гауссу - это вариант алгоритма распространения веры, когда базовые распределения являются гауссовыми . Первой работой, посвященной анализу этой специальной модели, была основополагающая работа Вайсса и Фримена. [15]

Алгоритм GaBP решает следующую проблему маргинализации:

где Z - нормировочная константа, A - симметричная положительно определенная матрица ( матрица обратной ковариации, также известная как матрица точности), а b - вектор сдвига.

Эквивалентно можно показать, что с использованием гауссовой модели решение проблемы маргинализации эквивалентно задаче назначения MAP :

Эта задача также эквивалентна следующей задаче минимизации квадратичной формы:

Что также эквивалентно линейной системе уравнений

Сходимость алгоритма GaBP легче анализировать (по сравнению с общим случаем BP), и есть два известных достаточных условия сходимости. Первый был сформулирован Weiss et al. в 2000 году, когда информационная матрица A доминирует по диагонали . Второе условие сходимости сформулировано Johnson et al. [16] в 2006 г., когда спектральный радиус матрицы

где D = diag ( A ). Позже Су и Ву установили необходимые и достаточные условия сходимости для синхронного GaBP и затухающего GaBP, а также другое достаточное условие сходимости для асинхронного GaBP. Для каждого случая условие сходимости включает проверку 1) непустого множества (определяемого A), 2) спектрального радиуса определенной матрицы меньше единицы и 3) проблемы сингулярности (при преобразовании сообщения BP в убеждение ) не происходит. [17]

Алгоритм GaBP был связан с областью линейной алгебры [18], и было показано, что алгоритм GaBP можно рассматривать как итерационный алгоритм для решения линейной системы уравнений Ax = b, где A - информационная матрица, а b - сдвиг. вектор. Эмпирически показано, что алгоритм GaBP сходится быстрее, чем классические итерационные методы, такие как метод Якоби, метод Гаусса – Зейделя , последовательная избыточная релаксация и другие. [19] Кроме того, показано, что алгоритм GaBP невосприимчив к численным задачам метода предварительно обусловленных сопряженных градиентов [20]

Синдромное декодирование АД [ править ]

Предыдущее описание алгоритма BP называется декодированием на основе кодового слова, которое вычисляет приблизительную предельную вероятность для данного принятого кодового слова . Существует эквивалентная форма [21], которая вычисляет , где - синдром принятого кодового слова, а - декодированная ошибка. Декодированный входной вектор равен . Это изменение только меняет интерпретацию функции масс . В явном виде сообщения

где - вероятность априорной ошибки для переменной

Этот синдромный декодер не требует информации о полученных битах, поэтому может быть адаптирован к квантовым кодам, где единственной информацией является синдром измерения.

В двоичном случае эти сообщения могут быть упрощены, чтобы вызвать экспоненциальное снижение сложности [22] [23]

Определение логарифмического отношения правдоподобия , , то

где

Отношение апостериорного логарифмического правдоподобия можно оценить как

Ссылки [ править ]

  1. ^ a b Браунштейн, А .; Mézard, M .; Zecchina, R. (2005). «Обзор распространения: алгоритм выполнимости». Случайные структуры и алгоритмы . 27 (2): 201–226. arXiv : cs / 0212002 . DOI : 10.1002 / rsa.20057 .
  2. Жемчужина, Иудея (1982). «Преподобный Байес о машинах вывода: распределенный иерархический подход» (PDF) . Труды Второй Национальной конференции по искусственному интеллекту . AAAI-82: Питтсбург, Пенсильвания . Менло-Парк, Калифорния: AAAI Press. С. 133–136 . Проверено 28 марта 2009 года .
  3. ^ Ким, Джин Х .; Жемчуг, Иудея (1983). «Вычислительная модель для комбинированных причинно-следственных и диагностических рассуждений в системах вывода» (PDF) . Материалы восьмой международной совместной конференции по искусственному интеллекту . IJCAI-83: ​​Карлсруэ, Германия . 1 . С. 190–193 . Проверено 20 марта 2016 года .
  4. Жемчужина, Иудея (1988). Вероятностное мышление в интеллектуальных системах: сети правдоподобных выводов (2-е изд.). Сан-Франциско, Калифорния: Морган Кауфманн. ISBN 978-1-55860-479-7.
  5. ^ Yedidia, JS; Фримен, WT; Ю. (январь 2003 г.). «Понимание распространения убеждений и их обобщений» . В Лакемейере, Герхард; Небель, Бернхард (ред.). Изучение искусственного интеллекта в новом тысячелетии . Морган Кауфманн. С. 239–236. ISBN 978-1-55860-811-5. Проверено 30 марта 2009 года .
  6. ^ Уэйнрайт, MJ; Иордания, Мичиган (2007). «2.1 Распределения вероятностей на графах». Графические модели, экспоненциальные семейства и вариационный вывод . Основы и тенденции в машинном обучении . 1 . С. 5–9. DOI : 10.1561 / 2200000001 .
  7. ^ Вайс, Яир (2000). «Корректность распространения локальной вероятности в графических моделях с петлями». Нейронные вычисления . 12 (1): 1–41. DOI : 10.1162 / 089976600300015880 . PMID 10636932 . 
  8. ^ Mooij, J; Каппен, Х (2007). «Достаточные условия сходимости алгоритма сумма – произведение». IEEE Transactions по теории информации . 53 (12): 4422–4437. arXiv : cs / 0504030 . DOI : 10.1109 / TIT.2007.909166 .
  9. ^ Löliger, Ханс-Андреа (2004). «Введение в факторные графы». Журнал обработки сигналов IEEE . 21 (1): 28–41. Bibcode : 2004ISPM ... 21 ... 28L . DOI : 10.1109 / msp.2004.1267047 .
  10. ^ а б Yedidia, JS; Фримен, WT; Weiss, Y .; Ю. (июль 2005 г.). «Построение приближений свободной энергии и обобщенных алгоритмов распространения убеждений» . IEEE Transactions по теории информации . 51 (7): 2282–2312. CiteSeerX 10.1.1.3.5650 . DOI : 10.1109 / TIT.2005.850085 . Проверено 28 марта 2009 года . 
  11. ^ Кикучи, Ryoichi (15 марта 1951). «Теория кооперативных явлений». Физический обзор . 81 (6): 988–1003. Bibcode : 1951PhRv ... 81..988K . DOI : 10.1103 / PhysRev.81.988 .
  12. ^ Курата, Мичио; Кикучи, Рёичи; Ватари, Тацуро (1953). "Теория кооперативных явлений. III. Подробное обсуждение метода вариации кластеров". Журнал химической физики . 21 (3): 434–448. Bibcode : 1953JChPh..21..434K . DOI : 10.1063 / 1.1698926 .
  13. Кикучи, Рёичи; Кисть, Стивен Г. (1967). «Усовершенствование метода вариации кластеров». Журнал химической физики . 47 (1): 195–203. Bibcode : 1967JChPh..47..195K . DOI : 10.1063 / 1.1711845 .
  14. ^ Pelizzola, Алессандро (2005). «Кластерный вариационный метод в статистической физике и вероятностные графические модели». Журнал физики A: математический и общий . 38 (33): R309 – R339. arXiv : cond-mat / 0508216 . Bibcode : 2005JPhA ... 38R.309P . DOI : 10.1088 / 0305-4470 / 38/33 / R01 . ISSN 0305-4470 . [ постоянная мертвая ссылка ]
  15. ^ Вайс, Яир; Фриман, Уильям Т. (октябрь 2001 г.). "Корректность распространения убеждений в гауссовских графических моделях произвольной топологии". Нейронные вычисления . 13 (10): 2173–2200. CiteSeerX 10.1.1.44.794 . DOI : 10.1162 / 089976601750541769 . PMID 11570995 .  
  16. ^ Малиутов, Дмитрий М .; Джонсон, Джейсон К .; Вилски, Алан С. (октябрь 2006 г.). «Прогулочные суммы и распространение убеждений в гауссовских графических моделях» . Журнал исследований в области машинного обучения . 7 : 2031–2064 . Проверено 28 марта 2009 года .
  17. ^ Су, Циньлян; Ву, Ик-Чунг (март 2015 г.). «Об условиях сходимости распространения гауссовских убеждений». IEEE Trans. Сигнальный процесс. 63 (5): 1144–1155. Bibcode : 2015ITSP ... 63.1144S . DOI : 10.1109 / TSP.2015.2389755 .
  18. ^ Гауссовский решатель распространения убеждений для систем линейных уравнений. Авторы O. Shental, D. Bickson, PH Siegel, JK Wolf и D. Dolev, IEEE Int. Symp. по Информ. Theory (ISIT), Торонто, Канада, июль 2008 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ Архивировано 14 июня 2011 г. на Wayback Machine.
  19. ^ Линейное обнаружение через распространение убеждений. Дэнни Биксон, Дэнни Долев, Ори Шентал, Пол Х. Сигел и Джек К. Вольф. На 45-й ежегодной конференции Allerton по коммуникациям, управлению и вычислениям, Allerton House, Иллинойс, 7 сентября. Http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ Архивировано 14 июня 2011 г. на Вайбак машина
  20. ^ Максимизация распределенной крупномасштабной сетевой полезности. Д. Биксон, Ю. Ток, А. Зимнис, С. Бойд и Д. Долев. На Международном симпозиуме по теории информации (ISIT), июль 2009 г. http://www.cs.huji.ac.il/labs/danss/p2p/gabp/ Архивировано 14 июня 2011 г. на Wayback Machine.
  21. ^ Дэйв, Maulik А. (1 декабря 2006). "Обзор" теории информации, логических выводов и алгоритмов обучения Дэвида Дж. К. Маккея ", Cambridge University Press, 2003". Новости ACM SIGACT . 37 (4): 34. DOI : 10,1145 / 1189056,1189063 . ISSN 0163-5700 . 
  22. Filler, Tomas (17 ноября 2009 г.). «Упрощение алгоритма распространения веры» (PDF) .
  23. Лю, Е-Хуа; Пулен, Дэвид (22 мая 2019 г.). "Нейронные декодеры распространения веры для квантовых кодов исправления ошибок". Письма с физическим обзором . 122 (20). arXiv : 1811.07835 . DOI : 10.1103 / physrevlett.122.200501 . ISSN 0031-9007 . PMID 31172756 .  

Дальнейшее чтение [ править ]

  • Биксон, Дэнни. (2009). Страница ресурсов распространения веры по Гауссу - веб- страница, содержащая последние публикации, а также исходный код Matlab.
  • Епископ, Кристофер М. (2006). «Глава 8: Графические модели» (PDF) . Распознавание образов и машинное обучение . Springer. С. 359–418. ISBN 978-0-387-31073-2. Проверено 20 марта 2014 .
  • Кофлан, Джеймс. (2009). Учебное введение в распространение веры .
  • Лёлигер, Ханс-Андреа (2004). «Введение в факторные графы». Журнал обработки сигналов IEEE . 21 (1): 28–41. Bibcode : 2004ISPM ... 21 ... 28L . DOI : 10.1109 / MSP.2004.1267047 .
  • Маккензи, Дана (2005). « Скорость связи приближается к предельной », New Scientist . 9 июля 2005 г. Выпуск 2507 (Требуется регистрация).
  • Вимерш, Хенк (2007). Итерационный дизайн приемника . Издательство Кембриджского университета. ISBN 978-0-521-87315-4.
  • Yedidia, JS; Фримен, WT; Вайс, Ю. (январь 2003 г.). «Понимание распространения убеждений и их обобщений» . В Лакемейере, Герхард; Небель, Бернхард (ред.). Изучение искусственного интеллекта в новом тысячелетии . Морган Кауфманн. С. 239–269. ISBN 978-1-55860-811-5. Проверено 30 марта 2009 года .
  • Yedidia, JS; Фримен, WT; Вайс, Ю. (июль 2005 г.). «Построение приближений свободной энергии и обобщенных алгоритмов распространения убеждений» . IEEE Transactions по теории информации . 51 (7): 2282–2312. CiteSeerX  10.1.1.3.5650 . DOI : 10.1109 / TIT.2005.850085 .