Теория информационного поля

Теория информационного поля (IFT) - это байесовская статистическая теория поля, относящаяся к реконструкции сигналов , космографии и другим связанным областям. ^[1]^[2] IFT суммирует доступную информацию о физическом поле с использованием байесовских вероятностей . Он использует вычислительные методы, разработанные для квантовой теории поля и статистической теории поля, для обработки бесконечного числа степеней свободы поля и для получения алгоритмов для вычисления значений математического ожидания поля . Например, заднийожидаемое значение поля, созданного известным гауссовским процессом и измеренного линейным устройством с известной статистикой гауссовского шума, задается обобщенным фильтром Винера, применяемым к измеренным данным. IFT расширяет такую известную формулу фильтра на ситуации с нелинейной физикой , нелинейными устройствами , негауссовым полем или статистикой шума, зависимостью статистики шума от значений поля и частично неизвестными параметрами измерения. Для этого используются диаграммы Фейнмана , уравнения перенормировки потоков и другие методы математической физики . ^[3]

Мотивация

Поля играют важную роль в науке, технологиях и экономике. Они описывают пространственные изменения некоторой величины, например температуры воздуха, в зависимости от положения. Знание конфигурации поля может иметь большое значение. Однако измерения полей никогда не могут с уверенностью обеспечить точную конфигурацию поля. Физические поля имеют бесконечное количество степеней свободы, но данные, генерируемые любым измерительным устройством, всегда конечны, обеспечивая только конечное количество ограничений на поле. Таким образом, однозначный вывод такого поля из одних только данных измерений невозможен, и остается только вероятностный вывод в качестве средства для утверждений о поле. К счастью, физические поля обнаруживают корреляции и часто подчиняются известным физическим законам. Такую информацию лучше всего объединить с выводом поля, чтобы преодолеть несоответствие степеней свободы поля точкам измерения. Чтобы справиться с этим, необходима теория информации для полей, а это и есть теория информационного поля.

Концепции

Байесовский вывод

${\ displaystyle s (x)}$ это значение поля в местоположении ${\ displaystyle x \ in \ Omega}$ в космосе ${\ displaystyle \ Omega}$ . Предварительные знания о неизвестном сигнальном поле ${\ displaystyle s}$ закодирован в распределении вероятностей ${\ displaystyle {\ mathcal {P}} (s)}$ . Данные ${\ displaystyle d}$ предоставляет дополнительную информацию о ${\ displaystyle s}$ через вероятность ${\ Displaystyle {\ mathcal {P}} (д | s)}$ который включается в апостериорную вероятность

{\ Displaystyle {\ mathcal {P}} (s | d) = {\ frac {{\ mathcal {P}} (d | s) \, {\ mathcal {P}} (s)} {{\ mathcal { P}} (d)}}}

согласно теореме Байеса .

Информационный гамильтониан

В IFT теорема Байеса обычно переписывается на языке статистической теории поля,

{\ Displaystyle {\ mathcal {P}} (s | d) = {\ frac {{\ mathcal {P}} (d, s)} {{\ mathcal {P}} (d)}} \ Equiv {\ гидроразрыв {e ^ {- {\ mathcal {H}} (d, s)}} {{\ mathcal {Z}} (d)}},}

с информационным гамильтонианом, определенным как

{\ Displaystyle {\ mathcal {H}} (d, s) \ Equiv - \ ln {\ mathcal {P}} (d, s) = - \ ln {\ mathcal {P}} (d | s) - \ ln {\ mathcal {P}} (s) \ Equiv {\ mathcal {H}} (d | s) + {\ mathcal {H}} (s),}

отрицательный логарифм совместной вероятности данных и сигнала, а статистическая сумма равна

{\ Displaystyle {\ mathcal {Z}} (d) \ Equiv {\ mathcal {P}} (d) = \ int {\ mathcal {D}} s \, {\ mathcal {P}} (d, s) .}

Эта переформулировка теоремы Байеса позволяет использовать методы математической физики, разработанные для обработки статистических теорий поля и квантовых теорий поля .

Поля

Поскольку поля имеют бесконечное число степеней свободы, определение вероятностей над пространствами конфигураций полей имеет тонкости. Идентификация физических полей как элементов функциональных пространств создает проблему, заключающуюся в том, что над ними не определена мера Лебега, и поэтому плотности вероятностей не могут быть определены там. Однако физические поля имеют гораздо большую регулярность, чем большинство элементов функциональных пространств, поскольку они непрерывны и гладкие в большинстве своих мест. Поэтому менее общие, но достаточно гибкие конструкции могут использоваться для обработки бесконечного числа степеней свободы поля.

Прагматический подход состоит в том, чтобы рассматривать поле как дискретизируемое в пикселях. Каждый пиксель несет одно значение поля, которое предполагается постоянным в пределах объема пикселя. Затем все утверждения о непрерывном поле должны быть преобразованы в его пиксельное представление. Таким образом, мы имеем дело с конечномерными полевыми пространствами, в которых плотности вероятностей хорошо определены.

Чтобы это описание было правильной теорией поля, дополнительно требуется, чтобы разрешение в пикселях ${\ displaystyle \ Delta x}$ всегда можно уточнить, а математические ожидания дискретизированного поля ${\ displaystyle s _ {\ Delta x}}$ сходятся к конечным значениям:

{\ Displaystyle \ langle f (s) \ rangle _ {(s | d)} \ Equiv \ lim _ {\ Delta x \ rightarrow 0} \ int ds _ {\ Delta x} f (s _ {\ Delta x}) \ , {\ mathcal {P}} (s _ {\ Delta x}).}

Интегралы по путям

Если этот предел существует, можно говорить об интеграле по пространству конфигурации поля или интеграле по путям

{\ Displaystyle \ langle е (s) \ rangle _ {(s | d)} \ Equiv \ int {\ mathcal {D}} s \, f (s) \, {\ mathcal {P}} (s). }

независимо от разрешения его можно оценить численно.

Гауссовский приор

Самый простой априор для поля - это гауссовское распределение вероятностей с нулевым средним

{\ Displaystyle {\ mathcal {P}} (s) = {\ mathcal {G}} (s, S) \ Equiv {\ frac {1} {| 2 \ pi S |}} e ^ {- {\ frac {1} {2}} \, s ^ ​​{\ dagger} S ^ {- 1} \, s}.}

Определитель в знаменателе может быть неверно определен в континуальном пределе.

{\ displaystyle \ Delta x \ rightarrow 0}

, однако, все, что необходимо для согласованности IFT, - это то, что этот определитель может быть оценен для любого представления поля конечного разрешения с помощью

{\ displaystyle \ Delta x> 0}

и что это позволяет вычислять сходящиеся ожидаемые значения.

Гауссовское распределение вероятностей требует задания двухточечной корреляционной функции поля ${\ Displaystyle S \ Equiv \ langle s \, s ^ {\ dagger} \ rangle _ {(s)}}$ с коэффициентами

{\ Displaystyle S_ {ху} \ эквив \ langle s (x) \, {\ overline {s (y)}} \ rangle _ {(s)}}

и скалярное произведение для непрерывных полей

{\ displaystyle a ^ {\ dagger} b \ Equiv \ int _ {\ Omega} dx \, {\ overline {a (x)}} \, b (x),}

относительно которой обратная ковариация поля сигнала

{\ Displaystyle S ^ {- 1}}

построен, т.е.

{\ Displaystyle (S ^ {- 1} S) _ {xy} \ Equiv \ int _ {\ Omega} dz \, (S ^ {- 1}) _ {xz} S_ {zy} = \ mathbb {1} _ {ху} \ эквив \ дельта (ху).}

Соответствующий гамильтониан априорной информации имеет вид

{\ Displaystyle {\ mathcal {H}} (s) = - \ ln {\ mathcal {G}} (s, S) = {\ frac {1} {2}} \, s ^ ​​{\ dagger} S ^ {-1} \, s + {\ frac {1} {2}} \, \ ln | 2 \ pi S |.}

Уравнение измерения

Данные измерений ${\ displaystyle d}$ был сгенерирован с вероятностью ${\ Displaystyle {\ mathcal {P}} (д | s)}$ . Если прибор был линейным, уравнение измерения вида

{\ displaystyle d = R \, s + n}

может быть дано, в котором

{\ displaystyle R}

отклик прибора, который описывает, как данные в среднем реагируют на сигнал, и

{\ displaystyle n}

это шум, просто разница между данными

{\ displaystyle d}

и линейный отклик сигнала

{\ Displaystyle R \, s}

. Важно отметить, что ответ переводит бесконечномерный вектор сигнала в конечномерное пространство данных. В компонентах это читается как

{\ displaystyle d_ {i} = \ int _ {\ Omega} dx \, R_ {ix} \, s_ {x} + n_ {i},}

где также были введены обозначения компонентов вектора для векторов сигналов и данных.

Если шум следует за независимым от сигнала гауссовой статистикой с нулевым средним и ковариацией ${\ displaystyle N}$ , ${\ Displaystyle {\ mathcal {P}} (п | s) = {\ mathcal {G}} (п, N),}$ тогда вероятность тоже гауссова,

{\ Displaystyle {\ mathcal {P}} (d | s) = {\ mathcal {G}} (dR \, s, N),}

а гамильтониан информации правдоподобия равен

{\ displaystyle {\ mathcal {H}} (d | s) = - \ ln {\ mathcal {G}} (dR \, s, N) = {\ frac {1} {2}} \, (dR \ , s) ^ {\ dagger} N ^ {- 1} \, (dR \, s) + {\ frac {1} {2}} \, \ ln | 2 \ pi N |.}

Линейное измерение гауссова сигнала с учетом гауссова и независимого от сигнала шума приводит к свободному IFT.

Бесплатная теория

Свободный гамильтониан

Совместный информационный гамильтониан гауссовского сценария, описанный выше, имеет вид

{\ displaystyle {\ begin {align} {\ mathcal {H}} (d, s) & = {\ mathcal {H}} (d | s) + {\ mathcal {H}} (s) \\ & { \ widehat {=}} {\ frac {1} {2}} \, (dR \, s) ^ {\ dagger} N ^ {- 1} \, (dR \, s) + {\ frac {1} {2}} \, s ^ ​​{\ dagger} S ^ {- 1} \, s \\ & {\ widehat {=}} {\ frac {1} {2}} \, \ left [s ^ {\ кинжал} \ underbrace {(S ^ {- 1} + R ^ {\ dagger} N ^ {- 1} R)} _ {D ^ {- 1}} \, ss ^ {\ dagger} \ underbrace {R ^ {\ dagger} N ^ {- 1} d} _ {j} - \ underbrace {d ^ {\ dagger} N ^ {- 1} R} _ {j ^ {\ dagger}} \, s \ right] \ \ & \ Equiv {\ frac {1} {2}} \, \ left [s ^ {\ dagger} D ^ {- 1} ss ^ {\ dagger} jj ^ {\ dagger} s \ right] \\ & = {\ frac {1} {2}} \, \ left [s ^ {\ dagger} D ^ {- 1} ss ^ {\ dagger} D ^ {- 1} \ underbrace {D \, j} _ { m} - \ underbrace {j ^ {\ dagger} D} _ {m ^ {\ dagger}} \, D ^ {- 1} s \ right] \\ & {\ widehat {=}} {\ frac {1 } {2}} \, (см) ^ {\ dagger} D ^ {- 1} (см), \ end {выровнено}}}

где

{\ displaystyle {\ widehat {=}}}

обозначает равенство с точностью до нерелевантных констант, что в данном случае означает выражения, не зависящие от

{\ displaystyle s}

. Из этого ясно, что апостериорная функция должна быть гауссовой со средним значением.

{\ displaystyle m}

и дисперсия

{\ displaystyle D}

,

{\ displaystyle {\ mathcal {P}} (s | d) \ propto e ^ {- {\ mathcal {H}} (d, s)} \ propto e ^ {- {\ frac {1} {2}} \, (sm) ^ {\ dagger} D ^ {- 1} (sm)} \ propto {\ mathcal {G}} (sm, D)}

где равенство между правой и левой частями выполняется, поскольку оба распределения нормированы,

{\ displaystyle \ int {\ mathcal {D}} s \, {\ mathcal {P}} (s | d) = 1 = \ int {\ mathcal {D}} s \, {\ mathcal {G}} ( sm, D)}

.

Обобщенный фильтр Винера

Апостериорное среднее

{\ Displaystyle м = D \, j = (S ^ {- 1} + R ^ {\ dagger} N ^ {- 1} R) ^ {- 1} R ^ {\ dagger} N ^ {- 1} d }

также известен как решение обобщенного фильтра Винера и ковариация неопределенности

{\ Displaystyle D = (S ^ {- 1} + R ^ {\ dagger} N ^ {- 1} R) ^ {- 1}}

как дисперсия Винера.

В IFT ${\ displaystyle j = R ^ {\ dagger} N ^ {- 1} d}$ называется источником информации, так как он действует как источник, возбуждающий поле (знания), и ${\ displaystyle D}$ распространитель информации, поскольку он распространяет информацию из одного места в другое в

{\ displaystyle m_ {x} = \ int _ {\ Omega} dy \, D_ {xy} j_ {y}.}

Теория взаимодействия

Взаимодействующий гамильтониан

Если какое-либо из предположений, которые приводят к свободной теории, нарушается, IFT становится теорией взаимодействия с членами, которые имеют порядок выше квадратичного в поле сигнала. Это происходит, когда сигнал или шум не соответствуют гауссовой статистике, когда отклик нелинейный, когда шум зависит от сигнала или когда отклик или ковариации неопределенны.

В этом случае информационный гамильтониан может быть расширен в ряд Тейлора - Фреше ,

{\ displaystyle {\ mathcal {H}} (d, \, s) = \ underbrace {{\ frac {1} {2}} s ^ {\ dagger} D ^ {- 1} sj ^ {\ dagger} s + {\ mathcal {H}} _ {0}} _ {= {\ mathcal {H}} _ {\ text {free}} (d, \, s)} + \ underbrace {\ sum _ {n = 3} ^ {\ infty} {\ frac {1} {n!}} \ Lambda _ {x_ {1} ... x_ {n}} ^ {(n)} s_ {x_ {1}} ... s_ { x_ {n}}} _ {= {\ mathcal {H}} _ {\ text {int}} (d, \, s)},}

где

{\ displaystyle {\ mathcal {H}} _ {\ text {free}} (d, \, s)}

- свободный гамильтониан, который сам по себе привел бы к гауссовской апостериорной теории, и

{\ displaystyle {\ mathcal {H}} _ {\ text {int}} (d, \, s)}

- взаимодействующий гамильтониан, кодирующий негауссовские поправки. Коэффициенты Тейлора первого и второго порядка часто отождествляются с (отрицательным) источником информации.

{\ displaystyle -j}

и распространитель информации

{\ displaystyle D}

, соответственно. Более высокие коэффициенты

{\ displaystyle \ Lambda _ {x_ {1} ... x_ {n}} ^ {(n)}}

связаны с нелинейными самовзаимодействиями.

Классическое поле

Классическое поле ${\ displaystyle s _ {\ text {cl}}}$ минимизирует информационный гамильтониан,

{\ displaystyle \ left. {\ frac {\ partial {\ mathcal {H}} (d, s)} {\ partial s}} \ right | _ {s = s _ {\ text {cl}}} = 0, }

и, следовательно, максимизирует задний:

{\ displaystyle \ left. {\ frac {\ partial {\ mathcal {P}} (s | d)} {\ partial s}} \ right | _ {s = s _ {\ text {cl}}} = \ left . {\ frac {\ partial} {\ partial s}} \, {\ frac {e ^ {- {\ mathcal {H}} (d, s)}} {{\ mathcal {Z}} (d)} } \ right | _ {s = s _ {\ text {cl}}} = - {\ mathcal {P}} (d, s) \, \ underbrace {\ left. {\ frac {\ partial {\ mathcal {H }} (d, s)} {\ partial s}} \ right | _ {s = s _ {\ text {cl}}}} _ {= 0} = 0}

Классическое поле

{\ displaystyle s _ {\ text {cl}}}

поэтому является максимальной апостериорной оценкой задачи вывода поля.

Критический фильтр

Задача фильтра Винера требует двухточечной корреляции ${\ Displaystyle S \ Equiv \ langle s \, s ^ {\ dagger} \ rangle _ {(s)}}$ поля, чтобы быть известным. Если он неизвестен, он должен быть выведен вместе с самим полем. Это требует указания гиперприора ${\ Displaystyle {\ mathcal {P}} (S)}$ . Часто можно предположить статистическую однородность (трансляционную инвариантность), подразумевая, что ${\ displaystyle S}$ диагональна в пространстве Фурье (при ${\ Displaystyle \ Omega = \ mathbb {R} ^ {u}}$ быть ${\ displaystyle u}$ мерное декартово пространство ). В этом случае только спектр мощности пространства Фурье ${\ Displaystyle P_ {s} ({\ vec {k}})}$ необходимо сделать вывод. Учитывая дальнейшее предположение о статистической изотропии, этот спектр зависит только от длины ${\ Displaystyle к = | {\ vec {k}} |}$ вектора Фурье ${\ displaystyle {\ vec {k}}}$ и только одномерный спектр ${\ Displaystyle P_ {s} (к)}$ должен быть определен. Тогда предыдущая ковариация поля читается в координатах пространства Фурье ${\ displaystyle S _ {{\ vec {k}} {\ vec {q}}} = (2 \ pi) ^ {u} \ delta ({\ vec {k}} - {\ vec {q}}) \ , P_ {s} (k)}$ .

Если до ${\ Displaystyle P_ {s} (к)}$ плоская, совместная вероятность данных и спектра равна

{\ displaystyle {\ begin {align} {\ mathcal {P}} (d, P_ {s}) & = \ int {\ mathcal {D}} s \, {\ mathcal {P}} (d, s, P_ {s}) \\ & = \ int {\ mathcal {D}} s \, {\ mathcal {P}} (d | s, P_ {s}) \, {\ mathcal {P}} (s | P_ {s}) \, {\ mathcal {P}} (P_ {s}) \\ & \ propto \ int {\ mathcal {D}} s \, {\ mathcal {G}} (d-Rs, N ) \, {\ mathcal {G}} (s, S) \\ & \ propto {\ frac {1} {| S | ^ {\ frac {1} {2}}}} \ int {\ mathcal {D }} s \, \ exp \ left [- {\ frac {1} {2}} \ left (s ^ {\ dagger} D ^ {- 1} sj ^ {\ dagger} ss ^ {\ dagger} j \ right) \ right] \\ & \ propto {\ frac {| D | ^ {\ frac {1} {2}}} {| S | ^ {\ frac {1} {2}}}} \ exp \ left [{\ frac {1} {2}} j ^ {\ dagger} D \, j \ right], \ end {align}}}

где обозначение пропагатора информации

{\ Displaystyle D = (S ^ {- 1} + R ^ {\ dagger} N ^ {- 1} R) ^ {- 1}}

и источник

{\ displaystyle j = R ^ {\ dagger} N ^ {- 1} d}

снова была использована проблема фильтра Винера. Соответствующий информационный гамильтониан имеет вид

{\ Displaystyle {\ mathcal {H}} (d, P_ {s}) \; {\ widehat {=}} \; {\ frac {1} {2}} \ left [\ ln | S \, D ^ {-1} | -j ^ {\ dagger} D \, j \ right] = {\ frac {1} {2}} \ mathrm {Tr} \ left [\ ln \ left (S \, D ^ {- 1} \ right) -j \, j ^ {\ dagger} D \ right],}

где

{\ displaystyle {\ widehat {=}}}

обозначает равенство с точностью до нерелевантных констант (здесь: константа относительно

{\ Displaystyle P_ {s}}

). Минимизируя это относительно

{\ Displaystyle P_ {s}}

, чтобы получить максимальную апостериорную оценку спектра мощности, дает

{\ displaystyle {\ begin {align} {\ frac {\ partial {\ mathcal {H}} (d, P_ {s})} {\ partial P_ {s} (k)}} & = {\ frac {1 } {2}} \ mathrm {Tr} \ left [D \, S ^ {- 1} \, {\ frac {\ partial \ left (S \, D ^ {- 1} \ right)} {\ partial P_ {s} (k)}} - j \, j ^ {\ dagger} {\ frac {\ partial D} {\ partial P_ {s} (k)}} \ right] \\ & = {\ frac {1 } {2}} \ mathrm {Tr} \ left [D \, S ^ {- 1} \, {\ frac {\ partial \ left (1 + S \, R ^ {\ dagger} N ^ {- 1} R \ right)} {\ partial P_ {s} (k)}} + j \, j ^ {\ dagger} D \, {\ frac {\ partial D ^ {- 1}} {\ partial P_ {s} (k)}} \, D \ right] \\ & = {\ frac {1} {2}} \ mathrm {Tr} \ left [D \, S ^ {- 1} \, {\ frac {\ partial S} {\ partial P_ {s} (k)}} R ^ {\ dagger} N ^ {- 1} R + m \, m ^ {\ dagger} \, {\ frac {\ partial S ^ {- 1 }} {\ partial P_ {s} (k)}} \ right] \\ & = {\ frac {1} {2}} \ mathrm {Tr} \ left [\ left (R ^ {\ dagger} N ^ {-1} R \, D \, S ^ {- 1} -S ^ {- 1} m \, m ^ {\ dagger} \, S ^ {- 1} \ right) \, {\ frac {\ partial S} {\ partial P_ {s} (k)}} \ right] \\ & = {\ frac {1} {2}} \ int \ left ({\ frac {dq} {2 \ pi}} \ справа) ^ {u} \ int \ left ({\ frac {dq '} {2 \ pi}} \ right) ^ {u} \ left (\ left (D ^ {- 1} -S ^ {- 1} \ right) \, D \, S ^ {- 1} -S ^ {- 1} m \, m ^ {\ dagger} \, S ^ {- 1} \ right) _ {{\ vec {q}} {\ vec {q}} '} \, {\ fr ac {\ partial (2 \ pi) ^ {u} \ delta ({\ vec {q}} - {\ vec {q}} ') \, P_ {s} (q)} {\ partial P_ {s} (k)}} \\ & = {\ frac {1} {2}} \ int \ left ({\ frac {dq} {2 \ pi}} \ right) ^ {u} \ left (S ^ {- 1} -S ^ {- 1} D \, S ^ {- 1} -S ^ {- 1} m \, m ^ {\ dagger} \, S ^ {- 1} \ right) _ {{\ vec {q}} {\ vec {q}}} \, \ delta (kq) \\ & = {\ frac {1} {2}} \ mathrm {Tr} \ left \ {S ^ {- 1} \ left [S- \ left (D + m \, m ^ {\ dagger} \ right) \ right] \, S ^ {- 1} \ mathbb {P} _ {k} \ right \} \\ & = {\ frac {\ mathrm {Tr} \ left [\ mathbb {P} _ {k} \ right]} {2 \, P_ {s} (k)}} - {\ frac {\ mathrm {Tr} \ left [\ left (D + m \, m ^ {\ dagger} \ right) \, \ mathbb {P} _ {k} \ right]} {2 \, \ left [P_ {s} (k) \ right] ^ { 2}}} = 0, \ end {выровнено}}}

где фильтр Винера означает

{\ Displaystyle м = D \, j}

и проектор спектрального диапазона

{\ displaystyle (\ mathbb {P} _ {k}) _ {{\ vec {q}} {\ vec {q}} '} \ Equiv (2 \ pi) ^ {u} \ delta ({\ vec { q}} - {\ vec {q}} ') \, \ delta (| {\ vec {q}} | -k)}

были представлены. Последний ездит с

{\ Displaystyle S ^ {- 1}}

, поскольку

{\ displaystyle (S ^ {- 1}) _ {\ vec {k}} {\ vec {q}}} = (2 \ pi) ^ {u} \ delta ({\ vec {k}} - { \ vec {q}}) \, [P_ {s} (k)] ^ {- 1}}

диагональна в пространстве Фурье. Таким образом, максимальная апостериорная оценка для спектра мощности равна

{\ Displaystyle P_ {s} (к) = {\ гидроразрыва {\ mathrm {Tr} \ left [\ left (m \, m ^ {\ dagger} + D \ right) \, \ mathbb {P} _ {k } \ right]} {\ mathrm {Tr} \ left [\ mathbb {P} _ {k} \ right]}}.}.

Его нужно рассчитывать итеративно, так как

{\ Displaystyle м = D \, j}

а также

{\ Displaystyle D = (S ^ {- 1} + R ^ {\ dagger} N ^ {- 1} R) ^ {- 1}}

зависеть как от

{\ Displaystyle P_ {s}}

сами себя. В эмпирическом байесовском подходе оценочные

{\ Displaystyle P_ {s}}

будет принято как данность. Как следствие, апостериорная средняя оценка поля сигнала является соответствующей

{\ displaystyle m}

и его неопределенность соответствующая

{\ displaystyle D}

в эмпирическом байесовском приближении.

Результирующий нелинейный фильтр называется критическим фильтром . ^[4] Обобщение формулы оценки спектра мощности как

{\ Displaystyle P_ {s} (к) = {\ гидроразрыва {\ mathrm {Tr} \ left [\ left (m \, m ^ {\ dagger} + \ delta \, D \ right) \, \ mathbb {P } _ {k} \ right]} {\ mathrm {Tr} \ left [\ mathbb {P} _ {k} \ right]}}}

демонстрирует порог восприятия для

{\ displaystyle \ delta <1}

, что означает, что дисперсия данных в полосе Фурье должна превышать ожидаемый уровень шума на определенный порог перед восстановлением сигнала.

{\ displaystyle m}

становится ненулевым для этой полосы. Когда дисперсия данных немного превышает этот порог, реконструкция сигнала перескакивает на конечный уровень возбуждения, аналогично фазовому переходу первого рода в термодинамических системах. Для фильтра с

{\ displaystyle \ delta = 1}

восприятие сигнала начинается непрерывно, как только дисперсия данных превышает уровень шума. Исчезновение прерывистого восприятия при

{\ displaystyle \ delta = 1}

похожа на термодинамическую систему, проходящую через критическую точку . Отсюда и название «критический фильтр».

Критический фильтр, его расширения до нелинейных измерений и включение априорных значений неплоского спектра позволили применить IFT к реальным задачам вывода сигналов, для которых ковариация сигнала обычно неизвестна априори.

Примеры применения IFT

Радиоинтерферометрическое изображение радиогалактик в скоплении галактик Abell 2219. Изображения были построены с помощью обратной проекции данных (вверху), алгоритма CLEAN (в центре) и алгоритма RESOLVE (внизу). Отрицательные и, следовательно, нефизические потоки отображаются белым цветом.

Обобщенный фильтр Винера, который появляется в бесплатном IFT, широко используется в обработке сигналов. Алгоритмы, явно основанные на IFT, были получены для ряда приложений. Многие из них реализованы с использованием библиотеки Numerical Information Field Theory (NIFTy).

D³PO - это код для снятия шумов, деконволюции и разложения фотонных наблюдений . Он восстанавливает изображения из отдельных событий счета фотонов, принимая во внимание статистику счета Пуассона и функцию отклика прибора. Он разделяет излучение неба на изображение диффузного излучения и одного из точечных источников, используя различную структуру корреляции и статистику двух компонентов для их разделения. D³PO был применен к данным спутников Fermi и RXTE .
RESOLVE - это байесовский алгоритм построения изображений с синтезом апертуры в радиоастрономии. RESOLVE аналогичен D³PO, но предполагает гауссовское правдоподобие и функцию отклика в пространстве Фурье. Он был применен к данным очень большого массива .
PySESA - это среда Python для пространственно-явного спектрального анализа для пространственно-явного спектрального анализа облаков точек и геопространственных данных.

Продвинутая теория

Многие методы из квантовой теории поля могут использоваться для решения проблем IFT, например диаграммы Фейнмана, эффективные действия и формализм полевого оператора.

Диаграммы Фейнмана

Первые три диаграммы Фейнмана, участвующие в апостериорной средней оценке поля. Линия обозначает распространитель информации, точка в конце строки - источник информации, а вершина - член взаимодействия. Первая диаграмма кодирует фильтр Винера, вторая - нелинейную поправку, а третья - поправку неопределенности для фильтра Винера.

В случае, если коэффициенты взаимодействия ${\ Displaystyle \ Lambda ^ {(п)}}$ в разложении Тейлора - Фреше информационного гамильтониана

{\ displaystyle {\ mathcal {H}} (d, \, s) = \ underbrace {{\ frac {1} {2}} s ^ {\ dagger} D ^ {- 1} sj ^ {\ dagger} s + {\ mathcal {H}} _ {0}} _ {= {\ mathcal {H}} _ {\ text {free}} (d, \, s)} + \ underbrace {\ sum _ {n = 3} ^ {\ infty} {\ frac {1} {n!}} \ Lambda _ {x_ {1} ... x_ {n}} ^ {(n)} s_ {x_ {1}} ... s_ { x_ {n}}} _ {= {\ mathcal {H}} _ {\ text {int}} (d, \, s)},}

малы, логарифм статистической суммы или свободная энергия Гельмгольца ,

{\ Displaystyle \ ln {\ mathcal {Z}} (d) = \ ln \ int {\ mathcal {D}} s \, e ^ {- {\ mathcal {H}} (d, s)} = \ сумма _ {c \ in C} c}

можно асимптотически разложить по этим коэффициентам. Свободный гамильтониан определяет среднее

{\ Displaystyle м = D \, j}

и дисперсия

{\ displaystyle D}

распределения Гаусса

{\ Displaystyle {\ mathcal {G}} (см, D)}

над которым интегрировано расширение. Это приводит к сумме по множеству

{\ displaystyle C}

всех связных диаграмм Фейнмана . По свободной энергии Гельмгольца любой связанный момент поля может быть вычислен с помощью

{\ displaystyle \ langle s_ {x_ {1}} \ ldots s_ {x_ {n}} \ rangle _ {(s | d)} ^ {\ text {c}} = {\ frac {\ partial ^ {n} \ ln {\ mathcal {Z}}} {\ partial j_ {x_ {1}} \ ldots \ partial j_ {x_ {n}}}}.}

Ситуации, в которых существуют небольшие параметры расширения, необходимые для сходимости такого схематического расширения, задаются полями сигнала, близкими к гауссовскому, где негауссовость статистики поля приводит к малым коэффициентам взаимодействия

{\ Displaystyle \ Lambda ^ {(п)}}

. Например, статистика космического микроволнового фона почти гауссова, с небольшими количествами негауссовости, которые, как полагают, были засеяны во время инфляционной эпохи в Ранней Вселенной .

Эффективное действие

Чтобы иметь стабильные числовые значения для задач IFT, необходим функционал поля, который в случае минимизации обеспечивает поле апостериорного среднего. Это дается эффективным действием или свободной энергией Гиббса поля. Свободная энергия Гиббса ${\ displaystyle G}$ можно построить из свободной энергии Гельмгольца с помощью преобразования Лежандра . В IFT это разница внутренней информационной энергии

{\ Displaystyle U = \ langle {\ mathcal {H}} (d, s) \ rangle _ {{\ mathcal {P}} '(s | d')}}

и энтропия Шеннона

{\ displaystyle {\ mathcal {S}} = - \ int {\ mathcal {D}} s \, {\ mathcal {P}} '(s | d') \, \ ln {\ mathcal {P}} ' (s | d ')}

для температуры

{\ displaystyle T = 1}

, где апостериорное приближение Гаусса

{\ Displaystyle {\ mathcal {P}} '(s | d') = {\ mathcal {G}} (см, D)}

используется с приблизительными данными

{\ displaystyle d '= (м, D)}

содержащий среднее значение и дисперсию поля. ^[5]

Тогда свободная энергия Гиббса равна

{\ Displaystyle {\ begin {align} G (m, D) & = U (m, D) -T \, {\ mathcal {S}} (m, D) \\ & = \ langle {\ mathcal {H }} (d, s) + \ ln {\ mathcal {P}} '(s | d') \ rangle _ {{\ mathcal {P}} '(s | d')} \\ & = \ int { \ mathcal {D}} s \, {\ mathcal {P}} '(s | d') \, \ ln {\ frac {{\ mathcal {P}} '(s | d')} {{\ mathcal {P}} (d, s)}} \\ & = \ int {\ mathcal {D}} s \, {\ mathcal {P}} '(s | d') \, \ ln {\ frac {{ \ mathcal {P}} '(s | d')} {{\ mathcal {P}} (s | d) \, {\ mathcal {P}} (d)}} \\ & = \ int {\ mathcal {D}} s \, {\ mathcal {P}} '(s | d') \, \ ln {\ frac {{\ mathcal {P}} '(s | d')} {{\ mathcal {P }} (s | d)}} - \ ln \, {\ mathcal {P}} (d) \\ & = {\ text {KL}} ({\ mathcal {P}} '(s | d') || {\ mathcal {P}} (s | d)) - \ ln {\ mathcal {Z}} (d), \ end {align}}}

дивергенции Кульбака-Либлер

{\ displaystyle {\ text {KL}} ({\ mathcal {P}} ', {\ mathcal {P}})}

между аппроксимационной и точной апостериорной плюс свободная энергия Гельмгольца. Поскольку последнее не зависит от приблизительных данных

{\ displaystyle d '= (м, D)}

, минимизация свободной энергии Гиббса эквивалентна минимизации расхождения Кульбака-Лейблера между приближенным и точным апостериорным. Таким образом, подход эффективного действия IFT эквивалентен вариационным байесовским методам , которые также минимизируют расхождение Кульбака-Лейблера между приближенными и точными апостериорными методами .

Минимизация свободной энергии Гиббса приблизительно дает апостериорное среднее поле

{\ Displaystyle \ langle s \ rangle _ {(s | d)} = \ int {\ mathcal {D}} s \, s \, {\ mathcal {P}} (s | d),}

тогда как минимизация информации гамильтониан обеспечивает максимальное апостериорное поле. Поскольку последний, как известно, приводит к чрезмерному подгонке шума, первый обычно является лучшим средством оценки поля.

Операторный формализм

Вычисление свободной энергии Гиббса требует вычисления гауссовых интегралов по информационному гамильтониану, поскольку внутренняя информационная энергия равна

{\ Displaystyle U (м, D) = \ langle {\ mathcal {H}} (d, s) \ rangle _ {{\ mathcal {P}} '(s | d')} = \ int {\ mathcal { D}} s \, {\ mathcal {H}} (d, s) \, {\ mathcal {G}} (sm, D).}

Такие интегралы могут быть вычислены с помощью формализма полевого оператора ^[6], в котором

{\ displaystyle O_ {m} = m + D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}}}

- оператор поля. Это генерирует выражение поля

{\ displaystyle s}

внутри интеграла, если применить его к функции распределения Гаусса,

{\ Displaystyle {\ begin {align} O_ {m} \, {\ mathcal {G}} (sm, D) & = (m + D \, {\ frac {\ mathrm {d}} {\ mathrm {d) } m}}) \, {\ frac {1} {| 2 \ pi D | ^ {\ frac {1} {2}}}} \, \ exp \ left [- {\ frac {1} {2} } (см) ^ {\ dagger} D ^ {- 1} (см) \ right] \\ & = (m + D \, D ^ {- 1} (см)) \, {\ frac {1} { | 2 \ pi D | ^ {\ frac {1} {2}}}} \, \ exp \ left [- {\ frac {1} {2}} (см) ^ {\ dagger} D ^ {- 1 } (sm) \ right] \\ & = s \, {\ mathcal {G}} (sm, D), \ end {align}}}

и любая более высокая мощность поля, если применяется несколько раз,

{\ displaystyle {\ begin {align} (O_ {m}) ^ {n} \, {\ mathcal {G}} (sm, D) & = s ^ {n} \, {\ mathcal {G}} ( sm, D). \ end {выравнивается}}}

Если информационный гамильтониан является аналитическим, все его члены могут быть сгенерированы через полевой оператор

{\ Displaystyle {\ mathcal {H}} (d, O_ {m}) \, {\ mathcal {G}} (sm, D) = {\ mathcal {H}} (d, s) \, {\ mathcal {G}} (см, D).}

Поскольку оператор поля не зависит от поля

{\ displaystyle s}

сам по себе, его можно вытащить из интеграла по траекториям конструкции внутренней энергии информации,

{\ displaystyle U (m, D) = \ int {\ mathcal {D}} s \, {\ mathcal {H}} (d, O_ {m}) \, {\ mathcal {G}} (sm, D ) = {\ mathcal {H}} (d, O_ {m}) \ int {\ mathcal {D}} s \, {\ mathcal {G}} (sm, D) = {\ mathcal {H}} ( d, O_ {m}) \, 1_ {m},}

где

{\ displaystyle 1_ {m} = 1}

следует рассматривать как функционал, который всегда возвращает значение

{\ displaystyle 1}

независимо от стоимости его ввода

{\ displaystyle m}

. Полученное выражение можно вычислить, коммутируя аннигилятор среднего поля

{\ displaystyle D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}}}

справа от выражения, где они исчезают, так как

{\ Displaystyle {\ гидроразрыва {\ mathrm {d}} {\ mathrm {d} m}} \, 1_ {m} = 0}

. Аннигилятор среднего поля

{\ displaystyle D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}}}

коммутирует со средним полем как

{\ displaystyle \ left [D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}}, m \ right] = D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}} \, мм \, D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}} = D + m \, D \, {\ frac {\ mathrm {d }} {\ mathrm {d} m}} - m \, D \, {\ frac {\ mathrm {d}} {\ mathrm {d} m}} = D.}

Используя формализм оператора поля, можно вычислить свободную энергию Гиббса, что позволяет сделать (приближенный) вывод апостериорного среднего поля посредством численной робастной минимизации функционала.

История

Книгу Норберта Винера ^[7] можно считать одной из первых работ по полевому выводу. Использование интегралов по путям для вывода полей было предложено рядом авторов, например Эдмундом Бертшингером ^[8] или Уильямом Биалеком и А. Зи. ^[9] Связь теории поля и байесовских рассуждений была явно обозначена Йоргом Леммом. ^[10] Термин « теория информационного поля» был введен Торстеном Энслином. ^[11] См. Последнюю ссылку для получения дополнительной информации об истории IFT.

Смотрите также

Байесовский вывод
Байесовское иерархическое моделирование
Гауссовский процесс
Статистические выводы

Теория информационного поля

Мотивация

Концепции

Байесовский вывод

Информационный гамильтониан

Поля

Интегралы по путям

Гауссовский приор

Уравнение измерения

Бесплатная теория

Свободный гамильтониан

Обобщенный фильтр Винера

Теория взаимодействия

Взаимодействующий гамильтониан

Классическое поле

Критический фильтр

Примеры применения IFT

Продвинутая теория

Диаграммы Фейнмана

Эффективное действие

Операторный формализм

История

Смотрите также

Рекомендации