Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике Байесовской , то заднее предсказание распределение есть распределение возможных значений ненаблюдаемых условных на наблюдаемых значениях. [1] [2]

Учитывая набор наблюдений N i.id , новое значение будет извлечено из распределения, которое зависит от параметра :

Может показаться заманчивым включить одну лучшую оценку для , но при этом игнорируется неопределенность , а поскольку источник неопределенности игнорируется, прогнозируемое распределение будет слишком узким. Другими словами, предсказания экстремальных значений будут иметь меньшую вероятность, чем если бы учитывалась неопределенность параметров, заданная их апостериорным распределением.

Апостериорное прогнозирующее распределение учитывает неопределенность в отношении . Апостериорное распределение возможных значений зависит от :

И апостериорное прогнозирующее распределение заданных вычисляется путем маргинализации распределения заданных по апостериорному распределению заданных :

Поскольку оно учитывает неопределенность относительно , апостериорное прогнозное распределение в целом будет шире, чем прогнозное распределение, которое включает единственную наилучшую оценку для .

Предыдущее и апостериорное прогнозирующее распределение [ править ]

До интеллектуального распределение , в байесовской контексте, является распределением точки данных маргинальной над его предварительным распределением. То есть, если и , то предварительное прогнозируемое распределение является соответствующим распределением , где

Это похоже на апостериорное прогнозирующее распределение, за исключением того, что маргинализация (или, что эквивалентно, ожидание) берется по отношению к апостериорному распределению, а не к апостериорному распределению.

Кроме того, если априорное распределение является сопряженным априорным , тогда апостериорное предсказывающее распределение будет принадлежать к тому же семейству распределений, что и априорное предсказывающее распределение. Это легко увидеть. Если априорное распределение сопряжено, то

то есть апостериорное распределение также принадлежит, но просто с другим параметром вместо исходного параметра Затем,

Следовательно, апостериорное предсказывающее распределение следует тому же распределению H , что и апостериорное предсказывающее распределение , но с апостериорными значениями гиперпараметров, замененными предыдущими.

До интеллектуального распределения в виде распределения соединения , и на самом деле часто используется для определить на распределение соединения , из-за отсутствия каких - либо усложняющих факторов , таких как зависимость от данных и вопрос о сопряженности. Например, t-распределение Стьюдента может быть определено как предварительное прогнозирующее распределение нормального распределения с известным средним μ, но неизвестной дисперсией σ x 2 , с сопряженным предварительным распределением масштабированного обратного хи-квадрат, помещенным на σ x 2. , с гиперпараметрами ν и σ 2 . Результирующее составное распределение действительно является нестандартизированным t-распределением Стьюдента и следует одной из двух наиболее распространенных параметризаций этого распределения. Тогда соответствующее апостериорное прогнозирующее распределение снова будет t Стьюдента, а обновленные гиперпараметры, которые появляются в апостериорном распределении, также напрямую появляются в апостериорном прогнозирующем распределении.

В некоторых случаях соответствующее составное распределение определяется с использованием другой параметризации, чем та, которая была бы наиболее естественной для прогнозных распределений в текущей рассматриваемой проблеме. Часто это происходит из-за того, что предыдущее распределение, используемое для определения составного распределения, отличается от того, которое используется в текущей задаче. Например, как указано выше, t-распределение Стьюдента было определено в терминах масштабированного обратного распределения хи-квадрат, помещенного на дисперсию. Однако чаще используется обратное гамма-распределение.как сопряженный приор в этой ситуации. На самом деле они эквивалентны, за исключением параметризации; следовательно, t-распределение Стьюдента все еще можно использовать для любого прогнозирующего распределения, но гиперпараметры должны быть повторно параметризованы перед подключением.

В экспоненциальных семьях [ править ]

Большинство, но не все, общие семейства распределений принадлежат к экспоненциальному семейству распределений. Экспоненциальные семейства обладают большим количеством полезных свойств. Один из них заключается в том, что все члены имеют сопряженные априорные распределения - тогда как очень немногие другие распределения имеют конъюгированные априорные распределения.

Предыдущее прогнозное распределение в экспоненциальных семьях [ править ]

Еще одно полезного свойства , что функция плотности вероятности в распределении соединения , соответствующем уровню предсказательного распределения с экспоненциальной семьей распределения маргинального над его сопряженным предварительным распределением может быть определена аналитический. Предположим, что это член экспоненциального семейства с параметром , параметризованным в соответствии с естественным параметром и распределенным как

в то время как соответствующий конъюгат Prior, распределенный как

Тогда предварительное прогнозируемое распределение (результат сложения с ) равно

Последняя строка следует из предыдущей, признавая, что функция внутри интеграла является функцией плотности случайной величины, распределенной как , за исключением нормализующей функции . Следовательно, результат интегрирования будет обратным нормирующей функции.

Полученный результат не зависит от выбора параметризации , как ни один из , и появляется. ( является функцией параметра и, следовательно, будет принимать разные формы в зависимости от выбора параметризации.) Для стандартных вариантов выбора и часто проще работать напрямую с обычными параметрами, чем переписывать в терминах естественных параметров .

Причина, по которой интеграл поддается обработке, заключается в том, что он включает в себя вычисление нормировочной константы плотности, определенной произведением априорного распределения и вероятности . Когда они сопряжены , произведение является апостериорным распределением , и, по предположению, нормировочная константа этого распределения известна. Как показано выше, функция плотности составного распределения следует определенной форме, состоящей из произведения функции, которая составляет часть функции плотности для , с частным двух форм нормировочной «константы» для, один получен из априорного распределения, а другой - из апостериорного распределения. Бета-биномиальное распределение является хорошим примером того , как работает этот процесс.

Несмотря на аналитическую податливость таких распределений, они сами по себе обычно не являются членами экспоненциального семейства . Например, трехпараметрическое t-распределение Стьюдента , бета-биномиальное распределение и полиномиальное распределение Дирихле - все это предсказательные распределения распределений экспоненциального семейства ( нормальное распределение , биномиальное распределение и полиномиальное распределение соответственно), но ни одно из них не является членами экспоненциального семья. Это видно выше из-за наличия функциональной зависимости от. В экспоненциальном семейном распределении должна быть возможность разделить всю функцию плотности на мультипликативные множители трех типов: (1) факторы, содержащие только переменные, (2) факторы, содержащие только параметры, и (3) факторы, логарифм которых разлагается между переменными. и параметры. Наличие делает это невозможным, если только «нормализующая» функция либо полностью игнорирует соответствующий аргумент, либо не использует его только в показателе степени выражения.

Апостериорное прогнозирующее распределение в экспоненциальных семьях [ править ]

Когда используется сопряженное предварительное распределение, апостериорное прогнозирующее распределение принадлежит к тому же семейству, что и предыдущее прогнозирующее распределение, и определяется просто путем включения обновленных гиперпараметров для апостериорного распределения параметра (ов) в формулу для предварительного прогнозного распределения. . Используя общую форму уравнений апостериорного обновления для распределений экспоненциального семейства (см. Соответствующий раздел в статье об экспоненциальном семействе ), мы можем выписать явную формулу для апостериорного прогнозного распределения:

куда

Это показывает, что апостериорное прогнозирующее распределение серии наблюдений в случае, когда наблюдения следуют экспоненциальному семейству с соответствующим сопряженным предшествующим , имеет ту же плотность вероятности, что и составное распределение, с параметрами, указанными выше. Сами наблюдения вводятся только в форме

Это называется достаточной статистикой наблюдений, потому что он говорит нам все , что нужно знать о наблюдениях, чтобы вычислить заднюю или задние на их основе (или интеллектуальное распределение, по этому вопросу, все остальное основано на вероятность из наблюдения, такие как предельное правдоподобие ).

Совместное прогнозирующее распределение, предельное правдоподобие [ править ]

Также можно рассмотреть результат сложения совместного распределения по фиксированному числу независимых одинаково распределенных выборок с предварительным распределением по общему параметру. В байесовской среде это возникает в различных контекстах: вычисление априорного или апостериорного прогнозирующего распределения множества новых наблюдений и вычисление предельной вероятности наблюдаемых данных (знаменатель в законе Байеса ). Когда распределение образцов происходит из экспоненциального семейства, а предварительное распределение является конъюгированным, полученное распределение соединений будет управляемым и будет следовать форме, аналогичной приведенному выше выражению. На самом деле легко показать, что совместное составное распределение набора для наблюдений имеет вид

Этот результат и приведенный выше результат для одного составного распределения тривиально распространяются на случай распределения по векторному наблюдению, например многомерное гауссовское распределение .

Отношение к семплированию Гиббса [ править ]

Сворачивание узла в свернутом семплере Гиббса эквивалентно сложению . В результате, когда набор независимых одинаково распределенных (iid) узлов зависит от одного и того же предыдущего узла, и этот узел свернут, результирующая условная вероятностьодного узла с учетом других, а также родителей свернутого узла (но не обусловливающего какие-либо другие узлы, например, любые дочерние узлы) такое же, как апостериорное прогнозирующее распределение всех оставшихся узлов iid (или, точнее, ранее использовались узлы iid, так как сворачивание приводит к зависимостям между узлами). То есть, как правило, можно реализовать свертывание узла, просто прикрепив всех родителей узла непосредственно ко всем дочерним элементам и заменив прежнее условное распределение вероятностей, связанное с каждым дочерним элементом, соответствующим апостериорным прогнозирующим распределением для дочернего элемента, обусловленным его родители и другие узлы, ранее использовавшиеся iid, которые также были дочерними элементами удаленного узла. Например, для более подробного обсуждения и некоторых предостережений по определенным сложным вопросам см.Статья о полиномиальном распределении Дирихле .

См. Также [ править ]

  • Составное распределение вероятностей
  • Предельная вероятность
  • Интервал прогноза # Байесовская статистика

Ссылки [ править ]

  1. ^ "Апостериорное прогнозирующее распределение" . SAS . Проверено 19 июля 2014 года .
  2. ^ Гельман А, Карлин Дж. Б., Стерн Х. С., Дансон ДБ, Вехтари А., Рубин ДБ (2014) Байесовский анализ данных , Чепмен и Холл, стр. 7