В статистике Байесовской , то апостериорная вероятность из случайного события или неопределенного предложения является условной вероятностью того, что назначается [ требуется уточнение ] после соответствующего доказательства или фон принимается во внимание. «Посторонний» в данном контексте означает принятие во внимание соответствующих доказательств, относящихся к конкретному рассматриваемому делу.
Заднее распределение вероятностей является распределение вероятности неизвестного количества, рассматривается как случайная величина , обусловливающее доказательств , полученных из эксперимента или обследования.
Определение
Апостериорная вероятность - это вероятность параметров учитывая доказательства : .
Это контрастирует с функцией правдоподобия , которая представляет собой вероятность свидетельства с учетом параметров:.
Эти два отношения связаны следующим образом:
Учитывая до поверье , что функция распределения вероятностей является и что наблюдения иметь вероятность , то апостериорная вероятность определяется как
где - нормирующая постоянная, вычисляемая как
для непрерывного , или суммируя по всем возможным значениям для дискретных . [2]
Следовательно, апостериорная вероятность пропорциональна произведению Вероятность · Априорная вероятность .
Пример
Предположим, что в школе 60% мальчиков и 40% девочек. Девушки носят брюки или юбки в равном количестве; все мальчики носят брюки. Наблюдатель видит (случайного) ученика на расстоянии; все, что может видеть наблюдатель, - это то, что на этом ученице брюки. Какова вероятность того, что этот студент - девушка? Правильный ответ можно вычислить с помощью теоремы Байеса.
Событие в том, что наблюдаемый студент - это девушка, а событие в том, что наблюдаемый студент носит брюки. Чтобы вычислить апостериорную вероятность, нам сначала нужно знать:
- , или вероятность того, что студент - девушка, независимо от любой другой информации. Поскольку наблюдатель видит случайного ученика, а это означает, что все ученики имеют одинаковую вероятность быть наблюдаемым, а процент девочек среди учеников составляет 40%, эта вероятность равна 0,4.
- , или вероятность того, что учащийся не девочка (т. е. мальчик), независимо от любой другой информации ( является дополнительным событием к ). Это 60% или 0,6.
- , или вероятность того, что студент будет в брюках, учитывая, что студент - девушка. Поскольку они с такой же вероятностью будут носить юбки, как и брюки, это 0,5.
- , или вероятность того, что студент будет в брюках, учитывая, что студент мальчик. Это дается как 1.
- или вероятность того, что (случайно выбранный) студент будет в брюках, независимо от любой другой информации. С(по закону полной вероятности ) это.
Учитывая всю эту информацию, апостериорная вероятность того, что наблюдатель заметил девушку, учитывая, что наблюдаемый студент носит брюки, может быть вычислена путем замены этих значений в формулу:
Интуитивно понятный способ решить эту проблему - предположить, что в школе N учеников. Количество мальчиков = 0,6N и количество девочек = 0,4N. Если N достаточно велико, общее количество пользователей брюк = 0,6N + 50% от 0,4N. А количество девушек, носящих брюки, = 50% от 0,4N. Следовательно, в популяции брюк девушки составляют (50% от 0,4N) / (0,6N + 50% от 0,4N) = 25%. Другими словами, если вы выделили группу носителей брюк, четверть этой группы составят девушки. Таким образом, если вы видите брюки, самое большее, что вы можете сделать, это то, что вы смотрите на единственную выборку из подгруппы студентов, из которых 25% - девушки. И по определению вероятность того, что эта случайная ученица окажется девушкой, составляет 25%. Таким образом можно решить любую проблему теоремы Байеса.
Расчет
Заднее распределение вероятностей одного случайных переменный присваиваются значением другого может быть вычислено с теоремой Байеса путем умножения предварительного распределения вероятностей по функции правдоподобия , а затем деления на константе нормализующей , следующим образом :
дает апостериорную функцию плотности вероятности для случайной величины учитывая данные , где
- это априорная плотность ,
- - функция правдоподобия как функция ,
- - нормирующая постоянная, а
- это апостериорная плотность учитывая данные .
Достоверный интервал
Апостериорная вероятность - это условная вероятность, обусловленная случайно наблюдаемыми данными. Следовательно, это случайная величина. Для случайной величины важно суммировать ее неопределенность. Один из способов достижения этой цели - обеспечить достоверный интервал апостериорной вероятности.
Классификация
В классификации апостериорные вероятности отражают неопределенность оценки наблюдения для определенного класса, см. Также Вероятности членства в классах . В то время как методы статистической классификации по определению генерируют апостериорные вероятности, машинное обучение обычно предоставляет значения принадлежности, которые не вызывают какой-либо вероятностной уверенности. Желательно преобразовать или повторно масштабировать значения членства в вероятности членства в классе, поскольку они сопоставимы и, кроме того, более легко применимы для последующей обработки.
Смотрите также
Рекомендации
- ^ Кристофер М. Бишоп (2006). Распознавание образов и машинное обучение . Springer. С. 21–24. ISBN 978-0-387-31073-2.
- ^ Эндрю Гельман, Джон Б. Карлин, Хэл С. Стерн, Дэвид Б. Дансон, Аки Вехтари и Дональд Б. Рубин (2014). Байесовский анализ данных . CRC Press. п. 7. ISBN 978-1-4398-4095-5.CS1 maint: несколько имен: список авторов ( ссылка )