Парадокс Линдлите в этом противоречащий ситуация в статистике , в которых байесовские и частотных подходы к проверке гипотез проблем дают различные результаты для некоторых вариантов в априорном распределении . Проблема разногласий между двумя подходами обсуждалась в учебнике Гарольда Джеффриса 1939 года; [1] он стал известен как парадокс Линдли после того, как Деннис Линдли назвал разногласие парадоксом в статье 1957 года. [2]
Хотя это и называется парадоксом , разные результаты байесовского и частотного подходов можно объяснить их использованием для ответа на принципиально разные вопросы, а не фактического несогласия между двумя методами.
Тем не менее, для большого класса априорных подходов различия между частотным и байесовским подходами вызваны сохранением фиксированного уровня значимости: как признавал даже Линдли, «теория не оправдывает практику сохранения фиксированного уровня значимости» и даже «некоторые вычисления профессора Пирсона в обсуждении этой статьи подчеркнули, как уровень значимости должен измениться с размером выборки, если бы потери и априорные вероятности оставались фиксированными ». [2] Фактически, если критическое значение увеличивается с увеличением размер выборки достаточно быстро, тогда расхождение между частотным и байесовским подходами становится незначительным по мере увеличения размера выборки. [3]
Описание парадокса
Результат некоторого эксперимента имеет два возможных объяснения, гипотезы а также , и некоторое предварительное распространение представление неопределенности относительно того, какая гипотеза более точна, прежде чем принимать во внимание .
Парадокс Линдли возникает, когда
- Результат "значимо" по частотному тесту с указанием достаточных доказательств для отклонения , скажем, на уровне 5%, и
- Апостериорная вероятность из дано высокий, что указывает на веские доказательства того, что лучше согласуется с чем .
Эти результаты могут появиться одновременно, когда очень специфично, более расплывчатый, и предварительное распределение не сильно благоприятствует тому или другому, как показано ниже.
Числовой пример
Следующий числовой пример иллюстрирует парадокс Линдли. В одном городе за определенный период времени родился 49 581 мальчик и 48 870 девочек. Наблюдаемая пропорциярождений мальчиков составляет 49 581/98 451 ≈ 0,5036. Мы предполагаем, что доля рождений мужского пола является биномиальной переменной с параметром. Мы заинтересованы в том, чтобы проверить, действительно лисоставляет 0,5 или другое значение. То есть наша нулевая гипотеза и альтернатива .
Частотный подход
Частотный подход к тестированию состоит в том, чтобы вычислить p-значение , вероятность увидеть долю мальчиков, по крайней мере, столь же велика, как предполагая правда. Поскольку число рождений очень велико, мы можем использовать нормальное приближение для доли рождений мужского пола., с участием а также , вычислить
Мы были бы в равной степени удивлены, если бы увидели 49 581 рождение девочки, т.е. , поэтому частотный специалист обычно выполняет двусторонний тест, для которого p-значение будет. В обоих случаях значение p ниже уровня значимости α, равного 5%, поэтому частотный подход отвергает поскольку это не согласуется с наблюдаемыми данными.
Байесовский подход
При отсутствии причин отдавать предпочтение одной гипотезе другой, байесовский подход заключался бы в назначении априорных вероятностей и равномерное распределение по под , а затем вычислить апостериорную вероятность используя теорему Байеса ,
После наблюдения мальчики из рождений, мы можем вычислить апостериорную вероятность каждой гипотезы, используя функцию массы вероятности для биномиальной переменной,
где это бета-функция .
Из этих значений находим апостериорную вероятность , что сильно способствует над .
Два подхода - байесовский и частотный - кажутся конфликтующими, и в этом заключается «парадокс».
Согласование байесовского и частотного подходов
Однако, по крайней мере, в примере Линдли, если мы возьмем последовательность уровней значимости α n , такую, что α n = n - r с r > 1/2 , тогда апостериорная вероятность нуля сходится к 0, что согласуется с отказ от нуля. [3] В этом числовом примере принятие r = 1/2 дает уровень значимости 0,00318, поэтому частотный специалист не отвергнет нулевую гипотезу, которая примерно соответствует байесовскому подходу.
Если мы воспользуемся малоинформативным априором и проверим гипотезу, более похожую на гипотезу частотного подхода, парадокс исчезнет.
Например, если мы рассчитаем апостериорное распределение , используя равномерное априорное распределение на (т.е. ), мы нашли
Если мы используем это, чтобы проверить вероятность того, что новорожденный, скорее всего, будет мальчиком, чем девочкой, т. Е. , мы нашли
Другими словами, очень вероятно, что доля рождений мужского пола выше 0,5.
Ни один из анализов не дает непосредственной оценки величины эффекта , но оба могут использоваться для определения, например, того, будет ли доля рождений мальчиков выше определенного порогового значения.
Отсутствие настоящего парадокса
Очевидное расхождение между двумя подходами вызвано сочетанием факторов. Во-первых, частотный подход, описанный выше. без ссылки на . Байесовский подход оценивает как альтернатива , и считает, что первая лучше согласуется с наблюдениями. Это потому, что последняя гипотеза гораздо более расплывчата, так как может быть где угодно в , что приводит к очень низкой апостериорной вероятности. Чтобы понять, почему, полезно рассмотреть две гипотезы как генераторы наблюдений:
- Под , мы выбрали и спросите, какова вероятность того, что при 98 451 рождении будет 49 581 мальчик.
- Под , мы выбрали случайным образом из любого места в пределах от 0 до 1 и задайте тот же вопрос.
Большинство возможных значений для под очень слабо подтверждаются наблюдениями. По сути, очевидное несоответствие между методами - это вовсе не разногласия, а, скорее, два разных утверждения о том, как гипотезы соотносятся с данными:
- Частотный специалист считает, что является плохим объяснением наблюдения.
- Байесовец считает, что является гораздо лучшим объяснением наблюдения, чем .
Согласно частотному тесту соотношение полов новорожденных маловероятно 50/50. Тем не менее, 50/50 - лучшее приближение, чем большинство, но не все другие соотношения. Гипотеза соответствовали бы наблюдениям намного лучше, чем почти все другие соотношения, включая .
Например, этот выбор гипотез и априорных вероятностей подразумевает утверждение: «если > 0,49 и <0,51, то априорная вероятность быть точно 0,5 равно 0,50 / 0,51 98% ". Учитывая такое сильное предпочтение , легко понять, почему байесовский подход отдает предпочтение перед лицом , хотя наблюдаемое значение ложь от 0,5. Отклонение более 2 сигм от считается значимым в частотном подходе, но его значение отвергается предшествующим в байесовском подходе.
Посмотрев на это с другой стороны, мы можем увидеть, что априорное распределение по существу является плоским с дельта-функцией на . Ясно, что это сомнительно. Фактически, если бы вы представили действительные числа как непрерывные, то было бы более логичным предположить, что никакое данное число не может быть точным значением параметра, т. Е. Мы должны предположить, что P (theta = 0,5) = 0.
Более реалистичное распределение для в альтернативной гипотезе дает менее удивительный результат для апостериорной . Например, если мы заменим с участием , т. е. оценка максимального правдоподобия для, апостериорная вероятность будет всего 0,07 по сравнению с 0,93 для (Конечно, на самом деле нельзя использовать MLE как часть предыдущего распространения).
Недавнее обсуждение
Парадокс продолжает оставаться предметом активных дискуссий. [3] [4] [5] [6]
Смотрите также
Заметки
- ^ Джеффрис, Гарольд (1939). Теория вероятностей . Издательство Оксфордского университета . MR 0000924 .
- ^ а б Линдли, Д.В. (1957). «Статистический парадокс». Биометрика . 44 (1–2): 187–192. DOI : 10.1093 / Biomet / 44.1-2.187 . JSTOR 2333251 .
- ^ а б в Нааман, Майкл (01.01.2016). «Почти надежная проверка гипотез и разрешение парадокса Джеффриса-Линдли» . Электронный статистический журнал . 10 (1): 1526–1550. DOI : 10.1214 / 16-EJS1146 . ISSN 1935-7524 .
- ^ Спанос, Арис (2013). «Кому стоит бояться парадокса Джеффриса-Линдли?». Философия науки . 80,1 : 73-93. DOI : 10.1086 / 668875 .
- ^ Шпренгер, янв (2013). «Проверка точной нулевой гипотезы: случай парадокса Линдли» (PDF) . Философия науки . 80 : 733–744. DOI : 10.1086 / 673730 . hdl : 2318/1657960 .
- ^ Роберт, Кристиан П. (2014). «О парадоксе Джеффриса-Линдли». Философия науки . 81.2 : 216–232. arXiv : 1303,5973 . DOI : 10.1086 / 675729 .
дальнейшее чтение
- Шафер, Гленн (1982). «Парадокс Линдли». Журнал Американской статистической ассоциации . 77 (378): 325–334. DOI : 10.2307 / 2287244 . JSTOR 2287244 . Руководство по ремонту 0664677 .