Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Гармоническое среднее р -значение [1] [2] [3] (НМР) представляет собой статистический метод для решения проблемы множественных сравнений , что управляет сильным чувство семьи-накрест частоты ошибок . [2] Это улучшает на мощность по коррекции Бонферроните путем проведения комбинированных испытаний, то есть путь тестирования ли группы из р -значений являются статистически значимыми, как метод Фишера . [4] Однако он избегает ограничительного предположения, что p -значения независимы., в отличие от метода Фишера. [2] [3] Следовательно, он контролирует частоту ложноположительных результатов, когда тесты являются зависимыми, за счет меньшей мощности (т. Е. Более высокого уровня ложноотрицательных результатов ), когда тесты являются независимыми. [2] Помимо предоставления альтернативы таким подходам, как коррекция Бонферрони, которая контролирует строгий уровень ошибок в семье , он также предоставляет альтернативу широко используемой процедуре Бенджамини-Хохберга (BH) для управления менее строгим коэффициентом ложного обнаружения . [5] Это связано с тем, что HMP способен обнаруживать значимые группы.гипотез больше, чем способность BH обнаруживать важные отдельные гипотезы. [2]

Существует две версии метода: (i) прямая интерпретация HMP как приближенного p- значения и (ii) процедура преобразования HMP в асимптотически точное p- значение . Подход предусматривает многоуровневую процедуру тестирования, в которой можно искать самые маленькие группы статистически значимых p- значений .

Прямая интерпретация гармонического среднего р -значение [ править ]

Взвешенное среднее гармоническое из р -значения определяется как

где есть вес , который должен подвести к одному, то есть . В этом случае можно выбрать равные веса .

В общем, интерпретация HMP напрямую как p -значения является антиконсервативной, что означает, что частота ложных срабатываний выше, чем ожидалось. Однако по мере того, как HMP становится меньше, при определенных допущениях, расхождение уменьшается, так что прямая интерпретация значимости дает частоту ложных срабатываний, близкую к предполагаемой для достаточно малых значений (например ). [2]

HMP никогда не бывает антиконсервативным более чем в один раз в пользу малого или большого . [3] Однако эти границы представляют собой наихудшие сценарии при произвольной зависимости, которые на практике могут оказаться консервативными. Вместо того, чтобы применять эти границы, можно получить асимптотически точные значения p путем преобразования HMP.

Асимптотически точная процедура гармонического среднего p- значения [ править ]

Обобщенная центральная предельная теорема показывает , что асимптотический точный р -значение, может быть вычислено из HMP, по формуле [2]

В соответствии с условиями обобщенной центральной предельной теоремы это преобразованное p -значение становится точным по мере того, как число тестов,, становится большим. В расчетах используется распределение Ландау , функцию плотности которого можно записать
Тест реализуется p.hmpкомандой harmonicmeanp пакета R ; учебник доступен в Интернете.

Точно так же можно сравнить HMP с таблицей критических значений (Таблица 1). Таблица показывает, что чем меньше частота ложных срабатываний и чем меньше количество тестов, тем ближе критическое значение к частоте ложных срабатываний.

Многократное тестирование с помощью многоуровневой процедуры тестирования [ править ]

Если HMP является значимым на некотором уровне для группы p- значений , можно искать все подмножества p- значений для наименьшей значимой группы, сохраняя при этом строгую частоту ошибок на уровне семьи. [2] Формально это процедура закрытого тестирования . [6]

Когда мало (например ), следующий многоуровневый тест, основанный на прямой интерпретации HMP, контролирует интенсивную семейную частоту ошибок на уровне приблизительно

  1. Определить HMP любого подмножества из р -значения быть
  2. Отвергните нулевую гипотезу о том, что ни одно из p- значений в подмножестве не является значимым, если , где . (Напомним, что по определению .)


Асимптотически точная версия вышеизложенного заменяется на шаге 2 на

где дает количество p- значений , а не только в подмножестве . [7]

Поскольку прямая интерпретация HMP выполняется быстрее, может использоваться двухпроходная процедура для идентификации подмножеств p- значений , которые могут быть значимыми с использованием прямой интерпретации, при условии подтверждения с использованием асимптотически точной формулы.

Свойства HMP [ править ]

HMP обладает рядом свойств, которые вытекают из обобщенной центральной предельной теоремы. [2] Это:

  • От устойчивой до положительной зависимости между p-значениями .
  • Нечувствительность к точному количеству испытаний, L .
  • Устойчив к распределению весов w .
  • Наибольшее влияние оказывают наименьшие значения p .

Когда HMP не имеет значения, нет ни одного подмножества составляющих тестов. И наоборот, когда многоуровневый тест считает значимым подмножество p- значений , HMP для всех вместе взятых p- значений, вероятно, будет значимым; это очевидно, когда HMP интерпретируется напрямую. Когда цель состоит в том, чтобы оценить значение отдельных р -значения, так что комбинированные тесты , касающиеся группы из р -значения не имеют никакого интереса, то НМР эквивалентно Бонферрони процедуру , но с учетом порога более строгой значимости (таблица 1).

HMP предполагает, что отдельные значения p имеют (не обязательно независимые) стандартные равномерные распределения, если их нулевые гипотезы верны. Поэтому большое количество тестов с недостаточной мощностью может повредить мощность HMP.

Хотя выбор весов не важен для валидности HMP при нулевой гипотезе, веса влияют на мощность процедуры. Дополнительные методы §5C из [2] и интерактивное руководство рассматривают проблему более подробно.

Байесовские интерпретации HMP [ править ]

HMP был задуман по аналогии с усреднением байесовской модели и может быть интерпретирован как обратно пропорциональный усредненному по модели байесовскому фактору при объединении p- значений из тестов отношения правдоподобия . [1] [2]

Гармоническое среднее эмпирическое правило [ править ]

И. Дж. Гуд сообщил об эмпирической взаимосвязи между байесовским фактором и p- значением, полученным в результате теста отношения правдоподобия. [1] Для нулевой гипотезы, вложенной в более общую альтернативную гипотезу, он заметил, что часто,

где обозначает коэффициент Байеса в пользу по сравнению с экстраполяцией, он предложил эмпирическое правило , в котором HMP принимается, обратно пропорциональна моделью усредненного Байеса фактора для коллекции тестов с общей нулевой гипотезой:
По мнению Гуда, его практическое правило поддерживало взаимозаменяемость байесовского и классического подходов к проверке гипотез. [8] [9] [10] [11] [12]

Байесовская калибровка р -значения [ править ]

Если распределения p- значений при альтернативных гипотезах следуют бета-распределениям с параметрами , формой, рассмотренной Селлке, Баярри и Бергером [13], то обратная пропорциональность между усредненным по модели байесовским фактором и HMP может быть формализована как [ 2] [14]

где
  • - априорная вероятность альтернативной гипотезы такая, что
  • ожидаемое значение при альтернативной гипотезе
  • вес, приписываемый p -значению
  • включает вероятности и мощности априорной модели в веса, и
  • нормализует веса.

Приближение лучше всего подходит для тестов с хорошей производительностью ( ).

Гармоническое среднее значение p как граница байесовского фактора [ править ]

Для тестов отношения правдоподобия ровно с двумя степенями свободы теорема Уилкса подразумевает, что , где - максимальное отношение правдоподобия в пользу альтернативной гипотезы и, следовательно , где - средневзвешенное максимальное отношение правдоподобия с использованием весов, поскольку это верхняя граница байесовского уравнения. фактор, то является верхней границей усредненного по модели байесовского фактора:

В то время как эквивалентность имеет место только для двух степеней свободы, соотношение между и и , следовательно , ведет себя аналогично для других степеней свободы. [2]

При предположении, что распределения p- значений при альтернативных гипотезах следуют бета-распределениям с параметрами и что веса HMP обеспечивают более жесткую верхнюю границу для усредненного по модели байесовского фактора:

результат, который снова воспроизводит обратную пропорциональность эмпирической зависимости Гуда. [15]

Ссылки [ править ]

  1. ^ a b c Хорошо, IJ (1958). «Параллельные и последовательные испытания значимости». Журнал Американской статистической ассоциации . 53 (284): 799–813. DOI : 10.1080 / 01621459.1958.10501480 . JSTOR  2281953 .
  2. ^ Б с д е е г ч я J к л м н Уилсон, ди - джей (2019). «Гармоническое среднее значение p для объединения зависимых тестов» . Труды Национальной академии наук США . 116 (4): 1195–1200. DOI : 10.1073 / pnas.1814092116 . PMC 6347718 . PMID 30610179 .  
  3. ^ a b c Вовк, Владимир; Ван, Руоду (25 апреля 2019 г.). «Объединение p-значений посредством усреднения» (PDF) . Алгоритмическое обучение в случайном мире .
  4. Перейти ↑ Fisher, RA (1934). Статистические методы для научных работников (5-е изд.). Эдинбург, Великобритания: Оливер и Бойд.
  5. Перейти ↑ Benjamini Y, Hochberg Y (1995). «Контроль ложного обнаружения: практичный и эффективный подход к множественному тестированию». Журнал Королевского статистического общества. Серия Б (Методическая) . 57 (1): 289–300. DOI : 10.1111 / j.2517-6161.1995.tb02031.x . JSTOR 2346101 . 
  6. Перейти ↑ Marcus R, Eric P, Gabriel KR (1976). «О процедурах закрытого тестирования с особым упором на заказной дисперсионный анализ». Биометрика . 63 (3): 655–660. DOI : 10.1093 / Biomet / 63.3.655 . JSTOR 2335748 . 
  7. Уилсон, Дэниел Дж (17 августа 2019 г.). «Обновленная поправка к« Гармоническому среднему значению p для объединения независимых тестов » » (PDF) .
  8. ^ Хорошо, Эй Джей (1984). «C192. Один хвост против двух, и эмпирическое правило гармонического среднего». Журнал статистических вычислений и моделирования . 19 (2): 174–176. DOI : 10.1080 / 00949658408810727 .
  9. ^ Хорошо, Эй Джей (1984). «C193. Парные и непарные сравнения и эмпирическое правило гармонического среднего». Журнал статистических вычислений и моделирования . 19 (2): 176–177. DOI : 10.1080 / 00949658408810728 .
  10. ^ Хорошо, Эй Джей (1984). «C213. Уточнение эмпирического правила гармонического среднего для объединения тестов« параллельно » ». Журнал статистических вычислений и моделирования . 20 (2): 173–176. DOI : 10.1080 / 00949658408810770 .
  11. ^ Хорошо, Эй Джей (1984). «C214. Эмпирическое правило гармонического среднего: некоторые классы приложений». Журнал статистических вычислений и моделирования . 20 (2): 176–179. DOI : 10.1080 / 00949658408810771 .
  12. ^ Хорошо, Ирвинг Джон. (2009). Хорошее мышление: основы вероятности и ее приложения . Dover Publications. ISBN 9780486474380. OCLC  319491702 .
  13. ^ Селлке, Томас; Баярри, М. Дж; Бергер, Джеймс О (2001). «Калибровка значений p для проверки точных нулевых гипотез». Американский статистик . 55 (1): 62–71. DOI : 10.1198 / 000313001300339950 . ISSN 0003-1305 . 
  14. Перейти ↑ Wilson, DJ (2019). "Ответ на задержку: когда среднее гармоническое значение p является байесовским фактором?" (PDF) . Труды Национальной академии наук США . 116 (13): 5857–5858. DOI : 10.1073 / pnas.1902157116 . PMC 6442550 . PMID 30890643 .   
  15. Перейти ↑ Held, L (2019). «О байесовской интерпретации гармонического среднего p- значения» . Труды Национальной академии наук США . 116 (13): 5855–5856. DOI : 10.1073 / pnas.1900671116 . PMID 30890644 .