Коррекция Бонферрони

В статистике , то коррекция Бонферрони является способом борьбы с проблемой множественных сравнений .

Фон [ править ]

Метод назван в честь использования неравенств Бонферрони . ^[1] Расширение метода на доверительные интервалы было предложено Олив Джин Данн . ^[2]

Статистическая проверка гипотез основана на отклонении нулевой гипотезы, если вероятность наблюдаемых данных при нулевых гипотезах мала. Если проверяется несколько гипотез, вероятность наблюдения редкого события увеличивается, и, следовательно, вероятность неправильного отклонения нулевой гипотезы (т. Е. Совершения ошибки типа I ) увеличивается. ^[3]

Поправка Бонферрони компенсирует это увеличение, проверяя каждую отдельную гипотезу на уровне значимости , где - желаемый общий альфа-уровень, а - количество гипотез. ^[4] Например, если испытание проверяет гипотезы с желаемым , то поправка Бонферрони будет проверять каждую отдельную гипотезу при . Аналогичным образом, при построении нескольких доверительных интервалов возникает одно и то же явление. ${\ displaystyle \ alpha / m}$ ${\ displaystyle \ alpha}$ ${\ displaystyle m}$ ${\ displaystyle m = 20}$ ${\ Displaystyle \ альфа = 0,05}$ ${\ Displaystyle \ альфа = 0,05 / 20 = 0,0025}$

Определение [ править ]

Позвольте быть семейство гипотез и их соответствующих p-значений . Пусть будет общее количество нулевых гипотез и количество истинных нулевых гипотез. Частота ошибок familywise (FWER) есть вероятность отказа по крайней мере один истинный , то есть сделать по крайней мере , одна ошибка I типа . Поправка Бонферрони отклоняет нулевую гипотезу для каждого , тем самым контролируя FWER на . Доказательство этого управления следует из неравенства Буля следующим образом: ${\ displaystyle H_ {1}, \ ldots, H_ {m}}$ ${\ displaystyle p_ {1}, \ ldots, p_ {m}}$ ${\ displaystyle m}$ ${\ displaystyle m_ {0}}$ ${\ displaystyle H_ {i}}$ ${\ displaystyle p_ {i} \ leq {\ frac {\ alpha} {m}}}$ ${\ displaystyle \ leq \ alpha}$

{\ displaystyle {\ text {FWER}} = P \ left \ {\ bigcup _ {i = 1} ^ {m_ {0}} \ left (p_ {i} \ leq {\ frac {\ alpha} {m}) } \ right) \ right \} \ leq \ sum _ {i = 1} ^ {m_ {0}} \ left \ {P \ left (p_ {i} \ leq {\ frac {\ alpha} {m}} \ right) \ right \} = m_ {0} {\ frac {\ alpha} {m}} \ leq m {\ frac {\ alpha} {m}} = \ alpha.}

Этот элемент управления не требует каких-либо предположений о зависимости между p-значениями или о том, сколько из нулевых гипотез верны. ^[5]

Расширения [ править ]

Обобщение [ править ]

Вместо проверки каждой гипотезы на уровне, гипотезы могут быть проверены на любой другой комбинации уровней, которые в сумме составляют , при условии, что уровень каждого теста определяется до просмотра данных. ^[6] Например, для двух проверок гипотез общее значение 0,05 можно поддерживать, проводя один тест при 0,04, а другой - 0,01. ${\ displaystyle \ alpha / m}$ ${\ displaystyle \ alpha}$ ${\ displaystyle \ alpha}$

Доверительные интервалы [ править ]

Процедура, предложенная Данном ^[2] (не путать с процедурой Данна для рангового дисперсионного анализа), может использоваться для корректировки доверительных интервалов . Если кто-то устанавливает доверительные интервалы и желает иметь общий уровень достоверности , каждый индивидуальный доверительный интервал может быть скорректирован до уровня . ^[2] ${\ displaystyle m}$ ${\ displaystyle 1- \ alpha}$ $1-{\frac {\alpha }{m}}$

Непрерывные проблемы [ править ]

При поиске сигнала в непрерывном пространстве параметров также может возникнуть проблема множественных сравнений или эффекта поиска в другом месте. Например, физик может искать частицы неизвестной массы, рассматривая широкий диапазон масс; Так было во время обнаружения бозона Хиггса, получившего Нобелевскую премию . В таких случаях можно применить непрерывное обобщение поправки Бонферрони, используя байесовскую логику, чтобы связать эффективное количество испытаний с соотношением объемов до и после. ^[7] $m$

Альтернативы [ править ]

Есть альтернативные способы контролировать частоту ошибок в семье . Например, метод Холма – Бонферрони и поправка Шидака повсеместно являются более мощными процедурами, чем поправка Бонферрони, а это означает, что они всегда не менее эффективны. В отличие от процедуры Бонферрони, эти методы не контролируют ожидаемое количество ошибок типа I на семейство (частоту ошибок типа I на семейство). ^[8]

Критика [ править ]

Что касается FWER контроля, коррекция Бонферрони может быть консервативной , если есть большое количество тестов и / или статистические испытания положительно коррелирует. ^[9]

Коррекция происходит за счет увеличения вероятности получения ложноотрицательных результатов , т. Е. Снижения статистической мощности . ^[10]^[9] Не существует окончательного консенсуса относительно того, как определять семью во всех случаях, и скорректированные результаты тестов могут варьироваться в зависимости от количества тестов, включенных в семейство гипотез. ^{[ необходима цитата ]} Такая критика относится к контролю FWER в целом и не относится к поправке Бонферрони.

Ссылки [ править ]

^ Бонферони, CE, Teoria STATISTICA делле классифицирует е Calcolo делла probabilità, Pubblicazioni дель R Istituto Superiore ди Scienze Economiche х Commerciali ди Firenze 1936
^ a b c Данн, Олив Джин (1961). «Множественные сравнения между средствами» (PDF) . Журнал Американской статистической ассоциации . 56 (293): 52–64. CiteSeerX 10.1.1.309.1277 . DOI : 10.1080 / 01621459.1961.10482090 .
^ Mittelhammer, Ron C .; Судья Джордж Г .; Миллер, Дуглас Дж. (2000). Эконометрические основы . Издательство Кембриджского университета. С. 73–74. ISBN 978-0-521-62394-0.
^ Миллер, Руперт Г. (1966). Одновременный статистический вывод . Springer. ISBN 9781461381228.
^ Goeman, Jelle J .; Солари, Альдо (2014). «Проверка множественных гипотез в геномике». Статистика в медицине . 33 (11): 1946–1978. DOI : 10.1002 / sim.6082 . PMID 24399688 .
^ Нойвальд, AF; Грин, П. (1994). «Выявление закономерностей в белковых последовательностях». J. Mol. Биол . 239 (5): 698–712. DOI : 10.1006 / jmbi.1994.1407 . PMID 8014990 .
^ Байер, Адриан Э .; Селяк, Урош (2020). «Эффект поиска в другом месте с объединенной байесовской и частотной точки зрения» . Журнал космологии и физики астрономических частиц . 2020 (10): 009–009. arXiv : 2007.13821 . DOI : 10.1088 / 1475-7516 / 2020/10/009 .
^ Frane, Andrew (2015). «Уместны ли показатели ошибок типа I для каждой семьи в социальных и поведенческих науках?» . Журнал современных прикладных статистических методов . 14 (1): 12–23. DOI : 10.22237 / jmasm / 1430453040 .
^ a b Моран, Мэтью (2003). «Аргументы в пользу отказа от последовательного Бонферрони в экологических исследованиях». Ойкос . 100 (2): 403–405. DOI : 10.1034 / j.1600-0706.2003.12010.x .
Перейти ↑ Nakagawa, Shinichi (2004). «Прощание с Бонферрони: проблемы низкой статистической мощности и предвзятости публикации» . Поведенческая экология . 15 (6): 1044–1045. DOI : 10.1093 / beheco / arh107 .

Дальнейшее чтение [ править ]

Даннетт, CW (1955). «Процедура множественных сравнений для сравнения нескольких обработок с контролем». Журнал Американской статистической ассоциации . 50 (272): 1096–1121. DOI : 10.1080 / 01621459.1955.10501294 .
Даннетт, CW (1964). «Новые таблицы для множественных сравнений с контролем». Биометрия . 20 (3): 482–491. DOI : 10.2307 / 2528490 . JSTOR 2528490 . S2CID 64020124 .
Шаффер, JP (1995). «Проверка множественных гипотез». Ежегодный обзор психологии . 46 : 561–584. DOI : 10.1146 / annurev.ps.46.020195.003021 . hdl : 10338.dmlcz / 142950 .
Strassburger, K .; Бретц, Франк (2008). «Совместимые одновременные нижние доверительные границы для процедуры Холма и других закрытых тестов на основе Бонферрони». Статистика в медицине . 27 (24): 4914–4927. DOI : 10.1002 / sim.3338 . PMID 18618415 .
Шидак, З. (1967). «Прямоугольные доверительные области для средних многомерных нормальных распределений». Журнал Американской статистической ассоциации . 62 (318): 626–633. DOI : 10.1080 / 01621459.1967.10482935 .
Хохберг, Йосеф (1988). «Более точная процедура Бонферрони для множественных тестов значимости» (PDF) . Биометрика . 75 (4): 800–802. DOI : 10.1093 / Biomet / 75.4.800 .

Внешние ссылки [ править ]

Бонферрони, онлайн-калькулятор Сидак
Множественные исправления при тестировании в данных GeneSpring и экспрессии генов

[1] Бонферони, CE, Teoria STATISTICA делле классифицирует е Calcolo делла probabilità, Pubblicazioni дель R Istituto Superiore ди Scienze Economiche х Commerciali ди Firenze 1936

[Dunn1961-2] Данн, Олив Джин (1961). «Множественные сравнения между средствами» (PDF) . Журнал Американской статистической ассоциации . 56 (293): 52–64. CiteSeerX 10.1.1.309.1277 . DOI : 10.1080 / 01621459.1961.10482090 .

[3] Mittelhammer, Ron C .; Судья Джордж Г .; Миллер, Дуглас Дж. (2000). Эконометрические основы . Издательство Кембриджского университета. С. 73–74. ISBN 978-0-521-62394-0.

[4] Миллер, Руперт Г. (1966). Одновременный статистический вывод . Springer. ISBN 9781461381228.

[5] Goeman, Jelle J .; Солари, Альдо (2014). «Проверка множественных гипотез в геномике». Статистика в медицине . 33 (11): 1946–1978. DOI : 10.1002 / sim.6082 . PMID 24399688 .

[pmid8014990-6] Нойвальд, AF; Грин, П. (1994). «Выявление закономерностей в белковых последовательностях». J. Mol. Биол . 239 (5): 698–712. DOI : 10.1006 / jmbi.1994.1407 . PMID 8014990 .

[Bayer2020-7] Байер, Адриан Э .; Селяк, Урош (2020). «Эффект поиска в другом месте с объединенной байесовской и частотной точки зрения» . Журнал космологии и физики астрономических частиц . 2020 (10): 009–009. arXiv : 2007.13821 . DOI : 10.1088 / 1475-7516 / 2020/10/009 .

[8] Frane, Andrew (2015). «Уместны ли показатели ошибок типа I для каждой семьи в социальных и поведенческих науках?» . Журнал современных прикладных статистических методов . 14 (1): 12–23. DOI : 10.22237 / jmasm / 1430453040 .

[Moran2003-9] Моран, Мэтью (2003). «Аргументы в пользу отказа от последовательного Бонферрони в экологических исследованиях». Ойкос . 100 (2): 403–405. DOI : 10.1034 / j.1600-0706.2003.12010.x .

[Nakagawa2004-10] Перейти ↑ Nakagawa, Shinichi (2004). «Прощание с Бонферрони: проблемы низкой статистической мощности и предвзятости публикации» . Поведенческая экология . 15 (6): 1044–1045. DOI : 10.1093 / beheco / arh107 .

[1]