Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Familywise error rate )
Перейти к навигации Перейти к поиску

В статистике , семьи мудрый уровень ошибок ( FWER ) является вероятность создания одного или нескольких ложных открытий или ошибок I типа при выполнении нескольких гипотез испытаний .

История [ править ]

Тьюки ввел термины «частота ошибок в эксперименте» и «частота ошибок в эксперименте», чтобы обозначить частоту ошибок, которую исследователь мог бы использовать в качестве контрольного уровня в эксперименте с множественными гипотезами. [ необходима цитата ]

Фон [ править ]

В рамках статистической системы существует несколько определений термина "семья":

  • В 1987 г. Хохберг и Тамане определили «семью» как «любую совокупность умозаключений, для которой имеет смысл принимать во внимание некоторую комбинированную меру погрешности». [1]
  • Согласно Коксу в 1982 году, набор умозаключений следует рассматривать как семью: [ необходима цитата ]
  1. Учесть эффект отбора за счет выемки данных
  2. Обеспечить одновременную правильность ряда выводов, чтобы гарантировать правильное общее решение.

Подводя итог, можно сказать, что семью лучше всего можно определить с помощью потенциального выборочного вывода, с которым приходится сталкиваться: семья - это наименьший набор элементов вывода в анализе, взаимозаменяемых в отношении их значения для цели исследования, из которого выбираются результаты для действий. , презентация или выделение может быть сделано ( Йоав Бенджамини ). [ необходима цитата ]

Классификация множественных проверок гипотез [ править ]

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть m нулевых гипотез, обозначенных как H 1H 2 , ...,  H m . Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование результатов каждого типа по всем H i   дает следующие случайные величины:

  • m - общее количество проверенных гипотез
  • количество истинных нулевых гипотез , неизвестный параметр
  • количество истинных альтернативных гипотез
  • V - количество ложных срабатываний (ошибка типа I) (также называемых «ложными открытиями»).
  • S - количество истинных положительных результатов (также называемых «истинными открытиями»).
  • T - количество ложноотрицательных результатов (ошибка типа II)
  • U - количество истинных негативов
  • это количество отклоненных нулевых гипотез (также называемых «открытиями», истинными или ложными)

В m проверках гипотез, из которых являются истинными нулевыми гипотезами, R - наблюдаемая случайная величина, а S , T , U и V - ненаблюдаемые случайные величины .

Определение [ править ]

FWER - это вероятность совершения хотя бы одной ошибки типа I в семье,

или, что эквивалентно,

Таким образом, гарантируя , вероятность совершения одной или нескольких ошибок типа I в семействе контролируется на уровне .

Процедура управляет FWER в слабом смысле, если управление FWER на уровне гарантируется только тогда, когда все нулевые гипотезы верны (то есть когда истинна «глобальная нулевая гипотеза»). [2]

Процедура контролирует FWER в строгом смысле, если управление FWER на уровне гарантировано для любой конфигурации истинных и ложных нулевых гипотез (независимо от того, верна ли глобальная нулевая гипотеза). [3]

Контрольные процедуры [ править ]

Существуют некоторые классические решения, обеспечивающие строгий контроль уровня FWER, и некоторые более новые решения.

Процедура Бонферрони [ править ]

  • Обозначим в р -значение для тестирования
  • отклонить, если

Процедура Шидака [ править ]

  • Проверка каждой гипотезы на уровне - это процедура множественного тестирования Сидака.
  • Эта процедура более эффективна, чем процедура Бонферрони, но выигрыш невелик.
  • Эта процедура может не контролировать FWER, если тесты имеют отрицательную зависимость.

Процедура Тьюки [ править ]

  • Процедура Тьюки применима только для парных сравнений .
  • Он предполагает независимость тестируемых наблюдений, а также равную вариацию между наблюдениями ( гомоскедастичность ).
  • Процедура вычисляет для каждой пары статистику стьюдентизированного диапазона : где - большее из двух сравниваемых средних, - меньшее и - стандартная ошибка рассматриваемых данных. [ необходима цитата ]
  • Тест Тьюки - это, по сути , t-критерий Стьюдента , за исключением того, что он корректирует частоту ошибок в семье . [ необходима цитата ]

Процедура понижения Холма (1979) [ править ]

  • Начните с упорядочивания значений p (от наименьшего к наибольшему) и позвольте связанным гипотезам быть
  • Пусть - минимальный индекс такой, что
  • Отвергните нулевые гипотезы . Если тогда ни одна из гипотез не отвергается. [ необходима цитата ]

Эта процедура неизменно более эффективна, чем процедура Бонферрони. [4] Причина, по которой эта процедура контролирует частоту ошибок семейства для всех m гипотез на уровне α в строгом смысле, заключается в том, что это процедура закрытого тестирования . Таким образом, каждое пересечение проверяется с помощью простого теста Бонферрони. [ необходима цитата ]

Процедура повышения Хохберга [ править ]

Повышающая процедура Хохберга (1988) выполняется с использованием следующих шагов: [5]

  • Начните с упорядочивания значений p (от наименьшего к наибольшему) и позвольте связанным гипотезам быть
  • Для данного , позвольте быть наибольшим таким, что
  • Отклонить нулевые гипотезы

Процедура Хохберга более действенна, чем процедура Холмса. Тем не менее, в то время как процедура Холма является закрытой процедурой тестирования (и, таким образом, как и Бонферрони, не имеет ограничений на совместное распределение тестовой статистики), процедура Хохберга основана на тесте Саймса, поэтому она выполняется только при неотрицательной зависимости. [ необходима цитата ]

Исправление Даннета [ править ]

Чарльз Даннетт (1955, 1966) описал альтернативную корректировку альфа-ошибки, когда k групп сравнивают с одной и той же контрольной группой. Теперь известный как тест Даннета, этот метод менее консервативен, чем корректировка Бонферрони. [ необходима цитата ]

Метод Шеффе [ править ]

Процедуры передискретизации [ править ]

Процедуры Бонферрони и Холма управляют FWER при любой структуре зависимости p- значений (или, что эквивалентно, статистике отдельных тестов). По сути, это достигается за счет применения структуры зависимости "наихудшего случая" (которая близка к независимости для большинства практических целей). Но такой подход консервативен, если зависимость действительно положительная. В качестве крайнего примера, при абсолютной положительной зависимости фактически существует только один тест, и, следовательно, FWER не накачан.

Учет структуры зависимости p- значений (или статистики отдельных тестов) дает более мощные процедуры. Этого можно достичь, применяя методы повторной выборки, такие как методы начальной загрузки и перестановки. Процедура Вестфолла и Янга (1993) требует определенного условия, которое не всегда выполняется на практике (а именно, поворотности подмножества). [6] Процедуры Романо и Вольфа (2005a, b) обходятся без этого условия и, таким образом, более применимы. [7] [8]

Гармоническая процедура среднего p- значения [ править ]

Процедура гармонического среднего p- значения (HMP) [9] [10] обеспечивает многоуровневый тест, который улучшает мощность коррекции Бонферрони, оценивая значимость групп гипотез, контролируя при этом частоту серьезных семейных ошибок. Значение любого подмножества из тестов оценивают путем расчета HMP для подмножества,

где - веса, сумма которых равна единице (т.е. ). Приближенная процедура, которая контролирует интенсивность семейств ошибок на уровне, приблизительно отклоняет нулевую гипотезу о том, что ни одно из p- значений в подмножестве не является значимым, когда (где ). Это приближение разумно для малых (например ) и становится произвольно хорошим при приближении к нулю. Также доступен асимптотически точный тест (см. Основную статью ).

Альтернативные подходы [ править ]

Контроль FWER обеспечивает более строгий контроль над ложным обнаружением по сравнению с процедурами ложного обнаружения (FDR). Контроль FWER ограничивает вероятность по крайней мере одного ложного открытия, тогда как контроль FDR ограничивает (в широком смысле) ожидаемую долю ложных открытий. Таким образом, процедуры FDR обладают большей мощностью за счет увеличения количества ошибок типа I , т. Е. Отклонения нулевых гипотез, которые на самом деле верны. [11]

С другой стороны, управление FWER менее жесткое, чем управление частотой ошибок для каждого семейства, что ограничивает ожидаемое количество ошибок для каждого семейства. Поскольку управление FWER касается как минимум одного ложного обнаружения, в отличие от управления частотой ошибок для каждого семейства, оно не рассматривает несколько одновременных ложных открытий как нечто худшее, чем одно ложное обнаружение. Коррекция Бонферрони часто рассматриваются как просто контролировать FWER, но на самом деле также контролирует частоту ошибок в-семьи. [12]

Ссылки [ править ]

  1. ^ Hochberg, Y .; Тамане, AC (1987). Множественные процедуры сравнения . Нью-Йорк: Вили. п. 5 . ISBN 978-0-471-82222-6.
  2. ^ Дмитриенко, Алексей; Тамане, Аджит; Бретц, Франк (2009). Множественные проблемы тестирования в фармацевтической статистике (1-е изд.). CRC Press. п. 37. ISBN 9781584889847.
  3. ^ Дмитриенко, Алексей; Тамане, Аджит; Бретц, Франк (2009). Множественные проблемы тестирования в фармацевтической статистике (1-е изд.). CRC Press. п. 37. ISBN 9781584889847.
  4. ^ Aickin, M; Генслер, Х (1996). «Поправка на множественное тестирование при сообщении результатов исследования: методы Бонферрони и Холма» . Американский журнал общественного здравоохранения . 86 (5): 726–728. DOI : 10,2105 / ajph.86.5.726 . PMC 1380484 . PMID 8629727 .  
  5. Перейти ↑ Hochberg, Yosef (1988). «Более точная процедура Бонферрони для множественных тестов значимости» (PDF) . Биометрика . 75 (4): 800–802. DOI : 10.1093 / Biomet / 75.4.800 .
  6. ^ Westfall, PH; Янг, СС (1993). Множественное тестирование на основе повторной выборки: примеры и методы корректировки p-значения . Нью-Йорк: Джон Вили. ISBN 978-0-471-55761-6.
  7. ^ Романо, JP; Вольф, М. (2005a). «Точные и приближенные пошаговые методы для проверки множественных гипотез». Журнал Американской статистической ассоциации . 100 (469): 94–108. DOI : 10.1198 / 016214504000000539 . ЛВП : 10230/576 .
  8. ^ Романо, JP; Вольф, М. (2005b). «Пошаговое множественное тестирование как формализованное отслеживание данных». Econometrica . 73 (4): 1237–1282. CiteSeerX 10.1.1.198.2473 . DOI : 10.1111 / j.1468-0262.2005.00615.x . 
  9. ^ Хорошо, Эй Джей (1958). «Параллельные и последовательные испытания значимости». Журнал Американской статистической ассоциации . 53 (284): 799–813. DOI : 10.1080 / 01621459.1958.10501480 . JSTOR 2281953 . 
  10. Перейти ↑ Wilson, DJ (2019). «Гармоническое среднее значение p для объединения зависимых тестов» . Труды Национальной академии наук США . 116 (4): 1195–1200. DOI : 10.1073 / pnas.1814092116 . PMC 6347718 . PMID 30610179 .  
  11. Перейти ↑ Shaffer, JP (1995). «Проверка множественных гипотез». Ежегодный обзор психологии . 46 : 561–584. DOI : 10.1146 / annurev.ps.46.020195.003021 . hdl : 10338.dmlcz / 142950 .
  12. ^ Frane, Andrew (2015). «Уместны ли показатели ошибок типа I для каждой семьи в социальных и поведенческих науках?» . Журнал современных прикладных статистических методов . 14 (1): 12–23. DOI : 10.22237 / jmasm / 1430453040 .

Внешние ссылки [ править ]

  • Понимание коэффициента ошибок Family Wise - сообщение в блоге, включая его полезность относительно коэффициента ложного обнаружения