Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В статистике при выполнении множественных сравнений коэффициент ложноположительных результатов (также известный как коэффициент выпадений или ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Частота ложных срабатываний рассчитывается как соотношение между количеством отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общим количеством фактических отрицательных событий (независимо от классификации).

Ложноположительным скорость (или «ложные тревоги») , как правило , относится к продолжительности ложного положительного соотношения .

Определение [ править ]

Частота ложных срабатываний составляет

где - количество ложных срабатываний, - количество истинных отрицаний и - общее количество истинных отрицаний.

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих его критериев (например, FWER или FDR ), которые были предварительно определены исследователем.

При выполнении нескольких сравнений в статистической основе , такие , как указаны выше, то ложный положительный коэффициент (также известный как отношение ложных тревог , в отличие от ложных срабатываний скорости / ложная тревога скорости ) обычно относится к вероятности ложно отклонения нулевой гипотезы для конкретного тест . Используя предложенную здесь терминологию, это просто .

Так как V является случайной величиной , и является константой ( ), ложный положительный коэффициент также случайная величина, в диапазоне от 0-1. Частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний , выраженному как .

Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в указанной статье [1] служит ложноположительным «коэффициентом», а не его «коэффициентом».

Классификация множественных проверок гипотез [ править ]

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, что у нас есть m нулевых гипотез, обозначенных как H 1H 2 , ...,  H m . Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование результатов каждого типа по всем H i   дает следующие случайные величины:

В m проверках гипотез, из которых являются истинными нулевыми гипотезами, R - наблюдаемая случайная величина, а S , T , U и V - ненаблюдаемые случайные величины .

Отличие от "частоты ошибок типа I" и других близких терминов [ править ]

Хотя частота ложных срабатываний математически равна частоте ошибок типа I , она рассматривается как отдельный термин по следующим причинам: [ необходима ссылка ]

  • Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны ( гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. Д.)
В отличие от этого, частота ложных срабатываний связана с последующим результатом, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез при реальной комбинации истинных и ложных нулевых гипотез (без учета «глобального нулевая гипотеза). Поскольку количество ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.
  • Более того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), а ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).

Также не следует путать частоту ложных срабатываний с частотой ошибок в семье , которая определяется как . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.

Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных обнаружений : в то время как первая определяется как , вторая определяется как .

См. Также [ править ]

  • Уровень ложного покрытия
  • Коэффициент ложного обнаружения
  • Чувствительность и специфичность

Ссылки [ править ]

  1. ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. DOI : 10.1056 / NEJM198810133191501 . PMID  3419477 .