Ложноположительная ставка

Эта статья в значительной степени или полностью основана на одном источнике . Соответствующее обсуждение можно найти на странице обсуждения . Пожалуйста, помогите улучшить эту статью , добавив ссылки на дополнительные источники .
Найти источники: «Рейтинг ложноположительных результатов» - новости · газеты · книги · ученый · JSTOR ( июль 2016 г. )

В статистике при выполнении множественных сравнений коэффициент ложноположительных результатов (также известный как коэффициент выпадений или ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста . Частота ложных срабатываний рассчитывается как соотношение между количеством отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общим количеством фактических отрицательных событий (независимо от классификации).

Ложноположительным скорость (или «ложные тревоги») , как правило , относится к продолжительности ложного положительного соотношения .

Определение [ править ]

Частота ложных срабатываний составляет ${\ displaystyle FPR = {\ frac {\ mathrm {FP}} {\ mathrm {FP} + \ mathrm {TN}}}}$

где - количество ложных срабатываний, - количество истинных отрицаний и - общее количество истинных отрицаний. ${\ Displaystyle \ mathrm {FP}}$ ${\ displaystyle \ mathrm {TN}}$ ${\ Displaystyle N = \ mathrm {FP} + \ mathrm {TN}}$

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и поддерживающих его критериев (например, FWER или FDR ), которые были предварительно определены исследователем.

При выполнении нескольких сравнений в статистической основе , такие , как указаны выше, то ложный положительный коэффициент (также известный как отношение ложных тревог , в отличие от ложных срабатываний скорости / ложная тревога скорости ) обычно относится к вероятности ложно отклонения нулевой гипотезы для конкретного тест . Используя предложенную здесь терминологию, это просто . ${\ displaystyle V / m_ {0}}$

Так как V является случайной величиной , и является константой ( ), ложный положительный коэффициент также случайная величина, в диапазоне от 0-1. Частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний , выраженному как . ${\ displaystyle m_ {0}}$ ${\ displaystyle V \ leq m_ {0}}$
${\ displaystyle E (В / м_ {0})}$

Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в указанной статье ^[1] служит ложноположительным «коэффициентом», а не его «коэффициентом». ${\ displaystyle V / m_ {0}}$

Классификация множественных проверок гипотез [ править ]

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, что у нас есть m нулевых гипотез, обозначенных как $H 1, H 2, ..., H m .$ Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование результатов каждого типа по всем H _i дает следующие случайные величины:

	Нулевая гипотеза верна (H ₀ )	Альтернативная гипотеза верна (H _A )	Общее
Тест объявлен значимым	$V$	$S$	$р$
Тест объявлен несущественным	$U$	$Т$	${\ displaystyle mR}$
Общее	${\ displaystyle m_ {0}}$	${\ Displaystyle м-м_ {0}}$	$м$

$m$ - общее количество проверенных гипотез
${\ displaystyle m_ {0}}$ количество истинных нулевых гипотез , неизвестный параметр
${\ Displaystyle м-м_ {0}}$ количество истинных альтернативных гипотез
$V$ - количество ложных срабатываний (ошибка типа I) (также называемых «ложными открытиями»).
$S$ - количество истинных положительных результатов (также называемых «истинными открытиями»).
$T$ - количество ложноотрицательных результатов (ошибка типа II)
$U$ - количество истинных негативов
${\ Displaystyle R = V + S}$ это количество отклоненных нулевых гипотез (также называемых «открытиями», истинными или ложными)

В $m$ проверках гипотез, из которых являются истинными нулевыми гипотезами, $R$ - наблюдаемая случайная величина, а $S$ , $T$ , $U$ и $V$ - ненаблюдаемые случайные величины . ${\ displaystyle m_ {0}}$

Отличие от "частоты ошибок типа I" и других близких терминов [ править ]

Этот раздел, возможно, содержит оригинальные исследования . Пожалуйста, улучшите его , проверяя сделанные утверждения и добавляя встроенные цитаты . Заявления, содержащие только оригинальные исследования, следует удалить. ( Февраль 2013 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

Хотя частота ложных срабатываний математически равна частоте ошибок типа I , она рассматривается как отдельный термин по следующим причинам: ^{[ необходима ссылка ]}

Частота ошибок типа I часто связана с априорной установкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок, учитывая, что все нулевые гипотезы верны ( гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. Д.)

В отличие от этого, частота ложных срабатываний связана с последующим результатом, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез при реальной комбинации истинных и ложных нулевых гипотез (без учета «глобального нулевая гипотеза). Поскольку количество ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.

Более того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), а ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).

Также не следует путать частоту ложных срабатываний с частотой ошибок в семье , которая определяется как . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной. ${\ Displaystyle \ mathrm {FWER} = \ Pr (V \ geq 1) \,}$

Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных обнаружений : в то время как первая определяется как , вторая определяется как . ${\ displaystyle E (В / м_ {0})}$ ${\ Displaystyle E (V / R)}$

См. Также [ править ]

Уровень ложного покрытия
Коэффициент ложного обнаружения
Чувствительность и специфичность

Ссылки [ править ]

^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. DOI : 10.1056 / NEJM198810133191501 . PMID 3419477 .

[Burke.at.all1988-1] Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии . 319 (15): 961–964. DOI : 10.1056 / NEJM198810133191501 . PMID 3419477 .

[1]