Ложные срабатывания и ложные отрицания

Ложноположительным ошибка в двоичной классификации , в которой результат теста ошибочно указывает на наличие такого условия, как болезнь , когда болезнь не присутствует, в то время как ложный отрицательный результат будет ошибка , напротив , где результат теста ошибочно не указывает на наличие состояния, когда оно присутствует. Это два типа ошибок в двоичном тесте , в отличие от двух видов правильных результатов (истинно положительный иправда отрицательный ). В медицине они также известны какложноположительный(илиложноотрицательный)диагноз, а встатистической классификации -какложноположительные(илиложноотрицательные)ошибки. ^[1]

В статистической проверке гипотез аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует отклонению нулевой гипотезы. Эти термины часто используются как синонимы, но есть различия в деталях и интерпретациях из-за различий между медицинским тестированием и статистической проверкой гипотез.

Ложноположительная ошибка

Ложноположительные ошибки , или ложные срабатывания , является результатом , который указует на данное условие существует , когда он не делает. Например, тест на беременность, который показывает, что женщина беременна, когда она не беременна, или осуждение невиновного человека.

Ложноположительная ошибка - это ошибка типа I, когда тест проверяет одно условие и ошибочно дает положительное (положительное) решение. Однако важно различать частоту ошибок типа 1 и вероятность того, что положительный результат окажется ложным. Последний известен как риск ложных срабатываний (см. Неоднозначность определения частоты ложных срабатываний ниже ). ^[2]

Ложноотрицательная ошибка

Ложноотрицательный ошибка , или ложный отрицательный , это результат теста , который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда лицо, виновное в совершении преступления, оправдано, это ложноотрицательные результаты. Условие «женщина беременна» или «человек виновен» выполняется, но тест (тест на беременность или судебное разбирательство) не учитывает это условие и ошибочно принимает решение, что человек не беременен или не виновен.

Ложноотрицательная ошибка - это ошибка типа II, возникающая в тесте, где проверяется одно условие, а результат теста ошибочный, т.е. условие отсутствует. ^[3]

Связанные термины

Ложноположительные и ложноотрицательные показатели

Частота ложноположительных результатов - это доля всех отрицательных результатов, которые все же дают положительные результаты теста, т. Е. Условная вероятность положительного результата теста с учетом события, которого не было.

Частота ложных срабатываний равна уровню значимости . Специфичность теста равно 1 минус процент ложных срабатываний.

При статистической проверке гипотез этой доле присваивается греческая буква α , а 1 - α определяется как специфичность теста. Повышение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательные результаты, отклоняющие альтернативную гипотезу, если она верна). ^[а]

Дополнительно Частота ложноотрицательных результатов - это доля положительных результатов, которые дают отрицательные результаты теста с тестом, т. е. условная вероятность отрицательного результата теста при наличии искомого условия.

При статистической проверке гипотез этой доле присваивается буква β . « Мощность » (или « чувствительность ») теста равна 1 - β .

Неоднозначность в определении частоты ложных срабатываний

Термин «коэффициент ложного обнаружения» (FDR) был использован Колкухоуном (2014) ^[4] для обозначения вероятности того, что «значимый» результат был ложноположительным. Позже Colquhoun (2017) ^[2] использовал термин ложноположительный риск (FPR) для того же количества, чтобы избежать путаницы с термином FDR, используемым людьми, которые работают над множественными сравнениями . Поправки для множественных сравнений направлены только на исправление частоты ошибок типа I, поэтому результатом является (исправленное) p- значение . Таким образом, они подвержены такому же неверному толкованию, как и любое другое значение p . Риск ложного срабатывания всегда выше, часто намного выше, чем значение p . ^[4]^[2]

Путаница этих двух идей, ошибка транспонированного условного выражения нанесла много вреда. ^[5] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности использования p- значений были подчеркнуты в Colquhoun (2017) ^[2] , указав, что даже наблюдение p = 0,001 не обязательно является убедительным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы над нулевым значением близко к 100, если бы гипотеза была неправдоподобной, с априорной вероятностью реального эффекта, равной 0,1, даже наблюдение p = 0,001 было бы ложноположительным. ставка 8 процентов. Он даже не достигнет 5-процентного уровня. Как следствие, было рекомендовано ^[2]^[6], чтобы каждое значение p сопровождалось априорной вероятностью наличия реального эффекта, который необходимо было бы предположить для достижения риска ложного срабатывания 5%. . Например, если мы наблюдаем p = 0,05 в одном эксперименте, мы должны быть на 87% уверены, что существует реальный эффект до того, как эксперимент будет проведен, чтобы достичь риска ложноположительных результатов в 5%.

Рабочая характеристика приемника

В статье « Рабочие характеристики приемника » рассматриваются параметры статистической обработки сигналов на основе соотношений ошибок различных типов.

Заметки

^ При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложных срабатываний. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с заданной выборкой, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложных отрицательных результатов и меньше ложных срабатываний.

Смотрите также

Мальчик, который кричал: "Волки

Внешние ссылки

Ежедневный график - Маловероятные результаты - Почему большинство опубликованных научных исследований, вероятно, ложно - Иллюстрация ложных срабатываний и ложных отрицаний в журнале The Economist в статье Проблемы с научными исследованиями Как наука идет не так Научные исследования изменили мир. Теперь он должен измениться сам (19 октября 2013 г.)

[4] При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложных срабатываний. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с заданной выборкой, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложных отрицательных результатов и меньше ложных срабатываний.

[1] Ложные срабатывания и ложные отрицания

[DC2017-2] а ^б ^в ^г ^д Colquhoun, Дэвид (2017). «Воспроизводимость исследований и неправильное толкование p-значений» . Королевское общество «Открытая наука» . 4 (12): 171085. DOI : 10.1098 / rsos.171085 . PMC 5750014 . PMID 29308247 .

[fn-3] Банерджи, А; Читнис, УБ; Джадхав, SL; Bhawalkar, JS; Чаудхури, S (2009). «Проверка гипотез, ошибки I и II типа» . Ind J Psychiatry . 18 (2): 127–31. DOI : 10.4103 / 0972-6748.62274 . PMC 2996198 . PMID 21180491 .

[DC2014-5] а б Колкухун, Дэвид (2014). «Расследование ложных открытий и неправильного толкования p- значений » . Королевское общество «Открытая наука» . 1 (3): 140216. DOI : 10.1098 / rsos.140216 . PMC 4448847 . PMID 26064558 .

[DC2016-6] Колкухун, Дэвид. «Проблема с p-значениями» . Эон . Журнал Aeon . Проверено 11 декабря +2016 .

[DC2018-7] Колкухун, Дэвид (2018). «Риск ложного срабатывания: предложение относительно того, что делать с значениями p». Американский статистик . 73 : 192–201. arXiv : 1802.04888 . DOI : 10.1080 / 00031305.2018.1529622 .

[1]