Ложноположительным ошибка в двоичной классификации , в которой результат теста ошибочно указывает на наличие такого условия, как болезнь , когда болезнь не присутствует, в то время как ложный отрицательный результат будет ошибка , напротив , где результат теста ошибочно не указывает на наличие состояния, когда оно присутствует. Это два типа ошибок в двоичном тесте , в отличие от двух видов правильных результатов (истинно положительный иправда отрицательный ). В медицине они также известны какложноположительный(илиложноотрицательный)диагноз, а встатистической классификации -какложноположительные(илиложноотрицательные)ошибки. [1]
В статистической проверке гипотез аналогичные концепции известны как ошибки типа I и типа II , где положительный результат соответствует отклонению нулевой гипотезы , а отрицательный результат соответствует отклонению нулевой гипотезы. Эти термины часто используются как синонимы, но есть различия в деталях и интерпретациях из-за различий между медицинским тестированием и статистической проверкой гипотез.
Ложноположительная ошибка
Ложноположительные ошибки , или ложные срабатывания , является результатом , который указует на данное условие существует , когда он не делает. Например, тест на беременность, который показывает, что женщина беременна, когда она не беременна, или осуждение невиновного человека.
Ложноположительная ошибка - это ошибка типа I, когда тест проверяет одно условие и ошибочно дает положительное (положительное) решение. Однако важно различать частоту ошибок типа 1 и вероятность того, что положительный результат окажется ложным. Последний известен как риск ложных срабатываний (см. Неоднозначность определения частоты ложных срабатываний ниже ). [2]
Ложноотрицательная ошибка
Ложноотрицательный ошибка , или ложный отрицательный , это результат теста , который ошибочно указывает на то, что условие не выполняется. Например, когда тест на беременность показывает, что женщина не беременна, но она беременна, или когда лицо, виновное в совершении преступления, оправдано, это ложноотрицательные результаты. Условие «женщина беременна» или «человек виновен» выполняется, но тест (тест на беременность или судебное разбирательство) не учитывает это условие и ошибочно принимает решение, что человек не беременен или не виновен.
Ложноотрицательная ошибка - это ошибка типа II, возникающая в тесте, где проверяется одно условие, а результат теста ошибочный, т.е. условие отсутствует. [3]
Связанные термины
Ложноположительные и ложноотрицательные показатели
Частота ложноположительных результатов - это доля всех отрицательных результатов, которые все же дают положительные результаты теста, т. Е. Условная вероятность положительного результата теста с учетом события, которого не было.
Частота ложных срабатываний равна уровню значимости . Специфичность теста равно 1 минус процент ложных срабатываний.
При статистической проверке гипотез этой доле присваивается греческая буква α , а 1 - α определяется как специфичность теста. Повышение специфичности теста снижает вероятность ошибок типа I, но может повысить вероятность ошибок типа II (ложноотрицательные результаты, отклоняющие альтернативную гипотезу, если она верна). [а]
Дополнительно Частота ложноотрицательных результатов - это доля положительных результатов, которые дают отрицательные результаты теста с тестом, т. е. условная вероятность отрицательного результата теста при наличии искомого условия.
При статистической проверке гипотез этой доле присваивается буква β . « Мощность » (или « чувствительность ») теста равна 1 - β .
Неоднозначность в определении частоты ложных срабатываний
Термин «коэффициент ложного обнаружения» (FDR) был использован Колкухоуном (2014) [4] для обозначения вероятности того, что «значимый» результат был ложноположительным. Позже Colquhoun (2017) [2] использовал термин ложноположительный риск (FPR) для того же количества, чтобы избежать путаницы с термином FDR, используемым людьми, которые работают над множественными сравнениями . Поправки для множественных сравнений направлены только на исправление частоты ошибок типа I, поэтому результатом является (исправленное) p- значение . Таким образом, они подвержены такому же неверному толкованию, как и любое другое значение p . Риск ложного срабатывания всегда выше, часто намного выше, чем значение p . [4] [2]
Путаница этих двух идей, ошибка транспонированного условного выражения нанесла много вреда. [5] Из-за неоднозначности обозначений в этой области важно смотреть на определение в каждой статье. Опасности использования p- значений были подчеркнуты в Colquhoun (2017) [2] , указав, что даже наблюдение p = 0,001 не обязательно является убедительным доказательством против нулевой гипотезы. Несмотря на то, что отношение правдоподобия в пользу альтернативной гипотезы над нулевым значением близко к 100, если бы гипотеза была неправдоподобной, с априорной вероятностью реального эффекта, равной 0,1, даже наблюдение p = 0,001 было бы ложноположительным. ставка 8 процентов. Он даже не достигнет 5-процентного уровня. Как следствие, было рекомендовано [2] [6], чтобы каждое значение p сопровождалось априорной вероятностью наличия реального эффекта, который необходимо было бы предположить для достижения риска ложного срабатывания 5%. . Например, если мы наблюдаем p = 0,05 в одном эксперименте, мы должны быть на 87% уверены, что существует реальный эффект до того, как эксперимент будет проведен, чтобы достичь риска ложноположительных результатов в 5%.
Рабочая характеристика приемника
В статье « Рабочие характеристики приемника » рассматриваются параметры статистической обработки сигналов на основе соотношений ошибок различных типов.
Заметки
- ^ При разработке алгоритмов обнаружения или тестов необходимо выбирать баланс между рисками ложноотрицательных и ложных срабатываний. Обычно существует порог того, насколько близко должно быть достигнуто совпадение с заданной выборкой, прежде чем алгоритм сообщит о совпадении. Чем выше этот порог, тем больше ложных отрицательных результатов и меньше ложных срабатываний.
Рекомендации
- ^ Ложные срабатывания и ложные отрицания
- ^ а б в г д Colquhoun, Дэвид (2017). «Воспроизводимость исследований и неправильное толкование p-значений» . Королевское общество «Открытая наука» . 4 (12): 171085. DOI : 10.1098 / rsos.171085 . PMC 5750014 . PMID 29308247 .
- ^ Банерджи, А; Читнис, УБ; Джадхав, SL; Bhawalkar, JS; Чаудхури, S (2009). «Проверка гипотез, ошибки I и II типа» . Ind J Psychiatry . 18 (2): 127–31. DOI : 10.4103 / 0972-6748.62274 . PMC 2996198 . PMID 21180491 .
- ^ а б Колкухун, Дэвид (2014). «Расследование ложных открытий и неправильного толкования p- значений » . Королевское общество «Открытая наука» . 1 (3): 140216. DOI : 10.1098 / rsos.140216 . PMC 4448847 . PMID 26064558 .
- ^ Колкухун, Дэвид. «Проблема с p-значениями» . Эон . Журнал Aeon . Проверено 11 декабря +2016 .
- ^ Колкухун, Дэвид (2018). «Риск ложного срабатывания: предложение относительно того, что делать с значениями p». Американский статистик . 73 : 192–201. arXiv : 1802.04888 . DOI : 10.1080 / 00031305.2018.1529622 .
Смотрите также
- Мальчик, который кричал: "Волки
Внешние ссылки
- Ежедневный график - Маловероятные результаты - Почему большинство опубликованных научных исследований, вероятно, ложно - Иллюстрация ложных срабатываний и ложных отрицаний в журнале The Economist в статье Проблемы с научными исследованиями Как наука идет не так Научные исследования изменили мир. Теперь он должен измениться сам (19 октября 2013 г.)