Заблуждение базовой ставки , которая также называется игнорированием базовой ставки или смещение базовой ставки , представляет собой тип заблуждения . Если им представлена соответствующая информация о базовой ставке (т. Е. Общая информация о распространенности) и конкретная информация (т. Е. Информация, относящаяся только к конкретному случаю), люди склонны игнорировать базовую ставку в пользу индивидуальной информации, вместо того, чтобы правильно интегрировать эти две . [1]
Пренебрежение базовой ставкой - это особая форма более общего пренебрежения расширением .
Ложноположительный парадокс [ править ]
Примером ошибки базовой ставки является парадокс ложноположительных результатов . Этот парадокс описывает ситуации, когда ложноположительных результатов больше, чем истинно положительных. Например, 50 из 1000 человек дали положительный результат на инфекцию, но только у 10 была инфекция, то есть 40 тестов были ложноположительными. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборки. [2] Когда распространенность, доля тех, у кого есть данное заболевание, ниже, чем уровень ложноположительных результатов теста , даже тесты, которые имеют очень низкий шанс дать ложноположительный результат в отдельном случае , дадут больше ложных, чем истинных положительных результатов.в целом . [3] Парадокс удивляет большинство людей. [4]
Это особенно противоречит интуиции при интерпретации положительного результата теста на популяции с низкой распространенностью после рассмотрения положительных результатов, полученных от популяции с высокой распространенностью. [3] Если процент ложных срабатываний теста выше, чем доля новой популяции с этим заболеванием, то администратор теста, чей опыт был получен в результате тестирования в популяции с высокой распространенностью, может на основании своего опыта сделать вывод, что положительный результат теста обычно указывает на положительный результат, тогда как на самом деле ложноположительный результат гораздо более вероятен.
Примеры [ править ]
Пример 1: болезнь [ править ]
Население с высокой заболеваемостью [ править ]
Кол- во человек | Зараженный | Незараженный | Общее |
---|---|---|---|
Положительный результат теста | 400 (истинно положительный) | 30 (ложное срабатывание) | 430 |
Тест отрицательный | 0 (ложноотрицательный) | 570 (истинно отрицательное) | 570 |
Общее | 400 | 600 | 1000 |
Представьте, что вы проводите тест на инфекционное заболевание на популяции A из 1000 человек, 40% из которых инфицированы. Показатель ложноположительных результатов теста составляет 5% (0,05), а количество ложноотрицательных результатов отсутствует. Ожидаемый результат из 1000 испытаний на популяции А будет:
- Заражены, и тест указывает на болезнь ( истинно положительный )
- 1000 × 40/100 = 400 человек получат истинный позитив
- Незараженный и тест указывает на болезнь (ложноположительный)
- 1000 × 100–40/100 × 0,05 = 30 человек получат ложное срабатывание
- Остальные 570 тестов правильно отрицательны.
Таким образом, в популяции A человек, получивший положительный результат теста, может быть уверен более чем на 93% (400/30 + 400), что это правильно указывает на инфекцию.
Население с низкой заболеваемостью [ править ]
Кол- во человек | Зараженный | Незараженный | Общее |
---|---|---|---|
Положительный результат теста | 20 (истинно положительный) | 49 (ложноположительный) | 69 |
Тест отрицательный | 0 (ложноотрицательный) | 931 (истинно отрицательный) | 931 |
Общее | 20 | 980 | 1000 |
Теперь рассмотрим тот же тест, примененный к популяции B , в которой инфицировано только 2%. Ожидаемый результат 1000 тестов на популяции B будет:
- Заражены, и тест указывает на болезнь ( истинно положительный )
- 1000 × 2/100 = 20 человек получат настоящий позитив
- Незараженный и тест указывает на болезнь (ложноположительный)
- 1000 × 100 - 2/100 × 0,05 = 49 человек получат ложное срабатывание
- Остальные 931 (= 1000 - (49 + 20)) тест положительно отрицательны.
В популяции B только 20 из 69 человек с положительным результатом теста действительно инфицированы. Таким образом, вероятность действительно заразиться после того, как человеку сказали, что он инфицирован, составляет всего 29% (20/20 + 49) для теста, который в противном случае кажется «точным на 95%».
Тестировщик, имеющий опыт работы с группой А, может найти парадокс в том, что в группе В результат, который обычно правильно указывал на инфекцию, теперь обычно является ложноположительным . Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения опасного для здоровья результата теста.
Пример 2: Пьяные водители [ править ]
- У группы сотрудников милиции есть алкотестеры, показывающие ложное опьянение в 5% случаев, когда водитель находится в трезвом состоянии. Однако алкотестеры никогда не перестают обнаруживать по-настоящему пьяного человека. Один из тысячи водителей водит машину в нетрезвом виде. Предположим, что полицейские наугад останавливают водителя, чтобы провести тест алкотестера. Это указывает на то, что водитель пьян. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность, что они действительно пьяны?
Многие ответят на 95%, но правильная вероятность составляет около 2%.
Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей
- 1 водитель в состоянии алкогольного опьянения, и 100% уверенность в том, что для этого водителя существует истинно положительный результат теста, поэтому имеется 1 истинно положительный результат теста.
- 999 водителей не пьяны, и среди них 5% ложноположительных результатов тестов, то есть 49,95 ложноположительных результатов тестов.
Следовательно, вероятность того, что один из водителей среди положительных результатов теста 1 + 49,95 = 50,95 действительно находится в состоянии алкогольного опьянения, равна .
Однако достоверность этого результата зависит от правильности первоначального предположения, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если присутствовала та или иная непроизвольная причина остановки водителя, то в расчет также включается вероятность того, что водитель в состоянии алкогольного опьянения будет управлять автомобилем грамотно, а водитель в нетрезвом виде водит (не) компетентно.
Более формально такая же вероятность примерно 0,02 может быть установлена с помощью теоремы Байеса . Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что можно представить как
где D означает, что алкотестер указывает на то, что водитель пьян. Теорема Байеса говорит нам, что
В первом абзаце нам сказали следующее:
- а также
Как видно из формулы, для теоремы Байеса требуется p ( D ), которую можно вычислить из предыдущих значений, используя закон полной вероятности :
который дает
Подставляя эти числа в теорему Байеса, мы обнаруживаем, что
Пример 3: идентификация террориста [ править ]
В 1-миллионном городе пусть будет 100 террористов и 999 900 нетеррористов. Чтобы упростить пример, предполагается, что все люди, присутствующие в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что этот же житель не является террористом, равна 0,9999. В попытке поймать террористов в городе устанавливают сигнализацию с камерой наблюдения и программой автоматического распознавания лиц .
Программное обеспечение имеет два уровня отказов по 1%:
- Уровень ложноотрицательных результатов: если камера сканирует террориста, звонок будет звонить в 99% случаев, а в 1% случаев он не будет звонить.
- Частота ложных срабатываний: если камера сканирует человека, не являющегося террористом, звонок не будет звонить в 99% случаев, но будет звонить в 1% случаев.
Предположим теперь, что житель вызывает тревогу. Какова вероятность того, что человек террорист? Другими словами, что такое P (T | B), вероятность того, что террорист был обнаружен при звонке в колокол? Кто-то, делающий «ошибку базовой ставки», сделает вывод, что существует 99% -ная вероятность того, что обнаруженный человек является террористом. Хотя такой вывод кажется разумным, на самом деле это неверное рассуждение, и приведенный ниже расчет покажет, что вероятность того, что они являются террористами, на самом деле составляет около 1%, а не около 99%.
Заблуждение возникает из-за смешения природы двух разных коэффициентов отказов. «Количество не-колоколов на 100 террористов» и «количество нетеррористов на 100 колоколов» не связаны между собой. Один не обязательно равен другому, и они даже не обязательно должны быть почти равными. Чтобы продемонстрировать это, представьте, что произойдет, если во втором городе, где террористов вообще нет, была бы установлена идентичная система сигнализации. Как и в первом городе, тревога звучит для 1 из каждых 100 обнаруженных жителей, не являющихся террористами, но, в отличие от первого города, тревога никогда не срабатывает для террористов. Таким образом, 100% всех случаев срабатывания сигнализации относятся к нетеррористам, но ложноотрицательный показатель даже не может быть подсчитан. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P (T | B) = 0%.При звонке в колокол вероятность обнаружения террориста равна нулю.
Представьте, что перед камерой проходит весь миллион жителей первого города. Около 99 из 100 террористов вызовут тревогу, равно как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу сработают около 10 098 человек, среди которых около 99 - террористы. Таким образом, вероятность того, что человек, вызвавший тревогу, на самом деле является террористом, составляет всего около 99 из 10 098, что меньше 1% и очень, очень ниже нашего первоначального предположения в 99%.
Ошибка базовой ставки в этом примере вводит в заблуждение, потому что нетеррористов намного больше, чем террористов, а количество ложных срабатываний (нетеррористов, считающихся террористами) намного больше, чем истинных срабатываний (реальное количество террористов) .
Выводы в психологии [ править ]
В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна. [5] [6] [7]
В некоторых экспериментах учащихся просили оценить средние баллы (GPA) гипотетических учащихся. Получая соответствующие статистические данные о распределении среднего балла, учащиеся, как правило, игнорировали их, если им давали описательную информацию о конкретном учащемся, даже если новая описательная информация явно не имела большого значения или не имела никакого отношения к успеваемости в школе. [6] Этот вывод был использован, чтобы доказать, что собеседования являются ненужной частью процесса приема в колледж, потому что интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.
Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемого репрезентативностью . Они утверждали, что многие суждения, касающиеся вероятности или причинно-следственных связей, основаны на том, насколько одна вещь репрезентативна для другой или категории. [6] Канеман считает пренебрежение базовой ставкой особой формой пренебрежения расширением . [8] Ричард Нисбетт утверждал, что некоторые предубеждения атрибуции, такие как фундаментальная ошибка атрибуцииявляются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую оценку») о том, как другие вели себя в аналогичных ситуациях, а вместо этого предпочитают более простые диспозиционные атрибуции . [9]
В психологии ведутся серьезные споры по поводу условий, при которых люди ценят или не ценят базовую информацию. [10] [11] Исследователи программы эвристики и систематических ошибок подчеркнули эмпирические результаты, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, нарушающие определенные нормы вероятностного рассуждения, такие как теорема Байеса . Вывод, сделанный из этого направления исследований, заключался в том, что вероятностное мышление человека в корне ошибочно и подвержено ошибкам. [12] Другие исследователи подчеркивали связь между когнитивными процессами и информационными форматами, утверждая, что такие выводы в целом необоснованны. [13] [14]
Снова рассмотрим пример 2 сверху. Требуемый вывод состоит в оценке (апостериорной) вероятности того, что (случайно выбранный) водитель находится в состоянии алкогольного опьянения, при условии, что тест алкотестера положительный. Формально эту вероятность можно вычислить с помощью теоремы Байеса , как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант задачи:
- 1 из 1000 водителей водит машину в нетрезвом виде. Алкотестеры никогда не перестают определять по-настоящему пьяного человека. Для 50 из 999 водителей, не находящихся в состоянии алкогольного опьянения, алкотестер ложно указывает на состояние опьянения. Предположим, полицейские затем наугад останавливают водителя и заставляют его пройти тест алкотестера. Это указывает на то, что они пьяны. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность, что они действительно пьяны?
В этом случае соответствующая числовая информация - p (drunk), p ( D | drunk), p ( D | sober) - представлена в терминах собственных частот по отношению к определенному эталонному классу (см. Задачу эталонного класса ). Эмпирические исследования показывают, что выводы людей более точно соответствуют правилу Байеса, когда информация представлена таким образом, что помогает преодолеть пренебрежение по базовой ставке со стороны непрофессионалов [14] и экспертов. [15] Как следствие, такие организации, как Cochrane Collaboration, рекомендуют использовать такой формат для передачи статистики здравоохранения. [16]Учить людей переводить подобные байесовские задачи рассуждений в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса. [17] Также было показано, что графическое представление собственных частот (например, массив значков) помогает людям делать более точные выводы. [17] [18] [19]
Чем полезны форматы собственных частот? Одна из важных причин заключается в том, что этот формат информации облегчает требуемый вывод, поскольку упрощает необходимые вычисления. Это можно увидеть, используя альтернативный способ вычисления требуемой вероятности p (drunk | D ):
где N (пьяный ∩ D ) обозначает количество пьяных водителей, получивших положительный результат алкотестера, а N ( D ) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения предыдущему следует из аксиом теории вероятностей, согласно которой N (drunk ∩ D ) = N × p ( D | drunk) × p(пьяный). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, психологически оно не эквивалентно. Использование собственных частот упрощает вывод, поскольку требуемая математическая операция может выполняться с натуральными числами, а не с нормализованными дробями (то есть вероятностями), потому что это делает большое количество ложных срабатываний более прозрачным, и поскольку собственные частоты демонстрируют «вложенный набор» состав". [20] [21]
Не каждый частотный формат облегчает байесовские рассуждения. [21] [22] Собственные частоты относятся к информации о частоте, которая получается в результате естественной выборки , [23] которая сохраняет информацию о базовой скорости (например, количество пьяных водителей при выборке случайной выборки водителей). Это отличается от систематической выборки , в которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный тест) из сравнения количества пьяных водителей с положительным результатом теста по сравнению с общим количеством людей, получивших положительный результат алкотестера, потому что информация о базовой скорости не сохраняется и должна быть явно повторно введена с использованием теоремы Байеса. .
См. Также [ править ]
- Байесовская вероятность
- Теорема Байеса
- Дноуглубительные работы
- Индуктивный аргумент
- Список когнитивных предубеждений
- Список парадоксов
- Вводящая в заблуждение яркость
- Профилактика парадокса
- Ошибка прокурора , ошибка в рассуждении, включающая игнорирование низкой априорной вероятности
- Парадокс Симпсона , еще одна ошибка в статистических рассуждениях о сравнении групп
- Стереотип
Ссылки [ править ]
- ^ «Логическая ошибка: ошибка базовой ставки» . Fallacyfiles.org . Проверено 15 июня 2013 .
- ^ Rheinfurth, MH; Хауэлл, LW (март 1998 г.). Вероятность и статистика в аэрокосмической технике (PDF) . НАСА . п. 16.
СООБЩЕНИЕ: ложноположительные тесты более вероятны, чем истинно положительные тесты, когда общая популяция имеет низкую распространенность болезни.
Это называется ложноположительным парадоксом.
- ^ a b Вашер, HL (май 2003 г.). «Количественная грамотность - тестирование на наркотики, скрининг рака и идентификация вулканических пород» . Journal of Geoscience Education : 2.
На первый взгляд это кажется извращенным: чем меньше студенты в целом используют
стероиды
, тем больше вероятность того, что студент, идентифицированный как пользователь, не будет их
употреблять
.
Это было названо ложноположительным парадоксом.
- Цитирование: Gonick, L .; Смит, В. (1993). Мультяшный справочник по статистике . Нью-Йорк: Харпер Коллинз. п. 49. - Перейти ↑ Madison, BL (август 2007 г.). «Математические знания для гражданства» . В Schoenfeld, AH (ed.). Оценка математических навыков . Публикации Института математических наук (Новое изд.). Издательство Кембриджского университета. п. 122. ISBN 978-0-521-69766-8.
Правильная [оценка вероятности ...] многих удивляет; отсюда и термин парадокс .
- Перейти ↑ Bar-Hillel, Maya (1980). «Ошибка базовой ставки в вероятностных суждениях» (PDF) . Acta Psychologica . 44 (3): 211–233. DOI : 10.1016 / 0001-6918 (80) 90046-3 .
- ^ a b c Канеман, Даниэль; Амос Тверски (1973). «О психологии предсказания». Психологический обзор . 80 (4): 237–251. DOI : 10.1037 / h0034747 . S2CID 17786757 .
- ^ Канеман, Даниэль; Амос Тверски (1985). «Доказательное влияние базовых ставок». В книге Даниэля Канемана, Пола Словича и Амоса Тверски (ред.). Суждение в условиях неопределенности: эвристика и предубеждения . Наука . 185 . С. 153–160. DOI : 10.1126 / science.185.4157.1124 . PMID 17835457 . S2CID 143452957 .
- ^ Канеман, Дэниел (2000). «Оценка моментами, прошлым и будущим». У Даниэля Канемана и Амоса Тверски (ред.). Выбор, ценности и рамки .
- ^ Нисбетт, Ричард Э .; Э. Боргида; Р. Крэндалл; Х. Рид (1976). «Популярная индукция: информация не всегда информативна». В JS Carroll & JW Payne (ред.). Познание и социальное поведение . 2 . С. 227–236.
- Перейти ↑ Koehler, JJ (2010). «Ошибка базовой ставки пересмотрена: описательные, нормативные и методологические проблемы». Поведенческие науки и науки о мозге . 19 : 1–17. DOI : 10.1017 / S0140525X00041157 . S2CID 53343238 .
- ^ Барби, AK; Сломан, С.А. (2007). «Базовое уважение: от экологической рациональности к двойственным процессам». Поведенческие науки и науки о мозге . 30 (3): 241–254, обсуждение 255–297. DOI : 10.1017 / S0140525X07001653 . PMID 17963533 . S2CID 31741077 .
- ^ Тверски, А .; Канеман, Д. (1974). «Суждение в условиях неопределенности: эвристика и предубеждения». Наука . 185 (4157): 1124–1131. Bibcode : 1974Sci ... 185.1124T . DOI : 10.1126 / science.185.4157.1124 . PMID 17835457 . S2CID 143452957 .
- ^ Космидес, Леда; Джон Туби (1996). «Являются ли люди в конце концов хорошими интуитивными статистиками? Переосмысление некоторых литературных выводов о суждениях в условиях неопределенности». Познание . 58 : 1–73. CiteSeerX 10.1.1.131.8290 . DOI : 10.1016 / 0010-0277 (95) 00664-8 . S2CID 18631755 .
- ^ a b Gigerenzer, G .; Хоффраге, У. (1995). «Как улучшить байесовские рассуждения без инструкции: частотные форматы». Психологический обзор . 102 (4): 684. CiteSeerX 10.1.1.128.3201 . DOI : 10.1037 / 0033-295X.102.4.684 .
- ^ Hoffrage, U .; Lindsey, S .; Hertwig, R .; Гигеренцер, Г. (2000). «Медицина: передача статистической информации». Наука . 290 (5500): 2261–2262. DOI : 10.1126 / science.290.5500.2261 . PMID 11188724 . S2CID 33050943 .
- ^ Акл, EA; Oxman, AD; Herrin, J .; Vist, GE; Терренато, I .; Sperati, F .; Костинюк, Ц .; Бланк, Д .; Шюнеманн, Х. (2011). Шюнеманн, Хольгер (ред.). «Использование альтернативных статистических форматов для представления рисков и снижения рисков» . Кокрановская база данных систематических обзоров (3): CD006776. DOI : 10.1002 / 14651858.CD006776.pub2 . PMC 6464912 . PMID 21412897 .
- ^ a b Sedlmeier, P .; Гигеренцер, Г. (2001). «Обучение байесовскому мышлению менее чем за два часа» . Журнал экспериментальной психологии: Общие . 130 (3): 380. DOI : 10.1037 / 0096-3445.130.3.380 . hdl : 11858 / 00-001M-0000-0025-9504-E .
- ^ Brase, GL (2009). «Иллюстрированные представления в статистических рассуждениях». Прикладная когнитивная психология . 23 (3): 369–381. DOI : 10.1002 / acp.1460 . S2CID 18817707 .
- ^ Эдвардс, А .; Elwyn, G .; Малли, А. (2002). «Объяснение рисков: превращение числовых данных в значимые картинки» . BMJ . 324 (7341): 827–830. DOI : 10.1136 / bmj.324.7341.827 . PMC 1122766 . PMID 11934777 .
- ^ Girotto, V .; Гонсалес, М. (2001). «Решение вероятностно-статистических задач: вопрос структуры информации и формы вопроса». Познание . 78 (3): 247–276. DOI : 10.1016 / S0010-0277 (00) 00133-5 . PMID 11124351 . S2CID 8588451 .
- ^ a b Hoffrage, U .; Gigerenzer, G .; Krauss, S .; Мартиньон, Л. (2002). «Представление облегчает рассуждение: что такое собственные частоты, а что нет». Познание . 84 (3): 343–352. DOI : 10.1016 / S0010-0277 (02) 00050-1 . PMID 12044739 . S2CID 9595672 .
- ^ Gigerenzer, G .; Хоффраге, У. (1999). «Преодоление трудностей в байесовских рассуждениях: ответ Льюису и Керену (1999) и Меллерсу и МакГроу (1999)» . Психологический обзор . 106 (2): 425. DOI : 10.1037 / 0033-295X.106.2.425 . hdl : 11858 / 00-001M-0000-0025-9CB4-8 .
- ^ Kleiter, GD (1994). «Естественная выборка: рациональность без базовых ставок». Вклад в математическую психологию, психометрию и методологию . Последние исследования в области психологии. С. 375–388. DOI : 10.1007 / 978-1-4612-4308-3_27 . ISBN 978-0-387-94169-1.
Внешние ссылки [ править ]
- Ошибка базовой ставки Файлы ошибок