Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Систематическая ошибка отбора - это систематическая ошибка, вызванная отбором лиц, групп или данных для анализа таким образом, что не достигается надлежащая рандомизация, что гарантирует, что полученная выборка не является репрезентативной для анализируемой популяции. [1] Иногда это называют эффектом выбора . Фраза «систематическая ошибка отбора» чаще всего относится к искажению статистического анализа , вызванному методом сбора образцов. Если не учитывать систематическую ошибку отбора, то некоторые выводы исследования могут быть ложными.

Типы [ править ]

Смещение выборки [ править ]

Отбор проб смещения является систематической ошибкой из - за не- случайной выборки популяции, [2] в результате чего некоторые членов населения, менее вероятно, будет включен , чем другие, что приводит к смещенной выборке , определяются как статистическая выборка из в популяции ( или нечеловеческий фактор), в котором не все участники одинаково сбалансированы или объективно представлены. [3] Это в основном классифицируется как подтип смещения выборки, [4] иногда конкретно называемый смещением выборки , [5] [6] [7], но некоторые классифицируют его как отдельный тип смещения. [8]

Отличие систематической ошибки выборки (хотя и не общепризнанной) заключается в том, что она подрывает внешнюю валидность теста (способность обобщать его результаты для остальной совокупности), в то время как систематическая ошибка выборки в основном касается внутренней валидности различий или сходства, обнаруженные в представленном образце. В этом смысле ошибки, возникающие в процессе сбора выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом последующем процессе вызывают смещение выборки.

Примеры систематической ошибки выборки включают в себя самостоятельный выбор , предварительный отбор участников исследования, дисконтирование субъектов исследования / тестов, которые не были завершены, и систематическую ошибку миграции путем исключения субъектов, которые недавно переехали в исследуемую область или покинули ее , систематическая ошибка времени , где обнаруживается медленно развивающееся заболевание с лучшим прогнозом, и систематическая ошибка заблаговременности , когда заболевание диагностируется у участников раньше, чем в сравниваемых популяциях, хотя средний курс заболевания такой же.

Временной интервал [ править ]

  • Досрочное прекращение исследования в тот момент, когда его результаты подтверждают желаемый вывод.
  • Испытание может быть прекращено досрочно при достижении экстремального значения (часто по этическим причинам), но экстремальное значение, вероятно, будет достигнуто переменной с наибольшей дисперсией , даже если все переменные имеют одинаковое среднее значение .

Экспозиция [ править ]

  • Ошибка восприимчивости
    • Смещение клинической восприимчивости , когда одно заболевание предрасполагает ко второму заболеванию, а лечение первого заболевания ошибочно предрасполагает ко второму заболеванию. Например, постменопаузальный синдром дает более высокую вероятность развития рака эндометрия , поэтому эстрогены, назначаемые для лечения постменопаузального синдрома, могут получить более высокую, чем реальную, вину за возникновение рака эндометрия. [9]
    • Протопатическая предвзятость , когда кажется , что лечение первых симптомов болезни или другого исхода приводит к исходу. Это потенциальная ошибка, когда до постановки диагноза проходит время от первых симптомов и начала лечения. [9] Его можно смягчить за счет запаздывания , то есть исключения воздействий, имевших место в определенный период времени до постановки диагноза. [10]
    • Смещение показаний , потенциальное смешение причин и следствий, когда воздействие зависит от показаний, например, лечение проводится людям с высоким риском заражения заболеванием, что потенциально вызывает преобладание пролеченных людей среди тех, кто заражен этим заболеванием. Это может вызвать ошибочный вид лечения, являющегося причиной заболевания. [11]

Данные [ редактировать ]

  • Разбиение (разделение) данных на разделы, зная содержимое разделов, а затем их анализ с помощью тестов, разработанных для слепо выбранных разделов.
  • Постфактум изменение включения данных по произвольным или субъективным причинам, включая:
    • Выбор вишни , который на самом деле является не смещением выбора, а смещением подтверждения , когда для подтверждения вывода выбираются конкретные подмножества данных (например, приводятся примеры авиакатастроф как свидетельство того, что рейс авиакомпании небезопасен, и игнорируется гораздо более распространенный пример полетов, которые безопасно завершить. См. эвристику доступности )
    • Отказ от неверных данных на (1) произвольных основаниях вместо того, чтобы соответствовать ранее заявленным или общепринятым критериям, или (2) отбрасывание « выбросов » на основании статистических данных, которые не принимают во внимание важную информацию, которая может быть получена из «диких» наблюдений. [12]

Исследования [ править ]

  • Выбор исследований для включения в мета-анализ (см. Также комбинаторный мета-анализ ).
  • Проведение повторных экспериментов и предоставление отчетов только о наиболее благоприятных результатах, возможно, повторное обозначение лабораторных записей других экспериментов как «калибровочные испытания», «ошибки приборов» или «предварительные исследования».
  • Представление наиболее значимого результата рывка данных, как если бы это был единственный эксперимент (который логически совпадает с предыдущим элементом, но считается менее нечестным).

Истощение [ править ]

Систематическая ошибка отсева - это своего рода систематическая ошибка отбора, вызванная отсевом (потерей участников) [13], не считая субъектов испытаний / тестов, которые не были завершены. Это тесно связано с смещением выживаемости , когда в анализ включаются только субъекты, которые «выжили» в процессе, или с ошибкой , когда включаются только субъекты, которые «потерпели неудачу» в процессе. Он включает в себя отсев , неполучение ответов (более низкий уровень ответов ), отказ от участия и отклонения от протокола.. Он дает предвзятые результаты, если они не одинаковы в отношении воздействия и / или результата. Например, при тестировании программы диеты исследователь может просто отклонить всех, кто выбывает из исследования, но большинство выбывших составляют те, для кого она не работает. Различные потери субъектов в группе вмешательства и в группе сравнения могут изменить характеристики этих групп и результаты независимо от исследуемого вмешательства . [13]

Потерянные для последующего наблюдения - это еще одна форма систематической ошибки истощения, которая проявляется в основном в медицинских исследованиях в течение длительного периода времени. Предвзятость отсутствия ответов или удержания может зависеть от ряда как материальных, так и нематериальных факторов, таких как: богатство, образование, альтруизм, начальное понимание исследования и его требований. [14] Исследователи также могут быть не в состоянии провести последующий контакт из-за неадекватной идентифицирующей информации и контактных данных, собранных на начальном этапе набора и исследования. [15]

Выбор наблюдателя [ править ]

Философ Ник Бостром утверждал, что данные фильтруются не только по плану исследования и измерениям, но и по необходимому предварительному условию, что должен быть кто-то, проводящий исследование. В ситуациях, когда существование наблюдателя или исследования коррелирует с данными, возникают эффекты выбора наблюдения и требуется антропное обоснование . [16]

Примером может служить история столкновений Земли в прошлом : если большие столкновения вызовут массовые вымирания и экологические нарушения, исключающие эволюцию разумных наблюдателей в течение длительных периодов времени, никто не будет наблюдать никаких свидетельств крупных столкновений в недавнем прошлом (поскольку они предотвратили бы появление разумных наблюдатели от эволюционирующих). Следовательно, есть потенциальная погрешность в записях столкновений с Землей. [17] Астрономические риски существования также могут быть недооценены из-за систематической ошибки отбора, и необходимо ввести антропную поправку. [18]

Предвзятость волонтера [ править ]

Предвзятость самоотбора или предвзятость добровольцев в исследованиях создают дополнительные угрозы для валидности исследования, поскольку эти участники могут по своей сути отличаться характеристиками от целевой популяции исследования. [19] Исследования показали, что волонтеры, как правило, происходят из более высокого социального положения, чем из более низкого социально-экономического положения. [20] Кроме того, это другое исследование показывает, что женщины более склонны участвовать в исследованиях, чем мужчины. Предвзятость добровольцев очевидна на протяжении всего жизненного цикла исследования, от набора до наблюдения. В более общем смысле реакцию добровольцев можно объяснить индивидуальным альтруизмом, желанием одобрения, личным отношением к теме исследования и другими причинами. [20] [14]Как и в большинстве случаев, смягчением последствий в случае предвзятости добровольцев является увеличение размера выборки. [ необходима цитата ]

Смягчение [ править ]

В общем случае ошибки отбора не могут быть преодолены только статистическим анализом существующих данных, хотя поправка Хекмана может использоваться в особых случаях. Оценка степени систематической ошибки отбора может быть сделана путем изучения корреляций между экзогенными (фоновыми) переменными и показателем лечения. Однако в моделях регрессии именно корреляция между ненаблюдаемыми детерминантами результата и ненаблюдаемыми детерминантами отбора в выборку приводит к смещению оценок, и эта корреляция между ненаблюдаемыми факторами не может быть напрямую оценена наблюдаемыми детерминантами лечения. [21]

Когда данные выбираются для целей подгонки или прогноза, можно настроить коалиционную игру, чтобы функция подгонки или точности прогноза могла быть определена для всех подмножеств переменных данных.

Связанные вопросы [ править ]

Систематическая ошибка отбора тесно связана с:

  • предвзятость публикации или предвзятость сообщения , искажение восприятия сообщества или метаанализа из-за отказа от публикации неинтересных (обычно отрицательных) результатов или результатов, которые идут вразрез с предубеждениями экспериментатора, интересами спонсора или ожиданиями сообщества.
  • предвзятость подтверждения , общая тенденция людей уделять больше внимания тому, что подтверждает нашу ранее существовавшую точку зрения; или, в частности, в экспериментальной науке, искажение, вызванное экспериментами, которые предназначены для поиска подтверждающих доказательств вместо попытки опровергнуть гипотезу.
  • смещение исключения, результат применения различных критериев к случаям и средствам контроля в отношении права участия в исследовании / различных переменных, служащих основанием для исключения.

См. Также [ править ]

  • Парадокс Берксона  - тенденция неверно истолковывать статистические эксперименты с использованием условных вероятностей
  • Теория черного лебедя  - теория реакции на неожиданные события
  • Сбор вишни  - ошибка указания на отдельные случаи, которые, кажется, подтверждают позицию, при игнорировании связанных случаев, которые могут противоречить позиции.
  • Предвзятость в финансировании
  • Список когнитивных предубеждений  - систематические модели отклонения от нормы или рациональности суждений
  • Предвзятость участия
  • Предвзятость публикации  - более высокая вероятность публикации результатов, указывающих на важный вывод.
  • Предвзятость сообщения
  • Ошибка выборки  - систематическая ошибка, при которой выборка собирается таким образом, что некоторые члены предполагаемой совокупности с меньшей вероятностью будут включены, чем другие.
  • Вероятность выборки
  • Теория избирательного воздействия  - теория в психологии, относящаяся к тенденции отдавать предпочтение информации, которая подкрепляет ранее существовавшие взгляды.
  • Самоисполняющееся пророчество  - предсказание, которое само сбылось.
  • Смещение выживаемости  - логическая ошибка, форма смещения отбора
  • Иллюзия частоты

Ссылки [ править ]

  1. ^ Словарь терминов по раку → систематическая ошибка выбора . Проверено 23 сентября, 2009.
  2. Медицинский словарь - 'смещение выборки' от 23 сентября 2009 г.
  3. ^ TheFreeDictionary → предвзятый образец . Проверено 23 сентября 2009. Сайт в свою очередь цитирует: Медицинский словарь Мосби, 8-е издание.
  4. ^ Словарь терминов по раку → Смещение выбора . Проверено 23 сентября, 2009.
  5. ^ Ардс, Шейла; Чанг, Чанджин; Майерс, Сэмюэл Л. (1998). «Влияние смещения выборки на расовые различия в сообщениях о жестоком обращении с детьми». Жестокое обращение с детьми и безнадзорность . 22 (2): 103–115. DOI : 10.1016 / S0145-2134 (97) 00131-2 . PMID  9504213 .
  6. ^ Кортес, Коринна; Мохри, Мехриар; Райли, Майкл; Ростамизаде, Афшин (2008). Теория коррекции смещения выборки при отборе (PDF) . Теория алгоритмического обучения . Конспект лекций по информатике. 5254 . С. 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . DOI : 10.1007 / 978-3-540-87987-9_8 . ISBN   978-3-540-87986-2. S2CID  842488 .
  7. ^ Кортес, Коринна; Мохри, Мехриар (2014). "Теория адаптации предметной области и выборки смещения и алгоритм регрессии" (PDF) . Теоретическая информатика . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . DOI : 10.1016 / j.tcs.2013.09.027 .  
  8. ^ Fadem, Барбара (2009). Поведенческая наука . Липпинкотт Уильямс и Уилкинс. п. 262. ISBN. 978-0-7817-8257-9.
  9. ^ а б Файнштейн А.Р .; Хорвиц Р.И. (ноябрь 1978 г.). «Критика статистических данных, связывающих эстрогены с раком эндометрия». Cancer Res . 38 (11 Pt 2): 4001–5. PMID 698947 . 
  10. ^ Tamim H; Монфаред А.А.; LeLorier J (март 2007 г.). «Применение времени запаздывания в определениях воздействия для контроля протопатического смещения». Pharmacoepidemiol Drug Saf . 16 (3): 250–8. DOI : 10.1002 / pds.1360 . PMID 17245804 . S2CID 25648490 .  
  11. Мэтью Р. Вейр (2005). Гипертония (ключевые заболевания) (серия Acp Key Diseases Series) . Филадельфия, Пенсильвания: Американский колледж врачей. п. 159. ISBN. 978-1-930513-58-7.
  12. ^ Краскал, Уильям Х. (1960). «Некоторые замечания по диким наблюдениям» . Технометрика . 2 (1): 1–3. DOI : 10.1080 / 00401706.1960.10489875 .
  13. ^ a b Jüni, P .; Эггер, Маттиас (2005). «Эмпирические доказательства систематической ошибки отсева в клинических испытаниях» . Международный журнал эпидемиологии . 34 (1): 87–88. DOI : 10.1093 / ije / dyh406 . PMID 15649954 . 
  14. ^ a b Джордан, Сью; Уоткинс, Алан; Стори, Мел; Аллен, Стивен Дж .; Брукс, Кэролайн Дж .; Гараева, Ивета; Небеса, Мартин Л .; Джонс, Рут; Пламмер, Сью Ф .; Рассел, Ян Т .; Торнтон, Кэтрин А. (09.07.2013). «Предвзятость добровольцев при наборе, удержании и сдаче образцов крови в рандомизированном контролируемом испытании с участием матерей и их детей в возрасте шести месяцев и двух лет: продольный анализ» . PLOS ONE . 8 (7): e67912. Bibcode : 2013PLoSO ... 867912J . DOI : 10.1371 / journal.pone.0067912 . ISSN 1932-6203 . PMC 3706448 . PMID   23874465 .
  15. ^ Малый, WP (1967-05-06). «Утрачено для продолжения» . Ланцет . Первоначально опубликовано как Том 1, выпуск 7497. 289 (7497): 997–999. DOI : 10.1016 / S0140-6736 (67) 92377-X . ISSN 0140-6736 . PMID 4164620 .  
  16. ^ Бостром, Ник (2002). Антропный уклон: эффекты отбора при наблюдении в науке и философии . Нью-Йорк: Рутледж. ISBN 978-0-415-93858-7.
  17. ^ Irković, MM; Sandberg, A .; Бостром, Н. (2010). «Антропная тень: эффекты выбора при наблюдении и риски исчезновения человека». Анализ рисков . 30 (10): 1495–506. DOI : 10.1111 / j.1539-6924.2010.01460.x . PMID 20626690 . 
  18. ^ Тегмарк, М .; Бостром, Н. (2005). «Астрофизика: вероятна ли катастрофа конца света?». Природа . 438 (7069): 754. Bibcode : 2005Natur.438..754T . DOI : 10.1038 / 438754a . PMID 16341005 . S2CID 4390013 .  
  19. ^ Трипепи, Джованни; Ягер, Китти Дж .; Деккер, Фридо В .; Зоккали, Кармин (2010). «Смещение отбора и смещение информации в клинических исследованиях» . Клиническая практика нефрона . 115 (2): c94 – c99. DOI : 10.1159 / 000312871 . ISSN 1660-2110 . PMID 20407272 .  
  20. ^ a b «Волонтерская предвзятость» . Каталог Bias . 2017-11-17 . Проверено 29 октября 2020 .
  21. ^ Heckman, JJ (1979). "Смещение выборки как ошибка спецификации". Econometrica . 47 (1): 153–161. DOI : 10.2307 / 1912352 . JSTOR 1912352 .