Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Иллюстрация простого смешивающего фактора. Другими словами, Z является причиной X и Y .

В статистике, confounder (также смешивая переменную , путая фактор , посторонний определитель или скрытую переменную ) является переменной , которая влияет как на зависимой переменной и независимой переменной , в результате чего паразитный ассоциацию . Смешение - это причинная концепция, и как таковая не может быть описана в терминах корреляций или ассоциаций. [1] [2] [3]

Определение [ править ]

В то время как посредник является фактором в причинно-следственной цепочке (1), вмешивающийся фактор - это ложный фактор, неправильно подразумевающий причинность (2).

Смешение определяется в терминах модели генерации данных (как на рисунке выше). Пусть X - некоторая независимая переменная , а Y - некоторая зависимая переменная . Для того, чтобы оценить влияние X на Y , статистик должен подавить влияние посторонних переменных , которые влияют как X и Y . Будем говорить , что X и Y Стыдно некоторой другой переменной Z , когда Z причинной влияет как X и Y .

Пусть будет вероятность события Y = y при гипотетическом вмешательстве X = x . X и Y не смешиваются тогда и только тогда, когда выполняется следующее:

для всех значений X = x и Y = y , где - условная вероятность увидеть X = x . Интуитивно это равенство утверждает, что X и Y не смешиваются, если наблюдаемая связь между ними такая же, как и связь, которая была бы измерена в контролируемом эксперименте с рандомизированным x .

В принципе, определяющее равенство можно проверить на основе модели генерации данных, если у нас есть все уравнения и вероятности, связанные с моделью. Это делается путем моделирования вмешательства (см. Байесовскую сеть ) и проверки того, равна ли полученная вероятность Y условной вероятности . Однако оказывается, что одной структуры графа достаточно для проверки равенства .

Контроль [ править ]

Рассмотрим исследователя, пытающегося оценить эффективность лекарственного средства X на основе данных о населении, в которых использование препарата было выбором пациента. Данные показывают, что пол ( Z ) влияет на выбор пациентом лекарства, а также на его шансы на выздоровление ( Y ). В этом сценарии пол Z нарушает отношения между X и Y, поскольку Z является причиной как X, так и Y :

Причинно-следственная диаграмма гендера как распространенной причины употребления наркотиков и выздоровления

У нас есть это

поскольку наблюдаемая величина содержит информацию о корреляции между X и Z , а интервенционная величина - нет (поскольку X не коррелирует с Z в рандомизированном эксперименте). Статистику нужна объективная оценка , но в случаях, когда доступны только данные наблюдений, несмещенная оценка может быть получена только путем «корректировки» всех смешивающих факторов, а именно, обусловливая их различные значения и усредняя результат. В случае единственного вмешивающегося фактора Z это приводит к "формуле настройки":

который дает объективную оценку для причинного влияния X на Y . Та же формула корректировки работает, когда имеется несколько факторов, влияющих на факторы, за исключением того, что в этом случае выбор набора Z переменных, который гарантировал бы несмещенные оценки, должен выполняться с осторожностью. Критерий правильного выбора переменных называется Back-Door [4] [5] и требует, чтобы выбранный набор Z «блокировал» (или перехватывал) [ требуется пояснение ] каждый путь [ требуется пояснение ] от X до Yкоторый заканчивается стрелкой в ​​X. Такие множества называются «допустимыми задними дверями» и могут включать в себя переменные, которые не являются общими причинами X и Y , а просто их заместителями.

Возвращаясь к примеру употребления наркотиков, поскольку Z соответствует требованию «черного хода» (т. Е. Перехватывает один путь «черного хода» ), формула корректировки «черного хода» действительна:

Таким образом, врач может предсказать вероятный эффект от введения лекарства на основе наблюдательных исследований, в которых условные вероятности, появляющиеся в правой части уравнения, можно оценить с помощью регрессии.

Вопреки распространенному мнению, добавление ковариат в набор корректировок Z может привести к смещению. Типичный контрпример возникает, когда Z является общим эффектом X и Y , [6] случай, в котором Z не вмешивается (т. Е. Нулевое множество является допустимым для черного хода), и корректировка Z создаст смещение, известное как « коллайдер». предвзятость »или« парадокс Берксона » .

В общем, смешивание можно контролировать с помощью корректировки тогда и только тогда, когда существует набор наблюдаемых ковариат, удовлетворяющих условию Back-Door. Более того, если Z является таким набором, то формула настройки уравнения (3) действительно <4,5>. До-исчисление Перла предоставляет дополнительные условия, при которых P ( y  | do ( x )) может быть оценено, не обязательно путем корректировки. [7]

История [ править ]

Согласно Морабиа (2011), [8] это слово происходит от средневекового латинского глагола «confudere», что означало «смешивание», и, вероятно, было выбрано для обозначения путаницы (от латинского: con = with + fusus = смешивать или сливать вместе ) между причиной, которую нужно оценить, и другими причинами, которые могут повлиять на результат и, таким образом, запутать или помешать желаемой оценке. Фишер использовал слово «смешивание» в своей книге 1935 года «План экспериментов» [9] для обозначения любого источника ошибки в своем идеале рандомизированного эксперимента. Согласно Vandenbroucke (2004) [10] это был Киш [11] кто использовал слово «смешивание» в современном смысле этого слова для обозначения «несопоставимости» двух или более групп (например, подвергшихся воздействию и не подвергавшихся воздействию) в наблюдательном исследовании.

Формальные условия, определяющие, что делает одни группы «сопоставимыми», а другие - «несравнимыми», были позже разработаны в эпидемиологии Гренландией и Робинсом (1986) [12] с использованием контрфактического языка Неймана (1935) [13] и Рубина (1974). [14] Позже они были дополнены графическими критериями, такими как условие Back-Door ( Pearl 1993; Greenland, Pearl and Robins, 1999). [3] [4]

Было показано, что графические критерии формально эквивалентны контрфактическому определению [15], но более прозрачны для исследователей, полагающихся на модели процессов.

Типы [ править ]

В случае оценки риска, оценивающего величину и характер риска для здоровья человека , важно контролировать смешение, чтобы изолировать эффект от конкретной опасности, такой как пищевая добавка, пестицид или новое лекарство. Для проспективных исследований сложно набирать и проверять добровольцев с одинаковым опытом (возраст, диета, образование, география и т. Д.), А в исторических исследованиях может быть аналогичная изменчивость. Из-за невозможности контролировать вариабельность добровольцев и исследований на людях, смешивание является особой проблемой. По этим причинам эксперименты предлагают способ избежать большинства форм смешения.

В некоторых дисциплинах смешение подразделяется на разные типы. В эпидемиологии одним из типов является «смешение по показаниям» [16], которое связано с искажением результатов наблюдательных исследований . Поскольку прогностические факторы могут влиять на решения о лечении (и смещать оценки эффектов лечения), контроль известных прогностических факторов может уменьшить эту проблему, но всегда возможно, что забытый или неизвестный фактор не был включен или что факторы сложно взаимодействуют. Смешение по показаниям было описано как наиболее важное ограничение наблюдательных исследований. На рандомизированные испытания не влияет искажение показаний из-за случайного распределения .

Смешивающие переменные также можно разделить на категории в соответствии с их источником. Выбор инструмента измерения (операционное смешение), ситуационных характеристик (процедурное смешение) или межличностных различий (личностное смешение).

  • Эксплуатационное озадачив может происходить как в экспериментальных и не экспериментальных научно - исследовательских проектов. Этот тип смешения возникает, когда мера, предназначенная для оценки конкретной конструкции, непреднамеренно измеряет и что-то еще. [17]
  • Процедурные Вмешивающиеся факторы могут иметь место в лабораторном эксперименте или квази-эксперименте . Этот тип смешения возникает, когда исследователь ошибочно позволяет другой переменной изменяться вместе с управляемой независимой переменной. [17]
  • Человек озадачив происходит , когда две или более группы единиц анализируются вместе (например, рабочие из различных профессий), несмотря на изменения в соответствии с одним или более другим (наблюдалось или ненаблюдаемой) характеристики (например, пол). [18]

Примеры [ править ]

Допустим, кто-то изучает связь между очередностью рождения (1-й ребенок, 2-й ребенок и т. Д.) И наличием синдрома Дауна у ребенка. В этом сценарии возраст матери будет мешающей переменной:

  1. Более высокий возраст матери напрямую связан с синдромом Дауна у ребенка
  2. Более высокий возраст матери напрямую связан с синдромом Дауна, независимо от очередности рождения (мать, имеющая первого или третьего ребенка в возрасте 50 лет, представляет такой же риск)
  3. Возраст матери напрямую связан с очередностью рождения (второй ребенок, за исключением двойни, рождается, когда мать старше, чем она была на момент рождения 1-го ребенка)
  4. Возраст матери не является следствием очередности рождения (наличие второго ребенка не влияет на возраст матери)

При оценке риска такие факторы, как возраст, пол и уровень образования, часто влияют на состояние здоровья, и поэтому их следует контролировать. Помимо этих факторов, исследователи могут не принимать во внимание или не иметь доступа к данным о других причинных факторах. Примером может служить исследование воздействия курения табака на здоровье человека. Курение, употребление алкоголя и диета связаны между собой. Оценка риска, которая учитывает последствия курения, но не учитывает потребление алкоголя или диету, может переоценить риск курения. [19] Курение и смешивание рассматриваются при оценке профессиональных рисков, таких как безопасность добычи угля. [20] Когда нет большой выборки некурящих или непьющих, занимающихся определенной профессией, оценка риска может быть смещена в сторону выявления негативного воздействия на здоровье.

Уменьшение возможности запутывания [ править ]

Снижение вероятности появления и влияния мешающих факторов может быть получено за счет увеличения типов и количества сравнений, выполняемых в анализе. Если измерения или манипуляции с основными конструкциями ошибочны (т. Е. Существуют операционные или процедурные затруднения), анализ подгрупп может не выявить проблем в анализе. Кроме того, увеличение количества сравнений может создать другие проблемы (см. Множественные сравнения ).

Рецензирование - это процесс, который может помочь в сокращении случаев искажения либо до реализации исследования, либо после анализа. Рецензирование полагается на коллективную экспертизу в рамках дисциплины для выявления потенциальных слабых мест в дизайне и анализе исследования, включая то, как результаты могут зависеть от искажения. Точно так же репликация может проверить надежность результатов одного исследования в альтернативных условиях исследования или альтернативных анализах (например, с учетом возможных искажений, не выявленных в первоначальном исследовании).

Смежные эффекты могут иметь меньшую вероятность возникновения и действовать одинаково во многих случаях и в разных местах. [ необходимая цитата ] При выборе исследовательских участков, окружающая среда может быть подробно охарактеризована на исследовательских участках, чтобы гарантировать, что участки являются экологически подобными и, следовательно, с меньшей вероятностью имеют смешанные переменные. Наконец, можно изучить взаимосвязь между переменными окружающей среды, которые могут затруднять анализ, и измеренными параметрами. Информация, относящаяся к переменным окружающей среды, затем может быть использована в моделях для конкретных участков для определения остаточной дисперсии, которая может быть вызвана реальными эффектами. [21]

В зависимости от типа существующего дизайна исследования существуют различные способы его изменения для активного исключения или контроля искажающих переменных: [22]

  • В исследованиях случай-контроль вмешивающиеся факторы одинаково распределяются по обеим группам, случаям и контролю. Например, если кто-то хочет изучить причину инфаркта миокарда и считает, что возраст является вероятной смешивающей переменной, каждому 67-летнему пациенту с инфарктом будет сопоставлен здоровый 67-летний «контрольный» человек. В исследованиях случай-контроль наиболее часто совпадающими переменными являются возраст и пол. Недостаток: исследования случай-контроль возможны только тогда, когда легко найти элементы контроля, т. Е. Лиц, чей статус по отношению ко всем известным потенциальным смешивающим факторам такой же, как у пациента случая: предположим, что исследование случай-контроль пытается найти причина данного заболевания у человека 1) 45 лет, 2) афроамериканца, 3) жителя Аляски, 4) заядлый футболист, 5) вегетарианец и 6) работает в сфере образования. Теоретически совершенным контролем был бы человек, который, помимо того, что у него нет исследуемого заболевания, соответствует всем этим характеристикам и не имеет болезней, которых также не было бы у пациента, - но найти такой контроль было бы огромной задачей.
  • Когортные исследования: Степень соответствия также возможна, и это часто достигается путем включения только определенных возрастных групп или определенного пола в исследуемую популяцию, создавая когорту людей, которые имеют схожие характеристики, и, таким образом, все когорты сопоставимы в отношении возможной смешивающей переменной. . Например, если считается, что возраст и пол противоречат друг другу, только мужчины в возрасте от 40 до 50 лет будут участвовать в когортном исследовании, которое будет оценивать риск инфаркта миокарда в когортах, которые либо физически активны, либо неактивны. Недостаток: в когортных исследованиях чрезмерное исключение входных данных может привести к тому, что исследователи будут слишком узко определять набор лиц, находящихся в аналогичном положении, для которых, по их мнению, исследование полезно, так что другие люди, к которым действительно применима причинная связь, могут потерять возможность воспользоваться рекомендациями исследования.Точно так же «чрезмерная стратификация» входных данных в рамках исследования может уменьшить размер выборки в данной страте до такой степени, что обобщения, сделанные путем наблюдения только за членами этой страты, не являютсястатистически значимо .
  • Двойное ослепление : скрывает от исследуемой популяции и наблюдателей членство участников в экспериментальной группе. Не позволяя участникам узнать, получают они лечение или нет, эффект плацебо должен быть одинаковым для контрольной группы и группы лечения. Не позволяя наблюдателям узнать об их членстве, не должно быть предвзятости со стороны исследователей, которые по-разному относятся к группам или по-разному интерпретируют результаты.
  • Рандомизированное контролируемое исследование: Метод, при котором исследуемая популяция делится случайным образом, чтобы снизить вероятность самоотбора участниками или предвзятости разработчиков исследования. Перед началом эксперимента тестировщики распределяют участников пула участников по своим группам (контрольным, интервенционным, параллельным), используя процесс рандомизации, такой как использование генератора случайных чисел. Например, в исследовании влияния физических упражнений выводы были бы менее достоверными, если бы участникам был предоставлен выбор, хотят ли они принадлежать к контрольной группе, которая не будет выполнять упражнения, или к группе вмешательства, которая будет готова принять участие в тренировке. программа упражнений. Затем в исследовании будут учитываться и другие переменные, помимо упражнений, такие как уровень здоровья до эксперимента и мотивация для принятия здоровых занятий. Со стороны наблюдателяэкспериментатор может выбирать кандидатов, которые с большей вероятностью продемонстрируют результаты, которые хочет увидеть исследование, или могут интерпретировать субъективные результаты (более энергичный, позитивный настрой) так, чтобы удовлетворить их желания.
  • Стратификация . Как и в приведенном выше примере, считается, что физическая активность защищает от инфаркта миокарда; и возраст считается возможным вмешивающимся фактором. Затем отобранные данные стратифицируются по возрастным группам - это означает, что связь между активностью и инфарктом будет анализироваться для каждой возрастной группы. Если разные возрастные группы (или возрастные слои) дают очень разные отношения риска , возраст следует рассматривать как смешивающую переменную. Существуют статистические инструменты, в том числе методы Мантеля – Хензеля, которые учитывают стратификацию наборов данных.
  • Контроль за искажением путем измерения известных искажающих факторов и включения их в качестве ковариант - это многомерный анализ, такой как регрессионный анализ . Многомерный анализ дает гораздо меньше информации о силе или полярности смешивающей переменной, чем методы стратификации. Например, если многовариантный анализ контролирует антидепрессант и не стратифицирует антидепрессанты по TCA и SSRI , тогда он будет игнорировать тот факт, что эти два класса антидепрессантов имеют противоположные эффекты на инфаркт миокарда, и один из них намного сильнее другого.

У всех этих методов есть свои недостатки:

  1. Лучший доступный защита от возможности ложных результатов благодаря смешению часто обойтись без усилий по расслоению и вместо того, чтобы провести рандомизированное исследование в виде достаточно большой выборке , взятой в целом, таким образом, что все потенциальные путая переменные (известные и неизвестные) будет случайно распределены по всем исследовательским группам и, следовательно, не будут коррелированы с двоичной переменной для включения / исключения в любой группе.
  2. Этические соображения: в двойных слепых и рандомизированных контролируемых исследованиях участники не знают, что они получают фиктивное лечение, и им может быть отказано в эффективном лечении. [23] Существует вероятность того, что пациенты соглашаются на инвазивную операцию (которая сопряжена с реальным медицинским риском) только при том понимании, что они получают лечение. Хотя это этическая проблема, это не полный отчет о ситуации. Для операций, которые в настоящее время проводятся регулярно, но для которых нет конкретных доказательств подлинного эффекта, могут возникнуть этические проблемы для продолжения таких операций. В таких обстоятельствах многие люди подвергаются реальным рискам хирургического вмешательства, однако эти методы лечения, возможно, не принесут заметной пользы. Контроль ложной хирургии - это метод, который может позволить медицинской науке определить, является ли хирургическая процедура эффективной или нет. Учитывая известные риски, связанные с медицинскими операциями,Сомнительно этично разрешать проведение непроверенных операций до бесконечности в будущем.

См. Также [ править ]

  • Анекдотические свидетельства  - свидетельства, основанные на личных показаниях
  • Причинный вывод  - раздел статистики, связанный с установлением причинно-следственных связей между переменными.
  • Эпидемиологический метод  - научный метод в конкретной области
  • Парадокс Симпсона  - феномен вероятности и статистики, при котором тренд появляется в группах данных, но исчезает, когда эти группы объединяются.

Ссылки [ править ]

  1. ^ Перл, Дж., (2009). Парадокс Симпсона , смешение и коллапсируемость причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк: Издательство Кембриджского университета.
  2. ^ VanderWeele, TJ; Шпицер И. (2013). «Об определении конфаунтера» . Анналы статистики . 41 (1): 196–220. arXiv : 1304.0564 . DOI : 10.1214 / 12-aos1058 . PMC  4276366 . PMID  25544784 .
  3. ^ a b Гренландия, S .; Робинс, JM; Перл, Дж. (1999). «Смешение и коллапсируемость в причинном выводе» . Статистическая наука . 14 (1): 29–46. DOI : 10,1214 / сс / 1009211805 .
  4. ^ а б Перл, Дж., (1993). «Аспекты графических моделей, связанные с причинностью», В трудах 49-й сессии Международного статистического института науки, стр. 391–401.
  5. ^ Перл, Дж. (2009). Причинные диаграммы и определение причинных эффектов в причинно- следственной связи : модели, рассуждения и выводы (2-е изд.). Нью-Йорк, Нью-Йорк, США: Издательство Кембриджского университета.
  6. ^ Ли, PH (2014). «Должны ли мы делать поправку на противоречие, если эмпирические и теоретические критерии дают противоречивые результаты? Исследование с помощью моделирования» . Sci Rep . 4 : 6085. Bibcode : 2014NatSR ... 4E6085L . DOI : 10.1038 / srep06085 . PMC 5381407 . PMID 25124526 .  
  7. ^ Шпицер, И .; Перл, Дж. (2008). «Полные методы идентификации причинной иерархии». Журнал исследований в области машинного обучения . 9 : 1941–1979.
  8. ^ Morabia, A (2011). «История современной эпидемиологической концепции смешения» (PDF) . Журнал эпидемиологии и общественного здравоохранения . 65 (4): 297–300. DOI : 10.1136 / jech.2010.112565 . PMID 20696848 . S2CID 9068532 .   
  9. Перейти ↑ Fisher, RA (1935). План экспериментов (стр. 114–145).
  10. ^ Vandenbroucke, JP (2004). «История смешения». Соз Правентивмед . 47 (4): 216–224. DOI : 10.1007 / BF01326402 . PMID 12415925 . S2CID 198174446 .  
  11. Перейти ↑ Kish, L (1959). «Некоторые статистические проблемы в дизайне исследования». Am Sociol . 26 (3): 328–338. DOI : 10.2307 / 2089381 . JSTOR 2089381 . 
  12. ^ Гренландия, S .; Робинс, JM (1986). «Идентифицируемость, возможность обмена и эпидемиологическое смешение». Международный журнал эпидемиологии . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . DOI : 10.1093 / ije / 15.3.413 . PMID 3771081 .  
  13. ^ Нейман Дж при содействии К. Iwaskiewics и СанктKolodziejczyk (1935). Статистические проблемы сельскохозяйственных экспериментов (с обсуждением). Дополнение J Roy Statist Soc Ser B 2 107-180.
  14. Перейти ↑ Rubin, DB (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Журнал педагогической психологии . 66 (5): 688–701. DOI : 10.1037 / h0037350 . S2CID 52832751 . 
  15. ^ Перл, Дж., (2009). Причинность: модели, рассуждение и вывод (2-е изд.). Нью-Йорк, Нью-Йорк, США: Издательство Кембриджского университета.
  16. Перейти ↑ Johnston, SC (2001). «Выявление противоречивых сведений с помощью слепого проспективного обзора» . Am J Epidemiol . 154 (3): 276–284. DOI : 10.1093 / AJE / 154.3.276 . PMID 11479193 . 
  17. ^ a b Пелхэм, Бретт (2006). Проведение исследований в области психологии . Бельмонт: Уодсворт. ISBN 978-0-534-53294-9.
  18. ^ Steg, L .; Буунк, АП; Ротенгаттер, Т. (2008). "Глава 4". Прикладная социальная психология: понимание и решение социальных проблем . Кембридж, Великобритания: Издательство Кембриджского университета.
  19. ^ Тьённеланд, Энн; Грёнбек, Мортен; Стрипп, Конни; Овервад, Ким (январь 1999 г.). «Потребление вина и диета в случайной выборке из 48763 датских мужчин и женщин» . Американское общество питания Американский журнал клинического питания . 69 (1): 49–54. DOI : 10.1093 / ajcn / 69.1.49 . PMID 9925122 . 
  20. ^ Акселсон, О. (1989). «Заблуждение от курения в профессиональной эпидемиологии» . Британский журнал промышленной медицины . 46 (8): 505–07. DOI : 10.1136 / oem.46.8.505 . PMC 1009818 . PMID 2673334 .  
  21. ^ Calow, Питер П. (2009) Справочник по оценке и управлению экологическими рисками , Wiley
  22. ^ Mayrent, Шерри L (1987). Эпидемиология в медицине . Липпинкотт Уильямс и Уилкинс . ISBN 978-0-316-35636-7.
  23. ^ Эмануэль, Иезекииль J; Миллер, Франклин Дж. (20 сентября 2001 г.). «Этика плацебо-контролируемых испытаний - золотая середина». Медицинский журнал Новой Англии . 345 (12): 915–9. DOI : 10.1056 / nejm200109203451211 . PMID 11565527 . 

Дальнейшее чтение [ править ]

  • Перл, Дж. (Январь 1998 г.). «Почему нет статистического теста на смешение, почему многие думают, что он есть, и почему они почти правы» (PDF) . Департамент компьютерных наук UCLA, технический отчет R-256 .
  • Монтгомери, округ Колумбия (2001). «Блокирование и смешение в факторном дизайне». Дизайн и анализ экспериментов (5-е изд.). Вайли. С. 287–302. В этом учебнике дается обзор мешающих факторов и того, как их учитывать при планировании экспериментов.

Внешние ссылки [ править ]

Эти сайты содержат описания или примеры смешанных переменных:

  • Учебное пособие: вмешательство и изменение меры воздействия (Школа общественного здравоохранения Бостонского университета)
  • Линейная регрессия (Йельский университет)
  • Учебник Университета Новой Англии