Из Википедии, бесплатной энциклопедии
  (Перенаправлено из смешанной переменной )
Перейти к навигации Перейти к поиску
Иллюстрация простого смешивающего фактора. Другими словами, Z является причиной X и Y .

В статистике, confounder (также смешивая переменную , путая фактор , посторонний определитель или скрытую переменную ) является переменной , которая влияет как на зависимой переменной и независимой переменной , в результате чего паразитный ассоциацию . Смешение является причинным понятием и как таковое не может быть описано в терминах корреляций или ассоциаций. [1] [2] [3]

Определение [ править ]

В то время как посредник является фактором в причинно-следственной цепочке (1), вмешивающийся фактор - это ложный фактор, неверно предполагающий причинность (2).

Смешение определяется в терминах модели генерации данных (как на рисунке выше). Пусть X - некоторая независимая переменная , а Y - некоторая зависимая переменная . Для того, чтобы оценить влияние X на Y , статистик должен подавить влияние посторонних переменных , которые влияют как X и Y . Будем говорить , что X и Y Стыдно некоторой другой переменной Z , когда Z причинной влияет как X и Y .

Пусть будет вероятность события Y = y при гипотетическом вмешательстве X = x . X и Y не смешиваются тогда и только тогда, когда выполняется следующее:

для всех значений X = x и Y = y , где - условная вероятность увидеть X = x . Интуитивно это равенство означает, что X и Y не смешиваются, если наблюдаемая связь между ними такая же, как и связь, которую можно было бы измерить в контролируемом эксперименте с рандомизированным x .

В принципе, определяющее равенство можно проверить на основе модели генерации данных, предполагая, что у нас есть все уравнения и вероятности, связанные с моделью. Это делается путем моделирования вмешательства (см. Байесовскую сеть ) и проверки, равна ли полученная вероятность Y условной вероятности . Однако оказывается, что для проверки равенства достаточно одной структуры графа .

Контроль [ править ]

Рассмотрим исследователя, пытающегося оценить эффективность лекарственного средства X на основе данных о населении, в которых использование препарата было выбором пациента. Данные показывают, что пол ( Z ) влияет на выбор пациентом лекарства, а также на его шансы на выздоровление ( Y ). В этом сценарии пол Z нарушает отношения между X и Y, поскольку Z является причиной как X, так и Y :

Причинно-следственная диаграмма гендера как распространенной причины употребления наркотиков и выздоровления

У нас есть это

потому что наблюдаемая величина содержит информацию о корреляции между X и Z , а интервенционная величина - нет (поскольку X не коррелирует с Z в рандомизированном эксперименте). Статистику нужна объективная оценка , но в случаях, когда доступны только данные наблюдений, несмещенную оценку можно получить только путем «корректировки» всех смешивающих факторов, а именно, обусловлив их различные значения и усреднив результат. В случае единственного мешающего фактора Z это приводит к "формуле настройки":

который дает объективную оценку для причинного влияния X на Y . Та же формула корректировки работает при наличии нескольких факторов, влияющих на факторы, за исключением того, что в этом случае выбор набора Z переменных, который гарантировал бы несмещенные оценки, должен производиться с осторожностью. Критерий правильного выбора переменных называется Back-Door [4] [5] и требует, чтобы выбранный набор Z «блокировал» (или перехватывал) [ требуется пояснение ] каждый путь [ необходимо пояснение ] от X до Yкоторый заканчивается стрелкой в ​​X. Такие наборы называются «допустимыми задними дверями» и могут включать в себя переменные, которые не являются общими причинами X и Y , а просто их заместителями.

Возвращаясь к примеру употребления наркотиков, поскольку Z соответствует требованию «черного хода» (т. Е. Перехватывает один путь «черного хода» ), формула корректировки «черного хода» действительна:

Таким образом, врач может предсказать вероятный эффект от введения препарата на основе наблюдательных исследований, в которых условные вероятности, появляющиеся в правой части уравнения, можно оценить с помощью регрессии.

Вопреки распространенному мнению, добавление ковариат в набор корректировок Z может привести к смещению. Типичный контрпример возникает, когда Z является общим эффектом X и Y , [6] случай, в котором Z не вмешивается (т. Е. Нулевое множество является допустимым для черного хода) и корректировка Z создаст смещение, известное как « коллайдер». предвзятость »или« парадокс Берксона » .

В общем, смешивание можно контролировать с помощью корректировки тогда и только тогда, когда существует набор наблюдаемых ковариат, удовлетворяющих условию «черного хода». Более того, если Z является таким набором, то формула настройки уравнения (3) действительно <4,5>. До-исчисление Перла предоставляет дополнительные условия, при которых можно оценить P ( y  | do ( x )), не обязательно путем корректировки. [7]

История [ править ]

Согласно Морабиа (2011), [8] это слово происходит от средневекового латинского глагола «confudere», означающего «смешивание», и, вероятно, было выбрано для обозначения путаницы (от латинского: con = with + fusus = смешивать или сливать вместе ) между причиной, которую нужно оценить, и другими причинами, которые могут повлиять на результат и, таким образом, запутать или помешать желаемой оценке. Фишер использовал слово «смешивание» в своей книге 1935 года «План экспериментов» [9] для обозначения любого источника ошибки в своем идеале рандомизированного эксперимента. Согласно Vandenbroucke (2004) [10] это был Киш [11] кто использовал слово «смешивание» в современном смысле этого слова для обозначения «несопоставимости» двух или более групп (например, подвергшихся воздействию и не подвергавшихся воздействию) в наблюдательном исследовании.

Формальные условия, определяющие, что делает одни группы «сопоставимыми», а другие «несравнимыми», были позже разработаны в эпидемиологии Гренландом и Робинсом (1986) [12] с использованием контрфактического языка Неймана (1935) [13] и Рубина (1974). [14] Позже они были дополнены графическими критериями, такими как условие Back-Door ( Pearl 1993; Greenland, Pearl and Robins, 1999). [3] [4]

Было показано, что графические критерии формально эквивалентны контрфактическому определению [15], но более прозрачны для исследователей, полагающихся на модели процессов.

Типы [ править ]

В случае оценки риска, оценивающего величину и характер риска для здоровья человека , важно контролировать искажение, чтобы изолировать эффект от конкретной опасности, такой как пищевая добавка, пестицид или новое лекарство. Для проспективных исследований сложно набирать и проверять добровольцев с одинаковым опытом (возраст, диета, образование, география и т. Д.), А в исторических исследованиях может быть аналогичная изменчивость. Из-за невозможности контролировать изменчивость добровольцев и исследований на людях, смешивание является особой проблемой. По этим причинам эксперименты предлагают способ избежать большинства форм смешения.

В некоторых дисциплинах смешение подразделяется на разные типы. В эпидемиологии одним из типов является «смешение по показаниям» [16], которое связано с искажением результатов наблюдательных исследований . Поскольку прогностические факторы могут влиять на решения о лечении (и смещать оценки эффектов лечения), контроль известных прогностических факторов может уменьшить эту проблему, но всегда возможно, что забытый или неизвестный фактор не был включен или что факторы сложно взаимодействуют. Смешение по показаниям было описано как наиболее важное ограничение наблюдательных исследований. На рандомизированные испытания не влияет искажение показаний из-за случайного распределения .

Смешивающие переменные также можно разделить на категории в соответствии с их источником. Выбор инструмента измерения (операционное смешение), ситуационных характеристик (процедурное смешение) или межличностных различий (личностное смешение).

  • Эксплуатационное озадачив может происходить как в экспериментальных и не экспериментальных научно - исследовательских проектов. Этот тип смешения возникает, когда мера, предназначенная для оценки определенной конструкции, непреднамеренно измеряет и что-то еще. [17]
  • Процедурные Вмешивающиеся факторы могут иметь место в лабораторном эксперименте или квази-эксперименте . Этот тип смешения возникает, когда исследователь по ошибке позволяет другой переменной изменяться вместе с управляемой независимой переменной. [17]
  • Человек озадачив происходит , когда две или более группы единиц анализируются вместе (например, рабочие из различных профессий), несмотря на изменения в соответствии с одним или более другим (наблюдалось или ненаблюдаемой) характеристики (например, пол). [18]

Примеры [ править ]

Допустим, кто-то изучает связь между очередностью рождения (1-й ребенок, 2-й ребенок и т. Д.) И наличием у ребенка синдрома Дауна . В этом сценарии возраст матери будет смешанной переменной:

  1. Более высокий возраст матери напрямую связан с синдромом Дауна у ребенка
  2. Более высокий возраст матери напрямую связан с синдромом Дауна, независимо от очередности рождения (мать, имеющая первого или третьего ребенка в возрасте 50 лет, представляет такой же риск)
  3. Возраст матери напрямую связан с очередностью рождения (2-й ребенок, за исключением двойни, рождается, когда мать старше, чем она была на момент рождения 1-го ребенка)
  4. Возраст матери не является следствием очередности рождения (наличие второго ребенка не влияет на возраст матери)

При оценке риска такие факторы, как возраст, пол и уровень образования, часто влияют на состояние здоровья, поэтому их следует контролировать. Помимо этих факторов, исследователи могут не учитывать или не иметь доступа к данным о других причинных факторах. Примером может служить исследование влияния курения табака на здоровье человека. Курение, употребление алкоголя и диета связаны между собой. Оценка риска, которая учитывает последствия курения, но не учитывает потребление алкоголя или диету, может переоценить риск курения. [19] Курение и смешивание рассматриваются при оценке профессиональных рисков, таких как безопасность добычи угля. [20] Когда нет большой выборки некурящих или непьющих, занимающихся определенной профессией, оценка риска может быть смещена в сторону выявления отрицательного воздействия на здоровье.

Уменьшение возможности запутывания [ править ]

Снижение вероятности возникновения и влияния мешающих факторов может быть получено за счет увеличения типов и количества сравнений, выполняемых в анализе. Если измерения или манипуляции с основными конструкциями ошибочны (т. Е. Существуют операционные или процедурные затруднения), анализ подгрупп может не выявить проблем в анализе. Кроме того, увеличение количества сравнений может создать другие проблемы (см. Множественные сравнения ).

Рецензирование - это процесс, который может помочь в сокращении случаев искажения либо до реализации исследования, либо после того, как был проведен анализ. Рецензирование полагается на коллективную экспертизу в рамках дисциплины для выявления потенциальных слабых мест в дизайне и анализе исследования, включая то, как результаты могут зависеть от искажения. Точно так же репликация может проверить надежность результатов одного исследования при альтернативных условиях исследования или альтернативных анализах (например, с учетом возможных искажений, не выявленных в первоначальном исследовании).

Смежные эффекты могут иметь меньшую вероятность возникновения и действовать одинаково во многих случаях и в разных местах. [ необходимая цитата ] При выборе исследовательских участков, окружающая среда может быть подробно охарактеризована на исследуемых участках, чтобы гарантировать, что участки являются экологически подобными и, следовательно, с меньшей вероятностью имеют смешанные переменные. Наконец, можно изучить взаимосвязь между переменными окружающей среды, которые могут затруднить анализ, и измеряемыми параметрами. Информация, относящаяся к переменным окружающей среды, может затем использоваться в моделях для конкретных участков для определения остаточной дисперсии, которая может быть связана с реальными эффектами. [21]

В зависимости от типа существующего дизайна исследования существуют различные способы его изменения для активного исключения или контроля смешивающих переменных: [22]

  • В исследованиях случай-контроль вмешивающиеся факторы одинаково распределяются по обеим группам, случаям и контролю. Например, если кто-то хотел изучить причину инфаркта миокарда и считает, что возраст является вероятной смешивающей переменной, каждому 67-летнему пациенту с инфарктом будет сопоставлен здоровый 67-летний «контрольный» человек. В исследованиях случай-контроль наиболее часто совпадающими переменными являются возраст и пол. Недостаток: исследования случай-контроль возможны только тогда, когда легко найти элементы контроля, то есть лиц, чей статус по отношению ко всем известным потенциальным смешивающим факторам такой же, как и у пациента случая: предположим, что исследование случай-контроль пытается найти причина данного заболевания у человека 1) 45 лет, 2) афроамериканца, 3) жителя Аляски, 4) заядлый футболист, 5) вегетарианец и 6) работает в сфере образования. Теоретически совершенным контролем был бы человек, который, помимо того, что у него нет исследуемой болезни, соответствует всем этим характеристикам и не имеет болезней, которых также не было бы у пациента, - но найти такой контроль было бы огромной задачей.
  • Когортные исследования: Степень соответствия также возможна, и это часто достигается путем включения в исследуемую популяцию только определенных возрастных групп или определенного пола, создавая когорту людей с похожими характеристиками, и, таким образом, все когорты сопоставимы в отношении возможной смешивающей переменной. . Например, если считается, что возраст и пол противоречат друг другу, только мужчины в возрасте от 40 до 50 лет будут участвовать в когортном исследовании, которое будет оценивать риск инфаркта миокарда в когортах, которые либо физически активны, либо неактивны. Недостаток: в когортных исследованиях чрезмерное исключение входных данных может привести к тому, что исследователи будут слишком узко определять набор лиц, находящихся в аналогичном положении, для которых, по их мнению, исследование является полезным, так что другие люди, к которым причинно-следственная связь действительно применима, могут потерять возможность воспользоваться рекомендациями исследования.Точно так же «чрезмерная стратификация» входных данных в рамках исследования может уменьшить размер выборки в данной страте до такой степени, что обобщения, сделанные путем наблюдения только за членами этой страты, не являютсястатистически значимо .
  • Двойное ослепление : скрывает от исследуемой популяции и наблюдателей членство участников в экспериментальной группе. Не позволяя участникам узнать, получают ли они лечение или нет, эффект плацебо должен быть одинаковым для контрольной группы и группы лечения. Не позволяя наблюдателям узнать об их членстве, не должно возникать предвзятости со стороны исследователей, которые по-разному относятся к группам или по-разному интерпретируют результаты.
  • Рандомизированное контролируемое исследование: Метод, при котором исследуемая популяция делится случайным образом, чтобы снизить вероятность самостоятельного выбора участниками или предвзятости разработчиков исследования. Перед началом эксперимента тестировщики распределяют участников пула участников в свои группы (контрольные, интервенционные, параллельные), используя процесс рандомизации, такой как использование генератора случайных чисел. Например, в исследовании влияния упражнений выводы были бы менее достоверными, если бы участникам был предоставлен выбор, хотят ли они принадлежать к контрольной группе, которая не будет выполнять упражнения, или к группе вмешательства, которая будет готова принять участие в упражнении. программа упражнений. Затем в исследовании будут учитываться и другие переменные, помимо физических упражнений, такие как уровень здоровья до эксперимента и мотивация к здоровым занятиям. Со стороны наблюдателяэкспериментатор может выбрать кандидатов, которые с большей вероятностью продемонстрируют результаты, которые хочет увидеть исследование, или могут интерпретировать субъективные результаты (более энергичный, позитивный настрой) в соответствии с их желаниями.
  • Стратификация . Как и в приведенном выше примере, считается, что физическая активность защищает от инфаркта миокарда; и возраст считается возможным вмешивающимся фактором. Затем отобранные данные стратифицируются по возрастным группам - это означает, что связь между активностью и инфарктом будет анализироваться для каждой возрастной группы. Если разные возрастные группы (или возрастные слои) дают очень разные соотношения рисков , возраст следует рассматривать как смешивающую переменную. Существуют статистические инструменты, в том числе методы Мантеля – Хензеля, которые учитывают стратификацию наборов данных.
  • Контроль за искажением путем измерения известных искажающих факторов и включения их в качестве ковариант - это многомерный анализ, такой как регрессионный анализ . Многомерный анализ дает гораздо меньше информации о силе или полярности мешающей переменной, чем методы стратификации. Например, если многовариантный анализ контролирует антидепрессант и не стратифицирует антидепрессанты по TCA и SSRI , тогда он будет игнорировать тот факт, что эти два класса антидепрессантов имеют противоположные эффекты на инфаркт миокарда, и один из них намного сильнее другого.

У всех этих методов есть свои недостатки:

  1. Лучший доступный защита от возможности ложных результатов благодаря смешению часто обойтись без усилий по расслоению и вместо того, чтобы провести рандомизированное исследование в виде достаточно большой выборке , взятой в целом, таким образом, что все потенциальные путая переменные (известные и неизвестные) будет случайно распределены по всем исследовательским группам и, следовательно, не будут коррелированы с бинарной переменной для включения / исключения в любой группе.
  2. Этические соображения: в двойных слепых и рандомизированных контролируемых испытаниях участники не знают, что они получают фиктивное лечение, и им может быть отказано в эффективном лечении. [23] Существует вероятность того, что пациенты соглашаются на инвазивную операцию (которая сопряжена с реальными медицинскими рисками) только при том понимании, что они получают лечение. Хотя это этическая проблема, это не полный отчет о ситуации. Для операций, которые в настоящее время проводятся регулярно, но для которых нет конкретных доказательств подлинного эффекта, могут возникнуть этические проблемы для продолжения таких операций. В таких обстоятельствах многие люди подвергаются реальным рискам хирургического вмешательства, однако эти методы лечения могут не принести заметной пользы. Контроль ложной хирургии - это метод, который может позволить медицинской науке определить, является ли хирургическая процедура эффективной или нет. Учитывая, что существуют известные риски, связанные с медицинскими операциями,Сомнительно этично разрешать проведение непроверенных операций до бесконечности в будущем.

См. Также [ править ]

  • Анекдотические свидетельства  - Доказательства, основанные на личных показаниях
  • Причинный вывод  - раздел статистики, связанный с установлением причинно-следственных связей между переменными.
  • Эпидемиологический метод  - научный метод в конкретной области
  • Парадокс Симпсона  - явление вероятности и статистики, при котором тренд появляется в группах данных, но исчезает, когда эти группы объединяются.

Ссылки [ править ]

  1. Перейти ↑ Pearl, J. (2009). Парадокс Симпсона , смешивание и коллапсируемость причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк: Издательство Кембриджского университета.
  2. ^ VanderWeele, TJ; Шпицер И. (2013). «Об определении конфаунтера» . Анналы статистики . 41 (1): 196–220. arXiv : 1304.0564 . DOI : 10.1214 / 12-aos1058 . PMC  4276366 . PMID  25544784 .
  3. ^ a b Гренландия, S .; Робинс, JM; Перл, Дж. (1999). «Смешение и коллапсируемость в причинном выводе» . Статистическая наука . 14 (1): 29–46. DOI : 10,1214 / сс / 1009211805 .
  4. ^ а б Перл, Дж., (1993). «Аспекты графических моделей, связанные с причинностью», В трудах 49-й сессии Международного статистического института науки, стр. 391–401.
  5. Перейти ↑ Pearl, J. (2009). Причинные диаграммы и определение причинных эффектов в причинно- следственной связи : модели, рассуждения и выводы (2-е изд.). Нью-Йорк, Нью-Йорк, США: Издательство Кембриджского университета.
  6. ^ Ли, PH (2014). «Должны ли мы вносить поправку на противоречие, если эмпирические и теоретические критерии дают противоречивые результаты? Исследование с помощью моделирования» . Sci Rep . 4 : 6085. Bibcode : 2014NatSR ... 4E6085L . DOI : 10.1038 / srep06085 . PMC 5381407 . PMID 25124526 .  
  7. ^ Шпицер, И .; Перл, Дж. (2008). «Полные методы идентификации причинно-следственной иерархии». Журнал исследований в области машинного обучения . 9 : 1941–1979.
  8. ^ Morabia, A (2011). «История современной эпидемиологической концепции смешения» (PDF) . Журнал эпидемиологии и общественного здравоохранения . 65 (4): 297–300. DOI : 10.1136 / jech.2010.112565 . PMID 20696848 . S2CID 9068532 .   
  9. Перейти ↑ Fisher, RA (1935). План экспериментов (стр. 114–145).
  10. ^ Vandenbroucke, JP (2004). «История смешения». Соз Правентивмед . 47 (4): 216–224. DOI : 10.1007 / BF01326402 . PMID 12415925 . S2CID 198174446 .  
  11. Перейти ↑ Kish, L (1959). «Некоторые статистические проблемы в дизайне исследования». Am Sociol . 26 (3): 328–338. DOI : 10.2307 / 2089381 . JSTOR 2089381 . 
  12. ^ Гренландия, S .; Робинс, JM (1986). «Идентифицируемость, возможность обмена и эпидемиологическое смешение». Международный журнал эпидемиологии . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . DOI : 10.1093 / ije / 15.3.413 . PMID 3771081 .  
  13. ^ Нейман Дж при содействии К. Iwaskiewics и СанктKolodziejczyk (1935). Статистические проблемы сельскохозяйственных экспериментов (с обсуждением). Дополнение J Roy Statist Soc Ser B 2 107-180.
  14. Перейти ↑ Rubin, DB (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Журнал педагогической психологии . 66 (5): 688–701. DOI : 10.1037 / h0037350 . S2CID 52832751 . 
  15. Перейти ↑ Pearl, J. (2009). Причинность: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, Нью-Йорк, США: Издательство Кембриджского университета.
  16. Перейти ↑ Johnston, SC (2001). «Выявление противоречивых сведений с помощью слепого проспективного обзора» . Am J Epidemiol . 154 (3): 276–284. DOI : 10.1093 / AJE / 154.3.276 . PMID 11479193 . 
  17. ^ a b Пелхэм, Бретт (2006). Проведение исследований в области психологии . Бельмонт: Уодсворт. ISBN 978-0-534-53294-9.
  18. ^ Steg, L .; Буунк, АП; Ротенгаттер, Т. (2008). "Глава 4". Прикладная социальная психология: понимание и решение социальных проблем . Кембридж, Великобритания: Издательство Кембриджского университета.
  19. ^ Тьённеланд, Энн; Грёнбек, Мортен; Стрипп, Конни; Овервад, Ким (январь 1999 г.). «Потребление вина и диета в случайной выборке из 48763 датских мужчин и женщин» . Американское общество питания Американский журнал клинического питания . 69 (1): 49–54. DOI : 10.1093 / ajcn / 69.1.49 . PMID 9925122 . 
  20. ^ Акселсон, О. (1989). «Заблуждение от курения в профессиональной эпидемиологии» . Британский журнал промышленной медицины . 46 (8): 505–07. DOI : 10.1136 / oem.46.8.505 . PMC 1009818 . PMID 2673334 .  
  21. ^ Calow, Питер П. (2009) Справочник по оценке и управлению экологическими рисками , Wiley
  22. ^ Mayrent, Шерри L (1987). Эпидемиология в медицине . Липпинкотт Уильямс и Уилкинс . ISBN 978-0-316-35636-7.
  23. ^ Эмануэль, Иезекииль J; Миллер, Франклин Дж. (20 сентября 2001 г.). «Этика плацебо-контролируемых испытаний - золотая середина». Медицинский журнал Новой Англии . 345 (12): 915–9. DOI : 10.1056 / nejm200109203451211 . PMID 11565527 . 

Дальнейшее чтение [ править ]

  • Перл, Дж. (Январь 1998 г.). «Почему нет статистического теста на смешение, почему многие думают, что он есть, и почему они почти правы» (PDF) . Департамент компьютерных наук Калифорнийского университета в Лос-Анджелесе, Технический отчет R-256 .
  • Монтгомери, округ Колумбия (2001). «Блокирование и смешение в факторном дизайне». Планирование и анализ экспериментов (5-е изд.). Вайли. С. 287–302. В этом учебнике есть обзор мешающих факторов и того, как их учитывать при планировании экспериментов.CS1 maint: postscript (link)

Внешние ссылки [ править ]

Эти сайты содержат описания или примеры смешанных переменных:

  • Учебное пособие: вмешательство и изменение меры воздействия (Школа общественного здравоохранения Бостонского университета)
  • Линейная регрессия (Йельский университет)
  • Учебник Университета Новой Англии