Коллайдер (статистика)

В статистике и причинно-следственных графиках переменная является коллайдером , когда на нее причинно влияют две или более переменных. Название «коллайдер» отражает тот факт, что в графических моделях стрелки от переменных, ведущих в коллайдер, кажутся «сталкивающимися» на узле , который является коллайдером. ^[1] Иногда их также называют перевернутыми вилками . ^[2]

Причинные переменные, влияющие на коллайдер, сами по себе не обязательно связаны. Если они не соседние, коллайдер неэкранирован . В противном случае коллайдер экранирован и является частью треугольника. ^[3]

Результатом наличия коллайдера на пути является то, что коллайдер блокирует связь между переменными, которые на него влияют. ^[4]^[5]^[6] Таким образом, коллайдер не порождает безусловной связи между определяющими его переменными.

Кондиционирование на коллайдере с помощью регрессионного анализа , стратификации, планирования эксперимента или выборки на основе значений коллайдера создает некаузальную связь между X и Y ( парадокс Берксона ). В терминологии причинно-следственных графов условие на коллайдере открывает путь между X и Y. Это приведет к смещению при оценке причинно-следственной связи между X и Y , что потенциально может привести к возникновению связей там, где их нет. Таким образом, коллайдеры могут подорвать попытки проверить причинно-следственные теории.

Коллайдеры иногда путают с вмешивающимися переменными. В отличие от коллайдеров, вмешивающиеся переменные следует контролировать при оценке причинно-следственных связей.

SEM модель коллайдера