Взаимодействие (статистика)


В статистике взаимодействие может возникнуть при рассмотрении взаимосвязи между тремя или более переменными и описывает ситуацию, в которой влияние одной причинной переменной на результат зависит от состояния второй причинной переменной (то есть, когда эффекты двух причинных переменных причины не суммируются ). [1] [2] Хотя понятие взаимодействия обычно рассматривается с точки зрения причинно-следственных связей, оно также может описывать и непричинные связи (тогда также называемые модерацией или модификацией эффекта ). Взаимодействия часто рассматриваются в контексте регрессионного анализа или факторных экспериментов .

Наличие взаимодействий может иметь важные последствия для интерпретации статистических моделей. Если две интересующие переменные взаимодействуют, связь между каждой из взаимодействующих переменных и третьей «зависимой переменной» зависит от значения другой взаимодействующей переменной. На практике это затрудняет прогнозирование последствий изменения значения переменной, особенно если переменные, с которыми она взаимодействует, трудно измерить или трудно контролировать.

Понятие «взаимодействие» тесно связано с понятием умеренности , которое распространено в исследованиях в области социальных наук и здравоохранения: взаимодействие между объясняющей переменной и переменной окружающей среды предполагает, что эффект объясняющей переменной смягчается или модифицируется переменной окружающей среды. . [1]

Переменная взаимодействия или функция взаимодействия — это переменная, созданная из исходного набора переменных, чтобы попытаться представить либо все присутствующее взаимодействие, либо некоторую его часть. В исследовательском статистическом анализе обычно используются произведения исходных переменных в качестве основы для проверки наличия взаимодействия с возможностью замены других более реалистичных переменных взаимодействия на более позднем этапе. Когда имеется более двух объясняющих переменных, конструируются несколько переменных взаимодействия, при этом попарные продукты представляют парные взаимодействия, а продукты более высокого порядка представляют взаимодействия более высокого порядка.

является примером модели с взаимодействием между переменными x 1 и x 2 («ошибка» относится к случайной величине , значение которой равно значению, на которое Y отличается от ожидаемого значения Y ; см. ошибки и остатки в статистике ). Часто модели представлены без термина взаимодействия , но это смешивает основной эффект и эффект взаимодействия (т. е. без указания термина взаимодействия возможно, что любой обнаруженный основной эффект на самом деле обусловлен взаимодействием).

Простая ситуация, в которой могут возникнуть взаимодействия, — это двухфакторный эксперимент , анализируемый с использованием дисперсионного анализа (ANOVA). Предположим , у нас есть два бинарных фактора A и B. Например, эти факторы могут указывать на то, был ли пациенту назначен какой-либо из двух методов лечения, причем методы лечения применялись либо по отдельности, либо в комбинации. Затем мы можем рассмотреть средний ответ на лечение (например, уровни симптомов после лечения) для каждого пациента как функцию назначенной комбинации лечения. В следующей таблице показана одна из возможных ситуаций: