Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Взаимодействие образования и идеологии на озабоченность по поводу повышения уровня моря

В статистике , взаимодействие может возникнуть при рассмотрении вопроса о взаимосвязи между тремя или более переменных, а также описывает ситуацию , в которой влияние одной переменной причинного на исход зависит от состояния переменной второго причинной (то есть, когда эффекты двух причины не складываются ). [1] [2] Хотя обычно понятие взаимодействия рассматривается в терминах причинно-следственных связей, оно также может описывать непричинные ассоциации. Взаимодействия часто рассматриваются в контексте регрессионного анализа или факторных экспериментов .

Наличие взаимодействий может иметь важные последствия для интерпретации статистических моделей. Если две представляющие интерес переменные взаимодействуют, соотношение между каждой из взаимодействующих переменных и третьей «зависимой переменной» зависит от значения другой взаимодействующей переменной. На практике это затрудняет прогнозирование последствий изменения значения переменной, особенно если переменные, с которыми она взаимодействует, трудно измерить или трудно контролировать.

Понятие «взаимодействие» тесно связано с понятием умеренности, которое является обычным в социальных исследованиях и исследованиях в области здравоохранения: взаимодействие между объясняющей переменной и переменной окружающей среды предполагает, что влияние объясняющей переменной было смягчено или изменено переменной окружающей среды. . [1]

Введение [ править ]

Переменное взаимодействие или функция взаимодействия является переменной строится из исходного набора переменных , чтобы попытаться представить либо все из присутствующего взаимодействия или некоторой его части. В исследовательском статистическом анализе обычно используют продукты исходных переменных в качестве основы для проверки наличия взаимодействия с возможностью замены других, более реалистичных переменных взаимодействия на более позднем этапе. Когда существует более двух независимых переменных, конструируется несколько переменных взаимодействия, где попарные продукты представляют попарные взаимодействия, а продукты более высокого порядка представляют взаимодействия более высокого порядка.

Двоичный фактор и количественные переменные Х взаимодействует (не являются аддитивные) при анализе по отношению к переменному исходу Y .

Таким образом, для ответа Y и две переменных х 1 и х 2 аддитивная модель будет:

В отличие от этого,

является примером модели с взаимодействием между переменными х 1 и х 2 ( «ошибка» относится к случайной переменной , значение которой является то , что с помощью которых Y отличается от ожидаемого значения из Y , см ошибки и остаточные примеси в статистике ). Часто модели представлены без члена взаимодействия , но это смешивает основной эффект и эффект взаимодействия (т. Е. Без указания члена взаимодействия возможно, что любой обнаруженный основной эффект на самом деле обусловлен взаимодействием).

В моделировании [ править ]

В ANOVA [ править ]

Простая установка, в которой могут возникать взаимодействия, - это двухфакторный эксперимент, анализируемый с помощью дисперсионного анализа (ANOVA). Предположим , у нас есть два бинарных факторов A и B . Например, эти факторы могут указывать на то, было ли пациенту назначено какое-либо из двух курсов лечения, применяемое отдельно или в комбинации. Затем мы можем рассмотреть средний ответ на лечение (например, уровни симптомов после лечения) для каждого пациента как функцию от введенной комбинации лечения. В следующей таблице показана одна возможная ситуация:

В этом примере нет взаимодействия между двумя методами лечения - их эффекты складываются. Причина этого заключается в том, что разница в среднем ответе между субъектами, получающими лечение A, и теми, кто не получает лечение A, составляет -2 независимо от того , вводится ли лечение B (-2 = 4-6) или нет (-2 = 5-7 ). Обратите внимание, что автоматически следует, что разница в среднем ответе между субъектами, получающими лечение B, и теми, кто не получает лечение B, одинакова, независимо от того , вводится ли лечение A (7-6 = 5-4).

Напротив, если наблюдаются следующие средние ответы

тогда существует взаимодействие между процедурами - их эффекты не складываются. Предположив , что большее число соответствует лучшей реакции, в этой ситуации лечение B полезно в среднем , если объект не также получает лечение A , но вредна в среднем , если в комбинации с лечением А . Лечение полезно в среднем независимо от того, является ли лечение Б также вводят, но это более полезно как в абсолютном , так и в относительном выражении , если даны в одиночку, а не в сочетании с лечением B . Подобные наблюдения сделаны для этого конкретного примера в следующем разделе.

Качественные и количественные взаимодействия [ править ]

Во многих приложениях полезно различать качественные и количественные взаимодействия. [3] Количественное взаимодействие между A и B является ситуация , когда величина эффекта B зависит от величины А , но направление эффекта B является постоянным для всех А . Качественное взаимодействие между A и B относится к ситуации, когда как величина, так и направление воздействия каждой переменной могут зависеть от значения другой переменной.

Таблица средних значений слева, ниже, показывает количественное взаимодействие - лечение A полезно как когда назначается B , так и когда B не назначается, но польза больше, когда B не назначается (т.е. когда A назначается отдельно) . Таблица средств справа показывает качественное взаимодействие. Вредно , когда Б дается, но это полезно , когда Б не дано. Обратите внимание, что такая же интерпретация будет иметь место, если мы рассмотрим выгоду от B в зависимости от того, дано ли A.

Различие между качественным и количественным взаимодействиями зависит от порядка, в котором рассматриваются переменные (напротив, свойство аддитивности инвариантно для порядка переменных). В следующей таблице, если мы сосредоточимся на эффекте лечения A , существует количественное взаимодействие: лечение A улучшит результат в среднем независимо от того, проводится лечение B или нет (хотя польза больше, если лечение А дается отдельно). Однако, если мы сосредоточимся на эффекте лечения B , есть качественное взаимодействие - предоставление лечения B субъекту, который уже получает лечение Aбудет (в среднем) ухудшить ситуацию, тогда как лечение В субъекту, не получающему лечение А , в среднем улучшит результат.

Аддитивность блока лечения [ править ]

В своей простейшей форме предположение об аддитивности лечебной установки утверждает, что наблюдаемый ответ y ij от экспериментальной установки i при получении лечения j может быть записан как сумма y ij  =  y i  +  t j . [4] [5] [6] Предположение об аддитивности единичной обработки подразумевает, что каждая обработка имеет точно такой же аддитивный эффект на каждую экспериментальную единицу. Так как любое данное экспериментальное устройство может только пройти один из обработок, предположение блок обработки аддитивности гипотеза , что не является непосредственно фальсифицируем, в соответствии с Кокс [ править ]и Кемпторн. [ необходима цитата ]

Однако многие последствия аддитивности лечебного блока можно фальсифицировать. [ необходимая цитата ] Для рандомизированного эксперимента предположение об аддитивности лечения подразумевает, что дисперсия постоянна для всех видов лечения. Поэтому, напротив, необходимым условием аддитивности единичного лечения является постоянство дисперсии. [ необходима цитата ]

Свойство аддитивности единичной обработки не инвариантно при изменении масштаба, [ необходима цитата ], поэтому статистики часто используют преобразования для достижения аддитивности единичной обработки. Если ожидается, что переменная отклика будет следовать параметрическому семейству распределений вероятностей, то статистик может указать (в протоколе эксперимента или наблюдательного исследования), что отклики будут преобразованы для стабилизации дисперсии. [7] Во многих случаях статистик может указать, что к ответам должны применяться логарифмические преобразования, которые, как считается, соответствуют мультипликативной модели. [5] [8]

Предположение об аддитивности единичного лечения было сформулировано в эксперименте Кемпторном [ необходима цитата ] и Коксом [ необходима ссылка ] . Использование Кемпторном аддитивности единичного лечения и рандомизации аналогично основанному на дизайне анализу выборки конечного населения.

В последние годы стало обычным [ цитата ] использовать терминологию Дональда Рубина, которая использует контрфакты. Предположим, мы сравниваем две группы людей по некоторому атрибуту y . Например, первая группа может состоять из людей, которым проводится стандартное лечение какого-либо заболевания, а вторая группа состоит из людей, которые получают новое лечение с неизвестным эффектом. Принимая «контрфактическую» перспективу, мы можем рассмотреть индивида, атрибут которого имеет значение y, если этот индивид принадлежит к первой группе, и чей атрибут имеет значение τ ( y ), если индивид принадлежит ко второй группе. Предположение об «аддитивности единичного лечения» состоит в том, чтоτ ( y ) =  τ , то есть «лечебный эффект» не зависит от y . Поскольку мы не можем наблюдать одновременно y и τ ( y ) для данного человека, это не проверяется на индивидуальном уровне. Однако аддитивность единичной обработки означает, что кумулятивные функции распределения F 1 и F 2 для двух групп удовлетворяют условию F 2 ( y ) =  F 1 ( y - τ ), если отнесение людей к группам 1 и 2 не зависит от все другие факторы, влияющие на y (т.е.конфаунтеры ). Отсутствие аддитивности единичного лечения можно рассматривать как форму взаимодействия между назначением лечения (например, для групп 1 или 2) и исходным или необработанным значением y .

Категориальные переменные [ править ]

Иногда взаимодействующие переменные являются категориальными переменными, а не действительными числами, и тогда исследование может рассматриваться как анализ проблемы дисперсии . Например, члены населения могут быть классифицированы по религии и роду занятий. Если кто-то хочет спрогнозировать рост человека только на основе религии и рода занятий, простая аддитивная модель, т. Е. Модель без взаимодействия, добавит к общему среднему росту поправку для конкретной религии и другую - для конкретного занятия. Модель с взаимодействием, в отличие от аддитивной модели, может добавить дополнительную настройку для «взаимодействия» между этой религией и этим занятием. Этот пример может вызвать подозрение, что слово « взаимодействие» употреблено неправильно.

Статистически наличие взаимодействия между категориальными переменными обычно проверяется с использованием формы дисперсионного анализа (ANOVA). Однако, если одна или несколько переменных являются непрерывными по своей природе, ее обычно проверяют с помощью множественной регрессии с умеренной скоростью. [9] Это так называется, потому что модератор - это переменная, которая влияет на силу взаимосвязи между двумя другими переменными.

Разработанные эксперименты [ править ]

Геничи Тагучи утверждал [10], что взаимодействия можно исключить из системы путем соответствующего выбора переменной отклика и преобразования. Однако Джордж Бокс и другие утверждали, что в целом это не так. [11]

Размер модели [ править ]

Для n предикторов количество членов линейной модели, которая включает константу, каждый предиктор и все возможные взаимодействия, равно . Поскольку эта величина растет экспоненциально, она легко становится непрактично большой. Один из способов ограничить размер модели - ограничить порядок взаимодействий. Например, если разрешено только двустороннее взаимодействие, количество терминов становится равным . В таблице ниже показано количество терминов для каждого количества предикторов и максимальный порядок взаимодействия.

В регрессии [ править ]

Самый общий подход к моделированию эффектов взаимодействия включает регрессию, начиная с приведенной выше элементарной версии:

где термин взаимодействия может быть сформирован явно путем умножения двух (или более) переменных или неявно с использованием факторной записи в современных статистических пакетах, таких как Stata . Компоненты x 1 и x 2 могут быть измерениями или {0,1} фиктивными переменными в любой комбинации. Взаимодействие с участием переменного фиктивным , умноженный на переменное измерение, называется наклон фиктивных переменные , [12] , так как они оценивают и испытать разницу в склонах между группами 0 и 1.

Когда переменные измерения используются во взаимодействиях, часто желательно работать с центрированными версиями, где среднее значение переменной (или какое-либо другое разумно центральное значение) установлено равным нулю. Центрирование делает основные эффекты в моделях взаимодействия более понятными. Коэффициент a в приведенном выше уравнении, например, представляет эффект x 1, когда x 2 равен нулю.

Взаимодействие образования и политической партии, влияющее на убеждения об изменении климата

Регрессионные подходы к моделированию взаимодействия являются очень общими, поскольку они могут включать дополнительные предикторы и множество альтернативных спецификаций или стратегий оценки помимо обычных наименьших квадратов . Среди возможных вариантов - робастные , квантильные модели и модели со смешанными эффектами ( многоуровневые ), а также обобщенное линейное моделирование, охватывающее широкий диапазон категориальных, упорядоченных, подсчитанных или иным образом ограниченных зависимых переменных. На графике показано взаимодействие образования и политики на основе взвешенного по вероятности логит-регрессионного анализа данных опроса. [13]

Графики взаимодействия [ править ]

Графики взаимодействия показывают возможные взаимодействия между переменными.

Пример: взаимодействие видов и температуры воздуха и их влияние на температуру тела [ править ]

Рассмотрим исследование температуры тела различных видов животных при разных температурах воздуха в градусах Фаренгейта. Данные представлены в таблице ниже.

График взаимодействия может использовать либо температуру воздуха, либо виды в качестве оси x. Второй фактор представлен линиями на графике взаимодействия.

Существует взаимодействие между двумя факторами (температурой воздуха и видами) в их влиянии на реакцию (температуру тела), потому что влияние температуры воздуха зависит от вида. Взаимодействие указано на графике, потому что линии не параллельны.

Пример: влияние тяжести инсульта и лечения на выздоровление [ править ]

В качестве второго примера рассмотрим клиническое исследование взаимосвязи между тяжестью инсульта и эффективностью лекарственного средства для выживаемости пациентов. Данные представлены в таблице ниже.

На графике взаимодействия линии для групп легкой и средней степени инсульта параллельны, что указывает на то, что препарат оказывает одинаковое действие в обеих группах, поэтому взаимодействия нет. Линия для группы тяжелого инсульта не параллельна другим линиям, что указывает на взаимосвязь между тяжестью инсульта и влиянием препарата на выживаемость. Линия для группы тяжелого инсульта плоская, что указывает на то, что среди этих пациентов нет разницы в выживаемости при лечении препаратом и плацебо. Напротив, линии для групп с легким и умеренным инсультом спускаются вправо, указывая на то, что среди этих пациентов группа плацебо имеет более низкую выживаемость, чем группа, принимавшая лекарства.

Проверка гипотез для взаимодействий [ править ]

Дисперсионный анализ и регрессионный анализ используются для проверки значимых взаимодействий.

Пример: взаимодействие температуры и времени при выпечке печенья [ править ]

Влияет ли на выход хорошего печенья температура и время выпечки в духовке? В таблице приведены данные для 8 пакетов файлов cookie.

Данные показывают, что выход хорошего печенья лучше всего, когда (i) температура высокая и время в духовке короткое, или (ii) температура низкая и время в духовке длительное. Если печенье оставить в духовке на длительное время при высокой температуре, печенье подгорело и выход низкий.

Из графика и данных видно, что линии не параллельны, что указывает на взаимодействие. Это можно проверить с помощью дисперсионного анализа (ANOVA). Первая модель ANOVA не будет включать член взаимодействия. То есть первая модель ANOVA игнорирует возможное взаимодействие. Вторая модель ANOVA будет включать член взаимодействия. То есть вторая модель ANOVA явно выполняет проверку гипотезы для взаимодействия.

Модель ANOVA 1: без взаимодействия; yield ~ температура + время [ править ]

В модели ANOVA, которая игнорирует взаимодействие, ни температура, ни время не оказывают существенного влияния на выход (p = 0,91), что, очевидно, является неверным выводом. Более подходящая модель ANOVA должна проверять возможное взаимодействие.

Модель 2 ANOVA: включить термин взаимодействия; yield ~ температура * время [ править ]

Член взаимодействия температура: время является значимым (p = 0,000180). На основании теста взаимодействия и графика взаимодействия выясняется, что влияние времени на урожайность зависит от температуры и наоборот.

Примеры [ править ]

Примеры реального взаимодействия:

  • Взаимодействие между добавлением сахара в кофе и перемешиванием кофе. Ни одна из двух отдельных переменных не оказывает большого влияния на сладость, но их комбинация оказывает.
  • Взаимодействие между добавлением углерода в сталь и закалкой . Ни один из двух по отдельности не оказывает большого влияния на силу, но их комбинация имеет драматический эффект.
  • Взаимодействие между курением и вдыханием волокон асбеста : оба фактора повышают риск карциномы легких, но воздействие асбеста увеличивает риск рака у курильщиков и некурящих. Здесь совместный эффект от вдыхания асбеста и курения выше, чем сумма обоих эффектов. [14]
  • Взаимодействие генетических факторов риска диабета 2 типа и диеты (в частности, «западный» режим питания). Было показано, что западная диета увеличивает риск диабета для субъектов с высоким «показателем генетического риска», но не для других субъектов. [15]
  • Взаимодействие между образованием и политической ориентацией, влияющее на восприятие общественностью изменения климата. Например, опросы в США часто обнаруживают, что принятие реальности антропогенного изменения климата возрастает с образованием среди умеренных или либеральных респондентов, но снижается по мере образования среди наиболее консервативных. [16] [17] Аналогичные взаимодействия наблюдались в отношении некоторых не связанных с климатом наук или восприятия окружающей среды [18], а также в отношении показателей научной грамотности или других знаний вместо образования. [19] [20]

См. Также [ править ]

  • Дисперсионный анализ
  • Факторный эксперимент
  • Обобщенный рандомизированный блочный дизайн
  • Линейная модель
  • Главный эффект
  • Взаимодействие
  • Тест аддитивности Тьюки

Ссылки [ править ]

  1. ^ а б Додж, Ю. (2003).Оксфордский словарь статистических терминов. Издательство Оксфордского университета. ISBN 978-0-19-920613-1.
  2. Перейти ↑ Cox, DR (1984). "Взаимодействие". Международное статистическое обозрение . 52 (1): 1–25. DOI : 10.2307 / 1403235 . JSTOR 1403235 . 
  3. Перейти ↑ Peto, DP (1982). «Статистические аспекты исследований рака». Лечение рака (Первое изд.). Лондон: Чепмен и Холл. ISBN 0-412-21850-X.
  4. ^ Kempthorne, Оскар (1979). Планирование и анализ экспериментов (исправленная перепечатка (1952) изд. Wiley). Роберт Э. Кригер. ISBN 978-0-88275-105-4.
  5. ^ a b Кокс, Дэвид Р. (1958). Планирование экспериментов . Глава 2. ISBN 0-471-57429-5.
  6. ^ Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в экспериментальный дизайн (второе изд.). Вайли. Главы 5-6. ISBN 978-0-471-72756-9.CS1 maint: multiple names: authors list (link)
  7. ^ Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в экспериментальный дизайн (второе изд.). Вайли. Главы 7-8. ISBN 978-0-471-72756-9.CS1 maint: multiple names: authors list (link)
  8. Перейти ↑ Bailey, RA (2008). Дизайн сравнительных экспериментов . Издательство Кембриджского университета. ISBN 978-0-521-68357-9. Главы перед публикацией доступны в режиме онлайн.
  9. Перейти ↑ Overton, RC (2001). «Умеренная множественная регрессия для взаимодействий, включающих категориальные переменные: статистический контроль неоднородной дисперсии между двумя группами». Психологические методы . 6 (3): 218–33. DOI : 10.1037 / 1082-989X.6.3.218 . PMID 11570229 . 
  10. ^ "Дизайн экспериментов - эксперименты Тагучи" . www.qualitytrainingportal.com . Проверено 27 ноября 2015 .
  11. Перейти ↑ George EP Box (1990). "Имеет ли значение взаимодействие?" (PDF) . Качественная инженерия . 2 : 365–369. DOI : 10.1080 / 08982119008962728 . Архивировано из оригинального (PDF) 10.06.2010 . Проверено 28 июля 2009 .
  12. ^ Гамильтон, LC 1992. Регрессия с графикой: второй курс прикладной статистики . Пасифик Гроув, Калифорния: Брукс / Коул. ISBN 978-0534159009 
  13. ^ Гамильтон, LC; Сайто, К. (2015). «Четырехсторонний взгляд на экологическую озабоченность США». Экологическая политика . 24 (2): 212–227. DOI : 10.1080 / 09644016.2014.976485 . S2CID 154762226 . 
  14. Перейти ↑ Lee, PN (2001). «Связь между совместным воздействием асбеста и курением и риском рака легких» . Медицина труда и окружающей среды . 58 (3): 145–53. DOI : 10.1136 / oem.58.3.145 . PMC 1740104 . PMID 11171926 .  
  15. ^ Lu, Q .; и другие. (2009). «Генетическая предрасположенность, западная диета и риск диабета 2 типа у мужчин» . Am J Clin Nutr . 89 (5): 1453–1458. DOI : 10,3945 / ajcn.2008.27249 . PMC 2676999 . PMID 19279076 .  
  16. Перейти ↑ Hamilton, LC (2011). «Образование, политика и мнения об изменении климата: свидетельства взаимодействия» . Изменение климата . 104 (2): 231–242. DOI : 10.1007 / s10584-010-9957-8 . S2CID 16481640 . 
  17. ^ McCright, AM (2011). «Политическая ориентация смягчает убеждения американцев и их беспокойство по поводу изменения климата». Изменение климата . 104 (2): 243–253. DOI : 10.1007 / s10584-010-9946-у . S2CID 152795205 . 
  18. ^ Гамильтон, Лоуренс С .; Сайто, Кей (2015). «Четырехсторонний взгляд на экологическую озабоченность США». Экологическая политика . 24 (2): 212–227. DOI : 10.1080 / 09644016.2014.976485 . S2CID 154762226 . 
  19. ^ Кахан, DM; Jenkins-Smith, H .; Браман, Д. (2011). «Культурное познание научного консенсуса» . Журнал исследований рисков . 14 (2): 147–174. DOI : 10.1080 / 13669877.2010.511246 . HDL : 10.1080 / 13669877.2010.511246 . S2CID 216092368 . 
  20. ^ Гамильтон, LC; Катлер, MJ; Шефер, А. (2012). «Общественные знания и озабоченность по поводу потепления полярных регионов». Полярная география . 35 (2): 155–168. DOI : 10.1080 / 1088937X.2012.684155 . S2CID 12437794 . 

Дальнейшее чтение [ править ]

  • Кокс, Дэвид Р. и Рид, Нэнси М. (2000) Теория планирования экспериментов , Chapman & Hall / CRC. ISBN 1-58488-195-X 
  • Саутвуд, KE (1978). «Материальная теория и статистическое взаимодействие: пять моделей». Американский журнал социологии . 83 (5): 1154–1203. DOI : 10.1086 / 226678 .
  • Brambor, T .; Кларк, WR (2006). «Понимание моделей взаимодействия: улучшение эмпирического анализа» . Политический анализ . 14 (1): 63–82. DOI : 10,1093 / панорамирование / mpi014 .
  • Hayes, AF; Маттес, Дж. (2009). «Вычислительные процедуры для исследования взаимодействий в OLS и логистической регрессии: реализации SPSS и SAS» . Методы исследования поведения . 41 (3): 924–936. DOI : 10,3758 / BRM.41.3.924 . PMID  19587209 .
  • Балли, Х.о .; Соренсен, BE (2012). «Эффекты взаимодействия в эконометрике». Эмпирическая экономика . 43 (x): 1-21. CiteSeerX  10.1.1.691.4349 . DOI : 10.1007 / s00181-012-0604-2 . S2CID  53504187 .

Внешние ссылки [ править ]

  • «Использование индикаторов и переменных взаимодействия» (PDF) . Архивировано из оригинального (PDF) 03 марта 2016 года . Проверено 3 февраля 2010 . (158  КБ )
  • Достоверность и переменная статистического взаимодействия: выступление за умножение как источник понимания
  • Основы статистического взаимодействия: в чем разница между «основными эффектами» и «эффектами взаимодействия»?