Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Причинно - следственная модель Рубина ( РКС ), также известная как причинно - следственная модель Нейман-Рубин , [1] представляет собой подход к статистическому анализу в причинно-следственном на основе структуру из возможных результатов , названных в честь Дональда Рубина . Название «причинная модель Рубина» было впервые придумано Полом У. Холландом . [2] Схема потенциальных результатов была впервые предложена Ежи Нейманом в его магистерской диссертации 1923 года [3], хотя он обсуждал ее только в контексте полностью рандомизированных экспериментов. [4] Рубин расширил его до общей схемы размышлений о причинно-следственной связи как в наблюдательных, так и в экспериментальных исследованиях. [1]

Введение [ править ]

Причинная модель Рубина основана на идее потенциальных результатов. Например, человек имел бы определенный доход в возрасте 40 лет, если бы он учился в колледже, тогда как у него был бы другой доход в возрасте 40 лет, если бы он не учился в колледже. Чтобы измерить причинный эффект от поступления в колледж для этого человека, нам нужно сравнить результат для одного и того же человека в обоих альтернативных вариантах будущего. Поскольку невозможно увидеть оба потенциальных результата одновременно, один из потенциальных результатов всегда отсутствует. Эта дилемма - «фундаментальная проблема причинного вывода ».

Из-за фундаментальной проблемы причинного вывода, причинные эффекты на уровне единицы не могут быть непосредственно наблюдаемы. Однако рандомизированные эксперименты позволяют оценить причинно-следственные эффекты на популяционном уровне. [5] В ходе рандомизированного эксперимента люди случайным образом распределяют лечение: в колледже или без него. Из-за этого случайного распределения группы (в среднем) эквивалентны, и разницу в доходах в возрасте 40 лет можно отнести к распределению в колледж, поскольку это было единственное различие между группами. Оценка среднего причинно-следственного эффекта (также называемого средним эффектом лечения ) может быть затем получена путем вычисления разницы в средних значениях между обработанной (посещающей колледж) и контрольной (не посещающей колледж) выборкой.

Однако во многих случаях рандомизированные эксперименты невозможны по этическим или практическим соображениям. В таких сценариях используется механизм неслучайного назначения. Это случай посещения колледжа: люди не распределяются случайным образом для посещения колледжа. Скорее люди могут выбрать поступление в колледж в зависимости от своего финансового положения, образования родителей и так далее. Многие статистические методы были разработаны для причинно-следственного вывода, такие как сопоставление оценок склонностей . Эти методы пытаются исправить механизм назначения, находя блоки управления, похожие на лечебные.

Расширенный пример [ править ]

Рубин определяет причинный эффект:

Интуитивно понятно, что причинный эффект одного лечения, E, по сравнению с другим, C, для конкретной единицы и интервала времени от до - это разница между тем, что произошло бы во время, если бы единица подверглась воздействию Е, инициированной в момент, и тем, что могло бы произойти. произошли в, если бы устройство подверглось воздействию C, инициированному в : «Если бы час назад я принял два аспирина вместо стакана воды, моя головная боль теперь исчезла бы» или «потому что час назад я принял два аспирина вместо стакана воды моя головная боль ушла ». Наше определение причинного эффекта лечения Е по сравнению с С будет отражать это интуитивное значение » [5].

Согласно RCM, причинный эффект от приема или отказа от приема аспирина час назад - это разница между тем, как ваша голова чувствовала бы себя в случае 1 (прием аспирина) и случае 2 (отказ от аспирина). Если ваша головная боль останется без аспирина, но исчезнет, ​​если вы приняли аспирин, то причинным эффектом от приема аспирина является облегчение головной боли. В большинстве случаев нас интересует сравнение двух вариантов будущего, одно из которых обычно называют «лечением», а другое - «контролем». Эти ярлыки несколько произвольны.

Возможные результаты [ править ]

Предположим, что Джо участвует в тестировании FDA на новое лекарство от гипертонии. Если бы мы были всеведущими, мы бы знали результаты для Джо как при лечении (новый препарат), так и при контроле (либо без лечения, либо при текущем стандартном лечении). Причинный эффект или эффект лечения - это разница между этими двумя потенциальными исходами.

артериальное давление Джо, если он примет новую таблетку. В общем, это обозначение выражает потенциальный результат лечения t на установке u . Точно так же влияние другой обработки c или контроля на единицу u . В данном случае это кровяное давление Джо, если он не принимает таблетку. - это причинный эффект от приема нового препарата.

Из этой таблицы мы знаем только причинное влияние на Джо. У всех остальных участников исследования может наблюдаться повышение артериального давления, если они принимают таблетки. Однако, независимо от причинного эффекта для других субъектов, причинным эффектом для Джо является более низкое кровяное давление по сравнению с тем, каким было бы его кровяное давление, если бы он не принял таблетку.

Рассмотрим более крупную выборку пациентов:

Причинно-следственный эффект различен для каждого субъекта, но лекарство действует на Джо, Мэри и Боба, потому что причинный эффект отрицательный. Их кровяное давление ниже при приеме препарата, чем было бы, если бы каждый из них не принимал препарат. С другой стороны, у Салли препарат вызывает повышение артериального давления.

Чтобы потенциальный результат имел смысл, он должен быть возможен, по крайней мере, априори . Например, если у Джо нет возможности получить новое лекарство ни при каких обстоятельствах, то это для него невозможно. Этого не может быть никогда. И если это невозможно наблюдать даже теоретически, то причинный эффект лечения на кровяное давление Джо не определен.

Нет причинно-следственной связи без манипуляций [ править ]

Причинный эффект нового препарата хорошо определен, потому что это простое различие двух потенциальных результатов, оба из которых могут произойти. В этом случае мы (или что-то еще) можем манипулировать миром, по крайней мере, концептуально, так что не исключено, что может произойти одно или другое.

Такое определение причинно-следственных связей становится гораздо более проблематичным, если один из возможных результатов никогда не может произойти. Например, как влияет рост Джо на его вес? Наивно, это похоже на другие наши примеры. Нам просто нужно сравнить два возможных результата: каким будет вес Джо при лечении (где лечение определяется как рост на 3 дюйма) и какой вес Джо будет под контролем (где контроль определяется как его текущий рост).

Немного подумав, высветится проблема: мы не можем увеличить рост Джо. Невозможно даже концептуально наблюдать, какой был бы вес Джо, будь он выше, потому что нет способа сделать его выше. Мы не можем манипулировать ростом Джо, поэтому нет смысла исследовать причинное влияние роста на вес. Отсюда слоган: Нет причинно-следственной связи без манипуляции .

Допущение стабильной стоимости единицы обработки (SUTVA) [ править ]

Мы требуем, чтобы «наблюдение [потенциального результата] на одном отделении не зависело от конкретного назначения лечения другим отделениям» (Cox 1958, §2.4). Это называется допущением о стабильной единице лечения (SUTVA), которое выходит за рамки концепции независимости.

В контексте нашего примера артериальное давление Джо не должно зависеть от того, получает Мэри препарат или нет. Но что, если это так? Предположим, что Джо и Мэри живут в одном доме, а Мэри всегда готовит. Наркотик вызывает у Мэри тягу к соленой пище, поэтому, если она примет лекарство, она будет готовить с большим количеством соли, чем в противном случае. Диета с высоким содержанием соли повышает кровяное давление Джо. Следовательно, его результат будет зависеть как от того, какое лечение он получил, так и от того, какое лечение получит Мэри.

Нарушение SUTVA затрудняет причинный вывод. Мы можем учесть зависимые наблюдения, рассматривая больше вариантов лечения. Мы создаем 4 процедуры с учетом того, получает ли Мэри лечение.

Напомним, что причинный эффект определяется как разница между двумя потенциальными исходами. В этом случае есть несколько причинных эффектов, потому что существует более двух потенциальных результатов. Один из них - это причинное воздействие препарата на Джо, когда Мэри получает лечение и рассчитывается . Другой - причинный эффект на Джо, когда Мэри не получает лечения и рассчитывается . Третий - это причинный эффект от лечения Мэри на Джо, когда Джо не лечили. Это рассчитывается как . Лечение, которое получает Мэри, оказывает на Джо больший причинный эффект, чем лечение, которое получил Джо, на Джо, и это в противоположном направлении.

Рассматривая таким образом больше потенциальных результатов, мы можем заставить SUTVA оставаться в силе. Однако, если от Мэри зависят какие-либо подразделения, кроме Джо, мы должны рассмотреть дальнейшие возможные результаты. Чем больше количество зависимых единиц, тем больше потенциальных результатов мы должны учитывать и тем сложнее становятся расчеты (рассмотрим эксперимент с 20 разными людьми, статус лечения каждого из которых может повлиять на результаты для всех остальных). Чтобы (легко) оценить причинный эффект однократного лечения по сравнению с контролем, SUTVA следует придерживаться.

Средний причинный эффект [ править ]

Учитывать:

Можно рассчитать средний причинный эффект, взяв среднее значение всех причинных эффектов.

То, как мы измеряем реакцию, влияет на то, какие выводы мы делаем. Предположим, что мы измеряем изменения артериального давления в процентах, а не в абсолютных величинах. Затем, в зависимости от точных цифр, средним причинным эффектом может быть повышение артериального давления. Например, предположим, что артериальное давление Джорджа будет 154 под контролем и 140 при лечении. Абсолютный размер причинного эффекта составляет -14, но процентная разница (с точки зрения уровня лечения 140) составляет -10%. Если артериальное давление Сары составляет 200 на лечении и 184 под контролем, то причинный эффект составляет 16 в абсолютном выражении, но 8% с точки зрения ценности лечения. Меньшее абсолютное изменение артериального давления (-14 против 16) дает большее процентное изменение (-10% против 8%) для Джорджа.Хотя средний причинный эффект для Джорджа и Сары равен +1 в абсолютном выражении, он равен -1 в процентном отношении.

Основная проблема причинного вывода [ править ]

Результаты, которые мы видели до этого момента, никогда не будут измерены на практике. По определению невозможно наблюдать эффект от более чем одного лечения на субъект в течение определенного периода времени. Джо не может принимать таблетку и не принимать ее одновременно. Следовательно, данные будут выглядеть примерно так:

Вопросительные знаки - это ответы, которые невозможно было наблюдать. Фундаментальная проблема причинных умозаключений [2] является то , что непосредственно наблюдающей причинно - следственной связью невозможно. Однако это не делает невозможным причинно-следственный вывод . Определенные методы и допущения позволяют преодолеть фундаментальную проблему.

Предположим, что у нас есть следующие данные:

Мы можем сделать вывод, каким был бы потенциальный исход Джо под контролем, если бы мы сделали предположение о постоянном эффекте:

и

Если бы мы хотели вывести ненаблюдаемые значения, мы могли бы предположить постоянный эффект. В следующих таблицах показаны данные, согласующиеся с предположением о постоянном эффекте.

Все субъекты имеют одинаковый причинный эффект, даже если у них разные результаты лечения.

Механизм присвоения [ править ]

Механизм назначения, метод, по которому единицам назначается лечение, влияет на расчет среднего причинного эффекта. Одним из таких механизмов назначения является рандомизация. Для каждого субъекта мы могли подбросить монетку, чтобы определить, получает ли она лечение. Если бы мы хотели, чтобы лечение получили пять субъектов, мы могли бы назначить лечение первым пяти именам, которые мы выбрали из шляпы. Когда мы случайным образом назначаем лечение, мы можем получить разные ответы.

Предположим, что эти данные верны:

Истинный средний причинно-следственный эффект равен -8. Но причинно-следственный эффект для этих людей никогда не бывает равным этому среднему значению. Причинно-следственный эффект варьируется, как обычно (всегда?) В реальной жизни. После случайного назначения лечения мы можем оценить причинный эффект следующим образом:

Другое случайное распределение обработок дает другую оценку среднего причинного эффекта.

Средний причинный эффект варьируется, потому что наша выборка мала, а ответы имеют большую дисперсию . Если бы выборка была больше, а дисперсия была бы меньше, средний причинный эффект был бы ближе к истинному среднему причинному эффекту, независимо от конкретных единиц, случайным образом назначенных для лечения.

В качестве альтернативы предположим, что механизм назначает лечение всем мужчинам и только им.

Согласно этому механизму назначения, женщины не могут получить лечение и, следовательно, невозможно определить средний причинный эффект для женщин. Чтобы сделать какие-либо выводы о причинном воздействии на субъекта, вероятность того, что субъект получит лечение, должна быть больше 0 и меньше 1.

Идеальный врач [ править ]

Рассмотрите возможность использования идеального врача как механизма назначения. Идеальный врач знает, как каждый субъект отреагирует на лекарство или контроль, и назначает каждому пациенту лечение, которое принесет ему наибольшую пользу. Идеальный врач знает следующую информацию об выборке пациентов:

Основываясь на этих знаниях, она назначает следующие лечебные процедуры:

Идеальный врач искажает оба средних значения, отфильтровывая плохие ответы как на лечение, так и на контроль. Разница между средствами, которая представляет собой предполагаемый средний причинный эффект, искажается в направлении, которое зависит от деталей. Например, такой субъект, как Сьюзи, которому причинен вред в результате приема лекарства, будет отнесен к контрольной группе идеальным врачом, и, таким образом, отрицательный эффект лекарства будет замаскирован.

Заключение [ править ]

Причинный эффект лечения для одного блока в определенный момент времени - это разница между переменной результата с лечением и без лечения. Фундаментальная проблема причинного вывода состоит в том, что невозможно наблюдать причинное воздействие на отдельную единицу. Вы либо принимаете аспирин сейчас, либо нет. Как следствие, необходимо делать предположения, чтобы оценить недостающие контрфакты.

Причинная модель Рубина также была связана с инструментальными переменными (Angrist, Imbens, and Rubin, 1996) [6] и другими методами причинного вывода. Для получения дополнительной информации о связи между причинной моделью Рубина, моделированием структурных уравнений и другими статистическими методами причинного вывода см. Morgan and Winship (2007). [7]

См. Также [ править ]

  • Причинно-следственная связь
  • Основная стратификация
  • Соответствие баллов склонности

Ссылки [ править ]

  1. ^ a b Sekhon, Jasjeet (2007). "Модель Неймана – Рубина причинного вывода и оценки с помощью методов сопоставления" (PDF) . Оксфордский справочник политической методологии .
  2. ^ a b Голландия, Пол В. (1986). «Статистика и причинно-следственный вывод». J. Amer. Статист. Доц. 81 (396): 945–960. DOI : 10.1080 / 01621459.1986.10478354 . JSTOR 2289064 .  
  3. ^ Нейман, Ежи. Sur les applications de la theorie des probabilites aux experience Agricoles: Essai des Principes. Магистерская диссертация (1923 г.). Выдержки перепечатаны на английском языке, Statistical Science, Vol. 5. С. 463–472. ( Д.М. Домбровска , Т.П. Спид, переводчики.)
  4. ^ Рубин, Дональд (2005). «Причинно-следственный вывод с использованием возможных результатов». J. Amer. Статист. Доц. 100 (469): 322–331. DOI : 10.1198 / 016214504000001880 .
  5. ^ a b Рубин, Дональд (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». J. Educ. Psychol. 66 (5): 688–701 [стр. 689]. DOI : 10.1037 / h0037350 .
  6. ^ Angrist, J .; Imbens, G .; Рубин, Д. (1996). «Идентификация причинно-следственных связей с использованием инструментальных переменных» (PDF) . J. Amer. Статист. Доц. 91 (434): 444–455. DOI : 10.1080 / 01621459.1996.10476902 .
  7. ^ Морган, S .; Уиншип, К. (2007). Противоречия и причинный вывод: методы и принципы социальных исследований . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-67193-4.

Дальнейшее чтение [ править ]

  • Гвидо Имбенс и Дональд Рубин (2015). Причинно-следственный вывод для статистики, социальных и биомедицинских наук: введение . Кембридж: Издательство Кембриджского университета. DOI: 10.1017 / CBO9781139025751
  • Дональд Рубин (1977) «Назначение группы лечения на основе ковариант», Журнал образовательной статистики , 2, стр. 1-26.
  • Рубин, Дональд (1978) «Байесовский вывод причинных эффектов: роль рандомизации», «Анналы статистики» , 6, стр. 34–58.

Внешние ссылки [ править ]

  • "Причинная модель Рубина" : статья Гвидо Имбенса и Дональда Рубина для нового экономического словаря Палгрейва .
  • «Контрфактический причинно-следственный анализ» : веб-страница, поддерживаемая Стивеном Морганом, Кристофером Уиншипом и другими со ссылками на многие исследовательские статьи о причинном выводе.