Соответствие оценки склонности

В статистическом анализе данных наблюдений , склонность оценки совпадения ( ПСМ ) представляет собой статистический соответствующий метод , что попытки оценить эффект лечения, политики, или другого вмешательства путем учета ковариаций , которые предсказывают , получающих лечение. PSM пытается уменьшить систематическую ошибку из-за мешающих переменных, которые могут быть обнаружены при оценке эффекта лечения, полученного путем простого сравнения результатов между подразделениями, которые получали лечение, и теми, которые его не получали . Пол Р. Розенбаум иДональд Рубин представил эту технику в 1983 году. ^[1]

Возможность систематической ошибки возникает из-за того, что разница в исходе лечения (например, средний эффект лечения ) между леченными и нелеченными группами может быть вызвана фактором, предсказывающим лечение, а не самим лечением. В рандомизированных экспериментах рандомизация позволяет объективно оценивать эффекты лечения; для каждой ковариаты рандомизация подразумевает, что терапевтические группы будут сбалансированы в среднем по закону больших чисел . К сожалению, в обсервационных исследованиях назначение лечения субъектам исследования обычно не является случайным. Соответствие пытается уменьшить систематическую ошибку назначения лечения и имитировать рандомизацию путем создания выборки единиц, получивших лечение, сопоставимых по всем наблюдаемым ковариатам с выборкой единиц, которые не получали лечение.

Например, кому-то может быть интересно узнать о последствиях курения . Требуется обсервационное исследование, поскольку неэтично случайным образом назначать людей для лечения «курение». Эффект лечения, оцениваемый простым сравнением тех, кто курил, с теми, кто не курил, будет зависеть от любых факторов, предсказывающих курение (например, пола и возраста). PSM пытается контролировать эти систематические ошибки, делая группы, получающие лечение и не получавшие лечения, сопоставимыми с контрольными переменными.

Обзор [ править ]

PSM предназначен для случаев причинно-следственного вывода и простой ошибки отбора в неэкспериментальных условиях, в которых: (i) несколько единиц в группе сравнения без лечения сопоставимы с единицами лечения; и (ii) выбор подмножества блоков сравнения, подобных блоку обработки, затруднен, потому что блоки должны сравниваться по многомерному набору характеристик предварительной обработки.

При нормальном сопоставлении сравниваются отдельные характеристики, которые различают экспериментальную и контрольную группы, чтобы сделать группы более похожими. Но если две группы не имеют существенного совпадения, то может быть внесена существенная ошибка . Например, если сравнивать только наихудшие случаи из необработанной «сравнительной» группы только с лучшими случаями из экспериментальной группы , результатом может быть регрессия к среднему значению , что может сделать группу сравнения лучше или хуже, чем в действительности.

PSM использует прогнозируемую вероятность членства в группе - например, лечение по сравнению с контрольной группой - на основе наблюдаемых предикторов, обычно получаемых с помощью логистической регрессии, для создания контрфактической группы . Оценки склонности могут использоваться для сопоставления или в качестве ковариат , отдельно или с другими сопоставимыми переменными или ковариатами.

Общая процедура [ править ]

1. Выполните логистическую регрессию :

Зависимая переменная: Z = 1, если объект участвовал (т.е. является членом группы лечения); Z = 0, если объект не участвовал (т.е. входит в контрольную группу).
Выберите подходящие искажающие факторы (переменные, предположительно связанные как с лечением, так и с исходом)
Получите оценку для оценки склонности: прогнозируемая вероятность ( p ) или log [ p / (1 - p )].

2. Убедитесь, что ковариаты сбалансированы по группам лечения и сравнения внутри слоев оценки склонности.

Используйте стандартизированные различия или графики для изучения распределений

3. Сопоставьте каждого участника с одним или несколькими неучастниками по оценке склонности, используя один из следующих методов:

Соответствие ближайшего соседа
Сопоставление штангенциркуля: сравниваемые единицы в пределах определенной ширины оценки склонности обрабатываемых единиц сопоставляются, причем ширина обычно составляет часть стандартного отклонения оценки склонности.
Метрическое сопоставление Махаланобиса в сочетании с PSM
Соответствие стратификации
Сопоставление разностей в различиях (ядерные и локальные линейные веса)
Точное соответствие

4. Убедитесь, что ковариаты сбалансированы по группам лечения и сравнения в согласованной или взвешенной выборке.

5. Многомерный анализ на основе новой выборки.

Используйте анализы, подходящие для независимых сопоставленных выборок, если с каждым участником сопоставлено более одного неучастника.

Примечание. Если у вас есть несколько совпадений для одного обработанного наблюдения, важно использовать взвешенные наименьшие квадраты, а не обычные наименьшие квадраты.

Формальные определения [ править ]

Основные настройки [ править ]

Базовый случай ^[1] представляет собой два лечения (пронумерованные 1 и 0) с N [независимыми и одинаково распределенными случайными величинами | iid]. Каждый субъект, которым я отвечал на лечение и на контроль, отвечал . Количество , чтобы оценить это средний эффект лечения : . Переменная указывает, получал ли я лечение ( Z = 1) или контроль ( Z = 0). Пусть будет вектором наблюдаемого измерения до лечения (или ковариата) для i- го субъекта. Наблюдения проводятся до назначения лечения, но особенности в ${\ displaystyle r_ {1i}}$ ${\ displaystyle r_ {0i}}$ $E[r_{1}]-E[r_{0}]$ $Z_{i}$ $X_{i}$ $X_{i}$ $X_{i}$ не может включать все (или некоторые) из тех, которые использовались для принятия решения о назначении лечения. Предполагается, что нумерация единиц (то есть: i = 1, ..., i = N ) не содержит никакой информации, кроме той, которая содержится в . В следующих разделах индекс i будет опущен, но при этом будет продолжено обсуждение стохастического поведения некоторых субъектов. $X_{i}$

Совершенно игнорируемое назначение лечения [ править ]

Пусть у некоторого субъекта есть вектор ковариат X (то есть: условно несвязанный) и некоторые потенциальные исходы r ₀ и r ₁ под контролем и лечением, соответственно. Назначение Лечение называется сильно игнорируемые , если потенциальные результаты являются независимыми от лечения ( Z ) зависимость от фоновых величин X . Это можно записать компактно как

r_{0},r_{1}\perp Z\mid X

где означает статистическую независимость . ^[1] $\perp$

Баланс баланса [ править ]

Балансирование оценки б ( Х ) является функцией наблюдаемого ковариата Х таким , что условное распределение по X дано Ь ( X ) является одинаковым для обработанных ( Z = 1) и контрольных ( Z = 0) единиц:

Z\perp X\mid b(X).

Самая тривиальная функция - это . $b(X)=X$

Оценка склонности [ править ]

Оценка склонности - это вероятность того, что объекту (например, человеку, классу, школе) будет назначено конкретное лечение с учетом набора наблюдаемых ковариат. Оценки предрасположенности используются для уменьшения систематической ошибки отбора путем приравнивания групп на основе этих ковариат.

Предположим , что мы имеем бинарную обработку индикатора Z , переменная отклика г и фона наблюдается ковариатами X . Оценка предрасположенности определяется как условная вероятность лечения с учетом фоновых переменных:

e(x)\ {\stackrel {\mathrm {def} }{=}}\ \Pr(Z=1\mid X=x).

Основные теоремы [ править ]

Следующее было впервые представлено и доказано Розенбаумом и Рубином в 1983 г .: ^[1]

Оценка склонности - это балансирующая оценка. $e(x)$
Любая оценка, которая «лучше», чем оценка склонности, является уравновешивающей оценкой (т. Е. Для некоторой функции f ). Оценка склонности - это самая грубая функция уравновешивающей оценки, поскольку она берет (возможно) многомерный объект ( X _i ) и преобразует его в одно измерение (хотя другие, очевидно, также существуют), в то время как оно является лучшим. $e(X)=f(b(X))$ $b(X)=X$
Если назначение лечения строго игнорируется с учетом X, тогда:

Это также совершенно игнорируется при любой балансировочной функции. В частности, с учетом оценки предрасположенности:

(r_{0},r_{1})\perp Z\mid e(X).

При любом значении балансировочного балла, разница между лечебной и контрольной помощью образцов под руку (то есть: ), основанная на предметах , которые имеют то же значение балансировочного счета, может служить в качестве несмещенной оценки от среднего эффекта лечения : . ${\bar {r}}_{1}-{\bar {r}}_{0}$ $E[r_{1}]-E[r_{0}]$

Использование выборочных оценок балансовых баллов может дать выборочный баланс по X

Отношение к достаточности [ править ]

Если мы думаем о значении Z в качестве параметра населения , что влияет на распределении X , то балансирование оценки служит достаточной статистикой для Z . Кроме того, приведенные выше теоремы показывают , что оценка Склонность является минимально достаточной статистикой , если думать о Z в качестве параметра X . Наконец, если назначение лечения Z строго игнорируется для данного X, тогда оценка склонности является минимальной достаточной статистикой для совместного распределения . $(r_{0},r_{1})$

Графический тест для обнаружения наличия мешающих переменных [ править ]

Judea Pearl показала, что существует простой графический тест, называемый критерием черного хода, который обнаруживает наличие мешающих переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все лазейки на графике. Это блокирование может быть выполнено либо путем добавления смешивающей переменной в качестве элемента управления в регрессии, либо путем сопоставления смешивающей переменной. ^[2]

Недостатки [ править ]

Было показано, что PSM в некоторых случаях увеличивает «несбалансированность, неэффективность, зависимость модели и смещение» и больше не рекомендуется Гэри Кингом по сравнению с другими методами сопоставления. ^[3] Идеи, лежащие в основе использования сопоставления, все еще актуальны, но должны применяться с другими методами сопоставления; оценки предрасположенности также могут использоваться в других продуктивных целях для взвешивания и оценки с двойной надежностью.

Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения на основе данных наблюдений. Ключевыми преимуществами PSM на момент его внедрения было то, что, используя линейную комбинацию ковариат для одного балла, он уравновешивает группы лечения и контроля по большому количеству ковариат без потери большого количества наблюдений. Если бы единицы в обработке и контроле были сбалансированы по большому количеству ковариат по одному, потребовалось бы большое количество наблюдений, чтобы преодолеть «проблему размерности», посредством которой введение новой балансирующей ковариаты увеличивает минимально необходимое количество наблюдений в образец геометрически .

Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и результат, но которые нельзя наблюдать, не могут быть учтены в процедуре сопоставления. ^[4] Поскольку процедура контролирует только наблюдаемые переменные, любое скрытое смещение из-за скрытых переменных может остаться после сопоставления. ^[5] Другая проблема заключается в том, что для ПСМ требуются большие образцы со значительным перекрытием между экспериментальной и контрольной группами.

Общие опасения по поводу сопоставления также были высказаны Джудеей Перл , которая утверждала, что скрытая систематическая ошибка может на самом деле увеличиваться, поскольку сопоставление наблюдаемых переменных может вызвать систематическую ошибку из-за бездействующих ненаблюдаемых искажающих факторов. Точно так же Перл утверждал, что снижение систематической ошибки может быть обеспечено (асимптотически) только путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. ^[6] Заблуждение возникает, когда экспериментатор не может найти альтернативные, не причинно-следственные объяснения наблюдаемой взаимосвязи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « черному критерию » Pearl. ^[2]

Реализации в статистических пакетах [ править ]

R : сопоставление оценок предрасположенности доступно как часть MatchItпакета. ^[7]^[8] Его также можно легко реализовать вручную. ^[9]
SAS : процедура PSMatch и OneToManyMTCHнаблюдения за макро- соответствием на основе оценки склонности. ^[10]
Stata : несколько команд реализуют сопоставление оценок склонности ^{[11], в} том числе написанные пользователем psmatch2. ^[12] Stata версии 13 и более поздних также предлагает встроенную команду teffects psmatch. ^[13]
SPSS : диалоговое окно для сопоставления оценок склонности доступно из меню IBM SPSS Statistics (Сопоставление оценок данных / склонностей) и позволяет пользователю установить допуск совпадения, рандомизировать порядок наблюдений при отборе образцов, установить приоритет точных совпадений, образец с или без замените, установите случайное начальное число и максимизируйте производительность за счет увеличения скорости обработки и минимизации использования памяти. Процедуру FUZZY Python также можно легко добавить в качестве расширения к программному обеспечению через диалоговое окно «Расширения». Эта процедура сопоставляет наблюдения и элементы управления путем использования случайных выборок из элементов управления на основе указанного набора ключевых переменных. Команда FUZZY поддерживает точное и нечеткое соответствие.

См. Также [ править ]

Причинно-следственная модель Рубина
Незнание
Поправка Хекмана
Соответствие (статистика)

Ссылки [ править ]

^ a b c d Розенбаум, Пол Р .; Рубин, Дональд Б. (1983). «Центральная роль шкалы склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. DOI : 10.1093 / Biomet / 70.1.41 .
^ a b Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-77362-1.
^ Король, Гэри; Нильсен, Ричард (2019-05-07). «Почему оценки склонности не следует использовать для сопоставления» . Политический анализ . 27 (4): 435–454. DOI : 10.1017 / pan.2019.11 . ISSN 1047-1987 . | ссылка на полную статью (с домашней страницы автора)
^ Гарридо М.М. и др. (2014). «Методы построения и оценки предрасположенности» . Исследования служб здравоохранения . 49 (5): 1701–20. DOI : 10.1111 / 1475-6773.12182 . PMC 4213057 . PMID 24779867 .
^ Шадиш, WR; Кук, Т.Д .; Кэмпбелл, Д. Т. (2002). Экспериментальные и квазиэкспериментальные планы для обобщенного причинного вывода . Бостон: Хоутон Миффлин. ISBN 978-0-395-61556-0.
Перейти ↑ Pearl, J. (2009). «Понимание оценок предрасположенности». Причинность: модели, рассуждения и выводы (второе изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-89560-6.
^ Хо, Даниэль; Имаи, Косуке; Кинг, Гэри ; Стюарт, Элизабет (2007). «Сопоставление как непараметрическая предварительная обработка для уменьшения зависимости модели в параметрическом причинно-следственном выводе» . Политический анализ . 15 (3): 199–236. DOI : 10,1093 / панорамирование / mpl013 .
^ «MatchIt: непараметрическая предварительная обработка для параметрического причинно-следственного вывода» . R проект .
^ Гельман, Андрей; Хилл, Дженнифер (2007). Анализ данных с использованием регрессии и многоуровневых / иерархических моделей . Нью-Йорк: Издательство Кембриджского университета. С. 206–212. ISBN 978-0-521-68689-1.
^ Парсонс, Лори. «Выполнение 1: N совпадения по шкале предрасположенности к оценке склонности» (PDF) . SUGI 29: Институт SAS . Проверено 10 июня, 2016 . CS1 maint: location (link)
^ Внедрение оценщиков соответствия оценок склонности с помощью STATA . Конспект лекций 2001 г.
^ Leuven, E .; Сианези, Б. (2003). «PSMATCH2: модуль Stata для выполнения полного сопоставления оценок Махаланобиса и склонности, построения общих графиков поддержки и ковариатного тестирования дисбаланса» . Cite journal requires |journal= (help)
^ "teffects psmatch - соответствие оценки склонности" (PDF) . Руководство по Stata .

Дальнейшее чтение [ править ]

Абади, Альберто ; Имбенс, Гвидо В. (2006). «Свойства большой выборки совпадающих оценщиков для средних эффектов лечения». Econometrica . 74 (1): 235–267. CiteSeerX 10.1.1.559.6313 . DOI : 10.1111 / j.1468-0262.2006.00655.x .
Лейте, Вальтер Л. (2017). Практические методы Оценка Склонность использованием R . Вашингтон, округ Колумбия: Sage Publications. ISBN 978-1-4522-8888-8.

[Rosenbaum_1983_41–55-1] Розенбаум, Пол Р .; Рубин, Дональд Б. (1983). «Центральная роль шкалы склонности в наблюдательных исследованиях причинных эффектов» . Биометрика . 70 (1): 41–55. DOI : 10.1093 / Biomet / 70.1.41 .

[pearl-2] Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-77362-1.

[3] Король, Гэри; Нильсен, Ричард (2019-05-07). «Почему оценки склонности не следует использовать для сопоставления» . Политический анализ . 27 (4): 435–454. DOI : 10.1017 / pan.2019.11 . ISSN 1047-1987 . | ссылка на полную статью (с домашней страницы автора)

[4] Гарридо М.М. и др. (2014). «Методы построения и оценки предрасположенности» . Исследования служб здравоохранения . 49 (5): 1701–20. DOI : 10.1111 / 1475-6773.12182 . PMC 4213057 . PMID 24779867 .

[5] Шадиш, WR; Кук, Т.Д .; Кэмпбелл, Д. Т. (2002). Экспериментальные и квазиэкспериментальные планы для обобщенного причинного вывода . Бостон: Хоутон Миффлин. ISBN 978-0-395-61556-0.

[pearl:ch11-3-5-6] Перейти ↑ Pearl, J. (2009). «Понимание оценок предрасположенности». Причинность: модели, рассуждения и выводы (второе изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-89560-6.

[7] Хо, Даниэль; Имаи, Косуке; Кинг, Гэри ; Стюарт, Элизабет (2007). «Сопоставление как непараметрическая предварительная обработка для уменьшения зависимости модели в параметрическом причинно-следственном выводе» . Политический анализ . 15 (3): 199–236. DOI : 10,1093 / панорамирование / mpl013 .

[8] «MatchIt: непараметрическая предварительная обработка для параметрического причинно-следственного вывода» . R проект .

[9] Гельман, Андрей; Хилл, Дженнифер (2007). Анализ данных с использованием регрессии и многоуровневых / иерархических моделей . Нью-Йорк: Издательство Кембриджского университета. С. 206–212. ISBN 978-0-521-68689-1.

[10] Парсонс, Лори. «Выполнение 1: N совпадения по шкале предрасположенности к оценке склонности» (PDF) . SUGI 29: Институт SAS . Проверено 10 июня, 2016 . CS1 maint: location (link)

[11] Внедрение оценщиков соответствия оценок склонности с помощью STATA . Конспект лекций 2001 г.

[12] Leuven, E .; Сианези, Б. (2003). «PSMATCH2: модуль Stata для выполнения полного сопоставления оценок Махаланобиса и склонности, построения общих графиков поддержки и ковариатного тестирования дисбаланса» . Cite journal requires |journal= (help)

[13] "teffects psmatch - соответствие оценки склонности" (PDF) . Руководство по Stata .

[1]