Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Обратное вероятностное взвешивание - это статистический метод расчета статистики, стандартизированной для псевдопопуляции, отличной от той, в которой были собраны данные. Часто применяются планы исследований с разрозненной выборкой и популяцией целевой группы (целевая группа). [1] Могут существовать запретительные факторы, не позволяющие исследователям напрямую брать образцы из целевой группы, такие как стоимость, время или этические соображения. [2] Решение этой проблемы состоит в использовании альтернативной стратегии проектирования, например, стратифицированной выборки . Взвешивание при правильном применении потенциально может повысить эффективность и уменьшить смещение невзвешенных оценок.

Одна очень ранняя взвешенная оценка - это оценка среднего значения Хорвица – Томпсона . [3] Если известна вероятность выборки , из которой выборочная совокупность берется из целевой совокупности, то для взвешивания наблюдений используется величина, обратная этой вероятности. Этот подход был обобщен для многих аспектов статистики в различных рамках. В частности, есть взвешенные вероятности , взвешенные уравнения оценки и взвешенные плотности вероятностей, из которых выводится большая часть статистики. Эти приложения систематизировали теорию других статистических данных и оценок, таких как модели маргинальной структуры ,стандартизированный коэффициент смертности и алгоритм EM для грубых или агрегированных данных.

Взвешивание обратной вероятности также используется для учета отсутствующих данных, когда субъекты с отсутствующими данными не могут быть включены в первичный анализ. [4] С оценкой вероятности выборки или вероятности того, что фактор будет измерен в другом измерении, можно использовать взвешивание обратной вероятности для завышения веса для субъектов, которые недопредставлены из-за большой степени отсутствующих данных .

Взвешенная оценка обратной вероятности (IPWE) [ править ]

Оценщик с обратной вероятностью взвешивания может использоваться для демонстрации причинно-следственной связи, когда исследователь не может провести контролируемый эксперимент, но имеет наблюдаемые данные для моделирования. Поскольку предполагается, что лечение не назначается случайным образом, цель состоит в том, чтобы оценить контрфактический или потенциальный результат, если бы всем субъектам в популяции было назначено любое лечение.

Предположим, что наблюдаемые данные взяты iid [ необходимы пояснения ] (независимые и одинаково распределенные) из неизвестного распределения P, где

  • ковариаты
  • это два возможных лечения.
  • отклик
  • Мы не предполагаем, что лечение назначается случайным образом.

Цель состоит в том, чтобы оценить потенциальный результат, который будет наблюдаться, если субъекту будет назначено лечение a. Затем сравните средние результаты , если у всех пациентов в популяции были назначены либо лечение: . Мы хотим оценить, используя данные наблюдений .

Формула оценщика [ править ]

Создание IPWE [ править ]

  1. куда
  2. построить или использовать любую модель склонности (часто модель логистической регрессии)

После вычисления среднего значения каждой группы лечения можно использовать статистический t-критерий или тест ANOVA для оценки разницы между средними значениями группы и определения статистической значимости эффекта лечения.

Предположения [ править ]

  1. Последовательность:
  2. Никаких неизмеренных искажающих факторов:
    • Назначение лечения основано исключительно на данных ковариации и не зависит от потенциальных результатов.
  3. Позитивность: для всех и

Ограничения [ править ]

Взвешенная оценка обратной вероятности (IPWE) может быть нестабильной, если предполагаемые склонности невелики. Если вероятность назначения какого-либо лечения мала, тогда модель логистической регрессии может стать нестабильной вокруг хвостов, в результате чего IPWE также станет менее стабильным.

Расширенная обратная взвешенная оценка вероятности (AIPWE) [ править ]

Альтернативная оценка - это расширенная оценка с обратной взвешенной вероятностью (AIPWE), сочетающая в себе свойства оценки на основе регрессии и оценки с обратной взвешенной вероятностью. Следовательно, это «вдвойне надежный» метод, поскольку он требует только правильного определения модели склонности или результата, но не того и другого вместе. Этот метод дополняет IPWE, чтобы уменьшить изменчивость и повысить эффективность оценки. Эта модель придерживается тех же предположений, что и взвешенная оценка обратной вероятности (IPWE). [5]

Формула оценщика [ править ]

Строительство AIPWE [ править ]

  1. Построить регрессионный оценщик для прогнозирования результата на основе ковариат и лечения
  2. Построить оценку склонности
  3. Объедините в AIPWE, чтобы получить

См. Также [ править ]

Ссылки [ править ]

  1. ^ Робинс, JM; Ротницкий, А; Чжао, LP (1994). «Оценка коэффициентов регрессии при не всегда соблюдении некоторых регрессоров». Журнал Американской статистической ассоциации . 89 (427): 846–866. DOI : 10.1080 / 01621459.1994.10476818 .
  2. ^ Бреслоу, NE; Ламли, Т; и другие. (2009). «Использование всей когорты в анализе данных по когортным случаям» . Am J Epidemiol . 169 (11): 1398–1405. DOI : 10.1093 / AJE / kwp055 . PMC 2768499 . PMID 19357328 .  
  3. ^ Хорвиц, Д.Г.; Томпсон, ди-джей (1952). «Обобщение выборки без замены из конечной вселенной». Журнал Американской статистической ассоциации . 47 : 663–685. DOI : 10.1080 / 01621459.1952.10483446 .
  4. ^ Эрнан, Массачусетс; Робинс, JM (2006). «Оценка причинных эффектов по эпидемиологическим данным» . J Epi Comm . 60 : 578–596. CiteSeerX 10.1.1.157.9366 . DOI : 10.1136 / jech.2004.029496 . PMC 2652882 . PMID 16790829 .   
  5. ^ Цао, Вэйхуа; Циатис, Анастасиос А .; Давидиан, Мари (2009). «Повышение эффективности и надежности дважды надежной оценки для среднего значения генеральной совокупности с неполными данными» . Биометрика . 96 (3): 723–734. DOI : 10.1093 / Biomet / asp033 . ISSN 0006-3444 . PMC 2798744 . PMID 20161511 .