В статистике , то оценка Хорвиц-Томпсон , названный в честь Daniel G. Хорвиц и Donovan J. Thompson, [1] является метод оценки общей [2] и среднее значение для псевдо-населения в стратифицированной выборке . Обратное вероятностное взвешивание применяется для учета различных пропорций наблюдений внутри слоев целевой совокупности. Оценщик Хорвица – Томпсона часто применяется при анализе обследований и может использоваться для учета недостающих данных .
Метод
Формально пусть быть независимой выборкой из n из N ≥ n различных слоев с общим средним μ . Предположим далее, что- вероятность включения случайно выбранной особи в суперпопуляцию, принадлежащую i- му слою. Оценка Хорвица – Томпсона общей суммы определяется следующим образом:
а оценка среднего значения определяется по формуле:
В байесовской вероятностной структуресчитается доля лиц в целевой популяции, принадлежащих к i- му слою. Следовательно,можно рассматривать как оценку полной выборки лиц в i- м слое. Оценки Хорвиц-Томпсон также могут быть выражены в виде предела взвешенной начальной загрузки передискретизации оценки среднего. Его также можно рассматривать как частный случай множественных подходов к вменению . [3]
Для планов пост-стратифицированных исследований оценка а также выполняются отдельными шагами. В таких случаях вычисление дисперсиине однозначно. Для получения согласованных оценок дисперсии оценки Хорвица – Томпсона могут применяться методы повторной выборки, такие как бутстрап или складной нож. [4] «Обзорный» пакет для R проводит анализ постстратифицированных данных с использованием оценки Хорвица – Томпсона. [5]
Доказательство беспристрастной оценки среднего Хорвица-Томпсона
Можно показать, что оценка Хорвица – Томпсона несмещена при оценке математического ожидания оценки Хорвица – Томпсона, , следующим образом:
Рекомендации
- ^ Хорвица, DG; Томпсон, DJ (1952) «Обобщение выборки без замены из конечной вселенной», Журнал Американской статистической ассоциации , 47, 663–685,. JSTOR 2280784
- ^ Уильям Г. Кокран (1977), методы отбора проб , 3-е издание, Wiley. ISBN 0-471-16240-X
- ^ Родерик Дж. Литтл, Дональд Б. Рубин (2002) Статистический анализ с отсутствующими данными , 2-е изд., Wiley. ISBN 0-471-18386-5
- ^ Кватембер, А. (2014). «Конечная популяция начальной загрузки - от максимального правдоподобия к подходу Хорвица-Томпсона». Австрийский статистический журнал . 43 : 93–102.
- ^ https://cran.r-project.org/web/packages/survey/