Отбор проб потока


Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В статистике при выборке потока , в отличие от выборки запасов , наблюдения собираются по мере того, как они входят в конкретное интересующее состояние в течение определенного интервала. [1] При работе с данными о продолжительности (такими как периоды занятости или показатели смертности ) метод выборки данных оказывает непосредственное влияние на последующий анализ и выводы . Примером в демографии может быть выборка числа людей, умерших в течение заданного периода времени (например, в течение определенного календарного года); популярным примером в экономике может быть число людей, оставшихся без работы в течение заданного периода времени (например, определенного квартала). [2]Исследователи, выдвигающие одинаковые предположения, но использующие разные методы выборки, могут прийти к принципиально разным выводам, если совместное распределение по потокам и запасам различается. [3]

Как правило, выборки потоков страдают от правой цензуры . По истечении определенного промежутка времени, когда интервал выборки заканчивается, за лицами в выборке больше не следят, результаты записывают, а данные анализируют. В примере с безработицей, описанном выше, мы наблюдаем точную продолжительность периода, в течение которого люди уходят с работы. Для людей, которые еще не вышли из безработицы, мы наблюдаем только нижнюю границу заклинания безработицы. [4] Различие между выборкой запаса и потока может также помочь объяснить, почему определенные статистические данные, измеряющие аналогичные показатели продолжительности, могут существенно различаться. Рассмотрим, например, среднюю продолжительность перерыва (AID), средний период, в течение которого люди, которые в настоящее время безработные, были безработными, и ACD, среднюю продолжительность периода полной безработицы для работающих людей. Салант показывает, что неоднородность коэффициентов опасности между запасом и распределением потока дает ключ к пониманию того, почему эти две статистики различаются. Например, если вероятность получить предложение о работе снижается со временем безработного, E[ T ] < E[ S ], где S и T обозначают наблюдаемую и фактическую продолжительность соответственно. [2]

Теория восстановления является подходящим инструментом для решения этих проблем [1] , и был предложен широкий спектр оценок. Эти оценщики варьируются от полностью параметрических моделей, таких как модель смешанных пропорциональных рисков [5] , до непараметрических и полупараметрических методов. [6]

использованная литература

  1. ^ a b Кэмерон AC и П.К. Триведи (2005): Микроэконометрика: методы и приложения. Издательство Кембриджского университета, Нью-Йорк.
  2. ^ a b Салант, С. (1977): Теория поиска и данные о продолжительности: теория сортов. Ежеквартальный журнал экономики, 91 (1), стр. 39–57.
  3. ^ Чешер, А. и Т. Ланкастер (1981): Выборка запасов и потоков. Письма по экономике 8 (1), стр. 63–65.
  4. ^ Вулдридж, Дж. (2002): Эконометрический анализ поперечных и панельных данных, MIT Press, Кембридж, Массачусетс.
  5. ^ Ланкастер, Т. (1979): Эконометрические методы определения продолжительности безработицы. Эконометрика 47 (4), стр. 939–956.
  6. ^ Хаусман, Дж. А. и Т. Воутерсен (2014), Оценка полупараметрической модели продолжительности без указания неоднородности. Журнал эконометрики 178 (1), стр. 114–131.