В статистике при выборке потока , в отличие от выборки запасов , наблюдения собираются по мере того, как они входят в конкретное интересующее состояние в течение определенного интервала. [1] При работе с данными о продолжительности (такими как периоды занятости или показатели смертности ) метод выборки данных оказывает непосредственное влияние на последующий анализ и выводы . Примером в демографии может быть выборка числа людей, умерших в течение заданного периода времени (например, в течение определенного календарного года); популярным примером в экономике может быть число людей, оставшихся без работы в течение заданного периода времени (например, определенного квартала). [2]Исследователи, выдвигающие одинаковые предположения, но использующие разные методы выборки, могут прийти к принципиально разным выводам, если совместное распределение по потокам и запасам различается. [3]
Как правило, выборки потоков страдают от правой цензуры . По истечении определенного промежутка времени, когда интервал выборки заканчивается, за лицами в выборке больше не следят, результаты записывают, а данные анализируют. В примере с безработицей, описанном выше, мы наблюдаем точную продолжительность периода, в течение которого люди уходят с работы. Для людей, которые еще не вышли из безработицы, мы наблюдаем только нижнюю границу заклинания безработицы. [4] Различие между выборкой запаса и потока может также помочь объяснить, почему определенные статистические данные, измеряющие аналогичные показатели продолжительности, могут существенно различаться. Рассмотрим, например, среднюю продолжительность перерыва (AID), средний период, в течение которого люди, которые в настоящее время безработные, были безработными, и ACD, среднюю продолжительность периода полной безработицы для работающих людей. Салант показывает, что неоднородность коэффициентов опасности между запасом и распределением потока дает ключ к пониманию того, почему эти две статистики различаются. Например, если вероятность получить предложение о работе снижается со временем безработного, E[ T ] < E[ S ], где S и T обозначают наблюдаемую и фактическую продолжительность соответственно. [2]
Теория восстановления является подходящим инструментом для решения этих проблем [1] , и был предложен широкий спектр оценок. Эти оценщики варьируются от полностью параметрических моделей, таких как модель смешанных пропорциональных рисков [5] , до непараметрических и полупараметрических методов. [6]