Стратифицированная выборка


В статистике стратифицированная выборка представляет собой метод выборки из совокупности , которая может быть разделена на подгруппы .

В статистических обследованиях , когда подгруппы населения в общей совокупности различаются, может быть целесообразным проводить выборку каждой подгруппы ( страты ) независимо. Стратификация — это процесс разделения членов совокупности на однородные подгруппы перед выборкой. Слои должны определять разделение населения. То есть он должен быть всеобъемлющим и взаимоисключающим : каждый элемент совокупности должен быть отнесен к одному и только одному слою. Затем внутри каждой страты применяется простая случайная выборка . Цель состоит в том, чтобы повысить точность выборки за счет уменьшения ошибки выборки . Он может давать взвешенное среднеекоторая имеет меньшую изменчивость, чем среднее арифметическое простой случайной выборки населения.

В вычислительной статистике стратифицированная выборка — это метод уменьшения дисперсии, когда методы Монте-Карло используются для оценки статистических данных населения из известного населения. [1]

Предположим, что нам нужно оценить среднее количество голосов за каждого кандидата на выборах. Предположим, что в стране 3 города: в городе А 1 миллион фабричных рабочих, в городе В 2 миллиона служащих, а в городе С 3 миллиона пенсионеров. Мы можем выбрать случайную выборку размером 60 по всему населению, но есть некоторая вероятность того, что полученная случайная выборка плохо сбалансирована по этим городам и, следовательно, смещена, вызывая значительную ошибку в оценке (когда интересующий результат имеет различное распределение по интересующему параметру между городами). Вместо этого, если мы решим взять случайную выборку из 10, 20 и 30 городов A, B и C соответственно, то мы можем получить меньшую ошибку в оценке для того же общего размера выборки. Этот метод обычно используется, когда население не является однородной группой.

Реальным примером использования стратифицированной выборки может служить политический опрос . Если респондентам нужно было отразить разнообразие населения, исследователь специально стремился включить участников различных групп меньшинств, таких как раса или религия, исходя из их пропорциональности общей численности населения, как указано выше. Таким образом, стратифицированное обследование может претендовать на то, чтобы быть более репрезентативным для населения, чем обследование простой случайной или систематической выборки .

Если плотность населения сильно различается в пределах региона, стратифицированная выборка обеспечит получение оценок с одинаковой точностью в различных частях региона и возможность проведения сравнений субрегионов с одинаковой статистической мощностью . Например, в Онтарио обследование, проводимое по всей провинции, может использовать более крупную долю выборки на менее населенном севере, поскольку разница в численности населения между севером и югом настолько велика, что доля выборки, основанная на выборке провинции в целом, может привести к сбор лишь горстки данных с севера.


Стратифицированная случайная выборка
Пример стратифицированной выборки