Выборка (статистика)


В статистике , обеспечении качества и методологии обследования выборка — это выбор подмножества ( статистической выборки ) лиц из статистической совокупности для оценки характеристик всей совокупности. Статистики пытаются собрать выборки, репрезентативные для рассматриваемой совокупности. Выборка имеет меньшие затраты и более быстрый сбор данных, чем измерение всего населения, и может дать информацию в тех случаях, когда невозможно провести выборку всего населения.

Каждое наблюдение измеряет одно или несколько свойств (таких как вес, местоположение, цвет) независимых объектов или людей. В выборке обследования к данным могут быть применены веса для корректировки структуры выборки, особенно в стратифицированной выборке . [1] На практике используются результаты теории вероятностей и статистической теории . В деловых и медицинских исследованиях выборка широко используется для сбора информации о населении. [2] Приемочный отбор используется для определения того, соответствует ли производственная партия материала установленным спецификациям .

Успешная статистическая практика основана на целенаправленной постановке задачи. В выборке это включает в себя определение « населения », из которого взята наша выборка. Популяцию можно определить как включающую всех людей или предметы с характеристиками, которые нужно понять. Поскольку очень редко бывает достаточно времени или денег для сбора информации обо всех или обо всем в популяции, целью становится поиск репрезентативной выборки (или подмножества) этой популяции.

Иногда то, что определяет популяцию, очевидно. Например, производителю необходимо решить, является ли партия материала из производства достаточно высокого качества, чтобы быть отпущенной покупателю, или должна быть приговорена к браку или доработке из-за низкого качества. В этом случае партия представляет собой совокупность.

Хотя интересующая совокупность часто состоит из физических объектов, иногда необходимо произвести выборку во времени, пространстве или некоторой комбинации этих измерений. Например, при исследовании кадрового состава супермаркетов можно было бы изучить длину очереди к кассе в разное время, или исследование пингвинов, находящихся под угрозой исчезновения, может быть направлено на то, чтобы понять, как они используют различные охотничьи угодья с течением времени. Для измерения времени внимание может быть сосредоточено на периодах или дискретных событиях.

В других случаях исследуемая «популяция» может быть еще менее осязаемой. Например, Джозеф Джаггер изучал поведение колес рулетки в казино в Монте-Карло и использовал это, чтобы идентифицировать смещенное колесо. В этом случае «совокупность», которую Джаггер хотел исследовать, представляла собой общее поведение колеса (т. е. вероятностное распределение его результатов по бесконечному числу испытаний), в то время как его «выборка» была сформирована из наблюдаемых результатов от этого колеса. Аналогичные соображения возникают при повторных измерениях некоторых физических характеристик, таких как электропроводность меди .


Визуальное представление процесса отбора проб
Визуальное представление выбора простой случайной выборки
Визуальное представление выбора случайной выборки с использованием метода систематической выборки.
Визуальное представление выбора случайной выборки с использованием метода стратифицированной выборки.
Визуальное представление выбора случайной выборки с использованием метода кластерной выборки.