Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Визуальное представление выбора простой случайной выборки [ требуется пояснение ]

В статистике и методологии количественного исследования выборка - это набор лиц или объектов, собранных или выбранных из статистической совокупности с помощью определенной процедуры. [1] Элементы образца известны как точки выборки , единицы выборки или наблюдение. [ необходима цитата ] Когда задумывается как набор данных, выборка часто обозначается заглавными латинскими буквами, например, а ее элементы выражаются строчными буквами (например, ), а размер выборки обозначается буквой . [2] [3]

Как правило, население очень велико, поэтому перепись или полный учет всех особей в популяции непрактичны или невозможны. Выборка обычно представляет собой подмножество управляемого размера. Образцы собираются, и на их основе рассчитывается статистика , так что можно делать выводы или экстраполяции из выборки в генеральную совокупность.

Образец может быть взят из популяции без замены (т.е. нет элемента может быть выбраны более чем один раз в том же образце), в этом случае оно является подмножеством из популяции ; или с заменой (т.е. элемент может появляться несколько раз в одном образце), в этом случае это мультиподмножество. [4]

Виды образцов [ править ]

Полный образец представляет собой набор объектов из родительского населения , которое включает в себя все такие объекты , которые удовлетворяют набор четко определенные критерии выбора. [5] [ неудавшаяся проверка ] Например, полная выборка австралийских мужчин ростом выше 2 м будет состоять из списка всехСамец-австралиец выше 2 м. Но сюда не будут входить немецкие мужчины, высокие австралийские женщины или люди ростом ниже 2 м. Таким образом, для составления такой полной выборки требуется полный список родительского населения, включая данные о росте, поле и национальности для каждого члена этого родительского населения. В случае человеческих популяций такой полный список вряд ли существует (человеческое население исчисляется миллиардами). Но такие полные образцы часто доступны в других дисциплинах, таких как набор игроков в крупной спортивной лиге, даты рождения членов парламента или полный ограниченный по величине список астрономических объектов.

Несмещенный (представитель) образец представляет собой набор объектов , выбранных из полного образца, используя процесс отбора , который не зависит от свойств объектов. [6] Например, объективная выборка австралийских мужчин ростом выше 2 м может состоять из случайной выборки из 1% австралийских мужчин ростом выше 2 м. Но тот, кто выбран из списка избирателей, может быть небеспристрастным, поскольку, например, мужчины в возрасте до 18 лет не будут включены в список избирателей. В астрономическом контексте объективная выборка может состоять из той части полной выборки, по которой доступны данные, при условии, что доступность данных не зависит от свойств отдельных источников.

Лучший способ избежать предвзятой или нерепрезентативной выборки - выбрать случайную выборку , также известную как вероятностная выборка. Случайная выборка определяется как выборка, в которой каждый отдельный член совокупности имеет известный ненулевой шанс быть выбранным в качестве части выборки. [7] Несколько типов случайных выборок: простые случайные выборки , систематические выборки , стратифицированные случайные выборки и кластерные случайные выборки .

Выборка, которая не является случайной, называется неслучайной выборкой или неслучайной выборкой . [8] Некоторые примеры образцов неслучайных являются удобные выборки , образцы суждения , целенаправленные образцы , образцы квот , образцы снежный ком , и квадратурные узлы в методах квази-Монте - Карло .

Математическое описание случайной выборки [ править ]

В математических терминах дано распределение вероятностей F , случайную выборку длины п (где п может быть любым положительным целым числом) представляет собой набор реализаций п независимых одинаково распределенных ( IID ) случайных величин с распределением F . [9]

Образец конкретно представляет результаты n экспериментов, в которых измеряется одна и та же величина. Например, если мы хотим оценить средний рост представителей определенной популяции, мы измеряем рост n человек. Каждое измерение извлекаются из распределения вероятностей F , характеризующее население, так что каждая измеренная высота является реализацией случайной величины с распределением F . Обратите внимание, что набор случайных величин (т. Е. Набор измеримых функций) не следует путать с реализациями этих переменных (которые являются значениями, которые принимают эти случайные величины). Другими словами, это функция, представляющая измерение в точке i.-й эксперимент, и это значение, полученное при проведении измерения.

См. Также [ править ]

  • Теория оценок
  • Репликация (статистика)
  • Определение размера выборки
  • Смещение выборки
  • Выборочное распределение
  • Ошибка выборки
  • Выборка (статистика)
  • Выборка опроса

Заметки [ править ]

  1. ^ Пек, Рокси ; Олсен, Крис и Девор, Джей (2008), Введение в статистику и анализ данных (3-е изд.), Belmont, Cal .: Thomson Brooks / Cole, p. 8, ISBN 978-0-495-11873-2, LCCN  2006933904 , извлекаются 2009-08-04
  2. ^ «Список вероятностных и статистических символов» . Математическое хранилище . 2020-04-26 . Проверено 21 августа 2020 .
  3. ^ "Что означает размер выборки?" . Наука . Проверено 21 августа 2020 .
  4. ^ Borzyszkowski, Анджей М .; Соколовский, Стефан, ред. (1993), "Характеристика морфизмов Штурма" (PDF) , Математические основы компьютерных наук 1993. 18-й Международный симпозиум, MFCS'93, Гданьск, Польша, 30 августа - 3 сентября 1993 г. Труды , конспекты лекций по информатике , 711 , . С. 281-290, CiteSeerX 10.1.1.361.7021 , DOI : 10.1007 / 3-540-57182-5_20 , ISBN   978-3-540-57182-7, Zbl  0925,11026
  5. ^ Pratt, JW, Райфа Х., и Schaifer, R. (1995). Введение в статистическую теорию принятия решений. Кембридж, Массачусетс: MIT Press. ISBN 9780262161442 . MR 1326829 
  6. ^ Lomax, RG и Hahs-Vaughan, Дебби Л. Введение в статистические концепции (3-е изд).
  7. ^ Кокран, Уильям Г. (1977). Методы отбора проб (Третье изд.). Вайли. ISBN 978-0-471-16240-7.
  8. ^ Йохан Strydom (2005). Введение в маркетинг (третье изд.). Вайли. ISBN 978-0-471-16240-7.
  9. ^ Сэмюэл С. Уилкс , Математическая статистика , Джон Вили, 1962, раздел 8.1.

Внешние ссылки [ править ]

  • Статистические термины стали проще