В статистике , выборка обследования описывает процесс выбора элементов выборки из целевой популяции для проведения обследования. Термин « обследование » может относиться ко многим различным типам или методам наблюдения. В выборке обследований чаще всего используется анкета, используемая для измерения характеристик и / или отношения людей. Различные способы связи с членами выборки после того, как они были отобраны, являются предметом сбора данных обследования . Цель выборки - снизить стоимость и / или объем работы, которая потребуется для обследования всей целевой совокупности. Обследование, которое измеряет всю целевую совокупность, называется переписью.. Выборка относится к группе или части населения, от которой должна быть получена информация.
Выборки опросов можно условно разделить на два типа: вероятностные и супервыборки. Выборки на основе вероятностей реализуют план выборочного контроля с заданными вероятностями (возможно, адаптированными вероятностями, заданными адаптивной процедурой). Выборка на основе вероятности позволяет сделать вывод о целевой группе населения на основе дизайна. Выводы основаны на известном объективном распределении вероятностей, которое было указано в протоколе исследования. Выводы, сделанные на основе вероятностных обследований, могут по-прежнему страдать от многих типов систематической ошибки.
Обследованиям, которые не основаны на вероятностной выборке, труднее измерить смещение или ошибку выборки . [1] Опросы, основанные на маловероятных выборках, часто не могут представить людей в целевой группе. [2]
В академических и правительственных исследованиях вероятностная выборка является стандартной процедурой. В Соединенных Штатах в «Перечне стандартов статистических обследований» Управления управления и бюджета говорится, что обследования, финансируемые из федерального бюджета, должны проводиться:
отбор образцов с использованием общепринятых статистических методов (например, вероятностных методов, которые могут предоставить оценки ошибки выборки). Любое использование не вероятностных методов выборки (например, отсечение или выборка на основе модели) должно быть статистически обосновано и иметь возможность измерить ошибку оценки. [3]
Случайная выборка и вывод на основе дизайна дополняются другими статистическими методами, такими как выборка на основе моделей и выборка на основе моделей. [4] [5]
Например, многие опросы не получают ответов. Несмотря на то, что изначально единицы выбираются с известной вероятностью, механизмы неответа неизвестны. Для обследований со значительным отсутствием ответов статистики предложили статистические модели, с помощью которых анализируются наборы данных.
Вопросы, связанные с выборкой для обследования, обсуждаются в нескольких источниках, в том числе в Salant and Dillman (1994). [6]
Вероятностная выборка
В вероятностной выборке (также называемой «научной» или «случайной» выборкой) каждый член целевой группы имеет известную и ненулевую вероятность включения в выборку. [7] Обследование, основанное на вероятностной выборке, теоретически может дать статистические измерения целевой группы населения, которые:
- без смещения , ожидаемое значение выборочного среднего равно среднему генеральному E (ȳ) = μ, и [8]
- иметь измеримую ошибку выборки, которая может быть выражена как доверительный интервал или предел погрешности . [9]
Выборка для вероятностного обследования создается путем построения списка целевой группы, называемого рамкой выборки , рандомизированного процесса выбора единиц из совокупности выборки, называемого процедурой отбора, и метода связи с выбранными единицами, чтобы они могли завершить опрос, называемый методом или режимом сбора данных. [10] Для некоторых целевых групп этот процесс может быть простым; например, выборка сотрудников компании с использованием списков заработной платы. Однако в больших, неорганизованных популяциях простое построение подходящей основы выборки часто является сложной и дорогостоящей задачей.
Распространенными методами проведения вероятностной выборки населения домохозяйств в США являются территориальная вероятностная выборка, выборка по телефону со случайным набором цифр и, в последнее время, выборка на основе адреса. [11]
В рамках вероятностной выборки существуют специальные методы, такие как стратифицированная выборка и кластерная выборка, которые повышают точность или эффективность процесса выборки без изменения фундаментальных принципов вероятностной выборки.
Стратификация - это процесс разделения членов совокупности на однородные подгруппы перед выборкой на основе вспомогательной информации о каждой единице выборки. Страты должны быть взаимоисключающими: каждый элемент совокупности должен быть отнесен только к одной страте. Страты также должны быть исчерпывающими в совокупности: нельзя исключать ни один элемент населения. Затем в каждой страте можно применять такие методы, как простая случайная выборка или систематическая выборка . Стратификация часто улучшает репрезентативность выборки за счет уменьшения ошибки выборки.
Смещение в вероятностной выборке
Предвзятость в опросах нежелательна, но часто неизбежна. Основные типы систематической ошибки, которые могут возникнуть в процессе выборки:
- Систематическая ошибка отсутствия ответов : когда отдельные лица или домохозяйства, выбранные в выборке для обследования, не могут или не собираются завершить обследование, существует вероятность возникновения систематической ошибки в результате этого неполучения ответов. Ошибка отсутствия ответов возникает, когда наблюдаемое значение отклоняется от параметра совокупности из-за различий между респондентами и не респондентами. [12]
- Смещения Ответ : Это не противоположность смещения без ответа, но вместо этого относится к возможной тенденции респондентов давать неточные или лживые ответы по различным причинам.
- Смещение отбора: смещение выбора возникает, когда некоторые единицы имеют разную вероятность выбора, которая не учитывается исследователем. Например, у некоторых домохозяйств есть несколько телефонных номеров, поэтому вероятность их выбора при телефонном обследовании выше, чем у домохозяйств, имеющих только один номер телефона. Это смещение отбора можно было бы скорректировать путем применения весового коэффициента обследования, равного [1 / (количество телефонных номеров)] для каждого домохозяйства.
- Предвзятость самоотбора : тип предвзятости, при которой люди добровольно выбирают себя в группу, тем самым потенциально искажая реакцию этой группы.
- Предвзятость, связанная с участием : предвзятость, возникающая из-за характеристик тех, кто решил участвовать в опросе или опросе.
- Систематическая ошибка охвата: систематическая ошибка охвата может возникать, когда члены совокупности не фигурируют в структуре выборки (неполный охват). Смещение охвата возникает, когда наблюдаемое значение отклоняется от параметра совокупности из-за различий между охваченными и не охваченными единицами. Телефонные опросы страдают от хорошо известного источника систематической ошибки охвата, поскольку они не могут включать домохозяйства без телефонов.
Невероятностная выборка
Многие опросы основаны не на вероятностных выборках, а на поиске подходящей группы респондентов для заполнения опроса. Вот некоторые распространенные примеры маловероятной выборки: [13]
- Образцы суждения: исследователь решает, какие члены популяции включить в выборку, на основании своего суждения. Исследователь может предоставить альтернативное обоснование репрезентативности выборки. Основное предположение состоит в том, что исследователь выберет единицы, характерные для популяции. Этот метод может подвергаться предубеждениям и восприятию исследователя. [14]
- Образцы снежков: часто используются, когда целевая популяция редка. Члены целевой группы населения привлекают к опросу других членов населения.
- Образцы квот . Выборка предназначена для включения определенного числа людей с определенными характеристиками. Например, 100 любителей кофе. Этот тип выборки распространен в не вероятностных исследованиях рынка.
- Удобные выборки: выборка состоит из лиц, к которым будет проще всего получить доступ для заполнения анкеты.
В не вероятностных выборках взаимосвязь между целевой совокупностью и выборкой обследования неизмерима, а потенциальная систематическая ошибка неизвестна. Искушенные пользователи маловероятных выборок обследований склонны рассматривать обследование как экспериментальное условие, а не как инструмент измерения численности населения, и проверять результаты на предмет внутренне непротиворечивых взаимоотношений.
Смотрите также
Рекомендации
- ^ «Невероятностная выборка - AAPOR» . www.aapor.org . Проверено 24 мая 2020 .
- ^ Вайсберг, Герберт Ф. (2005), Подход с общей погрешностью опроса, Издательство Чикагского университета: Чикаго. стр.231.
- ^ «Архивная копия» (PDF) . Управление управления и бюджета . Проверено 17 июня 2009 г. - из Национального архива .
- ^ Лор. Брюэр. Шведы
- ^ Ричард Валлиант, Алан Х. Дорфман и Ричард М. Ройалл (2000), Конечная выборка населения и вывод: подход к прогнозированию, Wiley, New York, p. 19
- ^ Салант, Присцилла, И. Диллман и А. Дон. Как провести собственный опрос. № 300.723 S3. 1994 г.
- Перейти ↑ Kish, L. (1965), Survey Sampling, New York: Wiley. п. 20
- Перейти ↑ Kish, L. (1965), Survey Sampling, New York: Wiley. стр.59
- ^ http://www.aapor.org/Education-Resources/For-Researchers/Poll-Survey-FAQ/Why-Sampling-Works.aspx
- Перейти ↑ Groves et al., Survey Methodology, Wiley: New York.
- ^ Майкл В. Линк, Майкл П. Батталья, Мартин Р. Франкель, Ларри Осборн и Али Х. Мокдад, Сравнение адресной выборки (ABS) и случайного набора номера (RDD) для общих обследований населения; Общественное мнение Q, весна 2008 г .; 72: 6 - 27.
- ^ «Глоссарий - Статистические стандарты NCES» . nces.ed.gov .
- ^ «Методы выборочного обследования» . www.statpac.com .
- ^ Правительство Канады, Статистическое управление Канады; Правительство Канады, Статистическое управление Канады (28 января 2009 г.). «Учебные ресурсы: Статистика: Сила из данных! Невероятностная выборка» . www150.statcan.gc.ca .
дальнейшее чтение
Учебник Groves et alia предоставляет обзор методологии опроса, в том числе недавнюю литературу по разработке опросников (на основе когнитивной психологии ):
- Роберт Гровс и другие. Методология исследования (2010 г.) Второе издание первого издания (2004 г.) ISBN 0-471-48348-6 .
Другие книги посвящены статистической теории выборки обследований и требуют некоторых знаний базовой статистики, как это обсуждается в следующих учебниках:
- Дэвид С. Мур и Джордж П. Маккейб (февраль 2005 г.). « Введение в статистическую практику » (5-е издание). WH Freeman & Company. ISBN 0-7167-6282-X .
- Фридман, Дэвид ; Пизани, Роберт; Purves, Роджер (2007). Статистика (4-е изд.). Нью-Йорк : Нортон . ISBN 0-393-92972-8. Архивировано из оригинала на 2008-07-06.
В элементарной книге Шеффера и других используются квадратные уравнения из школьной алгебры:
- Шеффер, Ричард Л., Уильям Менденхал и Р. Лайман Отт. Выборка элементарного обследования , пятое издание. Бельмонт: Duxbury Press, 1996.
Для Лора, Сэрндала и др. И Кокрана (классический) требуется больше математической статистики:
- Кокран, Уильям Г. (1977). Методы отбора проб (Третье изд.). Вайли. ISBN 0-471-16240-X.
- Лор, Шарон Л. (1999). Выборка: Дизайн и анализ . Даксбери. ISBN 0-534-35361-4.
- Сэрндал, Карл-Эрик; Свенссон, Бенгт; Ретман, Ян (1992). Выборка обследования с помощью модели . Springer-Verlag. ISBN 0-387-40620-4.
Исторически важные книги Деминга и Киша по-прежнему ценны для понимания социологов (особенно о переписи населения США и Институте социальных исследований при Мичиганском университете ):
- Деминг, У. Эдвардс (1966). Некоторая теория выборки . Dover Publications . ISBN 0-486-64684-X. OCLC 166526 .
- Киш, Лесли (1995) Survey Sampling , Wiley, ISBN 0-471-10949-5
Внешние ссылки
- Методология опроса CRAN Task View
- Что такое опрос? Буклет опубликован Национальным центром изучения общественного мнения и Американской статистической ассоциацией.
- Статья в Journal of Information Technology Learning and Performance « Организационные исследования: определение размера выборки в опросных исследованиях»
- Дизайн выборки и доверительные интервалы
- Методы выборки при обследовании
- Невероятностная выборка