Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Определение размера выборки - это акт выбора количества наблюдений или повторов для включения в статистическую выборку . Размер выборки - важная особенность любого эмпирического исследования, цель которого - сделать выводы о совокупности на основе выборки. На практике размер выборки, используемой в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости в том, чтобы они предлагали достаточную статистическую мощность . В сложных исследованиях может быть несколько разных размеров выборки: например, в стратифицированном обследовании будут разные размеры для каждой страты. В переписи, данные ищутся для всей генеральной совокупности, следовательно, предполагаемый размер выборки равен генеральной совокупности. В плане эксперимента , когда исследование может быть разделено на разные группы лечения , для каждой группы могут быть разные размеры выборки.

Объем выборки можно выбрать несколькими способами:

  • использование опыта - небольшие выборки, хотя иногда и неизбежны, могут привести к широкому доверительному интервалу и риску ошибок при проверке статистических гипотез .
  • использование целевой дисперсии для оценки, которая должна быть получена из выборки, полученной в конечном итоге, т.е. если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
  • использование целевой мощности статистического теста, который будет применяться после сбора образца.
  • с использованием уровня достоверности, т. е. чем больше требуемый уровень достоверности, тем больше размер выборки (с учетом требования постоянной точности).

Введение [ править ]

Большие размеры выборки обычно приводят к повышению точности при оценке неизвестных параметров. Например, если мы хотим узнать долю определенного вида рыб, инфицированных патогеном, мы обычно можем получить более точную оценку этой доли, если бы мы взяли и исследовали 200, а не 100 рыб. Это явление описывается рядом фундаментальных фактов математической статистики, включая закон больших чисел и центральную предельную теорему .

В некоторых ситуациях повышение точности для больших размеров выборки минимально или даже отсутствует. Это может быть следствием наличия систематических ошибок или сильной зависимости в данных, или если данные соответствуют распределению с тяжелыми хвостами.

Размеры выборки можно оценить по качеству полученных оценок. Например, если оценивается доля, можно иметь 95% доверительный интервал шириной менее 0,06 единиц. В качестве альтернативы, размер выборки может быть оценен на основе мощности теста гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, мы можем пожелать иметь 80% мощности, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка [ править ]

Оценка пропорции [ править ]

Относительно простая ситуация - оценка пропорции . Например, мы можем захотеть оценить долю жителей в сообществе, которым исполнилось 65 лет.

Оценщик из пропорции есть , где X представляет собой число «положительных» наблюдений (например, число людей из п отобранных людей , которые по крайней мере , 65 лет). Когда наблюдения независимы , эта оценка имеет (масштабированное) биномиальное распределение (а также является выборочным средним для данных из распределения Бернулли ). Максимальная дисперсия этого распределения составляет 0,25 n , что происходит, когда истинный параметр равен p = 0,5. На практике, поскольку p неизвестно, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, то можно использовать величину вместо 0,25.

При достаточно большом n распределение будет близко аппроксимироваться нормальным распределением . [1] Используя этот метод и метод Вальда для биномиального распределения , получаем доверительный интервал вида

,
где Z - стандартный Z-балл для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь доверительный интервал общей шириной W единиц (W / 2 с каждой стороны выборочного среднего), мы должны решить

для n , что дает размер выборки

, в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W / 2 = погрешность .)

В противном случае формула была бы такой , которая дает результат .

Например, если нас интересует оценка доли населения США, поддерживающей конкретного кандидата в президенты, и мы хотим, чтобы ширина 95% доверительного интервала составляла не более 2 процентных пунктов (0,02), тогда нам потребуется размер выборки. of (1,96 2 ) / (0,02 2 ) = 9604. В этом случае разумно использовать оценку 0,5 для p, потому что президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. Погрешность в этом случае составляет 1 процентный пункт (половина 0,02).

Сказанное обычно упрощается ...

сформирует 95% доверительный интервал для истинной пропорции. Если этот интервал должен быть не более W единиц шириной, уравнение

может быть решена за п , получая [2] [3] п  = 4 / W 2  = 1 / B 2 , где B является ошибка связана с оценкой, то есть, оценка обычно дается как в пределах ± B . Итак, для B = 10% требуется n = 100, для B = 5% требуется n = 400, для B = 3% требование приближается к n = 1000, а для B = 1% размер выборки n = 10000 необходимо. Эти цифры часто цитируются в новостях опросов общественного мнения и другихвыборочные опросы . Однако всегда помните, что сообщаемые результаты могут не соответствовать точному значению, поскольку числа предпочтительно округлять в большую сторону. Зная, что значение n - это минимальное количество точек выборки, необходимое для получения желаемого результата, количество респондентов должно быть на уровне минимума или выше него.

Оценка среднего [ править ]

Пропорция - это частный случай среднего. При оценке среднего значения генеральной совокупности с использованием независимой и идентично распределенной (iid) выборки размера n , где каждое значение данных имеет дисперсию σ 2 , стандартная ошибка выборочного среднего составляет:

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. Использование центральной предельной теоремы для обоснования аппроксимации выборочного среднего с нормальным распределением дает доверительный интервал вида

,
где Z - стандартный Z-балл для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь доверительный интервал общей шириной W единиц (W / 2 с каждой стороны выборочного среднего), мы должны решить

для n , что дает размер выборки

. (Примечание: W / 2 = погрешность .)

Например, если мы заинтересованы в оценке степени, на которую лекарство снижает кровяное давление субъекта, с доверительным интервалом 95% шириной в шесть единиц, и мы знаем, что стандартное отклонение кровяного давления в популяции составляет 15, тогда Требуемый размер выборки равен , который будет округлен до 97, потому что полученное значение является минимальным размером выборки, а размеры выборки должны быть целыми числами и должны лежать на вычисленном минимуме или превышать его.

Необходимые размеры выборки для проверки гипотез [ редактировать ]

Обычная проблема, с которой сталкиваются статистики, - это вычисление размера выборки, необходимого для получения определенной мощности для теста, при заданном коэффициенте ошибок типа I. Таким образом, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивной функции распределения :

Таблицы [ править ]

Таблица, показанная справа, может быть использована в двухвыборочном t-тесте для оценки размеров выборки экспериментальной группы и контрольной группы, которые имеют равный размер, то есть общее количество людей в исследовании вдвое больше, чем приведенного числа, а желаемый уровень значимости - 0,05. [4] Используемые параметры:

  • Желаемая статистическая мощность испытания, указанная в столбце слева.
  • D Коэна (= размер эффекта), который представляет собой ожидаемую разницу между средними целевыми значениями между экспериментальной и контрольной группами , деленную на ожидаемое стандартное отклонение .

Уравнение ресурсов Мида [ править ]

Уравнение ресурсов Мида часто используется для оценки размеров выборки лабораторных животных , а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов при оценке размера выборки, но дает намек на то, что является подходящим размером выборки, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или их очень трудно оценить. [5]

Все параметры в уравнении фактически являются степенями свободы числа их концептов, и, следовательно, их числа вычитаются на 1 перед вставкой в ​​уравнение.

Уравнение: [5]

куда:

  • N - общее количество людей или единиц в исследовании (минус 1)
  • B - блокирующий компонент , представляющий эффекты окружающей среды, разрешенные в конструкции (минус 1)
  • T - компонент лечения , соответствующий количеству используемых лечебных групп (включая контрольную группу ) или количеству задаваемых вопросов (минус 1)
  • E - это степени свободы компонента ошибки , которые должны быть где-то между 10 и 20.

Например, если исследование с использованием лабораторных животных планируется с четырьмя экспериментальными группами ( T = 3), с восемью животными в группе, всего 32 животных ( N = 31), без какой-либо дополнительной стратификации ( B = 0), тогда E будет равно 28, что выше порогового значения 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими. [6]

Кумулятивная функция распределения [ править ]

Пусть X i , i = 1, 2, ..., n - независимые наблюдения, взятые из нормального распределения с неизвестным средним μ и известной дисперсией σ 2 . Рассмотрим две гипотезы, нулевую гипотезу :

и альтернативная гипотеза:

для некоторой «наименьшей существенной разницы» μ *  > 0. Это наименьшее значение, при котором нам важно наблюдать разницу. Теперь, если мы хотим (1) отклонить H 0 с вероятностью не менее 1 -  & beta ; при H истинно (т.е. мощность 1 -  бета ), и (2) отклонить H 0 с вероятностью альфа , когда H 0 является правда, то нам понадобится следующее:

Если z α - верхняя α процентная точка стандартного нормального распределения, то

и так

'Отклонить H 0, если наше среднее значение выборки ( ) больше, чем '

- решающее правило, удовлетворяющее (2). (Это односторонний тест.)

Теперь мы хотим, чтобы это произошло с вероятностью не менее 1 -  β, когда H a истинно. В этом случае среднее значение по выборке будет получено из нормального распределения со средним значением μ * . Следовательно, мы требуем

Путем осторожных манипуляций можно показать (см. Статистическая мощность # Пример ), что это происходит, когда

где - нормальная кумулятивная функция распределения .

Размер стратифицированной выборки [ править ]

При использовании более сложных методов выборки, таких как стратифицированная выборка , выборку часто можно разделить на подвыборки. Как правило, если есть H такие подвыборки (от H различных слоев) , то каждый из них будет иметь образец размером п ч , ч = 1, 2, ..., Н . Эти n h должны соответствовать правилу n 1 + n 2 + ... + n H = n (т. Е. Общий размер выборки определяется как сумма размеров подвыборки). Выбор этих n h оптимально можно сделать различными способами, используя (например) оптимальное распределение Неймана.

Существует множество причин для использования стратифицированной выборки: [7] для уменьшения дисперсии оценок выборки, для использования частично неслучайных методов или для индивидуального изучения страт. Полезным, отчасти неслучайным методом может быть выборка людей там, где они легко доступны, а где нет, выборка кластеров для экономии транспортных расходов. [8]

В общем, для слоев H средневзвешенное значение выборки равно

с

[9]

Веса, часто, но не всегда, представляют пропорции элементов популяции в стратах, и . Для фиксированного размера выборки, то есть ,

[10]

которое можно сделать минимальным, если частота дискретизации в каждом слое сделана пропорциональной стандартному отклонению в каждом слое:, где и является константой, такой что .

«Оптимальное распределение» достигается, когда частота дискретизации внутри страт прямо пропорциональна стандартным отклонениям внутри страт и обратно пропорциональна квадратному корню из стоимости выборки на элемент внутри страт :

[11]

где - такая постоянная, что или, в более общем смысле, когда

[12]

Качественное исследование [ править ]

При определении размера выборки в качественных исследованиях используется другой подход. Как правило, это субъективное суждение, принимаемое по ходу исследования. [13] Один из подходов - продолжать включать других участников или материал до тех пор, пока не будет достигнуто насыщение . [14] Число, необходимое для достижения насыщения, было исследовано эмпирически. [15] [16] [17] [18]

Существует нехватка надежных указаний по оценке размеров выборки перед началом исследования с рядом приведенных предложений. [16] [19] [20] [21] Для тематического анализа был предложен инструмент, похожий на количественный расчет мощности, основанный на отрицательном биномиальном распределении . [22] [21]

См. Также [ править ]

  • Дизайн экспериментов
  • Пример инженерной поверхности отклика в разделе Пошаговая регрессия
  • Коэна h

Примечания [ править ]

  1. ^ NIST / SEMATECH , «7.2.4.2. Требуемые размеры выборки» , электронный справочник статистических методов.
  2. ^ «Вывод для регрессии» . utdallas.edu .
  3. ^ "Доверительный интервал для пропорции" Архивировано 23 августа 2011 г. в Wayback Machine
  4. ^ a b Глава 13 , стр. 215, в: Kenny, David A. (1987). Статистика для социальных и поведенческих наук . Бостон: Маленький, Браун. ISBN 978-0-316-48915-7.
  5. ^ a b Кирквуд, Джеймс; Роберт Хубрехт (2010). Справочник UFAW по уходу за лабораторными и другими исследовательскими животными и управлению ими . Вили-Блэквелл. п. 29. ISBN 978-1-4051-7523-4. онлайн Страница 29
  6. ^ Isogenic.info> Уравнение ресурсов Майкла Ф. В. Фестинга. Обновлено сентябрь 2006 г.
  7. Киш (1965, раздел 3.1)
  8. Киш (1965), стр. 148.
  9. Киш (1965), стр. 78.
  10. Киш (1965), стр. 81.
  11. Киш (1965), стр. 93.
  12. Киш (1965), стр. 94.
  13. ^ Sandelowski, М. (1995). Размер выборки при качественном исследовании. Исследования в области сестринского дела и здравоохранения , 18, 179–183
  14. Перейти ↑ Glaser, B. (1965). Постоянный сравнительный метод качественного анализа. Социальные проблемы , 12, 436–445.
  15. Перейти ↑ Francis, JJ, Johnston, M., Robertson, C., Glidewell, L., Entwistle, V., Eccles, MP, & Grimshaw, JM (2010). Каков адекватный размер выборки? Использование насыщенности данными для теоретических интервью. Психология и здоровье , 25, 1229–1245. DOI : 10,1080 / 08870440903194015
  16. ^ a b Гость, Г., Банс, А., и Джонсон, Л. (2006) . Сколько интервью достаточно ?: эксперимент с насыщением и вариативностью данных. Полевые методы , 18, 59–82. DOI : 10,1177 / 1525822X05279903
  17. ^ Райт, А., Мэлони, FL, и Feblowitz, JC (2011) . Отношение клиницистов к электронным спискам проблем и их использование: тематический анализ. BMC медицинской информатики и принятия решений , 11, 36. DOI : 10,1186 / 1472-6947-11-36
  18. ^ «Размер выборки и насыщенность в исследованиях PhD с использованием качественных интервью - Мейсон - Forum Qualitative Sozialforschung / Forum: Качественные социальные исследования» . Qualitative-research.net . 11 (3). 2010-08-24.
  19. ^ Emmel, N. (2013). Отбор и выбор случаев в качественном исследовании: реалистичный подход. Лондон: Мудрец.
  20. ^ Onwuegbuzie, AJ, и Лич, NL (2007) . Призыв к качественному анализу мощности. Качество и количество , 41, 105–121. DOI : 10.1007 / s11135-005-1098-1
  21. ^ a b Fugard AJB; Potts HWW (10 февраля 2015 г.). «Поддержка размышлений о размерах выборки для тематического анализа: количественный инструмент» (PDF) . Международный журнал методологии социальных исследований . 18 (6): 669–684. DOI : 10.1080 / 13645579.2015.1005453 . S2CID 59047474 .  
  22. Перейти ↑ Galvin R (2015). Сколько интервью достаточно? Приносят ли качественные интервью при исследовании энергопотребления зданий достоверные знания? Журнал строительной техники, 1: 2–12.

Ссылки [ править ]

  • Bartlett, JE, II; Котрлик, JW; Хиггинс, К. (2001). «Организационное исследование: определение подходящего размера выборки для опросного исследования» (PDF) . Информационные технологии, обучение и журнал производительности . 19 (1): 43–50.
  • Киш, Л. (1965). Обзорная выборка . Вайли. ISBN 978-0-471-48900-9.
  • Смит, Скотт (8 апреля 2013 г.). «Определение размера выборки: как убедиться, что вы получаете правильный размер выборки» . Qualtrics . Проверено 19 сентября 2018 года .
  • Израиль, Гленн Д. (1992). «Определение размера выборки» . Университет Флориды, PEOD-6 . Проверено 29 июня 2019 .
  • Ренс ван де Шут, Милица Миочевич (ред.). 2020. Решения малого размера выборки (открытый доступ): Руководство для прикладных исследователей и практиков . Рутледж.

Дальнейшее чтение [ править ]

  • NIST: выбор размеров образцов
  • ASTM E122-07: Стандартная практика расчета размера образца для оценки с указанной точностью среднего значения для характеристики партии или процесса

Внешние ссылки [ править ]

  • Сценарий MATLAB, реализующий формулу размера выборки Кохрана