Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Плотность вероятности опросов разного размера, каждый из которых имеет цветовую кодировку, соответствующую его 95% доверительному интервалу (ниже), пределу погрешности (слева) и размеру выборки (справа). Каждый интервал отражает диапазон, в котором можно иметь 95% -ную уверенность в том, что истинный процент может быть найден, если сообщаемый процент составляет 50%. Погрешность составляет половина доверительного интервала (кроме того , радиус интервала). Чем больше выборка, тем меньше погрешность. Кроме того, чем меньше заявленный процент от 50%, тем меньше погрешность.

Погрешность является статистической выражающим количествами случайной ошибки выборки в результатах опроса . Чем больше погрешность, тем меньше уверенности в том, что результат опроса будет отражать результат опроса всего населения . Допустимая погрешность будет положительной, если выборка из генеральной совокупности произведена не полностью и показатель результата имеет положительную дисперсию , то есть показатель варьируется .

Термин "погрешность" часто используется в контексте, не связанном с обследованием, для обозначения ошибки наблюдения при сообщении измеренных величин. Он также используется в разговорной речи для обозначения количества пространства или степени гибкости, которую можно иметь при достижении цели. Например, его часто используют в спорте комментаторы, когда описывают, сколько точности требуется для достижения цели, очков или результата. Боулинг , используемый в Соединенных Штатах 4,75 дюйма в ширину, и мяч составляет 8,5 дюйма в ширину, поэтому можно сказать , котелок имеет 21,75 дюйма предел ошибки при попытке ударить определенную булавку , чтобы заработать запасной (например, 1 контактный оставаясь на переулке).

Концепция [ править ]

Рассмотрим простой да / нет опроса в качестве образца респондентов , отобранных из населения , сообщающих процент от да ответов. Мы хотели бы знать, насколько близок к истинному результат опрос всего населения без необходимости его проведения. Если бы, гипотетически, мы должны были провести опрос среди последующих выборок респондентов (недавно отобранных ), мы бы ожидали, что эти последующие результаты будут нормально распределены . Погрешность описывает расстояние , в пределах которого определенный процент этих результатов , как ожидается, варьируется от .

Согласно правилу 68-95-99,7 , мы ожидаем, что 95% результатов будут находиться в пределах примерно двух стандартных отклонений ( ) по обе стороны от истинного среднего . Этот интервал называется доверительным интервалом , а радиус (половина интервала) называется пределом погрешности , что соответствует уровню достоверности 95% .

Как правило, на уровне достоверности выборка из совокупности, имеющей ожидаемое стандартное отклонение, имеет предел погрешности.

где обозначает квантиль (также обычно z-оценку ), а - стандартная ошибка .

Стандартное отклонение и стандартная ошибка [ править ]

Мы ожидаем, что нормально распределенные значения   будут иметь стандартное отклонение, которое так или иначе зависит от . Чем меньше , тем шире поле. Это называется стандартной ошибкой .

Для единственного результата нашего опроса мы предполагаем, что и все последующие результаты вместе будут иметь дисперсию .

Обратите внимание, что это соответствует дисперсии распределения Бернулли .

Максимальная погрешность при различных уровнях достоверности [ править ]

Эмпирическое правило.PNG

Для уровня достоверности существует соответствующий доверительный интервал для среднего , то есть интервал, в который значения должны попадать с вероятностью . Точные значения даются функцией квантиля нормального распределения (которое аппроксимирует правило 68-95-99,7).

Обратите внимание, что для не определено , то есть не определено, как есть .

Логарифмические графики зависимости размера выборки n и уровня достоверности γ . Стрелки показывают, что максимальная погрешность для выборки размером 1000 составляет ± 3,1% при уровне достоверности 95% и ± 4,1% при 99%. Вставная парабола иллюстрирует связь между at и at

Так как при , мы можем произвольно установить , высчитывает , и получить максимальную погрешность для при заданном уровне доверительной и размер выборки , даже до того , что фактические результаты. С

Кроме того, полезно для любых заявленных

Конкретные пределы ошибки [ править ]

Если опрос дает несколько процентных результатов (например, опрос, измеряющий одно предпочтение с множественным выбором), результат, наиболее близкий к 50%, будет иметь наибольшую погрешность. Обычно именно это число указывается как предел погрешности для всего опроса. Представьте отчеты об опросах как

(как на рисунке выше)

Когда данный процент приближается к крайним значениям 0% или 100%, его погрешность приближается к ± 0%.

Сравнение процентов [ править ]

Представьте себе отчеты об опросах с несколькими вариантами ответов как . Как описано выше, предел погрешности сообщили для опроса, как правило , быть , а ближе всего к 50%. Популярное понятие статистической связи или статистической ничьей , однако, касается не точности отдельных результатов, а точности ранжирования результатов. Что в первую очередь?

Если бы, гипотетически, мы должны были провести опрос среди последующих выборок респондентов (недавно отобранных ) и сообщить результат , мы могли бы использовать стандартную ошибку различия, чтобы понять, как ожидается падение . Для этого нам нужно применить сумму отклонений , чтобы получить новую дисперсию, ,

где является ковариационной из и .

Таким образом (после упрощения),

Обратите внимание, что это предполагает, что это значение близко к постоянному, то есть респонденты, выбирающие либо A, либо B, почти никогда не выберут C (обеспечивая и близкую к совершенно отрицательной корреляции ). При более близком соперничестве трех или более вариантов выбор правильной формулы для становится более сложным.

Эффект конечной численности населения [ править ]

Приведенные выше формулы для погрешности предполагают, что существует бесконечно большая совокупность, и, следовательно, зависят не от размера совокупности , а только от размера выборки . Согласно теории выборки , это предположение является разумным, когда доля выборки мала. Допустимая погрешность для конкретного метода выборки по существу одинакова независимо от того, является ли исследуемая популяция размером школы, города, штата или страны, если доля выборки мала.

В случаях, когда доля выборки больше (на практике более 5%), аналитики могут скорректировать допустимую погрешность, используя поправку на конечную совокупность, чтобы учесть дополнительную точность, полученную при выборке гораздо большего процента генеральной совокупности. FPC можно рассчитать по формуле [1]

... и так, если бы опрос проводился более чем 24%, скажем, электората в 300 000 избирателей

Интуитивно, для соответствующего большого ,

В первом случае она настолько мала, что не требует коррекции. В последнем случае, опрос фактически становится переписи и ошибки выборки становится спорным.

См. Также [ править ]

  • Инженерная терпимость
  • Ключевая актуальность
  • Погрешность измерения
  • Ошибка наблюдения
  • Случайная ошибка

Примечания [ править ]

  1. ^ Isserlis, Л. (1918). «О значении среднего, рассчитанного по выборке» . Журнал Королевского статистического общества . Блэквелл Паблишинг. 81 (1): 75–81. DOI : 10.2307 / 2340569 . JSTOR  2340569 . (Уравнение 1)

Ссылки [ править ]

  • Судман, Сеймур и Брэдберн, Норман (1982). Задавая вопросы: Практическое руководство по разработке анкеты . Сан-Франциско: Джосси Басс. ISBN 0-87589-546-8 
  • Воннакотт, Т.Х. и Р.Дж. Воннакотт (1990). Вводная статистика (5-е изд.). Вайли. ISBN 0-471-61518-8.

Внешние ссылки [ править ]

  • "Ошибки, теория" , Энциклопедия математики , EMS Press , 2001 [1994]
  • Вайсштейн, Эрик В. "Допустимая погрешность" . MathWorld .