Доверительный интервал биномиальной пропорции

В статистике , бином интервал доли доверия является доверительным интервалом для вероятности успеха вычисленной из результатов серии экспериментов на успех отказа ( Бернулли ). Другими словами, интервал биномиальной пропорции доверительный интервал оценка вероятности успеха р , когда только число экспериментов п и число успехов п _S известны.

Существует несколько формул для биномиального доверительного интервала, но все они основаны на предположении о биномиальном распределении . В общем, биномиальное распределение применяется, когда эксперимент повторяется фиксированное количество раз, каждое испытание эксперимента имеет два возможных результата (успех и неудача), вероятность успеха одинакова для каждого испытания, а испытания статистически независимы. . Поскольку биномиальное распределение является дискретным распределением вероятностей (т. Е. Не непрерывным) и его трудно вычислить для большого количества испытаний, для вычисления этого доверительного интервала используются различные аппроксимации, все со своими собственными компромиссами в точности и вычислительной интенсивности.

Простым примером биномиального распределения является набор различных возможных исходов и их вероятностей для количества орлов, наблюдаемых, когда монета подбрасывается десять раз. Наблюдаемая биномиальная пропорция - это доля флипов, оказавшихся орлом. Учитывая эту наблюдаемую пропорцию, доверительный интервал для истинной вероятности выпадения монеты орлом представляет собой диапазон возможных пропорций, которые могут содержать или не содержать истинную пропорцию. Например, 95% доверительный интервал для доли будет содержать истинную долю 95% случаев, когда используется процедура построения доверительного интервала. ^[1]

Нормальный интервал аппроксимации

Построение нормального интервала аппроксимации на логистической кривой выявляет проблемы с интервалами перерегулирования и нулевой ширины . ^[2]

Обычно используемая формула для биномиального доверительного интервала основана на аппроксимации распределения ошибок для биномиально распределенного наблюдения, ${\ displaystyle {\ hat {p}}}$ , с нормальным распределением . ^[3] Это приближение основано на центральной предельной теореме и ненадежно, когда размер выборки мал или вероятность успеха близка к 0 или 1. ^[4]

Используя нормальное приближение, вероятность успеха p оценивается как

{\ displaystyle {\ hat {p}} \ pm z {\ sqrt {\ frac {{\ hat {p}} \ left (1 - {\ hat {p}} \ right)} {n}}},}

или эквивалент

{\ displaystyle {\ frac {n_ {S}} {n}} \ pm {\ frac {z} {n {\ sqrt {n}}}} {\ sqrt {n_ {S} n_ {F}}}, }

где ${\ displaystyle {\ hat {p}} = n_ {S} / n}$ - это доля успехов в судебном процессе Бернулли , измеренная с помощью ${\ displaystyle n}$ испытания, приносящие ${\ displaystyle n_ {S}}$ успехов и ${\ displaystyle n_ {F} = n-n_ {S}}$ неудачи и ${\ displaystyle z}$ это ${\ displaystyle 1 - {\ tfrac {\ alpha} {2}}}$ квантиль из стандартного нормального распределения (т.е. пробит ) , соответствующей целевой частоты появления ошибок ${\ displaystyle \ alpha}$ . Для уровня достоверности 95% ошибка ${\ Displaystyle \ альфа = 1-0,95 = 0,05}$ , так ${\ displaystyle 1 - {\ tfrac {\ alpha} {2}} = 0,975}$ а также ${\ displaystyle z = 1,96}$ .

Важный теоретический вывод этого доверительного интервала включает обращение проверки гипотезы. В этой формулировке доверительный интервал представляет те значения параметра совокупности, которые имели бы большие p-значения, если бы они были проверены как гипотетическая пропорция совокупности . Сборник ценностей, ${\ displaystyle \ theta}$ , для которого справедливо нормальное приближение, можно представить в виде

{\ displaystyle \ left \ {\ theta \, \, {\ bigg |} \, \, y \ leq {\ frac {{\ hat {p}} - \ theta} {\ sqrt {{\ frac {1}) {n}} {\ hat {p}} \ left (1 - {\ hat {p}} \ right)}}} \ leq z _ {\ tfrac {\ alpha} {2}} \ right \},}

где ${\ displaystyle y}$ это ${\ displaystyle {\ tfrac {\ alpha} {2}}}$ квантиль из стандартного нормального распределения . Поскольку тест в середине неравенства является тестом Вальда , нормальный интервал аппроксимации иногда называют интервалом Вальда , но он был впервые описан Пьером-Симоном Лапласом в 1812 году ^[5].

Стандартная ошибка оценки доли при использовании взвешенных данных

Пусть будет простая случайная выборка ${\ Displaystyle X_ {1}, \ ldots, X_ {n}}$ где каждый ${\ displaystyle X_ {i}}$ является iid из распределения Бернулли (p) и вес ${\ displaystyle w_ {i}}$ - вес для каждого наблюдения. Стандартизируйте (положительные) веса ${\ displaystyle w_ {i}}$ поэтому они в сумме равны 1. Взвешенная доля выборки : ${\ displaystyle {\ hat {p}} = \ sum _ {i = 1} ^ {n} w_ {i} X_ {i}}$ . Поскольку ${\ displaystyle X_ {i}}$ независимы, и у каждого есть дисперсия ${\ displaystyle {\ text {Var}} (X_ {i}) = p (1-p)}$ , выборочная дисперсия пропорции составляет: ^[6]

${\ displaystyle {\ text {Var}} ({\ hat {p}}) = \ sum _ {i = 1} ^ {n} {\ text {Var}} (\ omega _ {i} X_ {i} ) = p (1-p) \ sum _ {i = 1} ^ {n} \ omega _ {i} ^ {2}}$ .

Стандартная ошибка из ${\ displaystyle {\ hat {p}}}$ - квадратный корень из этой величины. Потому что мы не знаем ${\ displaystyle p (1-p)}$ , мы должны это оценить. Несмотря на то, что существует множество возможных оценок, обычным является использование ${\ displaystyle {\ hat {p}}}$ , выборочное среднее и подставьте его в формулу. Это дает:

${\ displaystyle {\ text {SE}} ({\ hat {p}}) = {\ sqrt {{\ hat {p}} (1 - {\ hat {p}}) \ sum _ {i = 1} ^ {n} w_ {i} ^ {2}}}}$

Для невзвешенных данных ${\ displaystyle w_ {i} = 1 / n}$ , давая ${\ displaystyle \ sum _ {я = 1} ^ {n} w_ {i} ^ {2} = 1 / n}$ . SE становится ${\ displaystyle {\ sqrt {p (1-p) / n}}}$ , что приводит к знакомым формулам, показывающим, что расчет для взвешенных данных является их прямым обобщением.

Интервал счета Уилсона

Интервалы оценки Уилсона, нанесенные на логистическую кривую, выявляют асимметрию и хорошую производительность для малых n и где p равно или близко к 0 или 1.

Интервал оценки Уилсона является улучшением по сравнению с нормальным интервалом аппроксимации во многих отношениях. Он был разработан Эдвином Бидвеллом Уилсоном (1927). ^[7] В отличие от симметричного интервала нормальной аппроксимации (см. Выше), интервал оценки Вильсона асимметричен . Он не страдает проблемами перерегулирования и интервалов нулевой ширины, которые влияют на нормальный интервал, и его можно безопасно использовать с небольшими выборками и искаженными наблюдениями. ^[3] Наблюдаемая вероятность охвата постоянно приближается к номинальному значению, ${\ displaystyle 1- \ alpha}$ . ^[2]

Как и обычный интервал, но в отличие от интервала Клоппера-Пирсона , интервал можно вычислить непосредственно по формуле.

Уилсон начал с нормального приближения бинома:

{\ Displaystyle Z \ приблизительно {\ гидроразрыва {~ \ left (\, p - {\ hat {p}} \, \ right) ~} {\ sigma _ {n}}}}

с аналитической формулой для стандартного отклонения выборки, заданной как

{\ displaystyle \ sigma _ {n} = {\ sqrt {\, {\ frac {\, p \ left (1-p \ right) \,} {n}} ~}} ~}

.

Объединение этих двух и возведение радикала в квадрат дает уравнение, квадратичное по $p$ :

{\ displaystyle \ left (\, {\ hat {p}} - p \, \ right) ^ {2} = z ^ {2} \ cdot {\ frac {\, p \ left (1-p \ right) \,} {n}}}

Преобразование отношения в квадратное уравнение стандартной формы для $p$ , рассматривая ${\ displaystyle {\ hat {p}}}$ и $n$ как известные значения из выборки (см. предыдущий раздел), а использование значения $z,$ которое соответствует желаемой достоверности для оценки $p,$ дает следующее:

{\ displaystyle {\ biggl (} 1 + {\ frac {\, z ^ {2} \,} {n}} {\ biggr)} \, p ^ {2} + {\ biggl (} -2 {\ шляпа {p}} - {\ frac {\, z ^ {2} \,} {n}} {\ biggr)} \, p + {\ biggl (} {\ hat {p}} ^ {2} {\ biggr)} = 0 ~}

,

где все значения в скобках - известные величины. Решение для $p$ оценивает верхний и нижний пределы доверительного интервала для $p$ . Следовательно, вероятность успеха $p$ оценивается как

{\ displaystyle p \ приблизительно (w ^ {-}, w ^ {+}) = {\ frac {1} {~ 1 + {\ frac {\, z ^ {2} \,} {n}} ~} } \ left ({\ hat {p}} + {\ frac {\, z ^ {2} \,} {2n}} \ right) ~ \ pm ~ {\ frac {z} {~ 1 + {\ frac {z ^ {2}} {n}} ~}} {\ sqrt {{\ frac {\, {\ hat {p}} (1 - {\ hat {p}}) \,} {n}} + {\ гидроразрыва {\, z ^ {2} \,} {4n ^ {2}}} ~}} ~}

или эквивалент

{\ Displaystyle п \ приблизительно {\ гидроразрыва {~ n_ {S} + {\ tfrac {1} {2}} z ^ {2} ~} {n + z ^ {2}}} ~ \ pm ~ {\ frac {z} {n + z ^ {2}}} {\ sqrt {{\ frac {~ n_ {S} \, n_ {F} ~} {n}} + {\ frac {z ^ {2}} { 4}} ~}} ~.}

Практическое наблюдение при использовании этого интервала состоит в том, что он обладает хорошими свойствами даже для небольшого числа испытаний и / или с крайней вероятностью.

Интуитивно понятно, что центральное значение этого интервала - это средневзвешенное значение ${\ displaystyle {\ hat {p}}}$ а также ${\ displaystyle {\ tfrac {1} {2}}}$ , с участием ${\ displaystyle {\ hat {p}}}$ получая больший вес по мере увеличения размера выборки. Формально значение центра соответствует с использованием pseudocount из $1 / 2 z ²$ , количество стандартных отклонений доверительного интервала: добавьте это число как к количеству успехов, так и к количеству неудач, чтобы получить оценку отношения. Для общих двух стандартных отклонений в каждом интервале направлений (охват примерно 95%, что само по себе составляет примерно 1,96 стандартного отклонения), это дает оценку ${\ Displaystyle (п_ {S} +2) / (п + 4)}$ , известное как «правило плюс четыре».

Хотя квадратичная функция может быть решена явно, в большинстве случаев уравнения Вильсона также могут быть решены численно с использованием итерации с фиксированной точкой

{\ displaystyle p_ {k + 1} = {\ hat {p}} \ pm z \ cdot {\ sqrt {\ frac {p_ {k} \ cdot \ left (1-p_ {k} \ right)} {п }}}}

с участием ${\ displaystyle p_ {0} = {\ hat {p}}}$ .

Интервал Вильсона также может быть получен с помощью z-критерия для одной выборки или критерия хи-квадрат Пирсона с двумя категориями. Результирующий интервал,

{\ displaystyle \ left \ {\ theta \, \, {\ bigg |} \, \, y \ leq {\ frac {{\ hat {p}} - \ theta} {\ sqrt {{\ tfrac {1}) {n}} \ theta (1- \ theta)}}} \ leq z \ right \},}

затем можно решить для ${\ displaystyle \ theta}$ для получения интервала счета Вильсона. Тест в середине неравенства - это тест на баллы .

Принцип интервального равенства

Функция плотности вероятности для интервала оценок Вильсона плюс PDF на границах интервала. Площади хвоста равны.

Поскольку интервал получается путем решения из нормального приближения к биному, интервал оценки Уилсона ${\ Displaystyle (вес ^ {-}, вес ^ {+})}$ имеет свойство гарантировать получение того же результата, что и эквивалентный z-критерий или критерий хи-квадрат .

Это свойство можно визуализировать, построив график функции плотности вероятности для интервала оценок Уилсона (см. Wallis 2021: 297-313) ^[8], а затем построив нормальный PDF-файл для каждой границы. Области хвоста результирующего распределения Вильсона и нормального распределения, представляющие вероятность значительного результата в этом направлении, должны быть равны.

Интервал оценки Вильсона с поправкой на непрерывность и интервал Клоппера-Пирсона также соответствуют этому свойству. Практическое значение состоит в том, что эти интервалы могут использоваться в качестве критериев значимости с результатами, идентичными исходному тесту, а новые тесты могут быть получены по геометрии. ^[8]

Интервал оценки Вильсона с поправкой на непрерывность

Интервал Вильсона может быть изменен путем использования поправки на непрерывность , чтобы согласовать минимальную вероятность охвата , а не среднюю вероятность охвата, с номинальным значением, ${\ displaystyle 1- \ alpha}$ .

Так же, как интервал Вильсона отражает критерий хи-квадрат Пирсона , интервал Вильсона с поправкой на непрерывность отражает эквивалентный критерий хи-квадрат Йейтса .

Следующие формулы для нижней и верхней границ интервала оценок Вильсона с поправкой на непрерывность ${\ displaystyle (w_ {cc} ^ {-}, w_ {cc} ^ {+})}$ взяты из Newcombe (1998). ^[2]

{\ displaystyle {\ begin {align} w_ {cc} ^ {-} & = \ max \ left \ {0, {\ frac {2n {\ hat {p}} + z ^ {2} - \ left [z {\ sqrt {z ^ {2} - {\ frac {1} {n}} + 4n {\ hat {p}} (1 - {\ hat {p}}) + (4 {\ hat {p}} -2)}} + 1 \ right]} {2 (n + z ^ {2})}} \ right \} \\ w_ {cc} ^ {+} & = \ min \ left \ {1, {\ гидроразрыв {2n {\ hat {p}} + z ^ {2} + \ left [z {\ sqrt {z ^ {2} - {\ frac {1} {n}} + 4n {\ hat {p}} (1 - {\ hat {p}}) - (4 {\ hat {p}} - 2)}} + 1 \ right]} {2 (n + z ^ {2})}} \ right \} \ конец {выровнен}}}

Однако если p = 0, ${\ displaystyle w_ {cc} ^ {-}}$ следует принимать за 0; если p = 1, ${\ displaystyle w_ {cc} ^ {+}}$ тогда 1.

Уоллис (2021) ^[8] определяет более простой метод вычисления интервалов Вильсона с поправкой на непрерывность, который использует функции. Для оценки снизу положим ${\ displaystyle WilsonLower ({\ hat {p}}, n, \ alpha / 2) = w ^ {-}}$ , где ${\ displaystyle \ alpha}$ выбранный уровень ошибки для ${\ displaystyle z}$ . потом ${\ displaystyle w_ {cc} ^ {-} = WilsonLower (\ max ({\ hat {p}} - {\ tfrac {1} {2n}}, 0), n, \ alpha / 2)}$ . Преимущество этого метода состоит в том, что его можно разложить дальше.

Интервал Джеффри

Интервал Джеффриса имеет вывод байесовского, но он обладает хорошими свойствами частотных. В частности, он имеет свойства покрытия, аналогичные свойствам интервала Вильсона, но это один из немногих интервалов с преимуществом равных хвостов (например, для 95% доверительного интервала вероятности интервала, лежащего выше или ниже истинного значения оба близки к 2,5%). Напротив, интервал Вильсона имеет систематическое смещение, так что он центрирован слишком близко к p = 0,5. ^[9]

Интервал Джеффриса - это байесовский вероятный интервал, полученный при использовании неинформативного априорного значения Джеффри для биномиальной пропорции $p$ . В Джеффреис перед этой проблемы является бета - распределение с параметрами $(1/2, 1/2)$ , это конъюгат до . После наблюдения $x$ успехов в $n$ испытаниях апостериорное распределение для $p$ является бета-распределением с параметрами $(x + 1/2, n - x + 1/2)$ .

Когда $x \neq 0$ и $x \neq n$ , интервал Джеффри берется равным $100 (1 - α)%$ равновероятным интервалом апостериорной вероятности, то есть $квантилями α / 2$ и $1 - α / 2$ бета-распределения с параметрами $(х + 1/2, п - х + 1/2)$ . Эти квантили необходимо рассчитывать численно, хотя это достаточно просто с помощью современного статистического программного обеспечения.

Во избежание стремления вероятности охвата к нулю при $p \to 0$ или $1$ , когда $x = 0,$ верхний предел вычисляется, как и раньше, но нижний предел установлен на 0, а когда $x = n,$ нижний предел вычисляется, как прежде, но верхний предел установлен на 1. ^[4]

Интервал Клоппера – Пирсона

Интервал Клоппера – Пирсона - ранний и очень распространенный метод расчета биномиальных доверительных интервалов. ^[10] Это часто называют «точным» методом, потому что он основан на кумулятивных вероятностях биномиального распределения (то есть на точном правильном распределении, а не на приближении). Однако в случаях, когда мы знаем размер популяции, интервалы могут быть не самыми маленькими. Например, для населения размером 20 с истинной долей 50% Клоппер-Пирсон дает [0,272, 0,728], ширина которого составляет 0,456 (и где границы находятся на 0,0280 от «следующих достижимых значений» 6/20 и 14. / 20); тогда как Уилсон дает [0,299, 0,701], что имеет ширину 0,401 (и находится на 0,0007 от следующих достижимых значений).

Интервал Клоппера – Пирсона можно записать как

{\ Displaystyle S _ {\ leq} \ cap S _ {\ geq}}

или эквивалентно,

{\ Displaystyle \ влево (\ Inf S _ {\ geq} \ ,, \, \ sup S _ {\ leq} \ right)}

с участием

{\ Displaystyle S _ {\ Leq}: = \ left \ {\ theta \, \, {\ Big |} \, \, P \ left [\ OperatorName {Bin} \ left (n; \ theta \ right) \ leq x \ right]> {\ frac {\ alpha} {2}} \ right \} {\ text {and}} S _ {\ geq}: = \ left \ {\ theta \, \, {\ Big |} \ , \, P \ left [\ operatorname {Bin} \ left (n; \ theta \ right) \ geq x \ right]> {\ frac {\ alpha} {2}} \ right \},}

где 0 ≤ x ≤ n - количество успехов, наблюдаемых в выборке, а Bin ( n ; θ ) - биномиальная случайная величина с n попытками и вероятностью успеха θ .

Эквивалентно можно сказать, что интервал Клоппера – Пирсона равен ${\ textstyle \ left ({\ frac {x} {n}} - \ varepsilon _ {1}, \ {\ frac {x} {n}} + \ varepsilon _ {2} \ right)}$ с уровнем уверенности ${\ displaystyle 1- \ alpha}$ если ${\ Displaystyle \ varepsilon _ {я}}$ это нижняя грань таких, что следующие проверки гипотезы со значимостью проходят успешно. ${\ textstyle {\ frac {\ alpha} {2}}}$ :

H ₀ : ${\ displaystyle \ theta = {\ frac {x} {n}} - \ varepsilon _ {1}}$ с H _A : ${\ displaystyle \ theta> {\ frac {x} {n}} - \ varepsilon _ {1}}$
H ₀ : ${\ displaystyle \ theta = {\ frac {x} {n}} + \ varepsilon _ {2}}$ с H _A : ${\ displaystyle \ theta <{\ frac {x} {n}} + \ varepsilon _ {2}}$ .

Из-за связи между биномиальным распределением и бета-распределением интервал Клоппера – Пирсона иногда представляется в альтернативном формате, в котором используются квантили из бета-распределения.

{\ displaystyle B \ left ({\ frac {\ alpha} {2}}; x, n-x + 1 \ right) <\ theta

где x - количество успехов, n - количество испытаний, а B ( p ; v , w ) - p- й квантиль из бета-распределения с параметрами формы v и w .

Таким образом, ${\ displaystyle \ theta _ {min} <\ theta <\ theta _ {max}}$ , где:

{\ displaystyle {\ frac {\ Gamma (n + 1)} {\ Gamma (x) \ Gamma (n-x + 1)}} \ int _ {0} ^ {\ theta _ {min}} t ^ { x-1} (1-t) ^ {nx} dt = {\ frac {\ alpha} {2}}}

{\ displaystyle {\ frac {\ Gamma (n + 1)} {\ Gamma (x + 1) \ Gamma (nx)}} \ int _ {0} ^ {\ theta _ {max}} t ^ {x} (1-t) ^ {nx-1} dt = 1 - {\ frac {\ alpha} {2}}}

Тогда доверительный интервал биномиальной пропорции равен ${\ displaystyle (\ theta _ {min}, \ theta _ {max})}$ , как следует из связи между кумулятивной функцией распределения биномиального распределения и регуляризованной неполной бета-функцией .

Когда ${\ displaystyle x}$ либо ${\ displaystyle 0}$ или же ${\ displaystyle n}$ , доступны выражения в закрытой форме для границ интервала: когда ${\ displaystyle x = 0}$ интервал ${\ textstyle \ left (0, \, 1- \ left ({\ frac {\ alpha} {2}} \ right) ^ {\ frac {1} {n}} \ right)}$ и когда ${\ Displaystyle х = п}$ это ${\ textstyle \ left (\ left ({\ frac {\ alpha} {2}} \ right) ^ {\ frac {1} {n}}, \, 1 \ right)}$ . ^[11]

Бета-распределение, в свою очередь, связано с F-распределением, поэтому третью формулировку интервала Клоппера – Пирсона можно записать с использованием F-квантилей:

{\ displaystyle \ left (1 + {\ frac {n-x + 1} {x \, F \! \ left [{\ frac {\ alpha} {2}}; 2x, 2 (n-x + 1) \ right]}} \ right) ^ {- 1} <\ theta <\ left (1 + {\ frac {nx} {(x + 1) \, \, F \! \ left [1 - {\ frac { \ alpha} {2}}; 2 (x + 1), 2 (nx) \ right]}} \ right) ^ {- 1}}

где x - количество успехов, n - количество испытаний, а F ( c ; d ₁ , d ₂ ) - квантиль c из F-распределения с d ₁ и d ₂ степенями свободы. ^[12]

Интервал Клоппера – Пирсона является точным интервалом, поскольку он основан непосредственно на биномиальном распределении, а не на каком-либо приближении к биномиальному распределению. Этот интервал никогда не бывает меньше номинального охвата для любой доли населения, но это означает, что он обычно консервативен. Например, истинная степень охвата 95% интервала Клоппера – Пирсона может быть намного выше 95%, в зависимости от n и θ . ^[4] Таким образом, интервал может быть шире, чем необходимо для достижения 95% достоверности. Напротив, стоит отметить, что другие доверительные границы могут быть уже, чем их номинальная доверительная ширина, т. Е. Интервал нормальной аппроксимации (или «стандартный») интервал, интервал Вильсона, ^[7] интервал Агрести – Кулла, ^[12] и т. Д., с номинальным охватом 95% фактически может охватывать менее 95%. ^[4]

Определение интервала Клоппера – Пирсона также может быть изменено для получения точных доверительных интервалов для различных распределений. Например, это также может быть применено к случаю, когда выборки отбираются без замены из совокупности известного размера, вместо повторных выборок биномиального распределения. В этом случае основным распределением будет гипергеометрическое распределение .

Интервал Агрести – Кулля

Интервал Агрести – Кулла также является еще одним приближенным биномиальным доверительным интервалом. ^[12]

Дано ${\ displaystyle X}$ успехи в ${\ displaystyle n}$ испытания, определить

{\ Displaystyle {\ тильда {п}} = п + г ^ {2}}

а также

{\ displaystyle {\ tilde {p}} = {\ frac {1} {\ tilde {n}}} \ left (X + {\ frac {z ^ {2}} {2}} \ right)}

Тогда доверительный интервал для ${\ displaystyle p}$ дан кем-то

{\ displaystyle {\ tilde {p}} \ pm z {\ sqrt {{\ frac {\ tilde {p}} {\ tilde {n}}} \ left (1 - {\ tilde {p}} \ right) }}}

где ${\ displaystyle z = \ Phi ^ {- 1} \! \ left (1 - {\ frac {\ alpha} {2}} \! \ right)}$ - квантиль стандартного нормального распределения, как и раньше (например, 95% доверительный интервал требует ${\ Displaystyle \ альфа = 0,05}$ , тем самым производя ${\ displaystyle z = 1,96}$ ). По словам Брауна , Цая и ДасГупты ^[4], принимая ${\ displaystyle z = 2}$ вместо 1,96 дает интервал «добавить 2 успеха и 2 неудачи», ранее описанный Агрести и Коуллом . ^[12]

Этот интервал можно резюмировать как использование регулировки центральной точки, ${\ displaystyle {\ tilde {p}}}$ , интервала оценок Вильсона, а затем примените нормальное приближение к этой точке. ^[3]^[4]

{\ displaystyle {\ tilde {p}} = {\ frac {{\ hat {p}} + {\ frac {z ^ {2}} {2n}}} {1 + {\ frac {z ^ {2}) } {n}}}}}

Преобразование арксинуса

Преобразование арксинуса приводит к вытягиванию концов распределения. ^[13] Хотя он может стабилизировать дисперсию (и, следовательно, доверительные интервалы) данных о долях, его использование подвергалось критике в нескольких контекстах. ^[14]

Пусть X - количество успехов в n испытаниях, и пусть p = X / n . Дисперсия p равна

{\ displaystyle \ operatorname {var} (p) = {\ frac {p (1-p)} {n}}.}

Используя преобразование арксинуса, дисперсия арксинуса p ^1/2 равна ^[15]

{\ displaystyle \ operatorname {var} \ left (\ arcsin \ left ({\ sqrt {p}} \ right) \ right) \ приблизительно {\ frac {\ operatorname {var} (p)} {4p (1-p )}} = {\ frac {p (1-p)} {4np (1-p)}} = {\ frac {1} {4n}}.}

Итак, сам доверительный интервал имеет следующий вид:

{\ displaystyle \ sin ^ {2} \ left (\ arcsin \ left ({\ sqrt {p}} \ right) - {\ frac {z} {2 {\ sqrt {n}}}} \ right) <\ theta <\ sin ^ {2} \ left (\ arcsin \ left ({\ sqrt {p}} \ right) + {\ frac {z} {2 {\ sqrt {n}}}} \ right)}

где ${\ displaystyle z}$ это ${\ displaystyle \ scriptstyle 1 \, - \, {\ frac {\ alpha} {2}}}$ квантиль стандартного нормального распределения.

Этот метод можно использовать для оценки дисперсии p, но его использование проблематично, когда p близко к 0 или 1.

т преобразования

Пусть p будет долей успехов. Для 0 ≤ a ≤ 2,

{\ displaystyle t_ {a} = \ log \ left ({\ frac {p ^ {a}} {(1-p) ^ {2-a}}} \ right) = a \ log (p) - (2 -a) \ log (1-p)}

Это семейство является обобщением логит-преобразования, которое является частным случаем с a = 1 и может использоваться для преобразования пропорционального распределения данных в приблизительно нормальное распределение . Для набора данных необходимо оценить параметр a .

Правило трех - когда не наблюдается успехов

Правило трех используется , чтобы обеспечить простой способ указав приблизительный 95% доверительный интервал для р , в частном случае, когда нет успехов ( ${\ displaystyle {\ hat {p}} = 0}$ ) наблюдались. ^[16] Интервал равен (0,3 / n ) .

По симметрии можно было ожидать только успехов ( ${\ displaystyle {\ hat {p}} = 1}$ ) интервал равен (1 - 3 / n , 1) .

Сравнение разных интервалов

Есть несколько исследовательских работ, в которых сравниваются эти и другие доверительные интервалы для биномиальной пропорции. ^[3]^[2]^[17]^[18] И Агрести и Коул (1998) ^[12], и Росс (2003) ^[19] указывают, что точные методы, такие как интервал Клоппера – Пирсона, могут не работать так же хорошо, как некоторые приближения. . Нормальный интервал аппроксимации и его представление в учебниках подвергалось резкой критике, и многие статистики выступали за то, чтобы его не использовать. ^[4] Основными проблемами являются перерегулирование (границы превышают [0, 1]), интервалы нулевой ширины на ${\ displaystyle {\ hat {p}}}$ = 0 и 1 (ложное предположение о достоверности), ^[2] и общее несоответствие с проверкой значимости. ^[3]

Из перечисленных выше приближений методы интервалов оценки Вильсона (с поправкой на непрерывность или без нее) оказались наиболее точными и надежными, ^[3]^[4]^[2], хотя некоторые предпочитают подход Агрести – Коулла для большей выборки. размеры. ^[4] Методы Уилсона и Клоппера-Пирсона дают согласованные результаты с тестами на значимость источника ^[8], и это свойство является решающим для многих исследователей.

Многие из этих интервалов могут быть рассчитаны в R с использованием таких пакетов, как «binom» , или в Python с использованием пакета «ebcic» (Калькулятор точного биномиального доверительного интервала).

Смотрите также

Теория оценок
Псевдосчет