Пробит

Эта статья может быть слишком технической, чтобы ее могло понять большинство читателей . Пожалуйста, помогите улучшить его, чтобы он был понятен неспециалистам , не удаляя технические детали. ( Январь 2013 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

График пробит-функции

В теории вероятностей и статистике , то пробита функция является функцией квантиля связан со стандартным нормальным распределением , которое обычно обозначаются как N (0,1). Математически это функция, обратная кумулятивной функции стандартного нормального распределения, которая обозначается как , поэтому пробит обозначается как . У него есть приложения в исследовательской статистической графике и специализированном регрессионном моделировании переменных двоичного отклика . ${\ displaystyle \ Phi (z)}$ ${\ Displaystyle \ Phi ^ {- 1} (р)}$

Во многом из-за центральной предельной теоремы стандартное нормальное распределение играет фундаментальную роль в теории вероятностей и статистике. Если мы примем во внимание известный факт, что стандартное нормальное распределение помещает 95% вероятности между -1,96 и 1,96 и симметрично относительно нуля, из этого следует, что

\Phi (-1.96)=0.025=1-\Phi (1.96).\,\!

Функция пробит дает «обратное» вычисление, генерируя значение случайной величины N (0,1), связанной с указанной кумулятивной вероятностью. Продолжая пример,

\operatorname {probit} (0.025)=-1.96=-\operatorname {probit} (0.975)

.

В целом,

\Phi (\operatorname {probit} (p))=p

и

\operatorname {probit} (\Phi (z))=z.

Концептуальная разработка [ править ]

Идея пробит-функции была опубликована Честером Иттнером Блиссом в статье 1934 года в журнале Science о том, как обрабатывать такие данные, как процент вредителей, убитых пестицидом . ^[1] Блисс предложил преобразовать процент убитых в « вероятность не этого » (или «пробит»), которая была линейно связана с современным определением (он произвольно определил ее как равную 0 для 0,0001 и 1 для 0,9999). Он включил таблицу, чтобы помочь другим исследователям преобразовать процент убитых в его пробит, которую они затем могли построить против логарифма дозы и, таким образом, надеялись получить более или менее прямую линию. Такая так называемая пробит-модельпо-прежнему важен в токсикологии, а также в других областях. Такой подход оправдан, в частности, если вариацию ответа можно рационализировать как логнормальное распределение толерантности между испытуемыми на тесте, где толерантность конкретного пациента - это доза, ровно достаточная для интересующей реакции.

Метод, предложенный Блиссом, был реализован в Probit Analysis , важном тексте по токсикологическим приложениям, написанном DJ Finney . ^[2]^[3] Значения, представленные Финни, могут быть получены из пробитов, как они определены здесь, путем добавления значения 5. Это различие резюмируется Коллеттом (стр. 55): ^[4] «Исходное определение пробита [с 5 добавлено] в первую очередь для того, чтобы избежать работы с отрицательными вероятностями; ... Это определение все еще используется в некоторых кругах, но в основных пакетах статистического программного обеспечения для того, что называется пробит-анализом., вероятности определяются без добавления 5. "Следует отметить, что пробит-методология, включая численную оптимизацию для подбора пробит-функций, была внедрена до широкого распространения электронных вычислений. При использовании таблиц было удобно иметь равномерно положительные вероятности. Общие области применения не требуют положительных пробитов.

Диагностика отклонения распределения от нормальности [ править ]

Помимо обеспечения основы для важных типов регрессии, пробит-функция полезна в статистическом анализе для диагностики отклонения от нормальности в соответствии с методом построения графика QQ. Если набор данных фактически является выборка из нормального распределения , график значений против их пробита оценки будет близко к линейному. Специфические отклонения от нормы, такие как асимметрия , тяжелые хвосты или бимодальностьможет быть диагностирован на основании обнаружения конкретных отклонений от линейности. В то время как график QQ может использоваться для сравнения с любым семейством распределений (не только с нормальным), нормальный график QQ является относительно стандартной процедурой исследовательского анализа данных, поскольку предположение о нормальности часто является отправной точкой для анализа.

Вычисление [ править ]

Функция CDF нормального распределения и обратная ей не доступны в закрытой форме , и вычисления требуют осторожного использования численных процедур. Однако функции широко доступны в программном обеспечении для статистического и вероятностного моделирования, а также в электронных таблицах. В Microsoft Excel , например, функция пробит доступна как norm.s.inv (р). В вычислительных средах, где доступны численные реализации обратной функции ошибок , пробит-функция может быть получена как

\operatorname {probit} (p)={\sqrt {2}}\,\operatorname {erf} ^{-1}(2p-1).

Примером является MATLAB , где доступна функция erfinv. Язык Mathematica реализует InverseErf. В других средах , непосредственно реализовать функцию пробит , как показано на следующей сессии в языке программирования R .

> qnorm ( 0,025 ) [1] -1,959964 > pnorm ( -1,96 ) [1] 0,02499790

Подробные сведения о вычислении обратной функции ошибок можно найти в [1] . Вичура дает быстрый алгоритм вычисления пробит-функции до 16 знаков после запятой; это используется в R для генерации случайных величин для нормального распределения. ^[5]

Обыкновенное дифференциальное уравнение для функции пробит [ править ]

Другой способ вычисления основан на формировании нелинейного обыкновенного дифференциального уравнения (ОДУ) для пробита в соответствии с методом Штейнбрехера и Шоу. ^[6] Сокращение пробит-функции как ODE: $w(p)$

{\frac {dw}{dp}}={\frac {1}{f(w)}}

где - функция плотности вероятности $w$ . $f(w)$

В случае гауссиана:

{\frac {dw}{dp}}={\sqrt {2\pi }}\ e^{\frac {w^{2}}{2}}

Снова дифференцируя:

{\frac {d^{2}w}{dp^{2}}}=w\left({\frac {dw}{dp}}\right)^{2}

с центральными (начальными) условиями

w\left(1/2\right)=0,

w'\left(1/2\right)={\sqrt {2\pi }}.

Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов. Исходя из этого, решения сколь угодно высокой точности могут быть разработаны на основе подхода Штейнбрехера к ряду для обратной функции ошибок. Решение степенного ряда дается

w(p)={\sqrt {\frac {\pi }{2}}}\sum _{k=0}^{\infty }{\frac {d_{k}}{(2k+1)}}(2p-1)^{(2k+1)}

где коэффициенты удовлетворяют нелинейной рекуррентности $d_{k}$

d_{k+1}={\frac {\pi }{4}}\sum _{j=0}^{k}{\frac {d_{j}d_{k-j}}{(j+1)(2j+1)}}

с . В таком виде соотношение как . $d_{0}=1$ $d_{k+1}/d_{k}\rightarrow 1$ $k\rightarrow \infty$

См. Также [ править ]

Сравнение функции логита с масштабированным пробита (то есть обратной CDF от нормального распределения ), по сравнению против , что делает склоны и то же в начале координат.

\operatorname {logit} (x)

\Phi ^{-1}(x)/{\sqrt {\frac {\pi }{8}}}

С пробит-функцией (и пробит-моделью ) тесно связаны логит- функция и логит-модель . Обратная логистическая функция дается выражением

\operatorname {logit} (p)=\log \left({\frac {p}{1-p}}\right).

По аналогии с пробит-моделью, мы можем предположить, что такая величина линейно связана с набором предикторов, в результате чего получается логит-модель , основа, в частности, логистической регрессионной модели, наиболее распространенной формы регрессионного анализа для категориальных данных ответа. В современной статистической практике пробит- и логит-регрессионные модели часто рассматриваются как случаи обобщенной линейной модели .

См. Также [ править ]

Графики компромисса ошибок обнаружения (графики DET, альтернатива ROC)
Логистическая регрессия (она же логит-модель)
Logit
Пробит модель
Полиномиальный пробит
График QQ
Непрерывная функция
Монотонная функция
Квантильная функция
Сигмовидная функция
Анализ Rankit , также разработанный Честером Блиссом
Ридит скоринг

Ссылки [ править ]

^ Блаженство CI. (1934). «Метод пробитов». Наука . 79 (2037): 38–39. DOI : 10.1126 / science.79.2037.38 . JSTOR 1659792 . PMID 17813446 .
^ Финни, DJ (1947), Пробит-анализ . (1-е издание) Cambridge University Press, Кембридж, Великобритания.
^ Финни, ди-джей (1971). Пробит-анализ (3-е издание) . Издательство Кембриджского университета, Кембридж, Великобритания. ISBN 0-521-08041-X. OCLC 174198382 .
^ Коллетт, Д. (1991). Моделирование двоичных данных . Чепмен и Холл / CRC.
^ Wichura, MJ (1988). «Алгоритм AS241: процентные точки нормального распределения». Прикладная статистика . Блэквелл Паблишинг. 37 (3): 477–484. DOI : 10.2307 / 2347330 . JSTOR 2347330 .
^ Штайнбрехер Г., Шоу, WT (2008). «Квантильная механика». Европейский журнал прикладной математики . 19 (2): 87–112. DOI : 10.1017 / S0956792508007341 .CS1 maint: multiple names: authors list (link)

[1] Блаженство CI. (1934). «Метод пробитов». Наука . 79 (2037): 38–39. DOI : 10.1126 / science.79.2037.38 . JSTOR 1659792 . PMID 17813446 .

[2] Финни, DJ (1947), Пробит-анализ . (1-е издание) Cambridge University Press, Кембридж, Великобритания.

[3] Финни, ди-джей (1971). Пробит-анализ (3-е издание) . Издательство Кембриджского университета, Кембридж, Великобритания. ISBN 0-521-08041-X. OCLC 174198382 .

[4] Коллетт, Д. (1991). Моделирование двоичных данных . Чепмен и Холл / CRC.

[5] Wichura, MJ (1988). «Алгоритм AS241: процентные точки нормального распределения». Прикладная статистика . Блэквелл Паблишинг. 37 (3): 477–484. DOI : 10.2307 / 2347330 . JSTOR 2347330 .

[6] Штайнбрехер Г., Шоу, WT (2008). «Квантильная механика». Европейский журнал прикладной математики . 19 (2): 87–112. DOI : 10.1017 / S0956792508007341 .CS1 maint: multiple names: authors list (link)

[1]