Из Википедии, бесплатной энциклопедии
  (Перенаправлен из функции Пробит )
Перейти к навигации Перейти к поиску
График пробит-функции

В теории вероятностей и статистике , то пробита функция является функцией квантиля связан со стандартным нормальным распределением , которое обычно обозначаются как N (0,1). Математически это функция, обратная кумулятивной функции стандартного нормального распределения, которая обозначается как , поэтому пробит обозначается как . У него есть приложения в исследовательской статистической графике и специализированном регрессионном моделировании переменных двоичного отклика .

Во многом из-за центральной предельной теоремы стандартное нормальное распределение играет фундаментальную роль в теории вероятностей и статистике. Если мы примем во внимание известный факт, что стандартное нормальное распределение помещает 95% вероятности между -1,96 и 1,96 и симметрично относительно нуля, из этого следует, что

Функция пробит дает «обратное» вычисление, генерируя значение случайной величины N (0,1), связанной с указанной кумулятивной вероятностью. Продолжая пример,

.

В целом,

и

Концептуальная разработка [ править ]

Идея пробит-функции была опубликована Честером Иттнером Блиссом в статье 1934 года в журнале Science о том, как обрабатывать такие данные, как процент вредителей, убитых пестицидом . [1] Блисс предложил преобразовать процент убитых в « вероятность не этого » (или «пробит»), которая была линейно связана с современным определением (он произвольно определил ее как равную 0 для 0,0001 и 1 для 0,9999). Он включил таблицу, чтобы помочь другим исследователям преобразовать процент убитых в его пробит, которую они затем могли построить против логарифма дозы и, таким образом, надеялись получить более или менее прямую линию. Такая так называемая пробит-модельпо-прежнему важен в токсикологии, а также в других областях. Такой подход оправдан, в частности, если вариацию ответа можно рационализировать как логнормальное распределение толерантности между испытуемыми на тесте, где толерантность конкретного пациента - это доза, ровно достаточная для интересующей реакции.

Метод, предложенный Блиссом, был реализован в Probit Analysis , важном тексте по токсикологическим приложениям, написанном DJ Finney . [2] [3] Значения, представленные Финни, могут быть получены из пробитов, как они определены здесь, путем добавления значения 5. Это различие резюмируется Коллеттом (стр. 55): [4] «Исходное определение пробита [с 5 добавлено] в первую очередь для того, чтобы избежать работы с отрицательными вероятностями; ... Это определение все еще используется в некоторых кругах, но в основных пакетах статистического программного обеспечения для того, что называется пробит-анализом., вероятности определяются без добавления 5. "Следует отметить, что пробит-методология, включая численную оптимизацию для подбора пробит-функций, была внедрена до широкого распространения электронных вычислений. При использовании таблиц было удобно иметь равномерно положительные вероятности. Общие области применения не требуют положительных пробитов.

Диагностика отклонения распределения от нормальности [ править ]

Помимо обеспечения основы для важных типов регрессии, пробит-функция полезна в статистическом анализе для диагностики отклонения от нормальности в соответствии с методом построения графика QQ. Если набор данных фактически является выборка из нормального распределения , график значений против их пробита оценки будет близко к линейному. Специфические отклонения от нормы, такие как асимметрия , тяжелые хвосты или бимодальностьможет быть диагностирован на основании обнаружения конкретных отклонений от линейности. В то время как график QQ может использоваться для сравнения с любым семейством распределений (не только с нормальным), нормальный график QQ является относительно стандартной процедурой исследовательского анализа данных, поскольку предположение о нормальности часто является отправной точкой для анализа.

Вычисление [ править ]

Функция CDF нормального распределения и обратная ей не доступны в закрытой форме , и вычисления требуют осторожного использования численных процедур. Однако функции широко доступны в программном обеспечении для статистического и вероятностного моделирования, а также в электронных таблицах. В Microsoft Excel , например, функция пробит доступна как norm.s.inv (р). В вычислительных средах, где доступны численные реализации обратной функции ошибок , пробит-функция может быть получена как

Примером является MATLAB , где доступна функция erfinv. Язык Mathematica реализует InverseErf. В других средах , непосредственно реализовать функцию пробит , как показано на следующей сессии в языке программирования R .

> qnorm ( 0,025 ) [1] -1,959964 > pnorm ( -1,96 ) [1] 0,02499790

Подробные сведения о вычислении обратной функции ошибок можно найти в [1] . Вичура дает быстрый алгоритм вычисления пробит-функции до 16 знаков после запятой; это используется в R для генерации случайных величин для нормального распределения. [5]

Обыкновенное дифференциальное уравнение для функции пробит [ править ]

Другой способ вычисления основан на формировании нелинейного обыкновенного дифференциального уравнения (ОДУ) для пробита в соответствии с методом Штейнбрехера и Шоу. [6] Сокращение пробит-функции как ODE:

где - функция плотности вероятности w .

В случае гауссиана:

Снова дифференцируя:

с центральными (начальными) условиями

Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов. Исходя из этого, решения сколь угодно высокой точности могут быть разработаны на основе подхода Штейнбрехера к ряду для обратной функции ошибок. Решение степенного ряда дается

где коэффициенты удовлетворяют нелинейной рекуррентности

с . В таком виде соотношение как .

См. Также [ править ]

Сравнение функции логита с масштабированным пробита (то есть обратной CDF от нормального распределения ), по сравнению против , что делает склоны и то же в начале координат.

С пробит-функцией (и пробит-моделью ) тесно связаны логит- функция и логит-модель . Обратная логистическая функция дается выражением

По аналогии с пробит-моделью, мы можем предположить, что такая величина линейно связана с набором предикторов, в результате чего получается логит-модель , основа, в частности, логистической регрессионной модели, наиболее распространенной формы регрессионного анализа для категориальных данных ответа. В современной статистической практике пробит- и логит-регрессионные модели часто рассматриваются как случаи обобщенной линейной модели .

См. Также [ править ]

  • Графики компромисса ошибок обнаружения (графики DET, альтернатива ROC)
  • Логистическая регрессия (она же логит-модель)
  • Logit
  • Пробит модель
  • Полиномиальный пробит
  • График QQ
  • Непрерывная функция
  • Монотонная функция
  • Квантильная функция
  • Сигмовидная функция
  • Анализ Rankit , также разработанный Честером Блиссом
  • Ридит скоринг

Ссылки [ править ]

  1. ^ Блаженство CI. (1934). «Метод пробитов». Наука . 79 (2037): 38–39. DOI : 10.1126 / science.79.2037.38 . JSTOR  1659792 . PMID  17813446 .
  2. ^ Финни, DJ (1947), Пробит-анализ . (1-е издание) Cambridge University Press, Кембридж, Великобритания.
  3. ^ Финни, ди-джей (1971). Пробит-анализ (3-е издание) . Издательство Кембриджского университета, Кембридж, Великобритания. ISBN 0-521-08041-X. OCLC  174198382 .
  4. ^ Коллетт, Д. (1991). Моделирование двоичных данных . Чепмен и Холл / CRC.
  5. ^ Wichura, MJ (1988). «Алгоритм AS241: процентные точки нормального распределения». Прикладная статистика . Блэквелл Паблишинг. 37 (3): 477–484. DOI : 10.2307 / 2347330 . JSTOR 2347330 . 
  6. ^ Штайнбрехер Г., Шоу, WT (2008). «Квантильная механика». Европейский журнал прикладной математики . 19 (2): 87–112. DOI : 10.1017 / S0956792508007341 .CS1 maint: multiple names: authors list (link)