Распределение Пирсона - это семейство непрерывных распределений вероятностей . Впервые он был опубликован Карлом Пирсоном в 1895 году и впоследствии расширен им в 1901 и 1916 годах в серии статей по биостатистике .
История [ править ]
Система Пирсона изначально была разработана для моделирования явно искаженных наблюдений. В то время было хорошо известно, как адаптировать теоретическую модель к первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть создано так, чтобы оно произвольно хорошо соответствовало наблюдаемому среднему (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) иэксцесс (стандартизованный четвертый кумулянт) можно регулировать одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, показывающим асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.
В своей оригинальной статье Пирсон (1895, стр. 360) определил четыре типа распределений (пронумерованных с I по IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживаются ли распределения на ограниченном интервале, на полупрямой или на всей реальной прямой ; и были ли они потенциально искажены или обязательно симметричны. Во второй статье (Pearson 1901) были исправлены два упущения: он переопределил распределение типа V (первоначально просто нормальное распределение , но теперь распределение обратной гаммы).) и представил распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) ввел дополнительные частные случаи и подтипы (с VII по XII).
Райнд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и далее, 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый - это квадрат асимметрии : где γ 1 - асимметрия, или третий стандартизованный момент . Второй - традиционный эксцесс , или четвертый стандартизованный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2= 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2. ) Диаграмма справа показывает, какому типу Пирсона принадлежит данное конкретное распределение (обозначенное точкой (β 1 , β 2 )).
Многие из известных нам сегодня асимметричных и / или немезокуртических распределений были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, было использовано Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года об обратной вероятности . Бета-распределение приобрело известность благодаря своей принадлежности к системе Пирсона и было известно до 1940-х годов как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма-распределениевозникла из работы Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373–376) и была известна как распределение типа III Пирсона, прежде чем получить свое современное название в 1930-х и 1940-х годах. [2] 1895 документа Пирсон представил распределение IV типа, который содержит Стьюдент т -распределение как частный случай, предшествовавший Госсет последующего использование «s несколько лет. Его статья 1901 года представила обратное гамма-распределение (тип V) и бета-простое распределение (тип VI).
Определение [ править ]
Плотность Пирсона p определяется как любое допустимое решение дифференциального уравнения (см. Pearson 1895, стр. 381)
с:
Согласно Орду [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, , из рекуррентного соотношения для значений в функции вероятность массовой от гипергеометрического распределения (что дает линейную разделенному-на-квадратичной структура).
В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку
следует непосредственно из дифференциального уравнения.
Поскольку мы сталкиваемся с линейным дифференциальным уравнением первого порядка с переменными коэффициентами , его решение несложно:
Интеграл в этом решении значительно упрощается при рассмотрении некоторых частных случаев подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта (и, следовательно, количеством действительных корней ) квадратичной функции
Особые виды распространения [ править ]
Случай 1, отрицательный дискриминант [ править ]
Распределение Пирсона типа IV [ править ]
Если дискриминант квадратичной функции (2) отрицательный ( ), у нее нет вещественных корней. Затем определите
Заметим, что α - вполне определенное действительное число и α ≠ 0 , потому что по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется к виду
Отсутствие действительных корней очевидно из этой формулировки, потому что α 2 обязательно положительно.
Теперь выразим решение дифференциального уравнения (1) как функцию от y :
Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», поскольку интеграл
включает в себя обратную тригонометрическую функцию арктангенса. потом
Наконец, пусть
Применяя эти замены, получаем параметрическую функцию:
Эта ненормализованная плотность поддерживается на всей реальной линии . Это зависит от параметра масштаба α> 0 и параметров формы m > 1/2 и ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию от y, а не от x . Поэтому мы снова вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :
Нормирующая константа включает в себя сложную функцию Гамма (Г) и функцию бета (B). Обратите внимание, что параметр местоположения λ здесь не совпадает с исходным параметром местоположения, введенным в общей формулировке, но связан через
Распределение Пирсона типа VII [ править ]
Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если зафиксировать его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот частный случай известен как распределение типа VII Пирсона (ср. Pearson 1916, p. 450). Его плотность
где B - бета-функция .
Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если
для чего требуется m > 3/2. Это влечет за собой небольшую потерю общности, но гарантирует, что дисперсия распределения существует и равна σ 2 . Теперь параметр m управляет только эксцессом распределения. Если m стремится к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как частный случай:
Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .
Удобно потребовать m > 5/2 и положить
Это еще одна специализация, которая гарантирует существование первых четырех моментов раздачи. Более конкретно, тип VII , Пирсона распределение параметрироваться в терминах (λ, σ, & gamma ; 2 ) имеет среднее значение Х , стандартное отклонение от сг , перекос нуля, и избытка эксцесса Г 2 .
T -распределение студента [ править ]
Пирсона типа VII распределение эквивалентно нестандартизированного Стьюдента т -распределение с параметрами ν> 0, ц, сг 2 , применяя следующие подстановки в исходное параметризация:
Заметим, что выполняется ограничение m > 1/2 .
Результирующая плотность
что легко узнать как плотность t- распределения Стьюдента.
Это означает , что Пирсона типа VII распределение вбирает стандартный Стьюдент т -распределение , а также стандартное распределение Коши . В частности, стандартное t -распределение Стьюдента возникает как подслучай, когда μ = 0 и σ 2 = 1, что эквивалентно следующим заменам:
Плотность этого ограниченного однопараметрического семейства является стандартным t Стьюдента :
Случай 2, неотрицательный дискриминант [ править ]
Если квадратичная функция (2) имеет неотрицательный дискриминант ( ), у нее есть действительные корни a 1 и a 2 (не обязательно разные):
При наличии действительных корней квадратичная функция (2) может быть записана как
и поэтому решение дифференциального уравнения есть
Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл
включает только функцию логарифма, а не функцию arctan, как в предыдущем случае.
Используя замену
получаем следующее решение дифференциального уравнения (1):
Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить, а плотность записать следующим образом:
Распределение Пирсона типа I [ править ]
Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположный знак, то есть ,. Тогда решение p поддерживается на отрезке . Применить замену
где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):
Можно определить:
Перегруппировка констант и параметров упрощает:
Таким образом следует с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p было правильной функцией плотности вероятности.
Распределение Пирсона типа II [ править ]
Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.
Для кривой Пирсона типа II [4]
куда
Ордината y - частота . Кривая Пирсона типа II используется при вычислении таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена, когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . Для таблицы значений определенные значения используются в качестве констант в предыдущем уравнении:
Используемые моменты x :
Распределение Пирсона типа III [ править ]
Определение
есть . Распределение Пирсона типа III - это обобщенное гамма-распределение или распределение хи-квадрат .
Распределение Пирсона типа V [ править ]
Определение новых параметров:
следует за . Распределение Пирсона типа V является обратным гамма-распределением .
Распределение Пирсона типа VI [ править ]
Определение
следует за a . Распределение типа VI Пирсона - это простое бета-распределение или F -распределение .
Отношение к другим дистрибутивам [ править ]
Семья Пирсона включает, среди прочего, следующие распределения:
- Бета-распределение (тип I)
- Бета-простое распределение (тип VI)
- Распределение Коши (тип IV)
- Распределение хи-квадрат (тип III)
- Непрерывное равномерное распределение (предел типа I)
- Экспоненциальное распределение (тип III)
- Гамма-распределение (тип III)
- F -распределение (тип VI)
- Распределение обратного хи-квадрат (тип V)
- Обратное гамма-распределение (тип V)
- Нормальное распределение (предел типа I, III, IV, V или VI)
- Студенческий т -распределение (тип VII, который является не перекос подтипом типа IV)
Альтернативами системе распределений Пирсона с целью подгонки распределений к данным являются квантильно-параметризованные распределения (QPD) и распределения металога . QPD и металоги могут обеспечить большую гибкость формы и границ, чем система Пирсона. Вместо подгонки моментов QPD обычно подгоняются к эмпирическим CDF или другим данным с помощью линейных наименьших квадратов .
Приложения [ править ]
Эти модели используются на финансовых рынках, учитывая их способность параметризоваться таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. Д. [ Какие? ] [ необходима цитата ], и это семейство дистрибутивов может оказаться одним из наиболее важных.
В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5] [ необходима ссылка ]
Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и легче подходят для данных. См. Дистрибутивы металога .
Заметки [ править ]
- ^ Миллер, Джефф; и другие. (2006-07-09). «Бета-распространение» . Самые ранние известные варианты использования некоторых слов математики . Проверено 9 декабря 2006 .
- ^ Миллер, Джефф; и другие. (07.12.2006). «Гамма-распределение» . Самые ранние известные варианты использования некоторых слов математики . Проверено 9 декабря 2006 .
- ^ Ord JK (1972) стр. 2
- ^ Ramsey, Филип Х. (1989-09-01). «Критические значения для корреляции порядка ранга Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR 1165017 .
- ^ «Рекомендации по определению частоты паводковых потоков» (PDF) . USGS Water . Март 1982 . Проверено 14 июня 2019 .
Источники [ править ]
Первоисточники [ править ]
- Пирсон, Карл (1893). «Вклад в математическую теорию эволюции [аннотация]» . Труды Королевского общества . 54 (326–330): 329–333. DOI : 10,1098 / rspl.1893.0079 . JSTOR 115538 .
- Пирсон, Карл (1895). "Вклад в математическую теорию эволюции, II: изменение перекоса в однородном материале" (PDF) . Философские труды Королевского общества . 186 : 343–414. Bibcode : 1895RSPTA.186..343P . DOI : 10,1098 / rsta.1895.0010 . JSTOR 90649 .
- Пирсон, Карл (1901). «Математический вклад в теорию эволюции, X: Дополнение к мемуарам о перекосах» . Философские труды Королевского общества А . 197 (287–299): 443–459. Bibcode : 1901RSPTA.197..443P . DOI : 10,1098 / rsta.1901.0023 . JSTOR 90841 .
- Пирсон, Карл (1916). «Математические вклады в теорию эволюции, XIX: второе приложение к мемуарам о перекосах» . Философские труды Королевского общества А . 216 (538–548): 429–457. Bibcode : 1916RSPTA.216..429P . DOI : 10,1098 / rsta.1916.0009 . JSTOR 91092 .
- Райнд, А. (июль – октябрь 1909 г.). «Таблицы для облегчения вычисления вероятных ошибок главных констант распределений асимметричных частот» . Биометрика . 7 (1/2): 127–147. DOI : 10.1093 / Biomet / 7.1-2.127 . JSTOR 2345367 .
Вторичные источники [ править ]
- Милтон Абрамовиц и Ирен А. Стегун (1964). Справочник по математическим функциям с формулами, графиками и математическими таблицами . Национальное бюро стандартов .
- Eric W. Weisstein et al. Распределение Пирсона типа III . Из MathWorld .
Ссылки [ править ]
- Элдертон, сэр В.П., Джонсон, Н.Л. (1969) Системы частотных кривых . Издательство Кембриджского университета.
- Орд Дж. К. (1972) Семейства частотных распределений . Гриффин, Лондон.