Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Диаграмма системы Пирсона, показывающая распределения типов I, III, VI, V и IV с точки зрения β 1 (квадрат асимметрии) и β 2 (традиционный эксцесс)

Распределение Пирсона - это семейство непрерывных распределений вероятностей . Впервые он был опубликован Карлом Пирсоном в 1895 году и впоследствии расширен им в 1901 и 1916 годах в серии статей по биостатистике .

История [ править ]

Система Пирсона изначально была разработана для моделирования явно искаженных наблюдений. В то время было хорошо известно, как адаптировать теоретическую модель к первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть создано так, чтобы оно произвольно хорошо соответствовало наблюдаемому среднему (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) иэксцесс (стандартизованный четвертый кумулянт) можно регулировать одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, показывающим асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.

В своей оригинальной статье Пирсон (1895, стр. 360) определил четыре типа распределений (пронумерованных с I по IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживаются ли распределения на ограниченном интервале, на полупрямой или на всей реальной прямой ; и были ли они потенциально искажены или обязательно симметричны. Во второй статье (Pearson 1901) были исправлены два упущения: он переопределил распределение типа V (первоначально просто нормальное распределение , но теперь распределение обратной гаммы).) и представил распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) ввел дополнительные частные случаи и подтипы (с VII по XII).

Райнд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и далее, 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый - это квадрат асимметрии : где γ 1 - асимметрия, или третий стандартизованный момент . Второй - традиционный эксцесс , или четвертый стандартизованный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2= 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2. ) Диаграмма справа показывает, какому типу Пирсона принадлежит данное конкретное распределение (обозначенное точкой (β 1 , β 2 )).

Многие из известных нам сегодня асимметричных и / или немезокуртических распределений были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, было использовано Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года об обратной вероятности . Бета-распределение приобрело известность благодаря своей принадлежности к системе Пирсона и было известно до 1940-х годов как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма-распределениевозникла из работы Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373–376) и была известна как распределение типа III Пирсона, прежде чем получить свое современное название в 1930-х и 1940-х годах. [2] 1895 документа Пирсон представил распределение IV типа, который содержит Стьюдент т -распределение как частный случай, предшествовавший Госсет последующего использование «s несколько лет. Его статья 1901 года представила обратное гамма-распределение (тип V) и бета-простое распределение (тип VI).

Определение [ править ]

Плотность Пирсона p определяется как любое допустимое решение дифференциального уравнения (см. Pearson 1895, стр. 381)

с:

Согласно Орду [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, , из рекуррентного соотношения для значений в функции вероятность массовой от гипергеометрического распределения (что дает линейную разделенному-на-квадратичной структура).

В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку

следует непосредственно из дифференциального уравнения.

Поскольку мы сталкиваемся с линейным дифференциальным уравнением первого порядка с переменными коэффициентами , его решение несложно:

Интеграл в этом решении значительно упрощается при рассмотрении некоторых частных случаев подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта (и, следовательно, количеством действительных корней ) квадратичной функции

Особые виды распространения [ править ]

Случай 1, отрицательный дискриминант [ править ]

Распределение Пирсона типа IV [ править ]

Если дискриминант квадратичной функции (2) отрицательный ( ), у нее нет вещественных корней. Затем определите

Заметим, что α - вполне определенное действительное число и α ≠ 0 , потому что по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется к виду

Отсутствие действительных корней очевидно из этой формулировки, потому что α 2 обязательно положительно.

Теперь выразим решение дифференциального уравнения (1) как функцию от y :

Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», поскольку интеграл

включает в себя обратную тригонометрическую функцию арктангенса. потом

Наконец, пусть

Применяя эти замены, получаем параметрическую функцию:

Эта ненормализованная плотность поддерживается на всей реальной линии . Это зависит от параметра масштаба α> 0 и параметров формы m > 1/2 и  ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию от y, а не от x . Поэтому мы снова вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :

Нормирующая константа включает в себя сложную функцию Гамма (Г) и функцию бета  (B). Обратите внимание, что параметр местоположения λ здесь не совпадает с исходным параметром местоположения, введенным в общей формулировке, но связан через

Распределение Пирсона типа VII [ править ]

График плотностей типа VII Пирсона с λ = 0, σ = 1 и: γ 2 = ∞ (красный); γ 2 = 4 (синий); и γ 2 = 0 (черный)

Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если зафиксировать его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот частный случай известен как распределение типа VII Пирсона (ср. Pearson 1916, p. 450). Его плотность

где B - бета-функция .

Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если

для чего требуется m > 3/2. Это влечет за собой небольшую потерю общности, но гарантирует, что дисперсия распределения существует и равна σ 2 . Теперь параметр m управляет только эксцессом распределения. Если m стремится к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как частный случай:

Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .

Удобно потребовать m > 5/2 и положить

Это еще одна специализация, которая гарантирует существование первых четырех моментов раздачи. Более конкретно, тип VII , Пирсона распределение параметрироваться в терминах (λ, σ, & gamma ; 2 ) имеет среднее значение Х , стандартное отклонение от сг , перекос нуля, и избытка эксцесса Г 2 .

T -распределение студента [ править ]

Пирсона типа VII распределение эквивалентно нестандартизированного Стьюдента т -распределение с параметрами ν> 0, ц, сг 2 , применяя следующие подстановки в исходное параметризация:

Заметим, что выполняется ограничение m > 1/2 .

Результирующая плотность

что легко узнать как плотность t- распределения Стьюдента.

Это означает , что Пирсона типа VII распределение вбирает стандартный Стьюдент т -распределение , а также стандартное распределение Коши . В частности, стандартное t -распределение Стьюдента возникает как подслучай, когда μ = 0 и σ 2 = 1, что эквивалентно следующим заменам:

Плотность этого ограниченного однопараметрического семейства является стандартным t Стьюдента :

Случай 2, неотрицательный дискриминант [ править ]

Если квадратичная функция (2) имеет неотрицательный дискриминант ( ), у нее есть действительные корни a 1 и a 2 (не обязательно разные):

При наличии действительных корней квадратичная функция (2) может быть записана как

и поэтому решение дифференциального уравнения есть

Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл

включает только функцию логарифма, а не функцию arctan, как в предыдущем случае.

Используя замену

получаем следующее решение дифференциального уравнения (1):

Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить, а плотность записать следующим образом:

Распределение Пирсона типа I [ править ]

Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположный знак, то есть ,. Тогда решение p поддерживается на отрезке . Применить замену

где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):

Можно определить:

Перегруппировка констант и параметров упрощает:

Таким образом следует с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p было правильной функцией плотности вероятности.

Распределение Пирсона типа II [ править ]

Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.

Для кривой Пирсона типа II [4]

куда

Ордината y - частота . Кривая Пирсона типа II используется при вычислении таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена, когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . Для таблицы значений определенные значения используются в качестве констант в предыдущем уравнении:

Используемые моменты x :

Распределение Пирсона типа III [ править ]

Определение

есть . Распределение Пирсона типа III - это обобщенное гамма-распределение или распределение хи-квадрат .

Распределение Пирсона типа V [ править ]

Определение новых параметров:

следует за . Распределение Пирсона типа V является обратным гамма-распределением .

Распределение Пирсона типа VI [ править ]

Определение

следует за a . Распределение типа VI Пирсона - это простое бета-распределение или F -распределение .

Отношение к другим дистрибутивам [ править ]

Семья Пирсона включает, среди прочего, следующие распределения:

  • Бета-распределение (тип I)
  • Бета-простое распределение (тип VI)
  • Распределение Коши (тип IV)
  • Распределение хи-квадрат (тип III)
  • Непрерывное равномерное распределение (предел типа I)
  • Экспоненциальное распределение (тип III)
  • Гамма-распределение (тип III)
  • F -распределение (тип VI)
  • Распределение обратного хи-квадрат (тип V)
  • Обратное гамма-распределение (тип V)
  • Нормальное распределение (предел типа I, III, IV, V или VI)
  • Студенческий т -распределение (тип VII, который является не перекос подтипом типа IV)

Альтернативами системе распределений Пирсона с целью подгонки распределений к данным являются квантильно-параметризованные распределения (QPD) и распределения металога . QPD и металоги могут обеспечить большую гибкость формы и границ, чем система Пирсона. Вместо подгонки моментов QPD обычно подгоняются к эмпирическим CDF или другим данным с помощью линейных наименьших квадратов .

Приложения [ править ]

Эти модели используются на финансовых рынках, учитывая их способность параметризоваться таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. Д. [ Какие? ] [ необходима цитата ], и это семейство дистрибутивов может оказаться одним из наиболее важных.

В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5] [ необходима ссылка ]

Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и легче подходят для данных. См. Дистрибутивы металога .

Заметки [ править ]

  1. ^ Миллер, Джефф; и другие. (2006-07-09). «Бета-распространение» . Самые ранние известные варианты использования некоторых слов математики . Проверено 9 декабря 2006 .
  2. ^ Миллер, Джефф; и другие. (07.12.2006). «Гамма-распределение» . Самые ранние известные варианты использования некоторых слов математики . Проверено 9 декабря 2006 .
  3. ^ Ord JK (1972) стр. 2
  4. ^ Ramsey, Филип Х. (1989-09-01). «Критические значения для корреляции порядка ранга Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR 1165017 . 
  5. ^ «Рекомендации по определению частоты паводковых потоков» (PDF) . USGS Water . Март 1982 . Проверено 14 июня 2019 .

Источники [ править ]

Первоисточники [ править ]

  • Пирсон, Карл (1893). «Вклад в математическую теорию эволюции [аннотация]» . Труды Королевского общества . 54 (326–330): 329–333. DOI : 10,1098 / rspl.1893.0079 . JSTOR  115538 .
  • Пирсон, Карл (1895). "Вклад в математическую теорию эволюции, II: изменение перекоса в однородном материале" (PDF) . Философские труды Королевского общества . 186 : 343–414. Bibcode : 1895RSPTA.186..343P . DOI : 10,1098 / rsta.1895.0010 . JSTOR  90649 .
  • Пирсон, Карл (1901). «Математический вклад в теорию эволюции, X: Дополнение к мемуарам о перекосах» . Философские труды Королевского общества А . 197 (287–299): 443–459. Bibcode : 1901RSPTA.197..443P . DOI : 10,1098 / rsta.1901.0023 . JSTOR  90841 .
  • Пирсон, Карл (1916). «Математические вклады в теорию эволюции, XIX: второе приложение к мемуарам о перекосах» . Философские труды Королевского общества А . 216 (538–548): 429–457. Bibcode : 1916RSPTA.216..429P . DOI : 10,1098 / rsta.1916.0009 . JSTOR  91092 .
  • Райнд, А. (июль – октябрь 1909 г.). «Таблицы для облегчения вычисления вероятных ошибок главных констант распределений асимметричных частот» . Биометрика . 7 (1/2): 127–147. DOI : 10.1093 / Biomet / 7.1-2.127 . JSTOR  2345367 .

Вторичные источники [ править ]

  • Милтон Абрамовиц и Ирен А. Стегун (1964). Справочник по математическим функциям с формулами, графиками и математическими таблицами . Национальное бюро стандартов .
  • Eric W. Weisstein et al. Распределение Пирсона типа III . Из MathWorld .

Ссылки [ править ]

  • Элдертон, сэр В.П., Джонсон, Н.Л. (1969) Системы частотных кривых . Издательство Кембриджского университета.
  • Орд Дж. К. (1972) Семейства частотных распределений . Гриффин, Лондон.