Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , то обобщенное распределение Парето (GPD) представляет собой семейство непрерывных вероятностных распределений . Его часто используют для моделирования хвостов другого распределения. Он определяется тремя параметрами: положением , масштабом и формой . [1] [2] Иногда это определяется только масштабом и формой [3], а иногда только параметром формы. В некоторых ссылках параметр формы указывается как . [4]

Определение [ править ]

Стандартная кумулятивная функция распределения (cdf) GPD определяется [5]

где поддержка для и для . Соответствующая функция плотности вероятности (PDF) есть

Характеристика [ править ]

Связанное семейство распределений в масштабе местоположения получается заменой аргумента z на и соответствующей корректировкой опоры.

Интегральная функция распределения из ( , и ) является

где поддержка - когда и когда .

Функция плотности вероятности (PDF) равна

,

опять же, когда и когда .

PDF-файл является решением следующего дифференциального уравнения : [ необходима ссылка ]

Особые случаи [ править ]

  • Если форма и расположение равны нулю, GPD эквивалентно экспоненциальному распределению .
  • По форме и расположению GPD эквивалентен распределению Парето с масштабом и формой .
  • Если , , , то [1] . (exGPD означает экспоненциальное обобщенное распределение Парето .)
  • GPD аналогичен распределению Burr .

Генерация обобщенных случайных величин Парето [ править ]

Генерация случайных величин GPD [ править ]

Если U будет равномерно распределена на (0, 1], то

и

Обе формулы получены путем обращения cdf.

В Matlab Statistics Toolbox вы можете легко использовать команду «gprnd» для генерации обобщенных случайных чисел Парето.

GPD как смесь экспоненциально-гамма [ править ]

Случайная величина GPD также может быть выражена как экспоненциальная случайная величина с параметром распределенной скорости гамма.

и

тогда

Однако обратите внимание, что, поскольку параметры для гамма-распределения должны быть больше нуля, мы получаем дополнительные ограничения, которые: должны быть положительными.

Экспоненциальное обобщенное распределение Парето [ править ]

Возведенное в степень обобщенное распределение Парето (exGPD) [ править ]

PDF (экспоненциальное обобщенное распределение Парето) для различных значений и .

Если , , , то распределяется в соответствии с экспоненцируются обобщенным распределение Парето , обозначаемое , .

Функция плотности вероятности (PDF) для , равна

где поддержка для , и для .

Для всех , то становится параметром места. См. Правую панель для PDF, когда форма положительная.

ExGPD имеет конечные моменты всех порядков для всех и .

Дисперсия из как функции . Обратите внимание, что разница зависит только от . Красная пунктирная линия представляет оцененную дисперсию , то есть .

Момент-Производящая функция от IS

где и обозначают бета-функцию и гамма-функцию соответственно.

Ожидаемое значение из , зависит от масштаба и формы параметров, в то время как участвует через функцию дигаммы :

Обратите внимание, что при фиксированном значении для , the играет как параметр местоположения в экспоненциальном обобщенном распределении Парето.

Дисперсия из , зависит от параметра формы только через функцию полигаммы порядка 1 (также называются тригамма-функция ):

На правой панели показано отклонение как функцию от . Обратите внимание на это .

Обратите внимание, что роли параметра масштаба и параметра формы под ним можно интерпретировать раздельно, что может привести к надежной и эффективной оценке, чем при использовании [2] . Роли этих двух параметров связаны друг с другом (по крайней мере, до второго центрального момента); см. формулу дисперсии, в которой участвуют оба параметра.

Оценщик Хилла [ править ]

Предположим, что это наблюдения (не обязательно iid) из неизвестного распределения с тяжелым хвостом, такое, что его распределение хвоста регулярно изменяется с индексом хвоста (следовательно, соответствующий параметр формы равен ). Чтобы быть конкретным, распределение хвоста описывается как

В теории экстремальных значений особый интерес представляет оценка параметра формы , особенно когда он положительный (так называемое распределение с тяжелым хвостом).

Позвольте быть их условной избыточной функцией распределения. Pickands-Balkema-де Хаана теорема (Pickands, 1975; Balkema и де Хаан, 1974) утверждает , что для большого класса , лежащих в основе функции распределения , и большого , хорошо аппроксимируются обобщенное распределением Парето (GPD), который мотивирован пик над порогом (POT) методы оценки : GPD играет ключевую роль в подходе POT.

Известным оценщиком, использующим методологию POT, является оценщик Хилла . Техническая формулировка оценки Хилла выглядит следующим образом. Для , записей на -й наибольшее значение . Затем, в этих обозначениях, оценка Хилла (см. Стр. 190 ссылки 5 Эмбрехтса и др. [3] ), основанная на статистике высшего порядка, определяется как

На практике оценщик Хилла используется следующим образом. Сначала вычислите оценку для каждого целого числа , а затем постройте упорядоченные пары . Затем выберите из набора оценок Хилла, которые примерно постоянны по отношению к : эти стабильные значения рассматриваются как разумные оценки для параметра формы . Если iid, то оценка Хилла является последовательной оценкой для параметра формы [4] .

Обратите внимание, что оценщик Хилла использует логарифмическое преобразование для наблюдений . (Оценка Пиканда также использовала логарифмическое преобразование, но немного другим способом [5] .)

См. Также [ править ]

  • Распределение заусенцев
  • Распределение Парето
  • Обобщенное распределение экстремальных значений
  • Экспоненциальное обобщенное распределение Парето
  • Теорема Пикандса – Балкемы – де Хаана.

Ссылки [ править ]

  1. ^ Коулз, Стюарт (2001-12-12). Введение в статистическое моделирование экстремальных значений . Springer. п. 75. ISBN 9781852334598.
  2. ^ Даргахи-Noubary, GR (1989). «Оценка хвоста: улучшенный метод». Математическая геология . 21 (8): 829–842. DOI : 10.1007 / BF00894450 . S2CID 122710961 . 
  3. ^ Хоскинг, JRM; Уоллис, младший (1987). "Параметр и квантильная оценка для обобщенного распределения Парето". Технометрика . 29 (3): 339–349. DOI : 10.2307 / 1269343 . JSTOR 1269343 . 
  4. ^ Дэвисон, AC (1984-09-30). «Моделирование превышения высоких пороговых значений с помощью приложения» . Ин де Оливейра, Дж. Тьяго (ред.). Статистические экстремумы и приложения . Kluwer. п. 462. ISBN. 9789027718044.
  5. ^ Embrechts, Пол; Клюппельберг, Клаудиа ; Микош, Томас (1997-01-01). Моделирование экстремальных событий для страхования и финансов . п. 162. ISBN. 9783540609315.

Дальнейшее чтение [ править ]

  • Пикандс, Джеймс (1975). «Статистический вывод с использованием статистики крайнего порядка» . Анналы статистики . 3 с : 119–131. DOI : 10.1214 / AOS / 1176343003 .
  • Balkema, A .; Де Хаан, Лоренс (1974). «Остаточное время жизни в преклонном возрасте» . Анналы вероятности . 2 (5): 792–804. DOI : 10.1214 / AOP / 1176996548 .
  • Ли, Сеюн; Ким, JHK (2018). «Экспоненциальное обобщенное распределение Парето: свойства и приложения к теории экстремальных значений». Коммуникации в статистике - теория и методы . 0 (8): 1–25. arXiv : 1708.01686 . DOI : 10.1080 / 03610926.2018.1441418 . S2CID  88514574 .
  • Н.Л. Джонсон; С. Коц; Н. Балакришнан (1994). Непрерывные одномерные распределения Том 1, второе издание . Нью-Йорк: Вили. ISBN 978-0-471-58495-7. Глава 20, Раздел 12: Обобщенные распределения Парето.
  • Барри С. Арнольд (2011). «Глава 7: Парето и обобщенные распределения Парето» . В Duangkamon Chotikapanich (ред.). Моделирование распределений и кривых Лоренца . Нью-Йорк: Спрингер. ISBN 9780387727967.
  • Арнольд, Британская Колумбия; Лагуна, Л. (1977). Об обобщенных распределениях Парето с приложениями к данным о доходах . Эймс, Айова: Государственный университет Айовы, факультет экономики.

Внешние ссылки [ править ]

  • Mathworks: обобщенное распределение Парето