Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Теория экстремальных значений используется для моделирования риска экстремальных, редких событий, таких как Лиссабонское землетрясение 1755 года .

Теория экстремальных значений или экстремальный стоимостный анализ ( EVA ) является филиалом статистики , связанной с экстремальными отклонениями от средней части вероятностных распределений . Он стремится оценить по заданной упорядоченной выборке заданной случайной величины вероятность событий, которые являются более экстремальными, чем любые ранее наблюдаемые. Анализ предельных значений широко используется во многих дисциплинах, таких как проектирование конструкций , финансы, науки о Земле , прогнозирование дорожного движения и инженерная геология . Например, EVA может использоваться в области гидрологии.для оценки вероятности необычно большого наводнения, такого как 100-летнее наводнение . Кроме того , для конструкции волнолома , прибрежное инженер будет стремиться оценить 50-летнюю волну и разработать структуру соответственно.

Анализ данных [ править ]

Для практического анализа экстремальных значений существуют два подхода.

Первый метод основан на получении ряда максимумов (минимумов) блоков в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), создавая «Годовой ряд максимальных значений» (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом «пик превышения порога» [1] (POT).

Для данных AMS анализ может частично опираться на результаты теоремы Фишера – Типпета – Гнеденко , в результате чего для подгонки выбирается обобщенное распределение экстремальных значений . [2] [3] Однако на практике для выбора между более широким диапазоном распределений применяются различные процедуры. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от общего распределения экстремальных значений (GEVD).[4]

Для данных POT анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе для размера превышений.

Распространенным предположением для первого является распределение Пуассона с обобщенным распределением Парето , используемым для превышений. Хвост фитинг может быть основан на Pickands-Balkema-де Хаана теорема . [5] [6]

Новак [7] резервирует термин «метод POT» для случая, когда порог не является случайным, и отличает его от случая, когда речь идет о превышении случайного порога.

Приложения [ править ]

Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:

  • Экстремальные наводнения ; Размер причудливых волн
  • Вспышки торнадо [8]
  • Максимальные размеры экологических популяций [9]
  • Побочные эффекты лекарств (например, Ксимелагатрана )
  • Суммы крупных страховых убытков
  • Риски капитала ; Ежедневный рыночный риск
  • Мутационные события в процессе эволюции
  • Крупные лесные пожары [10]
  • Экологические нагрузки на конструкции [11]
  • Оцените самое быстрое время, в течение которого люди способны пробежать 100 метров в спринте [12] и результаты в других спортивных дисциплинах. [13] [14]
  • Отказы трубопроводов из-за точечной коррозии .
  • Аномальный сетевой трафик ИТ, не позволяющий злоумышленникам получить доступ к важным данным
  • Анализ безопасности дорожного движения [15] [16]
  • Беспроводная связь [17]
  • Эпидемии [18]

История [ править ]

Теория экстремальных значений была основана Леонардом Типпетом (1902–1985). Типпет работал в Британской ассоциации исследований хлопковой промышленности , где работал над тем, чтобы сделать хлопковые нити более прочными. В своих исследованиях он понял, что прочность нити контролируется прочностью ее самых слабых волокон. С помощью Р. А. Фишера Типпет получил три асимптотических предела, описывающих распределения экстремумов в предположении независимых переменных. Эмиль Джулиус Гамбель систематизировал эту теорию в своей книге 1958 года « Статистика крайностей» , включая распределения Гамбеля.носят его имя. Эти результаты могут быть расширены, чтобы учесть небольшие корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Один из классов универсальности, представляющий особый интерес, - это лог-коррелированные поля , где корреляции логарифмически затухают с расстоянием.

Резюме исторически важных публикаций, относящихся к теории экстремальных значений, можно найти в статье Список публикаций по статистике .

Теория одномерной [ править ]

Позвольте быть последовательность независимых и одинаково распределенных случайных величин с кумулятивной функцией распределения F и обозначить максимум.

Теоретически точное распределение максимума может быть получено:

Связанная индикаторная функция - это процесс Бернулли с вероятностью успеха, которая зависит от величины экстремального события. Таким образом, количество экстремальных событий в испытаниях следует биномиальному распределению, а количество испытаний, пока событие не произойдет, следует геометрическому распределению с ожидаемым значением и стандартным отклонением того же порядка .

На практике у нас может не быть функции распределения, но теорема Фишера – Типпета – Гнеденко дает асимптотический результат. Если существуют последовательности констант и такие, что

как тогда

где зависит от формы хвоста распределения. В нормированном состоянии G принадлежит одному из следующих семейств невырожденных распределений :

Закон Вейбулла : когда распределение имеет легкий хвост с конечной верхней границей. Также известен как Тип 3.

Закон Гамбеля : когда распределение имеет экспоненциальный хвост. Также известен как Тип 1

Закон Фреше : когда распределение имеет тяжелый хвост (включая полиномиальное затухание). Также известен как Тип 2.

Во всех случаях .

Многомерная теория [ править ]

Теория экстремальных значений более чем одной переменной ставит дополнительные проблемы, которые необходимо решить. Одна из возникающих проблем заключается в том, что нужно указать, что составляет экстремальное событие. [19] Хотя это просто в одномерном случае, нет однозначного способа сделать это в многомерном случае. Основная проблема состоит в том, что, хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.

Например, в одномерном случае, учитывая набор наблюдений, легко найти наиболее экстремальное событие, просто взяв максимум (или минимум) из наблюдений. Однако в двумерном случае, учитывая набор наблюдений , не сразу понятно, как найти наиболее экстремальное событие. Предположим, что значения были измерены в определенное время, а значения - в более позднее. Какое из этих событий можно было бы считать более экстремальным? На этот вопрос нет универсального ответа.

Еще одна проблема в многомерном случае состоит в том, что предельная модель не так полно предписана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точный вид которой не предписывается теорией. Однако эта функция должна подчиняться определенным ограничениям. [20] [21]

В качестве примера применения двумерная теория экстремальных значений была применена к исследованию океана. [19] [22]

См. Также [ править ]

  • Чрезвычайный риск
  • Экстремальные погодные условия
  • Теорема Фишера – Типпета – Гнеденко.
  • Обобщенное распределение экстремальных значений
  • Теория больших отклонений
  • Выброс
  • Распределение Парето
  • Теорема Пикандса – Балкемы – де Хаана.
  • Редкие события
  • Распределение Вейбулла

Примечания [ править ]

  1. ^ Leadbetter, MR (1991). «На основе моделирования« Пики выше порога »». Статистика и вероятностные письма . 12 (4): 357–362. DOI : 10.1016 / 0167-7152 (91) 90107-3 .
  2. ^ Фишер и Типпетт (1928)
  3. ^ Гнеденко (1943)
  4. ^ Embrechts, Klüppelberg и Mikosch (1997)
  5. ^ Пикандс (1975)
  6. ^ Balkema и де Хаана (1974)
  7. Новак (2011)
  8. ^ | doi = 10.1126 / science.aah7393
  9. ^ Батт, Райан Д .; Карпентер, Стивен Р .; Айвз, Энтони Р. (март 2017 г.). «Экстремальные явления во временных рядах экосистемы озера» . Письма по лимнологии и океанографии . 2 (3): 63. DOI : 10.1002 / lol2.10037 .
  10. ^ Alvardo (1998, с.68)
  11. ^ Макконен (2008)
  12. ^ JHJ Einmahl & SGWR Smeets (2009), «Абсолютные 100-метровые мировые рекорды с помощью теории экстремальных значений» (PDF) , дискуссионный документ CentER, Тилбургский университет , 57 , архивирование из оригинала (PDF) 12 марта 2016 г. , извлечено в 2009 г. -08-12 CS1 maint: uses authors parameter (link)
  13. ^ Д. Gembris, J.Taylor & Д. Сьютер (2002), "Тенденции и случайные флуктуации в легкой атлетике", Природа , 417 (6888): 506, Bibcode : 2002Natur.417..506G , DOI : 10.1038 / 417506a , ЛВП : 2003/25362 , PMID 12037557 , S2CID 13469470  CS1 maint: uses authors parameter (link)
  14. ^ D. Gembris, J.Taylor & D. Сутер (2007), "Эволюция спортивных записей: статистические эффектов по сравнению с реальными улучшениями", Журнал прикладной статистики , 34 (5): 529-545, DOI : 10,1080 / 02664760701234850 , ЛВП : 2003/25404 , S2CID 55378036 CS1 maint: uses authors parameter (link)
  15. ^ Сонгчитрукса, П .; Тарко, А.П. (2006). «Теоретико-экстремальный подход к оценке безопасности». Анализ и предотвращение аварий . 38 (4): 811–822. DOI : 10.1016 / j.aap.2006.02.003 . PMID 16546103 . 
  16. ^ Орсини, Ф .; Gecchele, G .; Гастальди, М .; Росси, Р. (2019). «Предсказание столкновений на круговых перекрестках: сравнительное исследование подходов теории экстремальных значений». Transportmetrica A: Транспортная наука . 15 (2): 556–572. DOI : 10.1080 / 23249935.2018.1515271 . S2CID 158343873 . 
  17. ^ CG Tsinos, Ф. Foukalas, Т. Хаттаб и Л. Лай, « На выбор канала для несущей агрегирования систем .» IEEE Transactions on Communications, vol. 66, нет. 2 февраля 2018 г.) 808-818.
  18. ^ Вонг, Феликс; Коллинз, Джеймс Дж. (02.11.2020). «Доказательства того, что сверхраспространение коронавируса неуклонно» . Труды Национальной академии наук . DOI : 10.1073 / pnas.2018490117 . ISSN 0027-8424 . PMID 33139561 .  
  19. ^ a b Morton, ID; Бауэрс, Дж. (Декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Прикладные исследования океана . 18 (6): 303–317. DOI : 10.1016 / s0141-1187 (97) 00007-2 . ISSN 0141-1187 . 
  20. ^ Beirlant, Ян; Goegebeur, Юрий; Teugels, Jozef; Сегерс, Йохан (27 августа 2004 г.). Статистика крайностей: теория и приложения . Серия Уайли по вероятности и статистике. Чичестер, Великобритания: John Wiley & Sons, Ltd. DOI : 10.1002 / 0470012382 . ISBN 9780470012383.
  21. ^ Коулз, Стюарт (2001). «Введение в статистическое моделирование экстремальных значений». Серии Спрингера в статистике . DOI : 10.1007 / 978-1-4471-3675-0 . ISBN 978-1-84996-874-4. ISSN  0172-7397 .
  22. ^ Zachary, S .; Feld, G .; Ward, G .; Вольфрам, Дж. (Октябрь 1998 г.). «Многомерная экстраполяция в морской среде». Прикладные исследования океана . 20 (5): 273–295. DOI : 10.1016 / s0141-1187 (98) 00027-3 . ISSN 0141-1187 . 

Ссылки [ править ]

  • Abarbanel, H .; Кунин, С .; Levine, H .; MacDonald, G .; Rothaus, О. (январь 1992), "Статистика экстремальных событий с приложением к климату" (PDF) , JASON , JSR-90-30S , извлекаются 2015-03-03
  • Альварадо, Эрнесто; Сандберг, Дэвид V .; Пикфорд, Стюарт Г. (1998), «Моделирование больших лесных пожаров как экстремальных явлений» (PDF) , Northwest Science , 72 : 66–75, заархивировано из оригинала (PDF) 26 февраля 2009 г. , извлечено из архива 2009-02- 06
  • Balkema, A .; Лоренса (1974), "Остаточное время жизни в преклонном возрасте", Анналы вероятности , 2 (5): 792-804, DOI : 10,1214 / АОП / 1176996548 , JSTOR  2959306
  • Бурри К.В. (1975). Статистические методы в прикладной науке . Джон Вили и сыновья.
  • Кастильо Э. (1988) Теория экстремальных ценностей в инженерии. Academic Press, Inc. Нью-Йорк. ISBN 0-12-163475-2 . 
  • Кастильо, Э., Хади, А.С., Балакришнан, Н. и Сарабия, Дж. М. (2005) Экстремальные и связанные модели с приложениями в технике и науке, Серия Wiley по вероятности и статистике Wiley, Хобокен, Нью-Джерси. ISBN 0-471-67172-X . 
  • Коулз С. (2001) Введение в статистическое моделирование экстремальных значений . Спрингер, Лондон.
  • Embrechts P., Klüppelberg C. и Mikosch T. (1997) Моделирование экстремальных событий для страхования и финансов . Берлин: Весенний Верлаг
  • Фишер, РА; Типпетт, LHC (1928), «Предельные формы частотного распределения самого большого и самого маленького члена выборки», Proc. Camb. Фил. Soc. , 24 (2): 180-190, Bibcode : 1928PCPS ... 24..180F , DOI : 10,1017 / s0305004100015681
  • Гнеденко Б. В. (1943), "Sur ла распределение Limite их терм максимум сГип серия aleatoire", Анналы математики , 44 (3): 423-453, DOI : 10,2307 / 1968974 , JSTOR  1968974
  • Gumbel, EJ (1935), "Les Valeurs крайностями дез распределения Statistiques" (PDF) , Annales де l'Institut Анри Пуанкаре , 5 (2): 115-158 , извлекаться 2009-04-01
  • Гамбель, EJ (2004) [1958], Статистика крайностей , Минеола, Нью-Йорк: Довер, ISBN 978-0-486-43604-3
  • Makkonen, Л. (2008), "Проблемы анализа экстремальных значений", структурная безопасность , 30 (5): 405-419, DOI : 10.1016 / j.strusafe.2006.12.001
  • Лидбеттер, М. Р. (1991), "О качестве основы для 'Пикса над порогом' моделирование", Статистика и вероятностной Letters , 12 (4): 357-362, да : 10,1016 / 0167-7152 (91) 90107-3
  • Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1982) Крайности и связанные свойства случайных последовательностей и процессов. Спрингер-Верлаг, Нью-Йорк.
  • Lindgren, G .; Рутцен, Х. (1987), «Экстремальные значения: теория и технические приложения», Scandinavian Journal of Statistics, Theory and Applications , 14 : 241–279
  • Новак С.Ю. (2011) Методы экстремальной ценности с приложениями к финансам . Chapman & Hall / CRC Press, Лондон. ISBN 978-1-4398-3574-6 
  • Pickands, J (1975), "Статистический вывод с использованием статистики экстремальных порядка", Летопись статистики , 3 : 119-131, DOI : 10,1214 / AOS / 1176343003

Программное обеспечение [ править ]

  • Статистика экстремальных значений в R - Пакеты для статистики экстремальных значений в R
  • ExtremeStats.jl - Статистика экстремальных значений в Юлии
  • Extremes.jl - статистика экстремальных значений в Julia

Внешние ссылки [ править ]

  • Теория экстремальных ценностей может спасти вашу шею Простое нематематическое введение (pdf)
  • Исходный код для стационарного и нестационарного анализа экстремальных значений Калифорнийский университет, Ирвин
  • Этапы применения теории экстремальной ценности к финансам: обзор
  • Les valeurs extrêmes des distributions statistiques Полнотекстовый доступ к конференциям, проведенным Э. Дж. Гамбелем в 1933–1934 годах, на французском языке (pdf)