Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , L-моменты представляют собой последовательность статистических данных , используемых для обобщения формы распределения вероятностей . [1] [2] [3] [4] Они являются линейными комбинациями из порядковых статистик ( L-статистика ) , аналогичных обычные моменты , и могут быть использованы для вычисления величин , аналогичных стандартного отклонение , перекос и эксцесс , называемого L-шкала , L-асимметрия и L-эксцесс соответственно (L-среднее идентично общепринятому среднему ). Стандартизированные L-моменты называются отношениями L-моментов.и аналогичны стандартным моментам . Как и для обычных моментов, теоретическое распределение имеет набор L-моментов заселенности. L-моменты выборки могут быть определены для выборки из совокупности и могут использоваться в качестве оценок L-моментов совокупности.

L-моменты населения [ править ]

Для случайной величины X , то г - го населения Л-момент [1]

где X k: n обозначает статистику k- го порядка ( k- е наименьшее значение) в независимой выборке размера n из распределения X и обозначает ожидаемое значение . В частности, первые четыре L-момента популяции равны

Обратите внимание, что коэффициенты k -го L-момента такие же, как в k-м члене биномиального преобразования , используемом в конечной разности k-го порядка (конечный аналог производной).

Первые два из этих L-моментов имеют условные названия:

Шкала L равна половине средней разницы . [5]

Примеры L-моментов [ править ]

L-моменты выборки могут быть вычислены как L-моменты совокупности выборки, суммируя по подмножествам r -элементов выборки, следовательно, усредняя путем деления на биномиальный коэффициент :

Группировка их по статистике порядка подсчитывает количество способов, которыми элемент выборки n -элементов может быть j- м элементом подмножества r -элементов, и дает формулы приведенной ниже формы. Прямые оценки для первых четырех L-моментов в конечной выборке из n наблюдений: [6]

где х ( я ) это я го порядка статистики и является биномиальный коэффициент . Выборочные L-моменты также могут быть определены косвенно в терминах моментов , взвешенных по вероятности , [1] [7] [8], что приводит к более эффективному алгоритму их вычисления. [6] [9]

Соотношения L-моментов [ править ]

Набор соотношений L-моментов или масштабированных L-моментов определяется следующим образом:

Наиболее полезны из них , называется L-перекос , и , то L-эксцесс .

Отношения L-моментов лежат в интервале (–1, 1). Можно найти более точные границы для некоторых конкретных соотношений L-моментов; в частности, L-эксцесс лежит в [-, 1), и

[1]

Величина, аналогичная коэффициенту вариации , но основанная на L-моментах, также может быть определена: она называется «коэффициентом L-вариации» или «L-CV». Для неотрицательной случайной величины он находится в интервале (0,1) [1] и идентичен коэффициенту Джини . [10]

Связанные количества [ править ]

L-моменты - это статистические величины, которые получены из моментов, взвешенных по вероятности [11] (PWM), которые были определены ранее (1979). [7] ШИМ используются для эффективной оценки параметров распределений expressable в обратной форме , такой как Gumbel , [8] Тьюки, а Wakeby распределения.

Использование [ править ]

Есть два общих способа использования L-моментов, в обоих случаях аналогично обычным моментам:

  1. В качестве сводной статистики для данных.
  2. Вывести оценки параметров вероятностных распределений , применяя метод моментов к L-моментам, а не к обычным моментам.

Помимо стандартных моментов, последнее (оценка) чаще выполняется с использованием методов максимального правдоподобия ; однако использование L-моментов дает ряд преимуществ. В частности, L-моменты более устойчивы, чем обычные моменты, а для существования более высоких L-моментов требуется только, чтобы случайная величина имела конечное среднее значение. Одним из недостатков соотношений L-моментов для оценки является их обычно меньшая чувствительность. Например, распределение Лапласа имеет эксцесс в 6 и слабые экспоненциальные хвосты, но большее 4-е отношение L-моментов, чем, например, распределение Стьюдента с df = 3, которое имеет бесконечный эксцесс и гораздо более тяжелые хвосты.

В качестве примера рассмотрим набор данных с несколькими точками данных и одним удаленным значением данных. Если взять обычное стандартное отклонение этого набора данных, на него будет сильно влиять этот единственный пункт: однако, если взять L-шкалу, она будет гораздо менее чувствительна к этому значению данных. Следовательно, L-моменты гораздо более значимы при работе с выбросами в данных, чем обычные моменты. Однако есть и другие методы, которые лучше подходят для достижения еще большей надежности, чем просто замена моментов L-моментами. Одним из примеров этого является использование L-моментов в качестве сводной статистики в теории экстремальных значений  (EVT). Это приложение показывает ограниченную устойчивость L-моментов, то есть L-статистика не является устойчивой статистикой., поскольку одно экстремальное значение может отбросить их, но поскольку они являются только линейными (не статистикой более высокого порядка ), они меньше подвержены влиянию экстремальных значений, чем обычные моменты.

Еще одно преимущество L-моментов над обычными моментами состоит в том, что для их существования требуется только конечное среднее значение случайной величины, поэтому L-моменты существуют, даже если более высокие традиционные моменты не существуют (например, для t-распределения Стьюдента с низкими степенями свобода ). Кроме того, требуется конечная дисперсия для того, чтобы стандартные ошибки оценок L-моментов были конечными. [1]

Некоторые случаи появления L-моментов в статистической литературе включают книгу Дэвида и Нагараджи (2003, раздел 9.9) [12] и ряд статей. [10] [13] [14] [15] [16] [17] Сообщалось о ряде благоприятных сравнений L-моментов с обычными моментами. [18] [19]

Значения для некоторых распространенных дистрибутивов [ править ]

В таблице ниже приведены выражения для первых двух L-моментов и численные значения первых двух отношений L-моментов некоторых общих непрерывных распределений вероятностей с постоянными отношениями L-моментов. [1] [5] Более сложные выражения были получены для некоторых дальнейших распределений, для которых отношения L-моментов изменяются в зависимости от одного или нескольких параметров распределения, включая логнормальный , гамма , обобщенное Парето , обобщенное экстремальное значение и обобщенное логистические распределения. [1]

Обозначения для параметров каждого распределения такие же, как и в связанной статье. В выражении для среднего значения распределения Гумбеля γ - это постоянная Эйлера – Маскерони 0,57721 ....

Расширения [ править ]

Урезанные L-моменты - это обобщения L-моментов, которые придают нулевой вес экстремальным наблюдениям. Поэтому они более устойчивы к наличию выбросов, и в отличие от L-моментов они могут быть хорошо определены для распределений, для которых не существует среднего, таких как распределение Коши . [20]

См. Также [ править ]

  • L-оценка

Ссылки [ править ]

  1. ^ Б с д е е г ч Хоскинга, JRM (1990). «L-моменты: анализ и оценка распределений с использованием линейных комбинаций порядковых статистик». Журнал Королевского статистического общества, Series B . 52 (1): 105–124. JSTOR  2345653 .
  2. ^ Хоскинг, JRM (1992). «Моменты или L-моменты? Пример сравнения двух мер формы распределения». Американский статистик . 46 (3): 186–189. DOI : 10.2307 / 2685210 . JSTOR 2685210 . 
  3. ^ Хоскинг, JRM (2006). «О характеристике распределений их L-моментами». Журнал статистического планирования и вывода . 136 : 193–198. DOI : 10.1016 / j.jspi.2004.06.004 .
  4. ^ Asquith, WH (2011) Распределительный анализ со статистикой L-моментов с использованием среды R для статистических вычислений , Create Space Independent Publishing Platform, [print-on-demand], ISBN 1-463-50841-7 
  5. ^ а б Джонс, MC (2002). «Простейшее студенческое распределение». Журнал Королевского статистического общества, серия D . 51 (1): 41–49. DOI : 10.1111 / 1467-9884.00297 . JSTOR 3650389 . 
  6. ^ а б Ван, QJ (1996). "Прямые выборочные оценки L моментов". Исследование водных ресурсов . 32 (12): 3617–3619. DOI : 10.1029 / 96WR02675 .
  7. ^ a b Гринвуд, Дж. А; Landwehr, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно-взвешенные моменты: определение и связь с параметрами нескольких распределений, выраженных в обратной форме» (PDF) . Исследование водных ресурсов . 15 (5): 1049–1054. DOI : 10.1029 / WR015i005p01049 .
  8. ^ а б Ландвер, JM; Маталас, Северная Каролина; Уоллис, младший (1979). «Вероятностно взвешенные моменты по сравнению с некоторыми традиционными методами оценки параметров и квантилей Гамбеля». Исследование водных ресурсов . 15 (5): 1055–1064. DOI : 10.1029 / WR015i005p01055 .
  9. ^ L Moments , 6 января 2006 г. , получено 19 января 2013 г. Документация NIST Dataplot
  10. ^ a b Valbuena, R .; Мальтамо, М .; Mehtätalo, L .; Пакален, П. (2017). «Ключевые структурные особенности бореальных лесов могут быть обнаружены непосредственно с использованием L-моментов из данных, полученных с помощью лидара» . Дистанционное зондирование окружающей среды . 194 : 437–446. DOI : 10.1016 / j.rse.2016.10.024 .
  11. ^ Хоскинг, JRM; Уоллис, младший (2005). Региональный частотный анализ: подход, основанный на L-моментах . Издательство Кембриджского университета. п. 3. ISBN 978-0521019408. Проверено 22 января 2013 года .
  12. ^ Дэвид, штат Джорджия; Нагараджа, HN (2003). Статистика заказов (3-е изд.). Вайли. ISBN 978-0-471-38926-2.
  13. ^ Серфлинг, R .; Сяо, П. (2007). "Вклад в многомерные L-моменты: матрицы L-комментариев". Журнал многомерного анализа . 98 (9): 1765–1781. CiteSeerX 10.1.1.62.4288 . DOI : 10.1016 / j.jmva.2007.01.008 . 
  14. ^ Delicado, P .; Гория, М.Н. (2008). «Небольшая выборка сравнения методов максимального правдоподобия, моментов и L-моментов для асимметричного экспоненциального распределения мощности». Вычислительная статистика и анализ данных . 52 (3): 1661–1673. DOI : 10.1016 / j.csda.2007.05.021 .
  15. ^ Alkasasbeh, МР; Ракаб, МЗ (2009). «Оценка параметров обобщенного логистического распределения: сравнительное исследование». Статистическая методология . 6 (3): 262–279. DOI : 10.1016 / j.stamet.2008.10.001 .
  16. ^ Джонс, MC (2004). «О некоторых выражениях для дисперсии, ковариации, асимметрии и L-моментов». Журнал статистического планирования и вывода . 126 (1): 97–106. DOI : 10.1016 / j.jspi.2003.09.001 .
  17. ^ Джонс, MC (2009). «Распределение Кумарасвами: распределение бета-типа с некоторыми преимуществами управляемости». Статистическая методология . 6 (1): 70–81. DOI : 10.1016 / j.stamet.2008.04.001 .
  18. ^ Ройстон, П. (1992). «Какие меры асимметрии и эксцесса лучше всего?». Статистика в медицине . 11 (3): 333–343. DOI : 10.1002 / sim.4780110306 .
  19. ^ Ульрих, TJ; Velis, DR; Вудбери, AD; Сакки, доктор медицины (2000). «L-моменты и C-моменты». Стохастические исследования окружающей среды и оценка рисков . 14 (1): 50–68. DOI : 10.1007 / s004770050004 .
  20. ^ Эламир, Эльсайед AH; Сехулт, Аллан Х. (2003). «Обрезанные L-моменты». Вычислительная статистика и анализ данных . 43 (3): 299–314. DOI : 10.1016 / S0167-9473 (02) 00250-5 .

Внешние ссылки [ править ]

  • Страница L-моментов Джонатан Р.М. Хоскинг, IBM Research
  • L моменты. Справочное руководство по датаплоту , т. 1, вспомогательная глава. Национальный институт стандартов и технологий , 2006 г. Проверено 25 мая 2010 г.