Из Википедии, бесплатной энциклопедии
  (Перенаправлено из дистрибутива Skewed )
Перейти к навигации Перейти к поиску

Пример распределения с неотрицательной (положительной) асимметрией. Эти данные взяты из экспериментов по выращиванию ростков пшеницы.

В теории вероятностей и статистике , перекос является мерой асимметрии распределения вероятностей в виде реальной значной случайной величины около ее среднего. Значение асимметрии может быть положительным, нулевым, отрицательным или неопределенным.

Для унимодального распределения отрицательный перекос обычно указывает, что хвост находится в левой части распределения, а положительный перекос указывает, что хвост находится справа. В случаях, когда один хвост длинный, а другой толстый, перекос не подчиняется простому правилу. Например, нулевое значение означает, что хвосты по обе стороны от среднего в целом уравновешиваются; это верно для симметричного распределения, но также может быть верно для асимметричного распределения, когда один хвост длинный и тонкий, а другой короткий, но толстый.

Введение [ править ]

Рассмотрим два распределения на рисунке чуть ниже. На каждом графике значения на правой стороне распределения сужаются по-разному от значений на левой стороне. Эти сужающиеся стороны называются хвостами , и они предоставляют визуальные средства для определения того, какой из двух видов асимметрии имеет распределение:

  1. отрицательный перекос : левый хвост длиннее; масса раздачи сосредоточена в правой части рисунка. Распределение называется левой перекос , левый хвост , или перекос влево , несмотря на точто сама криваяпредставляется, искажены или наклоняясь вправо; left вместо этого относится к вытянутому левому хвосту и, часто, среднее значение смещено влево от типичного центра данных. Распределение с наклоном влево обычно выглядит каккривая с наклоном вправо . [1]
  2. положительный перекос : правый хвост длиннее; масса раздачи сосредоточена в левой части рисунка. Распределение называется скошенным вправо , с правым хвостом или смещением вправо , несмотря на то, что сама кривая кажется смещенной или наклоненной влево; Право вместо этого относится к вытянутому правому хвосту и, часто, среднему значению, смещенному вправо от типичного центра данных. Распределение с наклоном вправо обычно выглядит каккривая с наклоном влево . [1]

Диаграммы отрицательного и положительного перекоса (английский) .svg

Асимметрия в ряду данных иногда может наблюдаться не только графически, но и при простой проверке значений. Например, рассмотрим числовую последовательность (49, 50, 51), значения которой равномерно распределены вокруг центрального значения 50. Мы можем преобразовать эту последовательность в отрицательно искаженное распределение, добавив значение намного ниже среднего, что, вероятно, является отрицательный выброс , например (40, 49, 50, 51). Следовательно, среднее значение последовательности становится 47,5, а медиана - 49,5. На основе формулы непараметрического перекоса , определяемого как перекос отрицательный. Точно так же мы можем сделать последовательность положительно искаженной, добавив значение, намного превышающее среднее значение, которое, вероятно, является положительным выбросом, например (49, 50, 51, 60), где среднее значение равно 52,5, а медиана - 50,5.

Как упоминалось ранее, унимодальное распределение с нулевым значением асимметрии не означает, что это распределение обязательно симметрично. Однако симметричное одномодальное или мультимодальное распределение всегда имеет нулевую асимметрию.

Пример асимметричного распределения с нулевой асимметрией. Этот рисунок служит контрпримером, что нулевая асимметрия не обязательно означает симметричное распределение. (Асимметрия рассчитывалась по моментному коэффициенту асимметрии Пирсона.)

Соотношение среднего и медианы [ править ]

Асимметрия не связана напрямую с соотношением между средним и медианой: распределение с отрицательным перекосом может иметь среднее значение больше или меньше медианы, а также для положительного перекоса. [2]

Общая взаимосвязь среднего и медианы при разно-искаженном унимодальном распределении

В старом понятии непараметрического перекоса , определяются как , где это среднее , является медианой , и представляет собой стандартное отклонение , коэффициент асимметрия определяются в терминах этих отношений: положительный / вправо непараметрические косые означает среднее больше , чем (вправо of) медианы, в то время как отрицательный / непараметрический перекос влево означает, что среднее значение меньше (слева от) медианы. Однако современное определение асимметрии и традиционное непараметрическое определение не всегда имеют один и тот же знак: хотя они совпадают для некоторых семейств распределений, в некоторых случаях они различаются, и их объединение вводит в заблуждение.

Если распределение симметрично , то среднее значение равно медиане, и распределение имеет нулевую асимметрию. [3] Если распределение одновременно симметричное и одномодальное , то среднее значение = медиана = мода . Это случай подбрасывания монеты или серии 1,2,3,4, ... Обратите внимание, однако, что обратное неверно в целом, т.е. нулевая асимметрия не означает, что среднее значение равно медиане.

В статье журнала 2005 г. указывается: [2]

Многие учебники учат практическому правилу, согласно которому среднее значение находится справа от медианы при наклоне вправо и слева от медианы при наклоне слева. Это правило с удивительной частотой не работает. Он может потерпеть неудачу в мультимодальных распределениях или в распределениях, где один хвост длинный, а другой тяжелый . Однако чаще всего правило не работает в дискретных распределениях, где площади слева и справа от медианы не равны. Такие распределения не только противоречат учебным отношениям между средним, медианой и перекосом, они также противоречат интерпретации медианы в учебниках.

Распределение взрослых жителей по домохозяйствам США

Например, в распределении взрослых жителей по домохозяйствам в США перекос вправо. Однако, поскольку в большинстве случаев меньше или равно моду, которая также является медианной, среднее значение находится в более тяжелом левом хвосте. В результате практическое правило, согласно которому среднее значение находится справа от медианы при правом перекосе, не удалось. [2]

Определение [ править ]

Моментный коэффициент асимметрии Пирсона [ править ]

Асимметрия случайной величины X является третьим стандартизированным моментом , определяемым как: [4] [5]

где μ - среднее значение, σ - стандартное отклонение , E - оператор математического ожидания , μ 3 - третий центральный момент , а κ t - t -ые кумулянты . Это иногда называют коэффициентом Пирсона момента асимметричности , [5] или просто коэффициентом моментного перекоса , [4] , но не следует путать с другими асимметрии статистикой Пирсона (см . Ниже) Последнее равенство выражает асимметрию через отношение третьего кумулянта κ 3в 1.5 степени второго кумулянта κ 2 . Это аналогично определению эксцесса как четвертого кумулянта, нормализованного квадратом второго кумулянта. Асимметрию также иногда обозначают Skew [ X ].

Если σ конечно, μ тоже конечно, и асимметрия может быть выражена через нецентральный момент E [ X 3 ], расширив предыдущую формулу,

Примеры [ править ]

Асимметрия может быть бесконечной, как если бы

где третьи кумулянты бесконечны, или когда

где третий кумулянт не определен.

Примеры распределений с конечной асимметрией включают следующее.

  • Нормальное распределение и любое другое симметричное распределение с конечным третьим моментом имеют асимметрию-
  • Половины нормальное распределение имеет асимметрию чуть ниже 1
  • Экспоненциальное распределение имеет асимметрию 2
  • Распределение логнормального может иметь асимметрию любого положительного значения, в зависимости от его параметров

Пример асимметрии [ править ]

Для выборки из n значений два естественных метода оценки моментов асимметрии совокупности [6]

и

где - среднее значение выборки , s - стандартное отклонение выборки , m 2 - (смещенный) второй центральный момент выборки , а m 3 - третий центральный момент выборки. [6]

Другое распространенное определение асимметрии выборки - [6] [7]

где - уникальная симметричная несмещенная оценка третьего кумулянта и - симметричная несмещенная оценка второго кумулянта (т. е. выборочная дисперсия ). Этот скорректированный стандартизированный коэффициент момента Фишера – Пирсона является версией, которую можно найти в Excel и нескольких статистических пакетах, включая Minitab , SAS и SPSS . [8]

В предположении , что лежащая в основе случайной величина обычно распространяются, можно показать , что все три отношения , и являются объективными и последовательными оценками асимметрии населения , с , то есть, их распределения сходятся к нормальному распределению со средним 0 и дисперсией 6 ( Фишер, 1930). [6] Таким образом, отклонение асимметрии образца приблизительно для достаточно больших образцов. Точнее, в случайной выборке размера n из нормального распределения [9] [10]

В нормальных выборках имеет меньшую дисперсию из трех оценок, с [6]

Для не-нормальных распределений, , и , как правило , смещены оценки на асимметрии населения ; их ожидаемые значения могут даже иметь знак, противоположный истинной асимметрии. Например, смешанное распределение, состоящее из очень тонких гауссиан с центрами -99, 0,5 и 2 с весами 0,01, 0,66 и 0,33, имеет асимметрию примерно -9,77, но в выборке из 3 имеет ожидаемое значение примерно 0,32, поскольку обычно все три выборки находятся в положительной части распределения, которое искажено в другую сторону.

Приложения [ править ]

Асимметрия - это описательная статистика, которую можно использовать вместе с гистограммой и нормальным графиком квантилей для характеристики данных или распределения.

Асимметрия указывает направление и относительную величину отклонения распределения от нормального распределения.

При выраженной асимметрии стандартные процедуры статистического вывода, такие как доверительный интервал для среднего, будут не только неверными в том смысле, что истинный уровень охвата будет отличаться от номинального (например, 95%) уровня, но они также приведут к неравенству. вероятности ошибок с каждой стороны.

Асимметрия может использоваться для получения приблизительных вероятностей и квантилей распределений (например, стоимости, подверженной риску в финансах) с помощью разложения Корниш-Фишера .

Многие модели предполагают нормальное распределение; т.е. данные симметричны относительно среднего. Нормальное распределение имеет нулевую асимметрию. Но на самом деле точки данных могут не быть идеально симметричными. Итак, понимание асимметрии набора данных показывает, будут ли отклонения от среднего положительными или отрицательными.

K-квадрат тест д'Агостина в это благость, из посадки теста нормальности на основе образца асимметрии и эксцесс образца.

Другие меры асимметрии [ править ]

Сравнение среднего , медианы и моды двух логнормальных распределений с одинаковыми медианами и разными асимметриями.

Были использованы другие меры асимметрии, включая более простые вычисления, предложенные Карлом Пирсоном [11] (не путать с моментным коэффициентом асимметрии Пирсона, см. Выше). Эти другие меры:

Первый коэффициент асимметрии Пирсона (асимметрия режима) [ править ]

Асимметрия моды Пирсона [12] или первый коэффициент асимметрии определяется как

среднее - режим/стандартное отклонение.

Второй коэффициент асимметрии Пирсона (медианная асимметрия) [ править ]

Медианная асимметрия Пирсона или второй коэффициент асимметрии [13] [14] определяется как

3 ( среднее - медиана )/стандартное отклонение.

Это простое кратное непараметрическому перекосу .

Квантильные меры [ править ]

Мера асимметрии Боули (с 1901 г.), [15] [16], также называемая коэффициентом Юла (с 1912 г.) [17] [18] , определяется как:

Числитель - это разница между средним значением верхнего и нижнего квартилей (мера местоположения) и медиана (еще одна мера местоположения), а знаменатель - это полумежквартильный диапазон , который для симметричных распределений является мерой дисперсии MAD .

Другие названия этой меры - мера асимметрии Гальтона [19], индекс Юла – Кендалла [20] и квартильная асимметрия [21].

Более общая формулировка функции асимметрии была описана Groeneveld, RA и Meeden, G. (1984): [22] [23] [24]

где F - кумулятивная функция распределения . Это приводит к соответствующей общей мере асимметрии [23], определяемой как верхняя грань этого показателя в диапазоне 1/2 ≤  u  <1. Другой показатель может быть получен путем интегрирования числителя и знаменателя этого выражения. [22] Функция γ ( u ) удовлетворяет условию −1 ≤  γ ( u ) ≤ 1 и корректно определена, не требуя наличия каких-либо моментов распределения. [22]Показатели асимметрии, основанные на квантилях, на первый взгляд легко интерпретировать, но они часто показывают значительно большие вариации выборки, чем методы, основанные на моментах. Это означает, что часто выборки из симметричного распределения (например, равномерного распределения) случайно имеют большую квантильную асимметрию.

Мера асимметрии Боули - γ ( u ), оцененная при u  = 3/4. Для меры асимметрии Келли используется u = 0,1. [25]

Коэффициент Греневельда и Медена [ править ]

Греневельд и Меден предложили в качестве альтернативной меры асимметрии [22]

где μ - среднее, ν - медиана, | ... | - абсолютное значение , а E () - оператор ожидания. По форме это тесно связано со вторым коэффициентом асимметрии Пирсона .

L-моменты [ править ]

Использование L-моментов вместо моментов обеспечивает меру асимметрии, известную как L-асимметрия. [26]

Асимметрия расстояния [ править ]

Значение асимметрии, равное нулю, не означает, что распределение вероятностей является симметричным. Таким образом, существует потребность в другой мере асимметрии, обладающей этим свойством: такая мера была введена в 2000 году. [27] Она называется асимметрией расстояния и обозначается dSkew. Если X - случайная величина, принимающая значения в d -мерном евклидовом пространстве, X имеет конечное ожидание, X ' является независимой идентично распределенной копией X и обозначает норму в евклидовом пространстве, тогда простая мера асимметрии относительно параметр местоположения θ равен

и dSkew ( X ): = 0 для X  = θ (с вероятностью 1). Асимметрия расстояния всегда находится между 0 и 1, равна 0 тогда и только тогда, когда X диагонально симметрична относительно θ ( X и 2θ− X имеют одинаковое распределение вероятностей), и равна 1 тогда и только тогда, когда X является константой c ( ) с вероятность один. [28] Таким образом, существует простой непротиворечивый статистический тест диагональной симметрии, основанный на асимметрии выборочного расстояния :

Medcouple [ править ]

Medcouple является масштабно-инвариантной надежной мерой асимметрии, с точки пробоя 25%. [29] Это медиана значений функции ядра.

взяты по всем парам таким образом, что , где - медиана выборки . Его можно рассматривать как медианное значение всех возможных мер квантильной асимметрии.

См. Также [ править ]

  • Пик Брэгга
  • Coskewness
  • Эксцесс
  • Параметры формы
  • Скошенное нормальное распределение
  • Риск перекоса

Ссылки [ править ]

Цитаты [ править ]

  1. ^ a b Сьюзан Дин, Барбара Илловски «Описательная статистика: асимметрия и среднее значение, медиана и мода» , веб-сайт Connexions.
  2. ^ a b c фон Хиппель, Пол Т. (2005). «Среднее, медианное и перекос: исправление правила из учебника» . Журнал статистики образования . 13 (2).
  3. ^ «1.3.5.11. Меры асимметрии и эксцесса» . NIST . Проверено 18 марта 2012 года .
  4. ^ a b «Меры формы: асимметрия и эксцесс» , 2008–2016 гг., Стэн Браун, Oak Road Systems
  5. ^ a b моментный коэффициент асимметрии Пирсона, FXSolver.com
  6. ^ а б в г д Джоанес, DN; Гилл, Калифорния (1998). «Сравнение мер асимметрии и эксцесса образца». Журнал Королевского статистического общества, серия D . 47 (1): 183–189. DOI : 10.1111 / 1467-9884.00122 .
  7. ^ Доан, Дэвид П. и Лори Э. Сьюард. «Измерение асимметрии: забытая статистика». Журнал статистики образования 19.2 (2011): 1-18. (Стр.7)
  8. ^ Доун ДП, Сьюард LE (2011) J. Стат Образов 19 (2)
  9. ^ Дункан Крамер (1997) Фундаментальная статистика для социальных исследований. Рутледж. ISBN 9780415172042 (стр. 85) 
  10. ^ Кендалл, MG; Стюарт, А. (1969) Расширенная теория статистики, Том 1: Теория распределения, 3-е издание , Griffin. ISBN 0-85264-141-9 (Пример 12.9) 
  11. ^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 5 июля 2010 года . Проверено 9 апреля 2010 года . CS1 maint: archived copy as title (link)
  12. ^ Вайсштейн, Эрик В. "Асимметрия режима Пирсона" . MathWorld .
  13. ^ Вайсштейн, Эрик В. "Коэффициенты асимметрии Пирсона" . MathWorld .
  14. ^ Доан, Дэвид П .; Сьюард, Лори Э. (2011). "Измерение асимметрии: забытая статистика?" (PDF) . Журнал статистики образования . 19 (2): 1–18. DOI : 10.1080 / 10691898.2011.11889611 .
  15. ^ Bowley, AL (1901). Элементы статистики, PS King & Son, Laondon. Или в более позднем издании: BOWLEY, AL. «Элементы статистики, 4-е издание (Нью-Йорк, Чарльз Скрибнер)» (1920).
  16. ^ Кенни JF и Keeping ES (1962) Математика статистики, Pt. 1, 3-е изд. , Ван Ностранд, (стр. 102).
  17. Yule, Джордж Удны. Введение в теорию статистики. C. Griffin, limited, 1912 год.
  18. ^ Groeneveld, Ричард A (1991). «Подход функции влияния к описанию асимметрии распределения». Американский статистик . 45 (2): 97–102. DOI : 10.2307 / 2684367 . JSTOR 2684367 . 
  19. Перейти ↑ Johnson, NL, Kotz, S & Balakrishnan, N (1994) p. 3 и стр. 40
  20. ^ Уилкс Д.С. (1995) Статистические методы в атмосферных науках , стр. 27. Academic Press. ISBN 0-12-751965-3 
  21. Перейти ↑ Weisstein, Eric W. Skewness . mathworld.wolfram.com . Проверено 21 ноября 2019 .
  22. ^ а б в г Groeneveld, RA; Миден, Г. (1984). «Измерение асимметрии и эксцесса». Статистик . 33 (4): 391–399. DOI : 10.2307 / 2987742 . JSTOR 2987742 . 
  23. ^ а б Макгилливрей (1992)
  24. ^ Хинкли Д. В. (1975) "О энергетических преобразованиях симметрии", Biometrika , 62, 101-111
  25. ^ AWL Pubudu Thilan. «Прикладная статистика I: Глава 5: Меры асимметрии» (PDF) . Университет Рухуны . п. 21.
  26. ^ Хоскинг, JRM (1992). «Моменты или L-моменты? Пример сравнения двух мер формы распределения». Американский статистик . 46 (3): 186–189. DOI : 10.2307 / 2685210 . JSTOR 2685210 . 
  27. ^ Szekely, GJ (2000). «Предельные и постпредельные теоремы для статистики», В: Статистика 21-го века (ред. Р. Р. Рао и Г. Дж. Секели), Деккер, Нью-Йорк, стр. 411–422.
  28. ^ Секели, Дж. Дж. И Мори, Т. Ф. (2001) "Характерная мера асимметрии и ее применение для проверки диагональной симметрии", Коммуникации в статистике - Теория и методы 30/8 и 9, 1633–1639.
  29. ^ Г. Брис; М. Юбер ; А. Струйф (ноябрь 2004 г.). «Надежная мера перекоса». Журнал вычислительной и графической статистики . 13 (4): 996–1017. DOI : 10.1198 / 106186004X12632 .

Источники [ править ]

  • Джонсон, Нидерланды; Коц, S; Балакришнан, Н. (1994). Непрерывные одномерные распределения . 1 (2-е изд.). Вайли. ISBN 0-471-58495-9.
  • MacGillivray, HL (1992). «Свойства формы семейств g- и h- и Джонсона». Коммуникации в статистике - теория и методы . 21 (5): 1244–1250. DOI : 10.1080 / 03610929208830842 .
  • Премаратне, Г., Бера, АК (2001). Корректировка тестов на асимметрию и эксцесс для неправильных характеристик распределения. Рабочий документ № 01-0116, Иллинойсский университет. Готовится к публикации в Comm in Statistics, Simulation and Computing. 1-15 2016 г.
  • Премаратне, Г., Бера, АК (2000). Моделирование асимметрии и чрезмерного эксцесса в данных возврата запасов. Рабочий документ Управления исследований № 00-0123, Университет Иллинойса.
  • Меры асимметрии распределения Вейбулла

Внешние ссылки [ править ]

  • «Коэффициент асимметрии» , Математическая энциклопедия , EMS Press , 2001 [1994]
  • Коэффициент асимметрии для многомерных распределений Мишеля Петижана
  • О более надежной оценке асимметрии и эксцесса Сравнение оценок перекоса Ким и Уайт.
  • Замкнутые распределения - моделирование, инверсия и оценка параметров