Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , то среднее абсолютное отклонение ( MAD ) является надежной мерой изменчивости в виде однофакторного выборки количественных данных . Он также может относиться к параметру совокупности, который оценивается с помощью MAD, рассчитанного на основе выборки.

Для однофакторного набора данных X 1X 2 , ...,  Х п , СУМАШЕДШАЯ определяется как медиана из абсолютных отклонений от данных Медиана - х :

то есть, начиная с остатков (отклонений) от медианы данных, MAD - это медиана их абсолютных значений .

Пример [ править ]

Рассмотрим данные (1, 1, 2, 2 , 4, 6, 9). Он имеет медианное значение 2. Абсолютные отклонения около 2 равны (1, 1, 0, 0, 2, 4, 7), которые, в свою очередь, имеют среднее значение 1 (поскольку отсортированные абсолютные отклонения равны (0, 0, 1, 1 , 2, 4, 7)). Таким образом, среднее абсолютное отклонение для этих данных равно 1.

Использует [ редактировать ]

Среднее абсолютное отклонение является мерой статистической дисперсии . Более того, MAD является надежной статистикой , более устойчивой к выбросам в наборе данных, чем стандартное отклонение . В стандартном отклонении расстояния от среднего возводятся в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно на него влиять. В MAD отклонения небольшого количества выбросов не имеют значения.

Поскольку MAD является более надежной оценкой масштаба, чем выборочная дисперсия или стандартное отклонение , она лучше работает с распределениями без среднего или дисперсии, такими как распределение Коши .

Отношение к стандартному отклонению [ править ]

MAD можно использовать аналогично тому, как можно было бы использовать отклонение для среднего. Для того , чтобы использовать в качестве MAD последовательной оценки для оценки от стандартного отклонения , один принимает

где - постоянный масштабный коэффициент , который зависит от распределения. [1]

Для нормально распределенных данных принято

то есть, обратная часть функции квантиля (также известная как обратная величина интегральной функции распределения ) для стандартного нормального распределения . [2] [3] Аргумент 3/4 таков, что покрывает 50% (от 1/4 до 3/4) стандартной нормальной кумулятивной функции распределения , т. Е.

Следовательно, мы должны иметь это

Заметив, что

у нас есть то , из чего мы получаем масштабный коэффициент .

Другой способ установить связь - отметить, что MAD равно медиане полунормального распределения :

Эта форма используется, например, для определения вероятной ошибки .

Абсолютное отклонение геометрической медианы [ править ]

Подобно тому, как медиана обобщается на геометрическую медиану в многомерных данных, может быть построено геометрическое MAD, которое обобщает MAD. Учитывая двумерный парный набор данных (X 1 , Y 1 ), (X 2 , Y 2 ), ..., (X n , Y n ) и соответствующим образом рассчитанную геометрическую медиану , геометрическое медианное абсолютное отклонение определяется выражением :

Это дает тот же результат, что и одномерное MAD в одном измерении, и легко распространяется на более высокие измерения. В случае комплексных значений ( X + i Y ) отношение MAD к стандартному отклонению не изменяется для нормально распределенных данных.

Население MAD [ править ]

MAD совокупности определяется аналогично MAD выборки, но основывается на полном распределении, а не на выборке. Для симметричного распределения с нулевым средним значением MAD населения является 75-й процентиль распределения.

В отличие от дисперсии , которая может быть бесконечной или неопределенной, MAD совокупности всегда является конечным числом. Например, стандартное распределение Коши имеет неопределенную дисперсию, но его MAD равно 1.

Самое раннее известное упоминание о концепции MAD произошло в 1816 году в статье Карла Фридриха Гаусса об определении точности численных наблюдений. [4] [5]

См. Также [ править ]

  • Отклонение (статистика)
  • Межквартильный размах
  • Вероятная ошибка
  • Надежные меры масштаба
  • Относительная средняя абсолютная разница
  • Среднее абсолютное отклонение
  • Наименьшие абсолютные отклонения

Заметки [ править ]

  1. ^ Rousseeuw, PJ ; Croux, C. (1993). «Альтернативы среднему абсолютному отклонению». Журнал Американской статистической ассоциации . 88 (424): 1273–1283. DOI : 10.1080 / 01621459.1993.10476408 . ЛВП : 2027,42 / 142454 .
  2. ^ Рупперт, Д. (2010). Статистика и анализ данных для финансового инжиниринга . Springer. п. 118. ISBN 9781441977878. Проверено 27 августа 2015 .
  3. ^ Leys, C .; и другие. (2013). «Обнаружение выбросов: не используйте стандартное отклонение вокруг среднего, используйте абсолютное отклонение вокруг медианы» (PDF) . Журнал экспериментальной социальной психологии . 49 (4): 764–766. DOI : 10.1016 / j.jesp.2013.03.013 .
  4. ^ Гаусс, Карл Фридрих (1816). "Bestimmung der Genauigkeit der Beobachtungen". Zeitschrift für Astronomie und Verwandte Wissenschaften . 1 : 187–197.
  5. ^ Уокер, Хелен (1931). Исследования по истории статистического метода . Балтимор, Мэриленд: Williams & Wilkins Co., стр. 24–25.

Ссылки [ править ]

  • Хоглин, Дэвид С .; Фредерик Мостеллер; Джон У. Тьюки (1983). Понимание надежного и исследовательского анализа данных . Джон Вили и сыновья. С. 404–414. ISBN 978-0-471-09777-8.
  • Russell, Roberta S .; Бернард В. Тейлор III (2006). Операционный менеджмент . Джон Вили и сыновья. С.  497–498 . ISBN 978-0-471-69209-6.
  • Venables, WN; Б.Д. Рипли (1999). Современная прикладная статистика с S-PLUS . Springer. п. 128. ISBN 978-0-387-98825-2.