Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Среднее абсолютное отклонение ( ААР ) из набора данных является средним из абсолютных отклонений от в центральной точке . Это сводная статистика по статистической дисперсии или изменчивости. В общем виде центральная точка может быть средним значением , медианой , модой или результатом любой другой меры центральной тенденции или любого контрольного значения, относящегося к данному набору данных. AAD включает среднее абсолютное отклонение и среднее абсолютное отклонение (сокращенно MAD ).

Меры рассеивания [ править ]

Некоторые меры статистической дисперсии определяются в терминах абсолютного отклонения. Термин «среднее абсолютное отклонение» не однозначно определяет меру статистического разброса , поскольку есть несколько показателей, которые можно использовать для измерения абсолютных отклонений, и есть несколько показателей центральной тенденции, которые также можно использовать. Таким образом, чтобы однозначно идентифицировать абсолютное отклонение, необходимо указать как меру отклонения, так и меру центральной тенденции. К сожалению, в статистической литературе еще не приняты стандартные обозначения, поскольку как среднее абсолютное отклонение от среднего значения, так и среднее абсолютное отклонение от среднего значения в литературе обозначаются инициалами «MAD», что может привести к путанице, поскольку в целом они могут иметь значения, значительно отличающиеся друг от друга.

Среднее абсолютное отклонение от центральной точки [ править ]

Среднее абсолютное отклонение набора { x 1 , x 2 , ..., x n } равно

Выбор меры центральной тенденции оказывает заметное влияние на величину среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:

Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.

Среднее абсолютное отклонение от среднего меньше или равно стандартному отклонению ; один из способов доказать это основывается на неравенстве Дженсена .

Для нормального распределения отношение среднего абсолютного отклонения к стандартному отклонению равно . Таким образом, если X - нормально распределенная случайная величина с ожидаемым значением 0, тогда см. Geary (1935): [1]

Другими словами, для нормального распределения среднее абсолютное отклонение примерно в 0,8 раза превышает стандартное отклонение. Однако измерения внутри выборки дают значения отношения среднего среднего отклонения / стандартного отклонения для данной гауссовой выборки n со следующими границами:, со смещением для малых n . [2]

Среднее абсолютное отклонение от среднего [ править ]

Среднее абсолютное отклонение (MAD), также называемое как «среднее отклонение» или иногда «среднее абсолютное отклонение», представляет собой среднее значение абсолютных отклонений Данных , вокруг означать обработки данных: среднее (абсолютного) расстояния от среднего. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме по отношению к указанной центральной точке (см. Выше).

MAD было предложено использовать вместо стандартного отклонения, поскольку оно лучше соответствует реальной жизни. [3] Поскольку MAD - это более простой способ измерения изменчивости, чем стандартное отклонение , он может быть полезен в школьном обучении. [4] [5]

Точность прогноза этого метода очень тесно связана с методом среднеквадратичной ошибки (MSE), который представляет собой просто среднеквадратичную ошибку прогнозов. Несмотря на то, что эти методы очень тесно связаны, MAD используется чаще, потому что его проще вычислить (избегая возведения в квадрат) [6] и легче понять. [7]

Среднее абсолютное отклонение от медианы [ править ]

Среднее абсолютное отклонение от медианы (медиана MAD) предлагает прямую меру масштаба случайной переменной вокруг ее медианы.

Это максимальное правдоподобие оценка параметра масштаба от распределения Лапласа . Для нормального распределения имеем . Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем и .

Используя общую дисперсионную функцию, Хабиб (2011) определил MAD относительно медианы как

где индикаторная функция

Это представление позволяет получить медианные коэффициенты корреляции MAD. [ необходима цитата ]

Среднее абсолютное отклонение от центральной точки [ править ]

Среднее абсолютное отклонение от среднего [ править ]

В принципе, среднее значение может быть принято в качестве центральной точки для медианного абсолютного отклонения, но чаще вместо него берется медианное значение.

Среднее абсолютное отклонение от медианы [ править ]

Медианное абсолютное отклонение (также MAD) является медианным абсолютным отклонением от медианы . Это надежная оценка дисперсии .

Для примера {2, 2, 3, 4, 14}: 3 - это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1 , 11}) со средним значением 1, в данном случае на него не влияет значение выброса 14, поэтому среднее абсолютное отклонение (также называемое MAD) равно 1.

Максимальное абсолютное отклонение [ править ]

Максимальное абсолютное отклонение вокруг произвольной точки есть максимум абсолютных отклонений образца от этой точки. Хотя это и не является строго мерой центральной тенденции, максимальное абсолютное отклонение можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше , где, где - максимум выборки .

Минимизация [ править ]

Меры статистической дисперсии, полученные из абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: медиана - это мера центральной тенденции, наиболее связанной с абсолютным отклонением. Некоторые параметры локации можно сравнить следующим образом:

  • Статистика нормы L 2 : среднее значение минимизирует среднеквадратичную ошибку
  • Статистика нормы L 1 : медиана минимизирует среднее абсолютное отклонение,
  • Статистика L ∞ norm : средний диапазон минимизирует максимальное абсолютное отклонение
  • статистика усеченной нормы L ∞ : например, среднее значение (среднее значение первого и третьего квартилей ), которое минимизирует среднее абсолютное отклонение всего распределения, также минимизирует максимальное абсолютное отклонение распределения после того, как верхние и нижние 25% были обрезаны .

Оценка [ править ]

Среднее абсолютное отклонение выборки - это смещенная оценка среднего абсолютного отклонения совокупности. Чтобы абсолютное отклонение было объективной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению генеральной совокупности. Однако это не так. Для населения 1, 2, 3 как абсолютное отклонение совокупности относительно медианы, так и абсолютное отклонение совокупности относительно среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки относительно среднего размера 3, которое можно извлечь из генеральной совокупности, составляет 44/81, в то время как среднее всех абсолютных отклонений выборки относительно медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.

Однако этот аргумент основан на понятии беспристрастности к среднему. Каждый показатель местоположения имеет свою собственную форму беспристрастности (см. Запись о смещенной оценке ). Соответствующая форма беспристрастности здесь - медианная непредвзятость.

См. Также [ править ]

  • Отклонение (статистика)
  • Средняя абсолютная ошибка
  • Ошибки и неточности в статистике
  • Наименьшие абсолютные отклонения
  • Функция потерь
  • Средняя абсолютная ошибка в процентах
  • Средняя разница
  • Среднеквадратичная ошибка
  • Среднее абсолютное отклонение
  • Квадратные отклонения

Ссылки [ править ]

  1. Перейти ↑ Geary, RC (1935). Отношение среднего отклонения к стандартному отклонению как критерий нормальности. Биометрика, 27 (3/4), 310–332.
  2. См. Также статьи Гири за 1936 и 1946 годы: Geary, RC (1936). Моменты отношения среднего отклонения к стандартному отклонению для нормальных образцов. Biometrika, 28 (3/4), 295–307 и Geary, RC (1947). Проверка на нормальность. Биометрика, 34 (3/4), 209–242.
  3. ^ Талеб Нассим Николас (2014). «Какая научная идея готова к пенсии?» . Край . Архивировано 16 января 2014 года . Проверено 16 января 2014 .CS1 maint: bot: original URL status unknown (link)
  4. ^ Кадер, Гэри (март 1999). «Средства и БЕЗОПАСНОСТЬ» . Преподавание математики в средней школе . 4 (6): 398–403. Архивировано 18 мая 2013 года . Проверено 20 февраля 2013 года .
  5. ^ Франклин, Кристин, Гэри Кадер, Дениз Мьюборн, Джерри Морено, Рокси Пек , Майк Перри и Ричард Шеффер (2007). Руководство по оценке и обучению статистическому образованию (PDF) . Американская статистическая ассоциация. ISBN  978-0-9791747-1-1. Архивировано (PDF) из оригинала на 2013-03-07 . Проверено 20 февраля 2013 .
  6. ^ Нахмиас, Стивен; Олсен, Тава Леннон (2015), Анализ производства и операций (7-е изд.), Waveland Press, стр. 62, ISBN 9781478628248, MAD часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
  7. ^ Штадтлер, Хартмут; Килгер, Кристоф; Мейр, Герберт, ред. (2014), Управление цепочкой поставок и расширенное планирование: концепции, модели, программное обеспечение и тематические исследования , Springer Texts in Business and Economics (5-е изд.), Springer, стр. 143, ISBN 9783642553097, значение MAD легче интерпретировать.

Внешние ссылки [ править ]

  • Преимущества среднего абсолютного отклонения