Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Средняя абсолютная разность (одномерная) является мера статистической дисперсии , равной средней абсолютной разность двух независимых величин , взятых из распределения вероятностей . Связанная статистика - это относительная средняя абсолютная разница , которая представляет собой среднее абсолютное различие, деленное на среднее арифметическое , и равное удвоенному коэффициенту Джини . Среднее абсолютное различие также известно как абсолютная разность средней (не следует путать с абсолютным значением в средней подписанной разности ) и Джиньте среднюю разность (ГМД).[1] Средняя абсолютная разность иногда обозначается как Δ или как MD.

Определение [ править ]

Средняя абсолютная разница определяются как «среднее» или «среднее», формально ожидаемое значение , абсолютной разность двух случайных величин X и Y независимо друг от друга и одинаково распределенных с одинаковым распределением (неизвестным) далее называемым Q .

Расчет [ править ]

В частности, в дискретном случае

  • Для случайной выборки размера n из популяции, равномерно распределенной согласно Q , по закону общего ожидания (эмпирическая) средняя абсолютная разница последовательности значений выборки y i , i = от 1 до n, может быть вычислена как среднее арифметическое. абсолютного значения всех возможных различий:

В непрерывном случае

Относительная средняя абсолютная разница [ править ]

Когда распределение вероятностей имеет конечное и ненулевое среднее арифметическое AM, относительная средняя абсолютная разность, иногда обозначаемая как Δ или RMD, определяется как

Относительная средняя абсолютная разница количественно определяет среднюю абсолютную разницу по сравнению с размером среднего и является безразмерной величиной. Относительная средняя абсолютная разница равна удвоенному коэффициенту Джини, который определяется в терминах кривой Лоренца . Это соотношение дает дополнительные перспективы как для относительной средней абсолютной разницы, так и для коэффициента Джини, включая альтернативные способы вычисления их значений.

Свойства [ править ]

Средняя абсолютная разница инвариантна к переносам и отрицанию и изменяется пропорционально положительному масштабированию. То есть, если X - случайная величина, а c - константа:

  • MD ( X + c ) = MD ( X ),
  • MD (- X ) = MD ( X ) и
  • MD ( c X ) = | c | MD ( X ).

Относительная средняя абсолютная разница инвариантна к положительному масштабированию, коммутирует с отрицанием и изменяется при переводе пропорционально отношению исходных и переведенных арифметических средних. То есть, если X - случайная величина, а c - константа:

  • RMD ( X + c ) = RMD ( X ) · среднее ( X ) / (среднее ( X ) + c ) = RMD ( X ) / (1 + c / среднее ( X )) для c ≠ −mean ( X ),
  • RMD (- X ) = −RMD ( X ) и
  • RMD ( c X ) = RMD ( X ) для c > 0.

Если случайная величина имеет положительное среднее значение, то ее относительная средняя абсолютная разница всегда будет больше или равна нулю. Если, кроме того, случайная величина может принимать только значения, которые больше или равны нулю, то ее относительная средняя абсолютная разница будет меньше 2.

По сравнению со стандартным отклонением [ править ]

Средняя абсолютная разница в два раза больше L-шкалы (второй L-момент ), а стандартное отклонение - это квадратный корень из дисперсии среднего (второй условный центральный момент). Различия между L-моментами и обычными моментами впервые видны при сравнении средней абсолютной разницы и стандартного отклонения (первый L-момент и первый условный момент являются средними).

И стандартное отклонение и средняя абсолютная значение разности мера дисперсия , как разброс из является значение популяции или вероятность распределения. Средняя абсолютная разница не определяется в терминах конкретной меры центральной тенденции, тогда как стандартное отклонение определяется в терминах отклонения от среднего арифметического. Поскольку стандартное отклонение возводит в квадрат свои различия, оно имеет тенденцию придавать больший вес большим различиям и меньший вес меньшим различиям по сравнению со средней абсолютной разницей. Когда среднее арифметическое конечно, средняя абсолютная разность также будет конечной, даже если стандартное отклонение бесконечно. См. Примеры для некоторых конкретных сравнений.

Недавно введенное стандартное отклонение расстояния играет аналогичную роль со средней абсолютной разницей, но стандартное отклонение расстояния работает с централизованными расстояниями. См. Также электронную статистику .

Примеры оценок [ править ]

Для случайной выборки S из случайной величины X , состоящей из n значений y i , статистика

является последовательной и несмещенной оценкой MD ( X ). Статистика:

является последовательной оценкой RMD ( X ), но, в общем, не является несмещенной .

Доверительные интервалы для RMD ( X ) могут быть рассчитаны с использованием методов выборки начальной загрузки.

Как правило, несмещенной оценки для RMD ( X ) не существует, отчасти из-за трудности нахождения несмещенной оценки для умножения на обратную величину. Например, даже если известно, что выборка взята из случайной величины X ( p ) для неизвестного p , а X ( p ) - 1 имеет распределение Бернулли , так что Pr ( X ( p ) = 1) = 1 -  p и Pr ( X ( p ) = 2) = p , то

RMD ( X ( p )) = 2 p (1 -  p ) / (1 +  p ) .

Но ожидаемое значение любой оценки R ( S ) RMD ( X ( p )) будет иметь форму: [ необходима цитата ]

где r i - константы. Таким образом, E ( R ( S )) никогда не может равняться RMD ( X ( p )) для всех p между 0 и 1.

Примеры [ править ]

† ì регуляризованная неполная бета-функция

См. Также [ править ]

  • Средняя абсолютная ошибка
  • Среднее отклонение
  • Оценщик
  • Коэффициент вариации
  • L-момент

Ссылки [ править ]

  1. ^ Yitzhaki, Шломо (2003). «Средняя разница Джини: превосходная мера изменчивости для ненормальных распределений» (PDF) . Международный статистический журнал Metron . Springer Verlag. 61 (2): 285–316.
  • Сюй, Куань (январь 2004 г.). «Как развивалась литература по индексу Джини за последние 80 лет?» (PDF) . Департамент экономики, Университет Далхаузи . Проверено 1 июня 2006 . Cite journal requires |journal= (help)
  • Джини, Коррадо (1912). Variabilità e Mutabilità . Болонья: Типография Паоло Куппини.
  • Джини, Коррадо (1921). «Измерение неравенства и доходов» . Экономический журнал . 31 (121): 124–126. DOI : 10.2307 / 2223319 . JSTOR  2223319 .
  • Чакраварти, SR (1990). Числа этического социального индекса . Нью-Йорк: Springer-Verlag.
  • Миллс, Джеффри А .; Зандвакили, Сурушэ (1997). «Статистический вывод с помощью начальной загрузки для измерения неравенства». Журнал прикладной эконометрики . 12 (2): 133–150. CiteSeerX  10.1.1.172.5003 . DOI : 10.1002 / (SICI) 1099-1255 (199703) 12: 2 <133 :: AID-JAE433> 3.0.CO; 2-H .
  • Ломницкий, З.А. (1952). «Стандартная ошибка средней разницы Джини» . Анналы математической статистики . 23 (4): 635–637. DOI : 10.1214 / АОМ / 1177729346 .
  • Наир, США (1936). «Стандартная ошибка средней разницы Джини». Биометрика . 28 (3–4): 428–436. DOI : 10.1093 / Biomet / 28.3-4.428 .
  • Ицхаки, Шломо (2003). «Средняя разница Джини: превосходная мера изменчивости для ненормальных распределений» (PDF) . Метрон - Международный статистический журнал . 61 : 285–316.