Статистическая дисперсия


Из Википедии, бесплатной энциклопедии
  (Перенаправлено из вариации (статистика) )
Перейти к навигации Перейти к поиску
Пример выборок из двух популяций с одинаковым средним, но разной дисперсией. Синее население гораздо более рассредоточено, чем красное.

В статистике дисперсия (также называемая изменчивостью , разбросом или разбросом ) — это степень, в которой распределение растягивается или сжимается. [1] Типичными примерами показателей статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах . Например, когда дисперсия данных в наборе велика, данные сильно разбросаны. С другой стороны, когда дисперсия мала, данные в наборе группируются.

Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее часто используемыми свойствами распределений.

Меры

Мерой статистической дисперсии является неотрицательное действительное число , которое равно нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.

Большинство показателей дисперсии имеют те же единицы измерения , что и измеряемая величина . Другими словами, если измерения в метрах или секундах, то же самое и с мерой дисперсии. Примеры мер рассеивания включают:

Они часто используются (вместе с факторами масштаба ) в качестве оценок параметров масштаба , в этом качестве они называются оценками масштаба. Надежные меры масштаба — это те, на которые не влияет небольшое количество выбросов , и они включают IQR и MAD.

Все вышеперечисленные меры статистической дисперсии обладают тем полезным свойством, что они инвариантны к местоположению и линейны по масштабу . Это означает, что если случайная величина X имеет дисперсию S X , то линейное преобразование Y  =  aX  +  b для действительных a и b должно иметь дисперсию S Y  = | а | S X , где | а | является абсолютным значением a , то есть игнорирует предшествующий отрицательный знак .

Другие меры дисперсии безразмерны . Другими словами, у них нет единиц, даже если у самой переменной есть единицы. Это включает:

  • Коэффициент вариации
  • Квартильный коэффициент дисперсии
  • Относительная средняя разница , равная удвоенному коэффициенту Джини
  • Энтропия : в то время как энтропия дискретной переменной не зависит от местоположения и масштаба и, следовательно, не является мерой дисперсии в указанном выше смысле, энтропия непрерывной переменной является инвариантной по местоположению и аддитивной по масштабу: если Hz является энтропией непрерывная переменная z и z =ax+b , тогда Hz=Hx+log(a) .

Существуют и другие меры дисперсии:

  • Дисперсия (квадрат стандартного отклонения) - не зависит от местоположения, но не линейна по масштабу.
  • Отношение дисперсии к среднему - в основном используется для данных подсчета, когда используется термин «коэффициент дисперсии» и когда это отношение безразмерно , поскольку данные подсчета сами по себе безразмерны, а не иначе.

Некоторые меры дисперсии имеют специальные цели. Дисперсия Аллана может использоваться для приложений, где шум нарушает сходимость. [2] Дисперсия Адамара может использоваться для противодействия чувствительности к линейному дрейфу частоты. [3]

Для категориальных переменных менее распространено измерение дисперсии одним числом; см. качественное изменение . Одной из таких мер является дискретная энтропия .

Источники

В физических науках такая изменчивость может быть результатом случайных ошибок измерения: инструментальные измерения часто не являются абсолютно точными, т. е. воспроизводимыми , и существует дополнительная межэкспертная изменчивость в интерпретации и представлении результатов измерений. Можно предположить, что измеряемая величина стабильна и что различия между измерениями обусловлены ошибкой наблюдения . Система большого числа частиц характеризуется средними значениями относительно небольшого числа макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение — важная мера в теории флуктуаций, которая объясняет многие физические явления, в том числе почему небо голубое. [4]

В биологических науках измеряемая величина редко бывает неизменной и стабильной, а наблюдаемая вариация может быть, кроме того, присуща явлению: она может быть связана с межиндивидуальной изменчивостью , то есть отдельными членами популяции, отличающимися друг от друга. Также это может быть связано с внутрииндивидуальной изменчивостью , то есть одним и тем же испытуемым, различающимся тестами, взятыми в разное время или в других различных условиях. Такие типы изменчивости также наблюдаются в сфере промышленных товаров; даже здесь дотошный ученый находит вариации.

В экономике , финансах и других дисциплинах регрессионный анализ пытается объяснить дисперсию зависимой переменной , обычно измеряемую ее дисперсией, с использованием одной или нескольких независимых переменных , каждая из которых имеет положительную дисперсию. Объясняемая доля дисперсии называется коэффициентом детерминации .

Частичное упорядочение дисперсии

Разброс с сохранением среднего (MPS) — это переход от одного распределения вероятностей A к другому распределению вероятностей B, где B формируется путем расширения одной или нескольких частей функции плотности вероятности A при сохранении среднего значения (ожидаемого значения) неизменным. [5] Концепция разброса, сохраняющего среднее значение, обеспечивает частичное упорядочение вероятностных распределений в соответствии с их дисперсиями: из двух вероятностных распределений одно может быть оценено как имеющее большую дисперсию, чем другое, или же ни одно из них не может быть ранжировано как имеющее большую дисперсию. .

Смотрите также

  • Средний
  • Круговая дисперсия
  • Качественная вариация
  • Погрешность измерения
  • Надежные меры масштаба
  • Сводные статистические данные

использованная литература

  1. ^ Электронный справочник NIST / SEMATECH по статистическим методам. «1.3.6.4. Параметры местоположения и масштаба» . www.itl.nist.gov . Министерство торговли США.
  2. ^ "Allan Variance - Обзор Дэвида В. Аллана" . www.allanstime.com . Проверено 16 сентября 2021 г. .
  3. Викискладе есть медиафайлы по теме Адамара . www.wriley.com . Проверено 16 сентября 2021 г. .
  4. ^ МакКуорри, Дональд А. (1976). Статистическая механика . Нью-Йорк: Харпер и Роу. ISBN 0-06-044366-9.
  5. ^ Ротшильд, Майкл; Стиглиц, Джозеф (1970). «Повышение риска I: определение». Журнал экономической теории . 2 (3): 225–243. doi : 10.1016/0022-0531(70)90038-4 .
Получено с " https://en.wikipedia.org/w/index.php?title=Statistical_дисперсион&oldid=1085897650 "