Эта статья нуждается в дополнительных ссылках для проверки . ( декабрь 2010 г. ) |
В статистике дисперсия (также называемая изменчивостью , разбросом или разбросом ) — это степень, в которой распределение растягивается или сжимается. [1] Типичными примерами показателей статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах . Например, когда дисперсия данных в наборе велика, данные сильно разбросаны. С другой стороны, когда дисперсия мала, данные в наборе группируются.
Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее часто используемыми свойствами распределений.
Мерой статистической дисперсии является неотрицательное действительное число , которое равно нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.
Большинство показателей дисперсии имеют те же единицы измерения , что и измеряемая величина . Другими словами, если измерения в метрах или секундах, то же самое и с мерой дисперсии. Примеры мер рассеивания включают:
Они часто используются (вместе с факторами масштаба ) в качестве оценок параметров масштаба , в этом качестве они называются оценками масштаба. Надежные меры масштаба — это те, на которые не влияет небольшое количество выбросов , и они включают IQR и MAD.
Все вышеперечисленные меры статистической дисперсии обладают тем полезным свойством, что они инвариантны к местоположению и линейны по масштабу . Это означает, что если случайная величина X имеет дисперсию S X , то линейное преобразование Y = aX + b для действительных a и b должно иметь дисперсию S Y = | а | S X , где | а | является абсолютным значением a , то есть игнорирует предшествующий отрицательный знак –.
Другие меры дисперсии безразмерны . Другими словами, у них нет единиц, даже если у самой переменной есть единицы. Это включает:
Существуют и другие меры дисперсии:
Некоторые меры дисперсии имеют специальные цели. Дисперсия Аллана может использоваться для приложений, где шум нарушает сходимость. [2] Дисперсия Адамара может использоваться для противодействия чувствительности к линейному дрейфу частоты. [3]
Для категориальных переменных менее распространено измерение дисперсии одним числом; см. качественное изменение . Одной из таких мер является дискретная энтропия .
В физических науках такая изменчивость может быть результатом случайных ошибок измерения: инструментальные измерения часто не являются абсолютно точными, т. е. воспроизводимыми , и существует дополнительная межэкспертная изменчивость в интерпретации и представлении результатов измерений. Можно предположить, что измеряемая величина стабильна и что различия между измерениями обусловлены ошибкой наблюдения . Система большого числа частиц характеризуется средними значениями относительно небольшого числа макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение — важная мера в теории флуктуаций, которая объясняет многие физические явления, в том числе почему небо голубое. [4]
В биологических науках измеряемая величина редко бывает неизменной и стабильной, а наблюдаемая вариация может быть, кроме того, присуща явлению: она может быть связана с межиндивидуальной изменчивостью , то есть отдельными членами популяции, отличающимися друг от друга. Также это может быть связано с внутрииндивидуальной изменчивостью , то есть одним и тем же испытуемым, различающимся тестами, взятыми в разное время или в других различных условиях. Такие типы изменчивости также наблюдаются в сфере промышленных товаров; даже здесь дотошный ученый находит вариации.
В экономике , финансах и других дисциплинах регрессионный анализ пытается объяснить дисперсию зависимой переменной , обычно измеряемую ее дисперсией, с использованием одной или нескольких независимых переменных , каждая из которых имеет положительную дисперсию. Объясняемая доля дисперсии называется коэффициентом детерминации .
Разброс с сохранением среднего (MPS) — это переход от одного распределения вероятностей A к другому распределению вероятностей B, где B формируется путем расширения одной или нескольких частей функции плотности вероятности A при сохранении среднего значения (ожидаемого значения) неизменным. [5] Концепция разброса, сохраняющего среднее значение, обеспечивает частичное упорядочение вероятностных распределений в соответствии с их дисперсиями: из двух вероятностных распределений одно может быть оценено как имеющее большую дисперсию, чем другое, или же ни одно из них не может быть ранжировано как имеющее большую дисперсию. .