Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример выборок из двух популяций с одинаковым средним значением, но разной дисперсией. Синее население гораздо более рассредоточено, чем красное.

В статистике , дисперсия (также называется изменчивость , разброс , или спрэд ) является степень , в которой распределение растягивают или сжимают. [1] Распространенными примерами мер статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах .

Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее часто используемыми свойствами распределений.

Меры [ править ]

Мера статистической дисперсии - это неотрицательное действительное число , равное нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.

Большинство мер дисперсии имеют те же единицы, что и измеряемая величина . Другими словами, если измерения даны в метрах или секундах, то и дисперсия измеряется. Примеры мер рассеивания включают:

Они часто используются (вместе с масштабными коэффициентами ) в качестве оценок по шкале параметров , в которых потенциал их называют оценки масштаба. Надежные меры масштаба - это те, на которые не влияет небольшое количество выбросов , и они включают IQR и MAD.

Все вышеупомянутые меры статистической дисперсии обладают тем полезным свойством, что они инвариантны к местоположению и линейны по масштабу . Это означает, что если случайная величина X имеет дисперсию S X, то линейное преобразование Y  =  aX  +  b для вещественных a и b должно иметь дисперсию S Y  = | а | S X , где | а | является абсолютным значением из , то есть игнорирует предшествующий отрицательный знак -.

Остальные меры дисперсии безразмерны . Другими словами, у них нет единиц измерения, даже если у самой переменной есть единицы. К ним относятся:

  • Коэффициент вариации
  • Квартильный коэффициент дисперсии
  • Относительная средняя разница , равная удвоенному коэффициенту Джини
  • Энтропия : в то время как энтропия дискретной переменной инвариантна относительно местоположения и не зависит от масштаба и, следовательно, не является мерой дисперсии в указанном выше смысле, энтропия непрерывной переменной инвариантна относительно местоположения и аддитивна по масштабу: если Hz - энтропия непрерывная переменная z и y = ax + b , то Hy = Hx + log (a) .

Существуют и другие меры рассеивания:

  • Дисперсия (квадрат стандартного отклонения) - не зависит от местоположения, но не линейна по масштабу.
  • Отношение дисперсии к среднему - в основном используется для данных подсчета, когда используется термин « коэффициент дисперсии» и когда это отношение безразмерно , поскольку данные подсчета сами по себе безразмерны, и не иначе.

Некоторые меры дисперсии имеют специальные цели, среди которых дисперсия Аллана и дисперсия Адамара .

Для категориальных переменных менее принято измерять дисперсию одним числом; увидеть качественное изменение . Одна из таких мер - дискретная энтропия .

Источники [ править ]

В физических науках такая изменчивость может быть результатом случайных ошибок измерения: измерения инструментов часто не совсем точны, т. Е. Воспроизводимы , и существует дополнительная вариативность между экспертами в интерпретации и представлении результатов измерений. Можно предположить, что измеряемая величина стабильна, и что отклонения между измерениями вызваны ошибкой наблюдений . Система из большого количества частиц характеризуется средними значениями относительно небольшого количества макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение - важная мера в теории флуктуаций, которая объясняет многие физические явления, в том числе почему небо голубое. [2]

В биологических науках измеряемая величина редко бывает неизменной и стабильной, и наблюдаемая вариация может дополнительно быть внутренним явлением: это может быть связано с межиндивидуальной вариабельностью , то есть с разными членами популяции, отличающимися друг от друга. Кроме того, это может быть связано с внутриличностной изменчивостью , то есть с одним и тем же субъектом, различающимся тестами, взятыми в разное время или в других различных условиях. Подобные типы изменчивости также наблюдаются на арене производимой продукции; даже там дотошный ученый находит вариации.

В экономике , финансах и других дисциплинах регрессионный анализ пытается объяснить дисперсию зависимой переменной , обычно измеряемую ее дисперсией, с использованием одной или нескольких независимых переменных, каждая из которых сама имеет положительную дисперсию. Объясненная доля дисперсии называется коэффициентом детерминации .

Частичное упорядочение дисперсии [ править ]

Средний сохраняющий спрэд (МПС) представляет собой переход от одного распределения вероятностей А на другое распределение вероятности В, где В формируются разводя одной или более частей функции плотности вероятности, в то время оставляя среднее (ожидаемое значение) без изменений. [3] Концепция сохраняющего среднее значение разброса обеспечивает частичное упорядочение распределений вероятностей в соответствии с их дисперсиями: из двух распределений вероятностей одно может быть оценено как имеющее большую дисперсию, чем другое, или, альтернативно, ни одно из них не может быть оценено как имеющее большую дисперсию. .

См. Также [ править ]

  • Средний
  • Сводные статистические данные
  • Качественная вариация
  • Надежные меры масштаба
  • Погрешность измерения

Ссылки [ править ]

  1. ^ Электронный справочник статистических методов NIST / SEMATECH. «1.3.6.4. Параметры положения и масштаба» . www.itl.nist.gov . Министерство торговли США.
  2. ^ Маккуарри, Дональд А. (1976). Статистическая механика . Нью-Йорк: Харпер и Роу. ISBN 0-06-044366-9.
  3. ^ Ротшильд, Майкл; Стиглиц, Джозеф (1970). «Возрастающий риск I: определение». Журнал экономической теории . 2 (3): 225–243. DOI : 10.1016 / 0022-0531 (70) 90038-4 .