Из Википедии, свободной энциклопедии
  (Перенаправлено с отношения дисперсии к среднему )
Перейти к навигации Перейти к поиску

В теории вероятностей и статистике , тем индекс дисперсии , [1] дисперсия индекса, коэффициент дисперсии, относительная дисперсия или дисперсия к среднему соотношению (VMR) , как и коэффициент вариации , является нормированной мерой дисперсии из а Распределение вероятностей : это мера, используемая для количественной оценки того, является ли набор наблюдаемых явлений сгруппированными или рассредоточенными по сравнению со стандартной статистической моделью.

Он определяется как отношение дисперсии к среднему значению ,

Он также известен как фактор Фано , хотя этот термин иногда зарезервирован для оконных данных (среднее значение и дисперсия вычисляются по субпопуляции), где индекс дисперсии используется в особом случае, когда окно бесконечно. Часто выполняется оконная обработка данных: VMR часто вычисляется для различных интервалов времени или небольших областей в пространстве, которые можно назвать «окнами», а результирующая статистика называется фактором Фано.

Он определяется только тогда, когда среднее значение не равно нулю, и обычно используется только для положительной статистики, такой как данные подсчета или время между событиями, или когда предполагается, что базовое распределение является экспоненциальным распределением или распределением Пуассона .

Терминология [ править ]

В этом контексте наблюдаемый набор данных может состоять из времени наступления предопределенных событий, таких как землетрясения в заданном регионе с заданной магнитудой, или из местоположений в географическом пространстве растений заданного вида. Детали таких явлений сначала преобразуются в подсчеты количества событий или появлений в каждой из набора равных по размеру областей времени или пространства.

Вышеупомянутое определяет индекс дисперсии для подсчетов . [2] Иное определение применимо для индекса дисперсии для интервалов , [3] , где величины являются обработанными длинами временных интервалов между событиями. Обычно используется то, что «индекс дисперсии» означает индекс дисперсии для подсчетов.

Интерпретация [ править ]

Некоторые распределения, в первую очередь распределение Пуассона , имеют равную дисперсию и среднее значение, что дает им VMR = 1. Геометрическое распределение и отрицательное биномиальное распределение имеют VMR> 1, в то время как биномиальное распределение имеет VMR <1, а постоянная случайная величина имеет VMR = 0. Это дает следующую таблицу:

Это можно считать аналогом классификации конических сечений по эксцентриситету ; подробности см. в кумулянтах конкретных распределений вероятностей .

Актуальность индекса дисперсии заключается в том, что он имеет значение единицы, когда распределение вероятностей количества появлений в интервале является распределением Пуассона . Таким образом, эту меру можно использовать для оценки того, можно ли моделировать наблюдаемые данные с использованием процесса Пуассона . Когда коэффициент дисперсии меньше 1, набор данных называется «недостаточно рассредоточенным»: это условие может относиться к шаблонам появления, которые более регулярны, чем случайность, связанная с пуассоновским процессом. Например, точки равномерно распределены в пространстве или регулярные периодические события будут недостаточно рассредоточены. Если индекс дисперсии больше 1, набор данных считается чрезмерно рассредоточенным.: это может соответствовать существованию кластеров событий. Сгруппированные, концентрированные данные чрезмерно рассредоточены.

Основанная на выборке оценка индекса дисперсии может использоваться для построения формальной статистической проверки гипотезы адекватности модели, согласно которой ряд подсчетов следует распределению Пуассона. [4] [5] Что касается подсчета интервалов, избыточная дисперсия соответствует большему количеству интервалов с низким счетом и большему количеству интервалов с высоким счетом по сравнению с распределением Пуассона: напротив, недостаточная дисперсия характеризуется наличием больше интервалов со счетами, близкими к среднему, по сравнению с распределением Пуассона.

VMR также является хорошей мерой степени случайности данного явления. Например, этот метод обычно используется в валютном менеджменте.

Пример [ править ]

Для случайно диффундирующих частиц ( броуновское движение ) распределение количества частиц внутри заданного объема является пуассоновским, т.е. VMR = 1. Следовательно, чтобы оценить, является ли данный пространственный паттерн (при условии, что у вас есть способ его измерить) исключительно из-за диффузии или если задействовано какое-то взаимодействие частица-частица: разделите пространство на участки, квадраты или единицы выборки (SU), посчитайте количество людей в каждом патче или SU, и вычислить VMR. Значения VMR, значительно превышающие 1, обозначают кластерное распределение, где случайного блуждания недостаточно, чтобы подавить притягивающий межчастичный потенциал.

История [ править ]

Первым, кто обсудил использование теста для обнаружения отклонений от пуассоновского или биномиального распределения, по-видимому, был Лексис в 1877 году. Одним из разработанных им тестов было соотношение Лексиса .

Этот индекс был впервые использован в ботанике Клэпхэмом в 1936 году.

Если переменные распределены по Пуассону, то индекс дисперсии распределяется как статистика χ 2 с n - 1 степенями свободы, когда n велико и μ > 3. [6] Для многих интересных случаев это приближение является точным, и Фишер в 1950 г. получил для него точный тест.

Хоэл изучил первые четыре момента его распределения. [7] Он обнаружил, что приближение к статистике χ 2 является разумным, если μ > 5.

Искаженные распределения [ править ]

Для сильно искаженных распределений может быть более подходящим использовать линейную функцию потерь, а не квадратичную. Аналогичный коэффициент дисперсии в этом случае представляет собой отношение среднего абсолютного отклонения от медианы к медиане данных, [8] или, в символах:

где n - размер выборки, m - медиана выборки и сумма, взятая по всей выборке. Айова , Нью-Йорк и Южная Дакота используют этот линейный коэффициент дисперсии для оценки налоговых сборов. [9] [10] [11]

Для теста с двумя выборками, в котором размеры выборки велики, обе выборки имеют одинаковую медиану и различаются разбросом вокруг нее, доверительный интервал для линейного коэффициента дисперсии в меньшей степени ограничен величиной

где t j - среднее абсолютное отклонение j- й выборки, а z α - длина доверительного интервала для нормального распределения достоверности α (например, для α = 0,05, z α = 1,96). [8]

См. Также [ править ]

  • Данные подсчета
  • Гармоническое среднее

Подобные соотношения [ править ]

  • Коэффициент вариации ,
  • Стандартизированный момент ,
  • Фано фактор , (оконный VMR)
  • Отношение сигнал-шум , (в обработке сигналов )
    • Соотношение сигнал / шум (обработка изображений)

Заметки [ править ]

  1. ^ Кокс и Льюис (1966)
  2. Перейти ↑ Cox & Lewis (1966), p72
  3. ^ Cox & Lewis (1966), р71
  4. ^ Cox & Lewis (1966), P158
  5. ^ Аптон и Кук (2006), под индексом дисперсии
  6. Перейти ↑ Frome, EL (1982). "Алгоритм AS 171: Тест точной дисперсии Фишера для распределения Пуассона". Журнал Королевского статистического общества, серия C . 31 (1): 67–71. JSTOR  2347079 .
  7. Перейти ↑ Hoel, PG (1943). «Об индексах дисперсии» . Анналы математической статистики . 14 (2): 155–162. DOI : 10.1214 / АОМ / 1177731457 . JSTOR 2235818 . 
  8. ^ а б Бонетт, Д.Г.; Зайер, Э (2006). «Доверительный интервал для коэффициента дисперсии в ненормальных распределениях». Биометрический журнал . 48 (1): 144–148. DOI : 10.1002 / bimj.200410148 . PMID 16544819 . 
  9. ^ «Определения статистических расчетов для массовой оценки» (PDF) . Iowa.gov . Архивировано из оригинала (PDF) 11 ноября 2010 года. Среднее соотношение: соотношение, расположенное на полпути между самым высоким и самым низким соотношением, когда отдельные коэффициенты для класса недвижимости ранжируются в порядке возрастания или убывания. Среднее соотношение чаще всего используется для определения уровня оценки данного класса недвижимости.
  10. ^ «Оценка справедливости в Нью-Йорке: результаты обзора рыночной стоимости 2010 года» . Архивировано из оригинала на 6 ноября 2012 года.
  11. ^ «Краткое изложение процесса оценки» (PDF) . state.sd.us . Налоговое управление штата Южная Дакота - Управление по имущественным / специальным налогам. Архивировано из оригинального (PDF) 10 мая 2009 года.

Ссылки [ править ]

  • Кокс, Д.Р .; Льюис, PAW (1966). Статистический анализ серий событий . Лондон: Метуэн.
  • Upton, G .; Кук, И. (2006). Оксфордский статистический словарь (2-е изд.). Издательство Оксфордского университета. ISBN 978-0-19-954145-4.