Диапазон (статистика)


В статистике диапазоном набора данных является разница между наибольшим и наименьшим значениями. [1] Разница здесь специфична, диапазон набора данных является результатом вычитания максимума и минимума выборки .

Однако в описательной статистике это понятие диапазона имеет более сложное значение. Диапазон представляет собой размер наименьшего интервала (статистики) , который содержит все данные и дает представление о статистической дисперсии . Измеряется в тех же единицах, что и данные. Поскольку он зависит только от двух наблюдений, он наиболее полезен для представления дисперсии небольших наборов данных. [2]

Для n независимых и одинаково распределенных непрерывных случайных величин X 1 , X 2 , ..., X n с кумулятивной функцией распределения G( x ) и функцией плотности вероятности g( x ). Пусть T обозначает диапазон выборки размера n из совокупности с функцией распределения G ( x ).

Гамбель отмечает, что «красота этой формулы совершенно омрачена тем фактом, что в общем случае мы не можем выразить G ( x  +  t ) через G ( x ) и что численное интегрирование длительное и утомительное». [3] : 385 

Если распределение каждого X i ограничено вправо (или влево), то асимптотическое распределение диапазона равно асимптотическому распределению наибольшего (наименьшего) значения. Для более общих распределений асимптотическое распределение может быть выражено как функция Бесселя . [3]

где x ( G ) — обратная функция. В случае, когда каждый из X i имеет стандартное нормальное распределение , средний диапазон определяется выражением [6]