В статистике , то в середине диапазон или средний крайний из набора значений статистических данных является средним арифметическим из максимальных и минимальных значений в наборе данных , определяются следующим образом: [1]
Средний диапазон - это средняя точка диапазона ; как таковая, это мера центральной тенденции .
Средний диапазон редко используется в практическом статистическом анализе, так как ему не хватает эффективности в качестве средства оценки для большинства представляющих интерес распределений, потому что он игнорирует все промежуточные точки, и ему не хватает устойчивости , поскольку выбросы значительно его изменяют. Действительно, это одна из наименее эффективных и наименее надежных статистических данных. Однако он находит некоторое применение в особых случаях: это максимально эффективный оценщик для центра равномерного распределения, усеченная устойчивость адреса в среднем диапазоне, и как L-оценщик его просто понять и вычислить.
Надежность [ править ]
Средний диапазон очень чувствителен к выбросам и игнорирует все, кроме двух точек данных. Следовательно, это очень ненадежная статистика , имеющая точку разбивки 0, что означает, что одно наблюдение может изменить ее произвольно. Кроме того, на него сильно влияют выбросы: увеличение максимума выборки или уменьшение минимума выборки на x изменяет средний диапазон на, в то время как оно изменяет среднее значение выборки, которое также имеет точку разбивки 0, только за счет этого. практическая статистика, если выбросы еще не обработаны.
Обрежутся СЧ известен как midsummary - The п % обрежутся средний уровень является средним значением п % и (100- п )% процентилей, и является более надежным, имеющей точку пробоя по п %. Посередине находится мидинге , составляющее 25% итоговой суммы. Медианный можно интерпретировать как полностью отделан (50%) среднего диапазона; это согласуется с соглашением о том, что медиана четного числа точек является средним значением двух средних точек.
Эти обрезанные средние диапазоны также представляют интерес как описательная статистика или как L-оценки центрального положения или асимметрии : различия срединных значений, такие как середина минус медиана, дают меры асимметрии в разных точках хвоста. [2]
Эффективность [ править ]
Несмотря на все недостатки, в некоторых случаях бывает полезно: средние частоты является весьма эффективным оценки М, учитывая небольшой образец достаточно platykurtic распределения, но оно неэффективно для mesokurtic распределений, таких как нормальный.
Например, для непрерывного равномерного распределения с неизвестным максимумом и минимумом средний диапазон является оценкой UMVU для среднего. Образец максимального и образец минимального вместе с образцом размера, являются достаточной статистикой для максимального населения и минимума - распределение других образцов, обусловливающие данного максимума и минимума, это только равномерное распределение между максимальным и минимальным и , таким образом , добавить нет информации. См. Проблему с немецкими танками для дальнейшего обсуждения. Таким образом, средний диапазон, который является объективной и достаточной оценкой среднего значения генеральной совокупности, на самом деле является UMVU: использование среднего значения выборки просто добавляет шум на основе неинформативного распределения точек в этом диапазоне.
И наоборот, для нормального распределения выборочное среднее является оценкой среднего UMVU. Таким образом, для платикуртических распределений, которые часто можно представить как между равномерным распределением и нормальным распределением, информативность средних точек выборки по сравнению со значениями экстремумов варьируется от «равной» для нормального до «неинформативного» для равномерного и для различных распределений. , один или другой (или некоторая их комбинация) могут быть наиболее эффективными. Надежным аналогом является trimean , который усредняет середину диапазона (25% обрезанного среднего диапазона) и медианы.
Небольшие образцы [ править ]
Для небольших размеров выборки ( n от 4 до 20), взятых из достаточно платикуртического распределения (отрицательный избыточный эксцесс , определяемый как γ 2 = (μ 4 / (μ 2 ) ²) - 3), средний диапазон является эффективной оценкой среднее μ . В следующей таблице приведены эмпирические данные, сравнивающие три оценки среднего для распределений различного эксцесса; модифицировано среднее является усеченным средним , где устраняются максимум и минимум. [3] [4]
Избыточный эксцесс (γ 2 ) | Наиболее эффективная оценка μ |
---|---|
От −1,2 до −0,8 | Средний диапазон |
От -0,8 до 2,0 | Иметь в виду |
От 2,0 до 6,0 | Модифицированное среднее |
Для n = 1 или 2 средний диапазон и среднее значение равны (и совпадают с медианой) и являются наиболее эффективными для всех распределений. Для n = 3 модифицированное среднее - это медиана, а вместо этого среднее является наиболее эффективной мерой центральной тенденции для значений γ 2 от 2,0 до 6,0, а также от -0,8 до 2,0.
Свойства выборки [ править ]
Для выборки размера n из стандартного нормального распределения средний диапазон M несмещен и имеет дисперсию, определяемую следующим образом: [5]
Для выборки размера n из стандартного распределения Лапласа средний диапазон M несмещен и имеет дисперсию, определяемую следующим образом: [6]
и, в частности, дисперсия не уменьшается до нуля при увеличении размера выборки.
Для выборки размера n из равномерного распределения с нулевым центром , средний диапазон M несмещен, nM имеет асимптотическое распределение, которое является распределением Лапласа . [7]
Отклонение [ править ]
В то время как среднее значение набора значений минимизирует сумму квадратов отклонений, а медиана минимизирует среднее абсолютное отклонение , средний диапазон минимизирует максимальное отклонение (определяемое как ): это решение вариационной задачи.
См. Также [ править ]
- Диапазон (статистика)
- Midhinge
Ссылки [ править ]
- ^ Dodge 2003 .
- ^ Velleman & Hoaglin 1981 .
- ^ Винсон, Уильям Дэниел (1951). Исследование мер центральной тенденции, используемых в контроле качества (магистратура). Университет Северной Каролины в Чапел-Хилл. Таблица (4.1), стр. 32–34.
- ^ Кауден, Дадли Джонстон (1957). Статистические методы контроля качества . Прентис-Холл. С. 67–68 .
- ^ Кендалл и Стюарт 1969 , пример 14.4.
- ^ Кендалл и Стюарт 1969 , пример 14.5.
- ^ Кендалл и Стюарт 1969 , пример 14.12.
- Додж, Ю. (2003). Оксфордский словарь статистических терминов . Издательство Оксфордского университета. ISBN 0-19-920613-9.
- Кендалл, MG; Стюарт, А. (1969). Расширенная теория статистики, Том 1 . Грифон. ISBN 0-85264-141-9.
- Веллеман П.Ф .; Хоглин, округ Колумбия (1981). Приложения, основы и вычисления исследовательского анализа данных . ISBN 0-87150-409-X.