В этой статье не процитировать какие - либо источники . ( апрель 2009 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
Межквартильное среднее (IQM) (или midmean ) представляет собой статистический показатель центральной тенденции , основанную на усеченное среднее из диапазона межквартильного . IQM очень похож на метод подсчета очков, используемый в видах спорта, которые оцениваются судейской коллегией: отбрасывают самые низкие и самые высокие оценки; вычислить среднее значение оставшихся баллов .
Расчет [ править ]
При вычислении IQM используются только данные между первым и третьим квартилями , а самые низкие 25% и самые высокие 25% данных отбрасываются.
предполагая, что значения были упорядочены.
Примеры [ править ]
Размер набора данных делится на четыре [ править ]
Метод лучше всего пояснить на примере. Рассмотрим следующий набор данных:
- 5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6
Сначала отсортируйте список по убыванию:
- 1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38
В наборе данных 12 наблюдений (точек данных), таким образом, у нас есть 4 квартиля по 3 числа. Отбросьте самые низкие и самые высокие 3 значения:
1, 3, 4, 5, 6, 6, 7, 7, 8,8, 9, 38
Теперь у нас осталось 6 из 12 наблюдений; Далее, мы вычислим арифметическое среднее из этих чисел:
- х IQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6,5
Это межквартильное среднее.
Для сравнения, среднее арифметическое исходного набора данных равно
- (5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8,5
из-за сильного влияния выброса, 38.
Размер набора данных не делится на четыре [ править ]
Приведенный выше пример состоял из 12 наблюдений в наборе данных, что упростило определение квартилей. Конечно, не во всех наборах данных есть количество наблюдений, которое делится на 4. Мы можем скорректировать метод расчета IQM, чтобы учесть это. Итак, в идеале мы хотим, чтобы IQM был равен среднему для симметричных распределений, например:
- 1, 2, 3, 4, 5
имеет среднее значение x mean = 3, и, поскольку это симметричное распределение, было бы желательно x IQM = 3.
Мы можем решить эту проблему, используя средневзвешенное значение квартилей и набора межквартильных данных:
Рассмотрим следующий набор данных из 9 наблюдений:
- 1, 3, 5, 7, 9, 11, 13, 15, 17
9/4 = 2,25 наблюдения в каждом квартиле и 4,5 наблюдения в межквартильном диапазоне. Усеките дробный размер квартиля и удалите это число из 1-го и 4-го квартилей (2,25 наблюдения в каждом квартиле, таким образом, самые низкие 2 и самые высокие 2 удаляются).
1, 3, (5), 7, 9, 11, (13),15, 17
Таким образом, имеется 3 полных наблюдения в межквартильном размахе и 2 частичных наблюдения. Поскольку у нас всего 4,5 наблюдения в межквартильном диапазоне, каждое из двух дробных наблюдений составляет 0,75 (и, таким образом, 3 × 1 + 2 × 0,75 = 4,5 наблюдения).
Теперь IQM рассчитывается следующим образом:
- х IQM = {(7 + 9 + 11) + 0,75 × (5 + 13)} / 4,5 = 9
В приведенном выше примере среднее значение имеет значение x mean = 9. То же, что и IQM, как и ожидалось. Аналогичен метод расчета IQM для любого количества наблюдений; дробные вклады в IQM могут быть 0, 0,25, 0,50 или 0,75.
Сравнение со средним и медианным значением [ править ]
Межквартильное среднее имеет некоторые свойства как среднего, так и медианы :
- Как и медиана , IQM нечувствителен к выбросам ; в приведенном примере наибольшее значение (38) было очевидным выбросом из набора данных, но его значение не используется при вычислении IQM. С другой стороны, общее среднее ( среднее арифметическое ) чувствительно к этим выбросам: x среднее = 8,5.
- Как и среднее значение , IQM - это отдельный параметр, основанный на большом количестве наблюдений из набора данных. Медианное всегда равен одному из наблюдений в наборе данных (предполагается , что нечетное число наблюдений). Среднее значение может быть равно любому значению между самым низким и самым высоким наблюдением, в зависимости от значения всех других наблюдений. IQM может быть равно любому значению между первым и третьим квартилями, в зависимости от всех наблюдений в межквартильном диапазоне.
См. Также [ править ]
Связанная статистика [ править ]
Приложения [ править ]
- Лондонская межбанковская процентная ставка оценивает базовую процентную ставку как межквартильное среднее ставок, предлагаемых несколькими банками.
- Everything2 использует межквартильное среднее значение репутации пользователей, чтобы определить качество его вклада. [1]