Эта статья требует дополнительных ссылок для проверки . ( май 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения ) |
В описательных статистиках , то межквартильная ( МКР ), также называемый midspread , средний 50% , или Н-спрэд , является мерой статистической дисперсии , равна разнице между 75 - м и 25 - м процентилями , или между верхним и нижней квартилью , [1] [2] IQR = Q 3 - Q 1 . Другими словами, IQR - это первый квартиль, вычтенный из третьего квартиля; эти квартили можно четко увидеть на прямоугольной диаграмме данных. Это усеченная оценка, определяемый как 25% усеченный диапазон , и является обычно используемым надежным показателем масштаба .
IQR - это мера изменчивости, основанная на разделении набора данных на квартили. Квартили делят упорядоченный набор данных на четыре равные части. Значения, разделяющие части, называются первым, вторым и третьим квартилями; и обозначаются Q1, Q2 и Q3 соответственно.
Используйте [ редактировать ]
В отличие от общего диапазона , межквартильный диапазон имеет точку разбивки 25% [3] и, таким образом, часто предпочтительнее общего диапазона.
IQR используется для построения коробчатых диаграмм , простых графических представлений распределения вероятностей .
IQR используется на предприятиях как маркер уровня их дохода .
Для симметричного распределения (где медиана равна midhinge , среднему значению первого и третьего квартилей), половина IQR равна медианному абсолютному отклонению (MAD).
Медиана является соответствующей мерой центральной тенденции .
IQR можно использовать для выявления выбросов (см. Ниже ).
Квартильное отклонение или полумежквартильный диапазон определяется как половина IQR. [4] [5]
Алгоритм [ править ]
IQR набора значений рассчитывается как разница между верхним и нижним квартилями, Q 3 и Q 1 . Каждый квартиль - это медиана [6], рассчитанная следующим образом.
Учитывая четное 2n или нечетное 2n + 1 количество значений
- первый квартиль Q 1 = медиана n наименьших значений
- третий квартиль Q 3 = медиана n наибольших значений [6]
Вторая квартиль Q 2 является таким же , как обычными медианы. [6]
Примеры [ править ]
Набор данных в таблице [ править ]
Следующая таблица состоит из 13 строк и соответствует правилам для нечетного количества записей.
я | х [я] | Медиана | Квартиль |
---|---|---|---|
1 | 7 | Q 2 = 87 (медиана всей таблицы) | Q 1 = 31 (медиана верхней половины, с 1 по 6 ряды) |
2 | 7 | ||
3 | 31 год | ||
4 | 31 год | ||
5 | 47 | ||
6 | 75 | ||
7 | 87 | ||
8 | 115 | ||
Q 3 = 119 (медиана нижней половины, с 8 по 13 ряды) | |||
9 | 116 | ||
10 | 119 | ||
11 | 119 | ||
12 | 155 | ||
13 | 177 |
Для данных этой таблицы межквартильный размах составляет IQR = Q 3 - Q 1 = 119 - 31 = 88.
Набор данных в виде обычного текстового поля [ править ]
+ −−−−− + - + * | −−−−−−−−−−−− | | | −−−−−−−−−−− | + −−−−− + - + + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + число линия 0 1 2 3 4 5 6 7 8 9 10 11 12
Для набора данных в этой рамочной диаграмме :
- нижний (первый) квартиль Q 1 = 7
- медиана (второй квартиль) Q 2 = 8,5
- верхний (третий) квартиль Q 3 = 9
- межквартильный размах, IQR = Q 3 - Q 1 = 2
- нижний 1,5 * усы IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Если нет точки данных в 4, то самая низкая точка больше 4.)
- верхний 1,5 * усы IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Если нет точки данных на 12, тогда наивысшая точка меньше 12.)
Это означает, что усы 1,5 * IQR могут быть неодинаковой длины.
Распределения [ править ]
Межквартильный размах непрерывного распределения может быть рассчитан путем интегрирования функции плотности вероятности (которая дает кумулятивную функцию распределения - также будут работать любые другие средства вычисления CDF). Нижний квартиль, Q 1 , представляет собой такое число, что интеграл PDF от -∞ до Q 1 равен 0,25, а верхний квартиль, Q 3 , является таким числом, что интеграл от -∞ до Q 3 равен 0,75; в терминах CDF квартили можно определить следующим образом:
где CDF −1 - функция квантиля .
Межквартильный размах и медиана некоторых распространенных распределений показаны ниже.
Распределение | Медиана | IQR |
---|---|---|
Нормальный | μ | 2 Φ −1 (0,75) σ ≈ 1,349σ ≈ (27/20) σ |
Лаплас | μ | 2 б п (2) ≈ 1,386 б |
Коши | μ | 2γ |
Тест межквартильного размаха на нормальность распределения [ править ]
МКР, среднее и стандартное отклонение популяции P может быть использовано в испытании простого , является ли или нет Р является нормально распределенным или гауссовым. Если P имеет нормальное распределение, то стандартный балл первого квартиля, z 1 , равен -0,67, а стандартный балл третьего квартиля, z 3 , равен +0,67. Учитывая среднее значение = X и стандартное отклонение = σ для P , если P нормально распределено, первый квартиль
и третий квартиль
Если фактические значения первого или третьего квартилей существенно отличаются [ требуется пояснение ] от расчетных значений, P не имеет нормального распределения. Однако нормальное распределение можно тривиально изменить, чтобы сохранить его Q1 и Q2 std. баллы 0,67 и -0,67 и не имеют нормального распределения (так что вышеупомянутый тест даст ложноположительный результат). Здесь будет указан лучший тест на нормальность, такой как график QQ .
Выбросы [ править ]
Межквартильный размах часто используется для поиска выбросов в данных. Выбросы здесь определяются как наблюдения, которые падают ниже Q1 - 1,5 IQR или выше Q3 + 1,5 IQR. На диаграмме высшее и наименьшее встречающиеся значения в пределах этого предела обозначены усами прямоугольника (часто с дополнительной полосой в конце усов), а любые выбросы - отдельными точками.
См. Также [ править ]
- Interdecile диапазон
- Midhinge
- Надежные меры масштаба
Ссылки [ править ]
- ^ Аптон, Грэм; Кук, Ян (1996). Понимание статистики . Издательство Оксфордского университета. п. 55. ISBN 0-19-914391-9.
- ^ Цвиллинджер, Д., Кокоска, С. (2000) Стандартные таблицы вероятностей и статистики CRC и формулы , CRC Press. ISBN 1-58488-059-7 стр. 18.
- ^ Rousseeuw, Питер Дж .; Кру, Кристоф (1992). Ю. Додж (ред.). «Явные шкалы для оценки с высокой точкой пробоя» (PDF) . L1-Статистический анализ и связанные с ним методы . Амстердам: Северная Голландия. С. 77–92.
- ^ Юла, Г. Udny (1911). Введение в теорию статистики . Чарльз Гриффин и компания. стр. 147 -148.
- ^ Вайсштейн, Эрик В. «Квартильное отклонение» . MathWorld .
- ^ a b c Bertil., Westergren (1988). Справочник по бета [beta] математике: концепции, теоремы, методы, алгоритмы, формулы, графики, таблицы . Studentlitteratur . п. 348. ISBN 9144250517. OCLC 18454776 .
Внешние ссылки [ править ]
- СМИ, связанные с межквартильным размахом, на Викискладе?