Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Коробчатая диаграмма (с межквартильным размахом) и функция плотности вероятности (pdf) нормальной популяции N (0, σ 2 )

В описательных статистиках , то межквартильная ( МКР ), также называемый midspread , средний 50% , или Н-спрэд , является мерой статистической дисперсии , равна разнице между 75 - м и 25 - м процентилями , или между верхним и нижней квартилью , [1] [2] IQR = Q 3  -  Q 1 . Другими словами, IQR - это первый квартиль, вычтенный из третьего квартиля; эти квартили можно четко увидеть на прямоугольной диаграмме данных. Это усеченная оценка, определяемый как 25% усеченный диапазон , и является обычно используемым надежным показателем масштаба .

IQR - это мера изменчивости, основанная на разделении набора данных на квартили. Квартили делят упорядоченный набор данных на четыре равные части. Значения, разделяющие части, называются первым, вторым и третьим квартилями; и обозначаются Q1, Q2 и Q3 соответственно.

Используйте [ редактировать ]

В отличие от общего диапазона , межквартильный диапазон имеет точку разбивки 25% [3] и, таким образом, часто предпочтительнее общего диапазона.

IQR используется для построения коробчатых диаграмм , простых графических представлений распределения вероятностей .

IQR используется на предприятиях как маркер уровня их дохода .

Для симметричного распределения (где медиана равна midhinge , среднему значению первого и третьего квартилей), половина IQR равна медианному абсолютному отклонению (MAD).

Медиана является соответствующей мерой центральной тенденции .

IQR можно использовать для выявления выбросов (см. Ниже ).

Квартильное отклонение или полумежквартильный диапазон определяется как половина IQR. [4] [5]

Алгоритм [ править ]

IQR набора значений рассчитывается как разница между верхним и нижним квартилями, Q 3 и Q 1 . Каждый квартиль - это медиана [6], рассчитанная следующим образом.

Учитывая четное 2n или нечетное 2n + 1 количество значений

первый квартиль Q 1 = медиана n наименьших значений
третий квартиль Q 3 = медиана n наибольших значений [6]

Вторая квартиль Q 2 является таким же , как обычными медианы. [6]

Примеры [ править ]

Набор данных в таблице [ править ]

Следующая таблица состоит из 13 строк и соответствует правилам для нечетного количества записей.

Для данных этой таблицы межквартильный размах составляет IQR = Q 3 - Q 1 = 119 - 31 = 88.

Набор данных в виде обычного текстового поля [ править ]

  + −−−−− + - +  * | −−−−−−−−−−−− | | | −−−−−−−−−−− | + −−−−− + - +   + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + −−− + число линия 0 1 2 3 4 5 6 7 8 9 10 11 12 

Для набора данных в этой рамочной диаграмме :

  • нижний (первый) квартиль Q 1 = 7
  • медиана (второй квартиль) Q 2 = 8,5
  • верхний (третий) квартиль Q 3 = 9
  • межквартильный размах, IQR = Q 3 - Q 1 = 2
  • нижний 1,5 * усы IQR = Q 1 - 1,5 * IQR = 7 - 3 = 4. (Если нет точки данных в 4, то самая низкая точка больше 4.)
  • верхний 1,5 * усы IQR = Q 3 + 1,5 * IQR = 9 + 3 = 12. (Если нет точки данных на 12, тогда наивысшая точка меньше 12.)

Это означает, что усы 1,5 * IQR могут быть неодинаковой длины.

Распределения [ править ]

Межквартильный размах непрерывного распределения может быть рассчитан путем интегрирования функции плотности вероятности (которая дает кумулятивную функцию распределения - также будут работать любые другие средства вычисления CDF). Нижний квартиль, Q 1 , представляет собой такое число, что интеграл PDF от -∞ до Q 1 равен 0,25, а верхний квартиль, Q 3 , является таким числом, что интеграл от -∞ до Q 3 равен 0,75; в терминах CDF квартили можно определить следующим образом:

где CDF −1 - функция квантиля .

Межквартильный размах и медиана некоторых распространенных распределений показаны ниже.

Тест межквартильного размаха на нормальность распределения [ править ]

МКР, среднее и стандартное отклонение популяции P может быть использовано в испытании простого , является ли или нет Р является нормально распределенным или гауссовым. Если P имеет нормальное распределение, то стандартный балл первого квартиля, z 1 , равен -0,67, а стандартный балл третьего квартиля, z 3 , равен +0,67. Учитывая среднее значение  =  X и стандартное отклонение  = σ для P , если P нормально распределено, первый квартиль

и третий квартиль

Если фактические значения первого или третьего квартилей существенно отличаются [ требуется пояснение ] от расчетных значений, P не имеет нормального распределения. Однако нормальное распределение можно тривиально изменить, чтобы сохранить его Q1 и Q2 std. баллы 0,67 и -0,67 и не имеют нормального распределения (так что вышеупомянутый тест даст ложноположительный результат). Здесь будет указан лучший тест на нормальность, такой как график QQ .

Выбросы [ править ]

График прямоугольной формы с четырьмя умеренными выбросами и одним экстремальным выбросом. На этом графике выбросы определяются как умеренные, выше Q3 + 1,5 IQR, и как экстремальные, выше Q3 + 3 IQR.

Межквартильный размах часто используется для поиска выбросов в данных. Выбросы здесь определяются как наблюдения, которые падают ниже Q1 - 1,5 IQR или выше Q3 + 1,5 IQR. На диаграмме высшее и наименьшее встречающиеся значения в пределах этого предела обозначены усами прямоугольника (часто с дополнительной полосой в конце усов), а любые выбросы - отдельными точками.

См. Также [ править ]

  • Interdecile диапазон
  • Midhinge
  • Надежные меры масштаба

Ссылки [ править ]

  1. ^ Аптон, Грэм; Кук, Ян (1996). Понимание статистики . Издательство Оксфордского университета. п. 55. ISBN 0-19-914391-9.
  2. ^ Цвиллинджер, Д., Кокоска, С. (2000) Стандартные таблицы вероятностей и статистики CRC и формулы , CRC Press. ISBN 1-58488-059-7 стр. 18. 
  3. ^ Rousseeuw, Питер Дж .; Кру, Кристоф (1992). Ю. Додж (ред.). «Явные шкалы для оценки с высокой точкой пробоя» (PDF) . L1-Статистический анализ и связанные с ним методы . Амстердам: Северная Голландия. С. 77–92.
  4. ^ Юла, Г. Udny (1911). Введение в теорию статистики . Чарльз Гриффин и компания. стр.  147 -148.
  5. ^ Вайсштейн, Эрик В. «Квартильное отклонение» . MathWorld .
  6. ^ a b c Bertil., Westergren (1988). Справочник по бета [beta] математике: концепции, теоремы, методы, алгоритмы, формулы, графики, таблицы . Studentlitteratur . п. 348. ISBN 9144250517. OCLC  18454776 .

Внешние ссылки [ править ]

  • СМИ, связанные с межквартильным размахом, на Викискладе?