Тест Шапиро-Уилка - это проверка нормальности в частотной статистике . Он был опубликован в 1965 году Сэмюэлем Сэнфордом Шапиро и Мартином Уилком . [1]
Теория
Тест Шапиро-Уилка проверяет нулевую гипотезу о том, что выборка x 1 , ..., x n произошла из нормально распределенной популяции. Тестовая статистика является
где
- (с круглыми скобками, заключающими индекс индекса i ; не путать с) - статистика i- го порядка , т. е. i- е наименьшее число в выборке;
- - выборочное среднее.
Коэффициенты даны: [1]
где C - векторная норма : [2]
и вектор m ,
сделано из ожидаемых значений этих порядковых статистик от независимых одинаково распределенных случайных величин , отбираемых из стандартного нормального распределения; наконец-то,является ковариационной матрицей этих статистик нормального порядка. [3]
Нет названия для распространения . Значения отсечки для статистики вычисляются с помощью моделирования Монте-Карло. [2]
Интерпретация
Нуль-гипотеза данного теста является то , что население распределено нормально. Таким образом, если значение p меньше выбранного альфа-уровня , нулевая гипотеза отклоняется и есть свидетельства того, что проверенные данные не имеют нормального распределения. С другой стороны, если значение p больше, чем выбранный альфа-уровень, то нулевая гипотеза (что данные пришли из нормально распределенной совокупности) не может быть отклонена (например, для альфа-уровня 0,05 набор данных со значением p менее 0,05 отвергает нулевую гипотезу о том, что данные взяты из нормально распределенной совокупности). [4]
Как и большинство тестов статистической значимости , если размер выборки достаточно велик, этот тест может обнаруживать даже тривиальные отклонения от нулевой гипотезы (т. Е., Хотя может быть некоторый статистически значимый эффект , он может быть слишком мал, чтобы иметь какое-либо практическое значение); таким образом, обычно рекомендуется дополнительное исследование величины эффекта , например, в этом случае график Q – Q. [5]
Анализ мощности
Моделирование методом Монте-Карло показало, что Шапиро-Уилк имеет лучшую мощность для заданного значения , за ним следует Андерсон-Дарлинг при сравнении тестов Шапиро-Уилка, Колмогорова-Смирнова , Лиллиефорса и Андерсона-Дарлинга. [6]
Приближение
Ройстон предложил альтернативный метод вычисления вектора коэффициентов, предоставив алгоритм вычисления значений, который увеличил размер выборки до 2000. [7] Этот метод используется в нескольких программных пакетах, включая Stata, [8] [9] SPSS и SAS. [10] Рахман и Говидараджулу увеличили размер выборки до 5 000 человек. [11]
Смотрите также
Рекомендации
- ^ а б Шапиро, СС; Вилк, МБ (1965). «Тест дисперсионного анализа на нормальность (полные выборки)». Биометрика . 52 (3–4): 591–611. DOI : 10.1093 / Biomet / 52.3-4.591 . JSTOR 2333709 . Руководство по ремонту 0205384 .п. 593
- ^ а б [1]
- ^ [2]
- ^ «Как мне интерпретировать тест Шапиро-Уилка на нормальность?» . JMP . 2004 . Проверено 24 марта 2012 года .
- ^ Поле, Энди (2009). Обнаружение статистики с помощью SPSS (3-е изд.). Лос-Анджелес [то есть Таузенд-Оукс, Калифорния]: SAGE Publications. п. 143. ISBN. 978-1-84787-906-6.
- ^ Разали, Норнадия; Вау, Яп Би (2011). «Силовые сравнения тестов Шапиро – Вилка, Колмогорова – Смирнова, Лиллиэфорса и Андерсона – Дарлинга» . Журнал статистического моделирования и аналитики . 2 (1): 21–33 . Проверено 30 марта 2017 года .
- ^ Ройстон, Патрик (сентябрь 1992 г.). «Аппроксимация W- критерия Шапиро – Уилка на ненормальность». Статистика и вычисления . 2 (3): 117–119. DOI : 10.1007 / BF01891203 .
- ^ Ройстон, Патрик. «Тесты Шапиро – Вилка и Шапиро – Франсиа». Технический бюллетень Stata, StataCorp LP . 1 (3).
- ^ Тесты Шапиро-Уилка и Шапиро-Франсиа на нормальность
- ^ Пак, Хун Мён (2002–2008). «Одномерный анализ и проверка нормальности с использованием SAS, Stata и SPSS» (PDF) . [рабочий документ] . Проверено 26 февраля 2014 года .
- ^ Рахман и Говидараджулу (1997). «Модификация теста Шапиро и Уилка на нормальность». Журнал прикладной статистики . 24 (2): 219–236. DOI : 10.1080 / 02664769723828 .
Внешние ссылки
- Пример работы с использованием Excel
- Алгоритм AS R94 (Shapiro Wilk) Код FORTRAN
- Исследовательский анализ с использованием критерия нормальности Шапиро – Уилка в R
- Реальная статистика в Excel: расширенный тест Шапиро-Уилка