Тест Шапиро – Франсиа - это статистический тест на нормальность населения, основанный на данных выборки. Он был введен С. С. Шапиро и Р. С. Франсиа в 1972 г. как упрощение теста Шапиро – Уилка . [1]
Теория
Позволять быть -я заказанная стоимость от нашего размера-образец. Например, если выборка состоит из значений, , потому что это второе по величине значение. Позволятьбыть среднее изго порядка статистики при принятиинезависимые оттяжки из нормального распределения . Например,Это означает, что второе по величине значение в выборке из четырех выборок из нормального распределения обычно примерно на 0,297 стандартного отклонения ниже среднего. [2] Сформируйте коэффициент корреляции Пирсона между и :
При нулевой гипотезе о том, что данные взяты из нормального распределения , эта корреляция будет сильной, поэтому значения будут сгруппированы чуть меньше 1, с пиком, сужающимся и приближающимся к 1, когда увеличивается. Если данные сильно отклоняются от нормального распределения,будет меньше. [1]
Этот тест является формализацией старой практики построения графика qq для сравнения двух распределений с играя роль квантильных точек выборочного распределения и играя роль соответствующих квантильных точек нормального распределения .
По сравнению со статистикой теста Шапиро – Уилка, статистика теста Шапиро – Франсиа легче вычислить, потому что не требует, чтобы мы формировали и инвертировали матрицу ковариаций между статистикой порядка.
Упражняться
Нет известного аналитического выражения в замкнутой форме для значенийтребуется тестом. Однако существует несколько приближений, подходящих для большинства практических целей. [2]
Точная форма нулевого распределения известен только . [1] Моделирование методом Монте-Карло показало, что преобразованная статистика почти нормально распределен, со значениями среднего и стандартного отклонения, которые медленно меняются в зависимости от в легко параметризуемой форме. [3]
Мощность
Сравнительные исследования пришли к выводу, что тесты статистической корреляции порядка, такие как Шапиро-Франсиа и Шапиро-Уилк, являются одними из самых эффективных из установленных статистических тестов на нормальность . [4] Можно предположить, что взвешивание с поправкой на ковариацию статистик разного порядка, используемое в тесте Шапиро-Уилка, должно сделать его немного лучше, но на практике варианты Шапиро-Уилка и Шапиро-Франсиа примерно одинаково хороши. Фактически, вариант Шапиро – Франсиа на самом деле демонстрирует больше возможностей для различения некоторых альтернативных гипотез. [5]
Рекомендации
- ^ а б в Шапиро, СС; Francia, RS (1972-03-01). «Приблизительный анализ дисперсии теста на нормальность». Журнал Американской статистической ассоциации . Американская статистическая ассоциация . 67 (337): 215–216. DOI : 10.2307 / 2284728 . ISSN 1537-274X . JSTOR 2284728 . OCLC 1480864 .
- ^ а б Арнольд, Барри С.; Балакришнан, Нараянасвами; Нагараджа, Хайкади Н. (2008) [1992]. Первый курс по статистике заказов . Классика прикладной математики. 54 . Филадельфия, Пенсильвания: Общество промышленной и прикладной математики . ISBN 978-0-89871-648-1. LCCN 2008061100 .
- ^ Ройстон, Патрик (1993). «Набор инструментов для тестирования на ненормальность полных и подвергнутых цензуре образцов». Статистик . Королевское статистическое общество . 42 (1): 37. DOI : 10,2307 / 2348109 . JSTOR 2348109 .
- ^ Разали, Норнадия Мохд; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро – Уилка, Колмогорова – Смирнова, Лиллиэфорса и Андерсона – Дарлинга» (PDF) . Журнал статистического моделирования и аналитики . Куала-Лумпур: Статистический институт Малайзии. 2 (1): 21–33. ISBN 978-967-363-157-5.
- ^ Ахмад, Фиаз; Хан, Рехан Ахмад (2015). «Сравнение мощности различных тестов на нормальность» . Пакистанский журнал статистики и операционных исследований . Лахор, Пакистан: Колледж статистических и актуарных наук , Университет Пенджаба . 11 (3): 331–345. DOI : 10,18187 / pjsor.v11i3.845 . ISSN 2220-5810 .