Тест Шапиро – Франсиа

Тест Шапиро – Франсиа - это статистический тест на нормальность населения, основанный на данных выборки. Он был введен С. С. Шапиро и Р. С. Франсиа в 1972 г. как упрощение теста Шапиро – Уилка . ^[1]

Теория

Позволять ${\ Displaystyle х _ {(я)}}$ быть ${\ displaystyle i}$ -я заказанная стоимость от нашего размера- ${\ displaystyle n}$ образец. Например, если выборка состоит из значений ${\ displaystyle \ left \ {5.6, -1.2,7.8,3.4 \ right \}}$ , ${\ displaystyle x _ {(2)} = 3,4}$ , потому что это второе по величине значение. Позволять ${\ displaystyle m_ {i: n}}$ быть среднее из ${\ displaystyle i}$ го порядка статистики при принятии ${\ displaystyle n}$ независимые оттяжки из нормального распределения . Например, ${\ displaystyle m_ {2: 4} \ приблизительно -0,297}$ Это означает, что второе по величине значение в выборке из четырех выборок из нормального распределения обычно примерно на 0,297 стандартного отклонения ниже среднего. ^[2] Сформируйте коэффициент корреляции Пирсона между ${\ displaystyle x}$ и ${\ displaystyle m}$ :

{\ displaystyle W '= {\ frac {\ operatorname {cov} (x, m)} {\ sigma _ {x} \ sigma _ {m}}} = {\ frac {\ sum _ {i = 1} ^ {n} (x _ {(i)} - {\ bar {x}}) (m_ {i} - {\ bar {m}})} {\ sqrt {\ left (\ sum _ {i = 1} ^ {n} (x _ {(i)} - {\ bar {x}}) ^ {2} \ right) \ left (\ sum _ {i = 1} ^ {n} (m_ {i} - {\ bar {m}}) ^ {2} \ right)}}}}

При нулевой гипотезе о том, что данные взяты из нормального распределения , эта корреляция будет сильной, поэтому ${\ displaystyle W '}$ значения будут сгруппированы чуть меньше 1, с пиком, сужающимся и приближающимся к 1, когда ${\ displaystyle n}$ увеличивается. Если данные сильно отклоняются от нормального распределения, ${\ displaystyle W '}$ будет меньше. ^[1]

Этот тест является формализацией старой практики построения графика qq для сравнения двух распределений с ${\ displaystyle x}$ играя роль квантильных точек выборочного распределения и ${\ displaystyle m}$ играя роль соответствующих квантильных точек нормального распределения .

По сравнению со статистикой теста Шапиро – Уилка ${\ displaystyle W}$ , статистика теста Шапиро – Франсиа ${\ displaystyle W '}$ легче вычислить, потому что не требует, чтобы мы формировали и инвертировали матрицу ковариаций между статистикой порядка.

Упражняться

Нет известного аналитического выражения в замкнутой форме для значений ${\ displaystyle m_ {i: n}}$ требуется тестом. Однако существует несколько приближений, подходящих для большинства практических целей. ^[2]

Точная форма нулевого распределения ${\ displaystyle W '}$ известен только ${\ displaystyle n = 3}$ . ^[1] Моделирование методом Монте-Карло показало, что преобразованная статистика ${\ Displaystyle \ ln (1-W ')}$ почти нормально распределен, со значениями среднего и стандартного отклонения, которые медленно меняются в зависимости от ${\ displaystyle n}$ в легко параметризуемой форме. ^[3]

Мощность

Сравнительные исследования пришли к выводу, что тесты статистической корреляции порядка, такие как Шапиро-Франсиа и Шапиро-Уилк, являются одними из самых эффективных из установленных статистических тестов на нормальность . ^[4] Можно предположить, что взвешивание с поправкой на ковариацию статистик разного порядка, используемое в тесте Шапиро-Уилка, должно сделать его немного лучше, но на практике варианты Шапиро-Уилка и Шапиро-Франсиа примерно одинаково хороши. Фактически, вариант Шапиро – Франсиа на самом деле демонстрирует больше возможностей для различения некоторых альтернативных гипотез. ^[5]

Рекомендации

^ ^а ^б ^в Шапиро, СС; Francia, RS (1972-03-01). «Приблизительный анализ дисперсии теста на нормальность». Журнал Американской статистической ассоциации . Американская статистическая ассоциация . 67 (337): 215–216. DOI : 10.2307 / 2284728 . ISSN 1537-274X . JSTOR 2284728 . OCLC 1480864 .
^ ^а ^б Арнольд, Барри С.; Балакришнан, Нараянасвами; Нагараджа, Хайкади Н. (2008) [1992]. Первый курс по статистике заказов . Классика прикладной математики. 54 . Филадельфия, Пенсильвания: Общество промышленной и прикладной математики . ISBN 978-0-89871-648-1. LCCN 2008061100 .
^ Ройстон, Патрик (1993). «Набор инструментов для тестирования на ненормальность полных и подвергнутых цензуре образцов». Статистик . Королевское статистическое общество . 42 (1): 37. DOI : 10,2307 / 2348109 . JSTOR 2348109 .
^ Разали, Норнадия Мохд; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро – Уилка, Колмогорова – Смирнова, Лиллиэфорса и Андерсона – Дарлинга» (PDF) . Журнал статистического моделирования и аналитики . Куала-Лумпур: Статистический институт Малайзии. 2 (1): 21–33. ISBN 978-967-363-157-5.
^ Ахмад, Фиаз; Хан, Рехан Ахмад (2015). «Сравнение мощности различных тестов на нормальность» . Пакистанский журнал статистики и операционных исследований . Лахор, Пакистан: Колледж статистических и актуарных наук , Университет Пенджаба . 11 (3): 331–345. DOI : 10,18187 / pjsor.v11i3.845 . ISSN 2220-5810 .

[Shapiro–Francia-1] а ^б ^в Шапиро, СС; Francia, RS (1972-03-01). «Приблизительный анализ дисперсии теста на нормальность». Журнал Американской статистической ассоциации . Американская статистическая ассоциация . 67 (337): 215–216. DOI : 10.2307 / 2284728 . ISSN 1537-274X . JSTOR 2284728 . OCLC 1480864 .

[Arnold-Balakrishnan-Nagaraja-2] а ^б Арнольд, Барри С.; Балакришнан, Нараянасвами; Нагараджа, Хайкади Н. (2008) [1992]. Первый курс по статистике заказов . Классика прикладной математики. 54 . Филадельфия, Пенсильвания: Общество промышленной и прикладной математики . ISBN 978-0-89871-648-1. LCCN 2008061100 .

[Royston-3] Ройстон, Патрик (1993). «Набор инструментов для тестирования на ненормальность полных и подвергнутых цензуре образцов». Статистик . Королевское статистическое общество . 42 (1): 37. DOI : 10,2307 / 2348109 . JSTOR 2348109 .

[Razali-Wah-4] Разали, Норнадия Мохд; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро – Уилка, Колмогорова – Смирнова, Лиллиэфорса и Андерсона – Дарлинга» (PDF) . Журнал статистического моделирования и аналитики . Куала-Лумпур: Статистический институт Малайзии. 2 (1): 21–33. ISBN 978-967-363-157-5.

[Ahmad-Kahn-5] Ахмад, Фиаз; Хан, Рехан Ахмад (2015). «Сравнение мощности различных тестов на нормальность» . Пакистанский журнал статистики и операционных исследований . Лахор, Пакистан: Колледж статистических и актуарных наук , Университет Пенджаба . 11 (3): 331–345. DOI : 10,18187 / pjsor.v11i3.845 . ISSN 2220-5810 .

[1]