Тест Ван дер Вардена

Названный в честь голландского математика Ван дер Варден , то Ван - дер - Варден тест является статистический тест , что к функции распределения населения равны. Тест Ван дер Вардена преобразует ранги из стандартного одностороннего дисперсионного анализа Краскела-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.

К версии населения теста является продолжением теста для двух популяций , опубликованных Ван дер Варден (1952,1953).

Задний план

Дисперсионный анализ (ANOVA) - это метод анализа данных для изучения значимости факторов ( независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия . То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о равенстве k средних значений совокупности. Стандартный дисперсионный анализ предполагает, что ошибки (т. Е. Остатки) распределены нормально . Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста .

Определение теста

Пусть n _j ( j = 1, 2, ..., k ) представляет размеры выборки для каждой из k групп (т. Е. Выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X _ij представляет i- ^е значение в j- ^й группе. Нормальные баллы рассчитываются как

{\ Displaystyle A_ {ij} = \ Phi ^ {- 1} \ left ({\ frac {R (X_ {ij})} {N + 1}} \ right)}

где R ( X _ij ) обозначает ранг наблюдения X _ij, а Φ ⁻¹ обозначает нормальную функцию квантиля . Среднее значение нормальных оценок для каждой выборки можно затем вычислить как

{\ displaystyle {\ bar {A}} _ {j} = {\ frac {1} {n_ {j}}} \ sum _ {i = 1} ^ {n_ {j}} A_ {ij} \ quad j = 1,2, \ ldots, k}

Дисперсия нормальных оценок может быть вычислена как

{\ displaystyle s ^ {2} = {\ frac {1} {N-1}} \ sum _ {j = 1} ^ {k} \ sum _ {i = 1} ^ {n_ {j}} A_ { ij} ^ {2}}

Тогда критерий Ван дер Вардена можно определить следующим образом:

H ₀ : все k функций распределения населения идентичны

H _a : По крайней мере, одна из популяций имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других популяций.

Статистика теста

{\ displaystyle T_ {1} = {\ frac {1} {s ^ {2}}} \ sum _ {j = 1} ^ {k} n_ {j} {\ bar {A}} _ {j} ^ {2}}

Для уровня значимости α критическая область равна

{\ displaystyle T_ {1}> \ chi _ {\ alpha, k-1} ^ {2}}

где Χ _{а, к - 1}² представляет собой α- квантиль из распределения хи-квадрат с к - 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отвергается, можно выполнить процедуру множественных сравнений , чтобы определить, какие пары популяций имеют тенденцию различаться. Населения j ₁ и j ₂ кажутся разными, если выполняется следующее неравенство:

{\ displaystyle \ left \ vert {\ bar {A}} _ {j_ {1}} - {\ bar {A}} _ {j_ {2}} \ right \ vert> s \, t_ {1- \ alpha / 2} {\ sqrt {\ frac {N-1-T_ {1}} {Nk}}} {\ sqrt {{\ frac {1} {n_ {j_ {1}}}} + {\ frac {1 } {n_ {j_ {2}}}}}}}

с т _{1 - α / 2} (1 - α / 2) - квантиль из трет-распределения .

Сравнение с тестом Краскела-Уоллиса

Самым распространенным непараметрическим тестом для однофакторной модели является тест Краскела-Уоллиса . Тест Краскала-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда предположения нормальности не выполняются.

Тест Ван дер Вардена

Задний план

Определение теста

Сравнение с тестом Краскела-Уоллиса

Рекомендации