Названный в честь голландского математика Ван дер Варден , то Ван - дер - Варден тест является статистический тест , что к функции распределения населения равны. Тест Ван дер Вардена преобразует ранги из стандартного одностороннего дисперсионного анализа Краскела-Уоллиса в квантили стандартного нормального распределения (подробности приведены ниже). Они называются нормальными оценками, и тест рассчитывается на основе этих нормальных оценок.
К версии населения теста является продолжением теста для двух популяций , опубликованных Ван дер Варден (1952,1953).
Задний план
Дисперсионный анализ (ANOVA) - это метод анализа данных для изучения значимости факторов ( независимых переменных ) в многофакторной модели. Однофакторную модель можно рассматривать как обобщение двухвыборочного t-критерия . То есть t-критерий для двух выборок - это проверка гипотезы о равенстве двух средних значений совокупности. Однофакторный дисперсионный анализ ANOVA проверяет гипотезу о равенстве k средних значений совокупности. Стандартный дисперсионный анализ предполагает, что ошибки (т. Е. Остатки) распределены нормально . Если это предположение о нормальности неверно, альтернативой является использование непараметрического теста .
Определение теста
Пусть n j ( j = 1, 2, ..., k ) представляет размеры выборки для каждой из k групп (т. Е. Выборок) в данных. Пусть N обозначает размер выборки для всех групп. Пусть X ij представляет i- е значение в j- й группе. Нормальные баллы рассчитываются как
где R ( X ij ) обозначает ранг наблюдения X ij, а Φ −1 обозначает нормальную функцию квантиля . Среднее значение нормальных оценок для каждой выборки можно затем вычислить как
Дисперсия нормальных оценок может быть вычислена как
Тогда критерий Ван дер Вардена можно определить следующим образом:
- H 0 : все k функций распределения населения идентичны
- H a : По крайней мере, одна из популяций имеет тенденцию давать более крупные наблюдения, чем по крайней мере одна из других популяций.
Статистика теста
Для уровня значимости α критическая область равна
где Χ а, к - 1 2 представляет собой α- квантиль из распределения хи-квадрат с к - 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если гипотеза об идентичных распределениях отвергается, можно выполнить процедуру множественных сравнений , чтобы определить, какие пары популяций имеют тенденцию различаться. Населения j 1 и j 2 кажутся разными, если выполняется следующее неравенство:
с т 1 - α / 2 (1 - α / 2) - квантиль из трет-распределения .
Сравнение с тестом Краскела-Уоллиса
Самым распространенным непараметрическим тестом для однофакторной модели является тест Краскела-Уоллиса . Тест Краскала-Уоллиса основан на ранжировании данных. Преимущество теста Ван дер Вардена состоит в том, что он обеспечивает высокую эффективность стандартного анализа ANOVA, когда предположения нормальности фактически выполняются, но он также обеспечивает надежность теста Краскела-Уоллиса, когда предположения нормальности не выполняются.
Рекомендации
- Коновер, WJ (1999). Практическая непараметрическая статистика (Третье изд.). Вайли. С. 396–406.
- ван дер Варден, Б.Л. (1952). «Порядок тестов для задачи с двумя выборками и их мощность», Indagationes Mathematicae , 14, 453–458.
- ван дер Варден, Б.Л. (1953). «Порядковые тесты для задачи с двумя выборками. II, III», Труды Koninklijke Nederlandse Akademie van Wetenschappen, Serie A , 564, 303–310, 311–316.
Эта статья включает материалы, являющиеся общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .