Тест Левена

В статистике , тест Левенный в этом выведенный статистик используется для оценки равенства дисперсий для переменного , рассчитанных для двух или более групп. ^[1] Некоторые общие статистические процедуры предполагают, что дисперсия совокупностей, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевую гипотезу о том, что дисперсии совокупности равны (так называемая однородность дисперсии или гомоскедастичность ). Если полученное p -значениекритерия Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборки вряд ли возникли на основе случайной выборки из генеральной совокупности с равными дисперсиями. Таким образом, нулевая гипотеза о равных дисперсиях отклоняется и делается вывод, что существует разница между дисперсиями в генеральной совокупности.

Некоторые из процедур, обычно предполагающих гомоскедастичность, для которых можно использовать тесты Левена, включают дисперсионный анализ и t-тесты .

Перед сравнением средних часто используется проба Левена. Когда тест Левена показывает значимость, следует переключиться на более общие тесты, свободные от предположений о гомоскедастичности (иногда даже непараметрических тестов). Уэлч т -test или неравных дисперсии т -test является более консервативным тестом.

Тест Левена также можно использовать в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной совокупности одинаковые или разные дисперсии. ^[2]

Определение

Тест Левена эквивалентен одностороннему межгрупповому дисперсионному анализу (ANOVA) с зависимой переменной, являющейся абсолютным значением разницы между оценкой и средним значением группы, к которой он принадлежит (показано ниже как ${\ displaystyle Z_ {ij} = | Y_ {ij} - {\ bar {Y}} _ {i \ cdot} |}$ ). Статистика теста, ${\ displaystyle W}$ , эквивалентно ${\ displaystyle F}$ статистика, которая будет получена с помощью такого ANOVA, и определяется следующим образом:

{\ displaystyle W = {\ frac {(Nk)} {(k-1)}} \ cdot {\ frac {\ sum _ {i = 1} ^ {k} N_ {i} (Z_ {i \ cdot} -Z _ {\ cdot \ cdot}) ^ {2}} {\ sum _ {i = 1} ^ {k} \ sum _ {j = 1} ^ {N_ {i}} (Z_ {ij} -Z_ { i \ cdot}) ^ {2}}},}

где

${\ displaystyle k}$ количество различных групп, к которым относятся выбранные случаи,
${\ displaystyle N_ {i}}$ количество дел в ${\ displaystyle i}$ ая группа,
${\ displaystyle N}$ общее количество случаев во всех группах,
${\ displaystyle Y_ {ij}}$ - значение измеряемой переменной для ${\ displaystyle j}$ й случай из ${\ displaystyle i}$ ая группа,
${\ displaystyle Z_ {ij} = {\ begin {cases} | Y_ {ij} - {\ bar {Y}} _ {i \ cdot} |, & {\ bar {Y}} _ {i \ cdot} { \ text {является средним для}} i {\ text {-ой группы}}, \\ | Y_ {ij} - {\ tilde {Y}} _ {i \ cdot} |, & {\ tilde {Y }} _ {i \ cdot} {\ text {- это медиана}} i {\ text {-ой группы}}. \ end {cases}}}$

(Используются оба определения, хотя второе, строго говоря, является тестом Брауна – Форсайта - см. Ниже для сравнения.)

${\ displaystyle Z_ {я \ cdot} = {\ frac {1} {N_ {i}}} \ sum _ {j = 1} ^ {N_ {i}} Z_ {ij}}$ это среднее значение ${\ displaystyle Z_ {ij}}$ для группы ${\ displaystyle i}$ ,
${\ displaystyle Z _ {\ cdot \ cdot} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {k} \ sum _ {j = 1} ^ {N_ {i}} Z_ { ij}}$ среднее из всех ${\ displaystyle Z_ {ij}}$ .

Статистика теста ${\ displaystyle W}$ приблизительно F-распределен с ${\ displaystyle k-1}$ а также ${\ displaystyle Nk}$ степени свободы, и, следовательно, значение результата ${\ displaystyle w}$ из ${\ displaystyle W}$ протестирован против ${\ Displaystyle F (\ альфа, k-1, Nk)}$ где ${\ displaystyle F}$ - квантиль F-распределения, где ${\ displaystyle k-1}$ а также ${\ displaystyle Nk}$ степени свободы и ${\ displaystyle \ alpha}$ - выбранный уровень значимости (обычно 0,05 или 0,01).

Сравнение с тестом Брауна – Форсайта.

Тест Брауна – Форсайта использует медианное значение вместо среднего при вычислении разброса внутри каждой группы ( ${\ displaystyle {\ bar {Y}}}$ против. ${\ displaystyle {\ tilde {Y}}}$ , выше). Хотя оптимальный выбор зависит от основного распределения, рекомендуется определение, основанное на медиане, как выбор, который обеспечивает хорошую устойчивость к многим типам ненормальных данных при сохранении хорошей статистической мощности . ^[2] Если кто-то знает об основном распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт провели исследования методом Монте-Карло, которые показали, что использование усеченного среднего дает наилучшие результаты, когда базовые данные соответствуют распределению Коши ( распределение с тяжелым хвостом ), а медиана работает лучше всего, когда базовые данные соответствуют распределению хи-квадрат с четырьмя степенями распределения свобода (сильно искаженное распределение ). Использование среднего дает наилучшую мощность для симметричных распределений с умеренным хвостом.

Смотрите также

Внешние ссылки

Параметрический и непараметрический тест Левена в SPSS
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35a.htm

[Levene1960-1] Levene, Говард (1960). «Робастные тесты на равенство дисперсий». В Инграме Олкине ; Гарольд Хотеллинг ; и другие. (ред.). Вклады в вероятность и статистику: Очерки в честь Гарольда Хотеллинга . Издательство Стэнфордского университета. С. 278–292.

[patvar-2] а ^б Деррик, B; Рак, А; Toher, D; Белый, П (2018). «Тесты на равенство дисперсий между двумя выборками, которые содержат как парные, так и независимые наблюдения» (PDF) . Журнал прикладных количественных методов . 13 (2): 36–47.

[1]

Тест Левена

Определение

Сравнение с тестом Брауна – Форсайта.

Смотрите также

Рекомендации

Внешние ссылки