В статистике , тест Левенный в этом выведенный статистик используется для оценки равенства дисперсий для переменного , рассчитанных для двух или более групп. [1] Некоторые общие статистические процедуры предполагают, что дисперсия совокупностей, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевую гипотезу о том, что дисперсии совокупности равны (так называемая однородность дисперсии или гомоскедастичность ). Если полученное p -значениекритерия Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборки вряд ли возникли на основе случайной выборки из генеральной совокупности с равными дисперсиями. Таким образом, нулевая гипотеза о равных дисперсиях отклоняется и делается вывод, что существует разница между дисперсиями в генеральной совокупности.
Некоторые из процедур, обычно предполагающих гомоскедастичность, для которых можно использовать тесты Левена, включают дисперсионный анализ и t-тесты .
Перед сравнением средних часто используется проба Левена. Когда тест Левена показывает значимость, следует переключиться на более общие тесты, свободные от предположений о гомоскедастичности (иногда даже непараметрических тестов). Уэлч т -test или неравных дисперсии т -test является более консервативным тестом.
Тест Левена также можно использовать в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной совокупности одинаковые или разные дисперсии. [2]
Определение
Тест Левена эквивалентен одностороннему межгрупповому дисперсионному анализу (ANOVA) с зависимой переменной, являющейся абсолютным значением разницы между оценкой и средним значением группы, к которой он принадлежит (показано ниже как ). Статистика теста,, эквивалентно статистика, которая будет получена с помощью такого ANOVA, и определяется следующим образом:
где
- количество различных групп, к которым относятся выбранные случаи,
- количество дел в ая группа,
- общее количество случаев во всех группах,
- - значение измеряемой переменной дляй случай из ая группа,
(Используются оба определения, хотя второе, строго говоря, является тестом Брауна – Форсайта - см. Ниже для сравнения.)
- это среднее значение для группы ,
- среднее из всех .
Статистика теста приблизительно F-распределен с а также степени свободы, и, следовательно, значение результата из протестирован против где - квантиль F-распределения, где а также степени свободы и - выбранный уровень значимости (обычно 0,05 или 0,01).
Сравнение с тестом Брауна – Форсайта.
Тест Брауна – Форсайта использует медианное значение вместо среднего при вычислении разброса внутри каждой группы ( против. , выше). Хотя оптимальный выбор зависит от основного распределения, рекомендуется определение, основанное на медиане, как выбор, который обеспечивает хорошую устойчивость к многим типам ненормальных данных при сохранении хорошей статистической мощности . [2] Если кто-то знает об основном распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт провели исследования методом Монте-Карло, которые показали, что использование усеченного среднего дает наилучшие результаты, когда базовые данные соответствуют распределению Коши ( распределение с тяжелым хвостом ), а медиана работает лучше всего, когда базовые данные соответствуют распределению хи-квадрат с четырьмя степенями распределения свобода (сильно искаженное распределение ). Использование среднего дает наилучшую мощность для симметричных распределений с умеренным хвостом.
Смотрите также
Рекомендации
- ^ Levene, Говард (1960). «Робастные тесты на равенство дисперсий». В Инграме Олкине ; Гарольд Хотеллинг ; и другие. (ред.). Вклады в вероятность и статистику: Очерки в честь Гарольда Хотеллинга . Издательство Стэнфордского университета. С. 278–292.
- ^ а б Деррик, B; Рак, А; Toher, D; Белый, П (2018). «Тесты на равенство дисперсий между двумя выборками, которые содержат как парные, так и независимые наблюдения» (PDF) . Журнал прикладных количественных методов . 13 (2): 36–47.