Анализ ковариации

Ковариационный анализ ( ANCOVA ) - это общая линейная модель, сочетающая ANOVA и регрессию . ANCOVA оценивает, равны ли средние значения зависимой переменной (DV) на разных уровнях категориальной независимой переменной (IV), часто называемой обработкой, при статистическом контроле эффектов других непрерывных переменных, которые не представляют особого интереса, известных как ковариаты.(CV) или мешающие переменные. Математически ANCOVA разлагает дисперсию DV на дисперсию, объясняемую CV, дисперсию, объясняемую категориальным IV, и остаточную дисперсию. Интуитивно ANCOVA можно рассматривать как «настройку» DV с помощью групповых средств CV. ^[1]

Модель ANCOVA предполагает линейную зависимость между ответом (DV) и ковариантой (CV):

$y_{ij}=\mu +\tau _{i}+\mathrm {B} (x_{ij}-{\overline {x}})+\epsilon _{ij}.$

В этом уравнении DV является j-м наблюдением в i-й категориальной группе; CV является j- м наблюдением ковариаты i- й группы. Переменные в модели, полученные из наблюдаемых данных, - это (общее среднее) и (глобальное среднее значение для ковариаты ). Подбираемые переменные: (влияние i- го уровня IV), (наклон линии) и (связанный член ненаблюдаемой ошибки для j- го наблюдения в i- й группе). $y_{ij}$ $x_{ij}$ $\mu$ ${\overline {x}}$ $x$ $\tau _{i}$ $B$ $\epsilon _{ij}$

Согласно данной спецификации категоричны эффекты лечения сумма к нулю Стандартные предположения о линейной регрессионной модели, также предполагается , что удержание, как описано ниже. ^[2] $\left(\sum _{i}^{a}\tau _{i}=0\right).$

Использует [ редактировать ]

Увеличить мощность [ править ]

ANCOVA может использоваться для увеличения статистической мощности (вероятность обнаружения значимой разницы между группами, если таковая существует) за счет уменьшения дисперсии ошибок внутри группы . ^[3] Чтобы понять это, необходимо понять тест, используемый для оценки различий между группами, F-тест . Р -test вычисляется путем деления объясненной дисперсии между группами (например, медицинские различиями восстановления) по необъяснимой дисперсии в пределах групп. Таким образом,

F={\frac {MS_{between}}{MS_{within}}}

Если это значение превышает критическое значение, мы заключаем, что существует значительная разница между группами. Необъяснимая дисперсия включает дисперсию ошибок (например, индивидуальные различия), а также влияние других факторов. Таким образом, влияние CV сгруппировано в знаменателе. Когда мы контролируем влияние CV на DV, мы удаляем его из знаменателя , увеличивая F , тем самым увеличивая вашу возможность найти значительный эффект, если он вообще существует.

Корректировка ранее существовавших различий [ править ]

Еще одно использование ANCOVA - корректировка существовавших ранее различий в неэквивалентных (интактных) группах. Это спорная цель применения при коррекции начальных различий группы (до присвоения группы) , которая существует на DV среди нескольких интактных групп. В этой ситуации участников нельзя уравнять путем случайного распределения, поэтому резюме используются для корректировки оценок и повышения сходства участников, чем без резюме. Однако даже с использованием ковариат не существует статистических методов, позволяющих приравнять неравные группы. Кроме того, CV может быть настолько тесно связан с IV, что удаление дисперсии DV, связанной с CV, устранит значительную дисперсию DV, сделав результаты бессмысленными. ^[4]

Предположения [ править ]

Есть несколько ключевых предположений, которые лежат в основе использования ANCOVA и влияют на интерпретацию результатов. ^[2] Стандартные предположения линейной регрессии остаются в силе; далее мы предполагаем, что наклон ковариаты одинаков для всех групп лечения (однородность наклонов регрессии).

Предположение 1: линейность регрессии [ править ]

Отношение регрессии между зависимой переменной и сопутствующими переменными должно быть линейным.

Допущение 2: однородность дисперсии ошибок [ править ]

Ошибка представляет собой случайную величину с условным нулевым средним и равными дисперсиями для разных классов лечения и наблюдений.

Допущение 3: независимость условий ошибки [ править ]

Ошибки не коррелированы. То есть матрица ковариации ошибок диагональна.

Предположение 4: нормальность ошибок [ править ]

В невязках (условие ошибки) должны быть распределены нормально \ . $\epsilon _{ij}$ $N(0,\sigma ^{2})$

Предположение 5: однородность наклонов регрессии [ править ]

Наклоны различных линий регрессии должны быть эквивалентными, т. Е. Линии регрессии должны быть параллельны между группами.

Пятая проблема, касающаяся однородности различных наклонов регрессии лечения, особенно важна при оценке соответствия модели ANCOVA. Также обратите внимание, что нам нужно только, чтобы термины ошибки были нормально распределены. Фактически, и независимая переменная, и сопутствующие переменные в большинстве случаев не будут иметь нормального распределения.

Проведение ANCOVA [ править ]

Проверить мультиколлинеарность [ править ]

Если CV сильно связано с другим CV (при корреляции 0,5 или более), то оно не будет регулировать DV сверх другого CV. То или другое следует удалить, поскольку они статистически избыточны.

Проверить допущение об однородности дисперсии [ править ]

Проверено тестом Левена на равенство дисперсий ошибок. Это наиболее важно после того, как были сделаны настройки, но если они были у вас до настройки, они, скорее всего, появятся позже.

Проверить однородность предположения о наклонах регрессии [ править ]

Чтобы увидеть, взаимодействует ли CV в значительной степени с IV, запустите модель ANCOVA, включая член взаимодействия как IV, так и CVxIV. Если взаимодействие CVxIV является значительным, ANCOVA не следует выполнять. Вместо этого Green & Salkind ^[5] предлагают оценивать групповые различия по DV на определенных уровнях CV. Также рассмотрите возможность использования умеренного регрессионного анализа , рассматривая CV и его взаимодействие как еще одну IV. В качестве альтернативы можно использовать анализ посредничества, чтобы определить, учитывает ли CV влияние IV на DV.

Запустить анализ ANCOVA [ править ]

Если взаимодействие CV × IV не является значительным, повторно запустите ANCOVA без члена взаимодействия CV × IV. В этом анализе нужно использовать настроенные средства и настроенный MSerror. Скорректированные средние (также называемые средними наименьшими квадратами, средними LS, оцененными предельными средними или EMM) относятся к групповым средним после учета влияния CV на DV.

Последующий анализ [ править ]

Если был значительный основной эффект , это означает, что существует значительная разница между уровнями одной IV без учета всех остальных факторов. ^[6] Чтобы точно определить, какие уровни значительно отличаются друг от друга, можно использовать те же контрольные тесты, что и для ANOVA. Если есть две или более IV, может иметь место значительное взаимодействие , что означает, что влияние одной IV на DV изменяется в зависимости от уровня другого фактора. Можно исследовать простые основные эффекты, используя те же методы, что и в факторном дисперсионном анализе .

Соображения относительно мощности [ править ]

В то время как включение ковариаты в ANOVA обычно увеличивает статистическую мощность за счет учета некоторой дисперсии в зависимой переменной и, таким образом, увеличения отношения дисперсии, объясняемой независимыми переменными, добавление ковариаты в ANOVA также снижает степени свободы . Соответственно, добавление ковариаты, которая учитывает очень небольшую дисперсию зависимой переменной, может фактически снизить мощность.

См. Также [ править ]

MANCOVA (многомерный ковариационный анализ)

Ссылки [ править ]

Перейти ↑ Keppel, G. (1991). Дизайн и анализ: Справочник исследователя (3-е изд.). Englewood Cliffs: Prentice-Hall, Inc.
^ a b Монтгомери, Дуглас К. «Планирование и анализ экспериментов» (8-е изд.). Джон Вили и сыновья, 2012.
^ Табачник, Б.Г. Фиделл, LS (2007). Использование многомерной статистики (5-е изд.). Бостон: образование Пирсона.
^ Миллер, Джорджия; Чепмен, JP (2001). «Непонимание анализа ковариации». Журнал аномальной психологии . 110 (1): 40–48. DOI : 10.1037 / 0021-843X.110.1.40 . PMID 11261398 .
^ Зеленый, SB, и Залкинд, НьюДжерси (2011). Использование SPSS для Windows и Macintosh: Анализ и понимание данных (6-е изд.). Река Аппер Сэдл, Нью-Джерси: Prentice Hall.
^ Хауэлл, округ Колумбия (2009) Статистические методы психологии (7-е изд.). Бельмонт: Cengage Wadsworth.

Внешние ссылки [ править ]

В Викиверситете есть ресурсы для изучения ANCOVA

Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, и их анализ в R (Университет Саутгемптона)
Односторонний анализ ковариации для независимых выборок
Использование ковариат в рандомизированных контролируемых испытаниях GJP Van Breukelen и KRA Van Dijk (2007)

[1] Перейти ↑ Keppel, G. (1991). Дизайн и анализ: Справочник исследователя (3-е изд.). Englewood Cliffs: Prentice-Hall, Inc.

[Montgomery,_Douglas_C_2012-2] Монтгомери, Дуглас К. «Планирование и анализ экспериментов» (8-е изд.). Джон Вили и сыновья, 2012.

[3] Табачник, Б.Г. Фиделл, LS (2007). Использование многомерной статистики (5-е изд.). Бостон: образование Пирсона.

[4] Миллер, Джорджия; Чепмен, JP (2001). «Непонимание анализа ковариации». Журнал аномальной психологии . 110 (1): 40–48. DOI : 10.1037 / 0021-843X.110.1.40 . PMID 11261398 .

[Green-5] Зеленый, SB, и Залкинд, НьюДжерси (2011). Использование SPSS для Windows и Macintosh: Анализ и понимание данных (6-е изд.). Река Аппер Сэдл, Нью-Джерси: Prentice Hall.

[Howell-6] Хауэлл, округ Колумбия (2009) Статистические методы психологии (7-е изд.). Бельмонт: Cengage Wadsworth.

[1]

vтеДизайн экспериментов
Научный метод	Научный эксперимент Статистический дизайн Контроль Внутренняя и внешняя действительность Экспериментальная установка Ослепление Оптимальный дизайн : байесовский Случайное назначение Рандомизация Ограниченная рандомизация Репликация против субдискретизации Размер образца
Лечение и блокировка	Уход Размер эффекта Контраст Взаимодействие Сбивает с толку Ортогональность Блокировка Ковариантный Мешающая переменная
Модели и выводы	Линейная регрессия Обычный метод наименьших квадратов Байесовский Случайный эффект Смешанная модель Иерархическая модель: байесовская Дисперсионный анализ (Anova) Теорема Кохрана Манова ( многомерный ) Анкова ( ковариация ) Сравнить средства Множественное сравнение
Дизайн полностью рандомизирован	Факториал Дробный факториал Плакетт-Берман Тагучи Методология поверхности отклика Полиномиальное и рациональное моделирование Бокс-Бенкен Центральный композит Блокировать Обобщенный рандомизированный блочный дизайн (GRBD) Латинский квадрат Греко-латинский квадрат Ортогональный массив Латинский гиперкуб Дизайн повторяющихся мер Кроссовер исследование Рандомизированное контролируемое исследование Последовательный анализ Тест последовательного отношения вероятностей
Глоссарий Категория Математический портал Статистический обзор Статистические темы