Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , ожидаемые средние квадраты (EMS) ожидаемые значения определенных статистических данных , возникающих в разделах сумм квадратов в дисперсионном анализе (ANOVA). Их можно использовать для определения того, какая статистика должна появиться в знаменателе в F-тесте для проверки нулевой гипотезы об отсутствии определенного эффекта.

Определение [ править ]

Когда общая скорректированная сумма квадратов в ANOVA делится на несколько компонентов, каждый из которых приписывается влиянию определенной переменной-предиктора, каждая из сумм квадратов в этом разделе является случайной величиной, имеющей ожидаемое значение . Это ожидаемое значение, деленное на соответствующее количество степеней свободы, является ожидаемым средним квадратом для этой прогнозирующей переменной.

Пример [ править ]

Следующий пример взят из анализа продольных данных Дональда Хедекера и Роберта Д. Гиббонса. [1]

Каждое из s процедур (одно из которых может быть плацебо) назначается выборке из (заглавных) N случайно выбранных пациентов, на которых наблюдаются определенные измерения в каждый из (строчных букв) n указанных раз, для (таким образом, числа пациентов, получающих разное лечение, могут отличаться), и мы предполагаем, что группы пациентов, получающих разное лечение, не пересекаются, поэтому пациенты вкладываются в лечение и не пересекаются с лечением. У нас есть

где

Общая скорректированная сумма квадратов равна

Таблица ANOVA ниже разбивает сумму квадратов (где ):

Использование в F-тестах [ править ]

Нулевая гипотеза, представляющая интерес, заключается в том, что нет никакой разницы между эффектами различных методов лечения - следовательно, нет разницы между методами лечения. Это можно выразить словами (с обозначениями, используемыми в таблице выше). Согласно этой нулевой гипотезе, ожидаемый средний квадрат эффектов лечения равен

Числитель в F-статистике для проверки этой гипотезы - это средний квадрат из-за различий между видами лечения, т.е. знаменатель, однако, не равен Причина в том, что приведенная ниже случайная величина, хотя при нулевой гипотезе она имеет F- распределения , не наблюдается - это не статистика - потому что его значение зависит от ненаблюдаемых параметров и

Вместо этого в качестве тестовой статистики используется следующая случайная величина, которая не определяется в терминах :

Примечания и ссылки [ править ]

  1. ^ Дональд Хедекер, Роберт Д. Гиббонс. Продольный анализ данных. Wiley Interscience. 2006. С. 21–24.