В статистике , ожидаемые средние квадраты (EMS) ожидаемые значения определенных статистических данных , возникающих в разделах сумм квадратов в дисперсионном анализе (ANOVA). Их можно использовать для определения того, какая статистика должна появиться в знаменателе в F-тесте для проверки нулевой гипотезы об отсутствии определенного эффекта.
Когда общая скорректированная сумма квадратов в ANOVA делится на несколько компонентов, каждый из которых приписывается влиянию определенной переменной-предиктора, каждая из сумм квадратов в этом разделе является случайной величиной, имеющей ожидаемое значение . Это ожидаемое значение, деленное на соответствующее количество степеней свободы, является ожидаемым средним квадратом для этой прогнозирующей переменной.
Следующий пример взят из анализа продольных данных Дональда Хедекера и Роберта Д. Гиббонса. [1]
Каждое из s процедур (одно из которых может быть плацебо) назначается выборке из (заглавных) N случайно выбранных пациентов, на которых наблюдаются определенные измерения в каждый из (строчных букв) n указанных раз, для (таким образом, числа пациентов, получающих разное лечение, могут отличаться), и мы предполагаем, что группы пациентов, получающих разное лечение, не пересекаются, поэтому пациенты вкладываются в лечение и не пересекаются с лечением. У нас есть
где
Общая скорректированная сумма квадратов равна
Таблица ANOVA ниже разбивает сумму квадратов (где ):
Нулевая гипотеза, представляющая интерес, заключается в том, что нет никакой разницы между эффектами различных методов лечения - следовательно, нет разницы между методами лечения. Это можно выразить словами (с обозначениями, используемыми в таблице выше). Согласно этой нулевой гипотезе, ожидаемый средний квадрат эффектов лечения равен
Числитель в F-статистике для проверки этой гипотезы - это средний квадрат из-за различий между видами лечения, т.е. знаменатель, однако, не равен Причина в том, что приведенная ниже случайная величина, хотя при нулевой гипотезе она имеет F- распределения , не наблюдается - это не статистика - потому что его значение зависит от ненаблюдаемых параметров и
Вместо этого в качестве тестовой статистики используется следующая случайная величина, которая не определяется в терминах :