В статистике , метод Шефф , названный в честь американского статиста Генри Шеффе , является способом регулирования уровней значимости в линейной регрессии анализе для учета множественных сравнений . Это особенно полезно при дисперсионном анализе (особый случай регрессионного анализа) и при построении одновременных доверительных интервалов для регрессий, включающих базисные функции .
Метод Шеффе представляет собой одноэтапную процедуру множественного сравнения, которая применяется к набору оценок всех возможных контрастов между средними на уровне факторов, а не только к попарным различиям, рассматриваемым методом Тьюки – Крамера . Он работает на тех же принципах, что и процедура Рабочего-Хотеллинга для оценки средних ответов в регрессии, которая применяется к набору всех возможных уровней факторов.
Метод
Пусть μ 1 , ..., μ r - средние значения некоторой переменной в r непересекающихся популяциях.
Произвольный контраст определяется как
где
Если μ 1 , ..., μ r равны друг другу, то все контрасты между ними равны 0. В противном случае некоторые контрасты отличаются от 0.
Технически контрастов бесконечно много. Одновременный коэффициент достоверности равен 1 - α, независимо от того, равны или неравны размеры выборки на уровне факторов. (Обычно представляет интерес только конечное число сравнений. В этом случае метод Шеффе обычно достаточно консервативен, и коэффициент ошибок по семейству ( коэффициент экспериментальных ошибок), как правило, будет намного меньше, чем α.) [1] [2]
Оценим C как
для которого оценочная дисперсия
где
- n i - размер выборки, взятой из i- й генеральной совокупности (той, среднее значение которой равно μ i ), и
- - оценочная дисперсия ошибок .
Можно показать, что вероятность равна 1 - α, что все доверительные границы типа
одновременно правильны, где, как обычно, N - размер всей популяции. Дрейпер и Смит в своем «Прикладном регрессионном анализе» (см. Ссылки) указывают, что в уравнении должно стоять «r» вместо «r-1». Ошибка с «r-1» является результатом неспособности учесть дополнительный эффект постоянного члена во многих регрессиях. То, что результат, основанный на «r-1», неверен, легко увидеть, если принять r = 2, как в стандартной простой линейной регрессии. Эта формула затем уменьшится до единицы с обычным t-распределением, которое подходит для прогнозирования / оценки для одного значения независимой переменной, а не для построения доверительной полосы для диапазона значений независимого значения. Также обратите внимание, что формула предназначена для работы со средними значениями для диапазона независимых значений, а не для сравнения с отдельными значениями, такими как отдельные значения наблюдаемых данных. [3]
Обозначение значения Шеффе в таблице
Часто буквы верхнего индекса используются, чтобы указать, какие значения существенно отличаются при использовании метода Шеффе. Например, когда средние значения переменных, которые были проанализированы с помощью ANOVA , представлены в таблице, им присваивается другой буквенный верхний индекс на основе контраста Шеффе. Значения, которые существенно не отличаются на основе апостериорного контраста Шеффе, будут иметь один и тот же верхний индекс, а значения, которые значительно отличаются, будут иметь разные верхние индексы (например, 15a, 17a, 34b будут означать, что первая и вторая переменные отличаются от третьей переменной. но не друг друга, потому что им обоим присвоен верхний индекс «а»). [ необходима цитата ]
Сравнение с методом Тьюки – Крамера.
Если должно быть выполнено только фиксированное количество парных сравнений, метод Тьюки – Крамера приведет к более точному доверительному интервалу. В общем случае, когда могут быть интересны многие или все контрасты, метод Шеффе более подходит и дает более узкие доверительные интервалы в случае большого количества сравнений.
Рекомендации
- ^ Максвелл, Скотт Э .; Делани, Гарольд Д. (2004). Планирование экспериментов и анализ данных: сравнение моделей . Лоуренс Эрлбаум Ассошиэйтс. С. 217–218. ISBN 0-8058-3718-3.
- ^ Милликен, Джордж А .; Джонсон, Даллас Э. (1993). Анализ беспорядочных данных . CRC Press. С. 35–36. ISBN 0-412-99081-4.
- ^ Дрейпер, Норман Р.; Смит, Гарри (1998). Прикладной регрессионный анализ (2-е изд.). John Wiley and Sons, Inc. стр. 93 . ISBN 9780471170822.
- Борер, Роберт (1967). «Об уточнении границ Шеффе». Журнал Королевского статистического общества . Серия Б. 29 (1): 110–114. JSTOR 2984571 .
- Шеффе, Х. (1999) [1959]. Дисперсионный анализ . Нью-Йорк: Вили. ISBN 0-471-34505-9.
Внешние ссылки
Эта статья включает материалы, являющиеся общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .