Диапазон тест Тьюки , также известный как тест Тьюков , метод Тьюков , честный тест значимости Тьюки , или HSD Тьюки ( честно значимая разница ) тест , [1] является одностадийной множественным сравнением процедуры и статистическим тест . Его можно использовать для поиска средств, которые существенно отличаются друг от друга.
Названный в честь Джона Тьюки , [2] он сравнивает все возможные пары средних и основан на стьюдентизированном распределении диапазонов ( q ) (это распределение похоже на распределение t из t- теста . См. Ниже). [3] Тесты HSD Тьюки не следует путать с тестами средней разницы Тьюки (также известными как диаграмма Бланда – Альтмана ).
Тест Тьюки сравнивает средства каждого лечения со средствами любого другого лечения; то есть он применяется одновременно к множеству всех попарных сравнений
и определяет любую разницу между двумя средними значениями, превышающую ожидаемую стандартную ошибку . Коэффициент достоверности для набора , когда все размеры выборки равны, точно равен для любой . Для неравных размеров выборки коэффициент достоверности больше 1 - α. Другими словами, метод Тьюки консервативен при неравных размерах выборки .
Предположения
- Проверяемые наблюдения независимы внутри групп и между ними.
- Группы, связанные с каждым средним значением в тесте, распределены нормально .
- Внутригрупповая дисперсия одинакова для всех групп, связанных с каждым средним значением в тесте ( однородность дисперсии ).
Статистика теста
Тест Тьюки основан на формуле, очень похожей на t- критерий. Фактически, тест Тьюки - это, по сути, t- тест , за исключением того, что он корректирует частоту ошибок в семье .
Формула теста Тьюки:
где Y A - большее из двух сравниваемых средних, Y B - меньшее из двух сравниваемых средних, а SE - стандартная ошибка суммы средних.
В этом Q сек значения можно сравнить с д значением из распределения стьюдентизированного диапазона . Если в Q сек значение больше , чем критическое значение д & alpha ;, полученного из распределения, два средства , как говорят, значительно отличаются на уровне. [3]
Поскольку нулевая гипотеза для теста Тьюки утверждает, что все сравниваемые средние значения принадлежат одной и той же совокупности (т. Е. Μ 1 = μ 2 = μ 3 = ... = μ k ), средние должны быть нормально распределены (согласно центральной предельной теореме ). Это приводит к предположению о нормальности теста Тьюки.
Распределение стьюдентизированного диапазона ( q )
В методе Тьюки используется стьюдентизированное распределение диапазонов . Предположим, что мы берем выборку размера n из каждой из k популяций с одинаковым нормальным распределением N ( μ , σ 2 ) и предполагаем, чтоmin - наименьшее из этих средних значений выборки иmax - это наибольшее из этих выборочных средних, и предположим, что S 2 - это совокупная дисперсия выборки из этих выборок. Тогда следующая случайная величина имеет распределение по стьюдентизированному диапазону.
Это значение q является основой критического значения q , основанного на трех факторах:
- α ( частота ошибок типа I или вероятность отклонения истинной нулевой гипотезы)
- k (количество популяций)
- df (количество степеней свободы ( N - k ), где N - общее количество наблюдений)
Распределение q сведено в таблицу и фигурирует во многих учебниках по статистике. В некоторых таблицах распределение q представлено безфактор. Чтобы понять, что это за таблица, мы можем вычислить результат для k = 2 и сравнить его с результатом t-распределения Стьюдента с теми же степенями свободы и тем же α . Кроме того, R предлагает кумулятивную функцию распределения ( ptukey
) и функцию квантиля ( qtukey
) для q .
Пределы уверенности
Доверительные пределы Тьюки для всех парных сравнений с доверительной вероятностью не менее 1 - α равны
Обратите внимание, что точечная оценка и оценочная дисперсия такие же, как и для одиночного попарного сравнения. Единственное различие между доверительными границами для одновременных сравнений и доверительных интервалов для одного сравнения - это кратность оцененного стандартного отклонения.
Также обратите внимание, что размеры выборки должны быть одинаковыми при использовании подхода стьюдентизированного диапазона. - стандартное отклонение всего дизайна, а не только двух сравниваемых групп. Возможна работа с неравными объемами выборки. В этом случае необходимо вычислить оценочное стандартное отклонение для каждого попарного сравнения, как это было формализовано Клайдом Крамером в 1956 году, поэтому процедуру для неравных размеров выборки иногда называют методом Тьюки – Крамера, который выглядит следующим образом:
где n i и n j - размеры групп i и j соответственно. Также применяются степени свободы для всего дизайна.
Смотрите также
Заметки
- ^ Лоури, Ричард. «Односторонний дисперсионный анализ - независимые образцы» . Vassar.edu . Архивировано из оригинального 17 октября 2008 года . Проверено 4 декабря 2008 года . Также иногда в качестве «честно» см., Например, Morrison, S .; Соснов, JJ; Хеффернан, Канзас; Jae, SY; Фернхолл, Б. (2013). «Старение, гипертония и физиологический тремор: вклад кардиобаллистического импульса в треморгенез у пожилых людей». Журнал неврологических наук . 326 (1–2): 68–74. DOI : 10.1016 / j.jns.2013.01.016 .
- ^ Тьюки, Джон (1949). «Сравнение индивидуальных средств в дисперсионном анализе». Биометрия . 5 (2): 99–114. JSTOR 3001913 .
- ^ a b Линтон, Л. Р., Хардер, Л. Д. (2007) Биология 315 - Примечания к лекциям по количественной биологии. Университет Калгари, Калгари, AB
дальнейшее чтение
- Монтгомери, Дуглас К. (2013). Дизайн и анализ экспериментов (восьмое изд.). Вайли. Раздел 3.5.7.