Тест дальности Тьюки

Диапазон тест Тьюки , также известный как тест Тьюков , метод Тьюков , честный тест значимости Тьюки , или HSD Тьюки ( честно значимая разница ) тест , ^[1] является одностадийной множественным сравнением процедуры и статистическим тест . Его можно использовать для поиска средств, которые существенно отличаются друг от друга.

Названный в честь Джона Тьюки , ^[2] он сравнивает все возможные пары средних и основан на стьюдентизированном распределении диапазонов ( q ) (это распределение похоже на распределение t из t- теста . См. Ниже). ^[3] Тесты HSD Тьюки не следует путать с тестами средней разницы Тьюки (также известными как диаграмма Бланда – Альтмана ).

Тест Тьюки сравнивает средства каждого лечения со средствами любого другого лечения; то есть он применяется одновременно к множеству всех попарных сравнений

{\ Displaystyle \ му _ {я} - \ му _ {j} \,}

и определяет любую разницу между двумя средними значениями, превышающую ожидаемую стандартную ошибку . Коэффициент достоверности для набора , когда все размеры выборки равны, точно равен ${\ displaystyle 1- \ alpha}$ для любой ${\ Displaystyle 0 \ Leq \ альфа \ Leq 1}$ . Для неравных размеров выборки коэффициент достоверности больше 1 - α. Другими словами, метод Тьюки консервативен при неравных размерах выборки .

Предположения

Проверяемые наблюдения независимы внутри групп и между ними.
Группы, связанные с каждым средним значением в тесте, распределены нормально .
Внутригрупповая дисперсия одинакова для всех групп, связанных с каждым средним значением в тесте ( однородность дисперсии ).

Статистика теста

Тест Тьюки основан на формуле, очень похожей на $t-$ критерий. Фактически, тест Тьюки - это, по сути, $t-$ тест , за исключением того, что он корректирует частоту ошибок в семье .

Формула теста Тьюки:

{\ displaystyle q_ {s} = {\ frac {Y_ {A} -Y_ {B}} {SE}},}

где $Y$ _A - большее из двух сравниваемых средних, $Y$ _B - меньшее из двух сравниваемых средних, а SE - стандартная ошибка суммы средних.

В этом $Q сек$ значения можно сравнить с $д$ значением из распределения стьюдентизированного диапазона . Если в $Q сек$ значение больше , чем критическое значение $д & alpha$ ;, полученного из распределения, два средства , как говорят, значительно отличаются на уровне ${\ Displaystyle \ альфа: 0 \ Leq \ альфа \ Leq 1}$ . ^[3]

Поскольку нулевая гипотеза для теста Тьюки утверждает, что все сравниваемые средние значения принадлежат одной и той же совокупности (т. $Е. Μ$ ₁ = $μ$ ₂ = $μ$ ₃ = ... = $μ k$ ), средние должны быть нормально распределены (согласно центральной предельной теореме ). Это приводит к предположению о нормальности теста Тьюки.

Распределение стьюдентизированного диапазона ( q )

В методе Тьюки используется стьюдентизированное распределение диапазонов . Предположим, что мы берем выборку размера n из каждой из k популяций с одинаковым нормальным распределением N ( μ , σ ² ) и предполагаем, что ${\ displaystyle {\ bar {y}}}$ _min - наименьшее из этих средних значений выборки и ${\ displaystyle {\ bar {y}}}$ _max - это наибольшее из этих выборочных средних, и предположим, что S ² - это совокупная дисперсия выборки из этих выборок. Тогда следующая случайная величина имеет распределение по стьюдентизированному диапазону.

{\ displaystyle q = {\ frac {{\ overline {y}} _ {\ max} - {\ overline {y}} _ {\ min}} {S {\ sqrt {2 / n}}}}}

Это значение q является основой критического значения q , основанного на трех факторах:

α ( частота ошибок типа I или вероятность отклонения истинной нулевой гипотезы)
k (количество популяций)
df (количество степеней свободы ( N - k ), где N - общее количество наблюдений)

Распределение q сведено в таблицу и фигурирует во многих учебниках по статистике. В некоторых таблицах распределение q представлено без ${\ displaystyle {\ sqrt {2}}}$ фактор. Чтобы понять, что это за таблица, мы можем вычислить результат для k = 2 и сравнить его с результатом t-распределения Стьюдента с теми же степенями свободы и тем же α . Кроме того, R предлагает кумулятивную функцию распределения ( ptukey) и функцию квантиля ( qtukey) для q .

Пределы уверенности

Доверительные пределы Тьюки для всех парных сравнений с доверительной вероятностью не менее 1 - α равны

{\ displaystyle {\ bar {y}} _ {i \ bullet} - {\ bar {y}} _ {j \ bullet} \ pm {\ frac {q _ {\ alpha; k; Nk}} {\ sqrt { 2}}} {\ widehat {\ sigma}} _ {\ varepsilon} {\ sqrt {\ frac {2} {n}}} \ qquad i, j = 1, \ ldots, k \ quad i \ neq j. }

Обратите внимание, что точечная оценка и оценочная дисперсия такие же, как и для одиночного попарного сравнения. Единственное различие между доверительными границами для одновременных сравнений и доверительных интервалов для одного сравнения - это кратность оцененного стандартного отклонения.

Также обратите внимание, что размеры выборки должны быть одинаковыми при использовании подхода стьюдентизированного диапазона. ${\ displaystyle {\ widehat {\ sigma}} _ {\ varepsilon}}$ - стандартное отклонение всего дизайна, а не только двух сравниваемых групп. Возможна работа с неравными объемами выборки. В этом случае необходимо вычислить оценочное стандартное отклонение для каждого попарного сравнения, как это было формализовано Клайдом Крамером в 1956 году, поэтому процедуру для неравных размеров выборки иногда называют методом Тьюки – Крамера, который выглядит следующим образом:

{\ displaystyle {\ bar {y}} _ {i \ bullet} - {\ bar {y}} _ {j \ bullet} \ pm {\ frac {q _ {\ alpha; k; Nk}} {\ sqrt { 2}}} {\ widehat {\ sigma}} _ {\ varepsilon} {\ sqrt {{\ frac {1} {n}} _ {i} + {\ frac {1} {n}} _ {j} }} \ qquad}

где n _i и n _j - размеры групп i и j соответственно. Также применяются степени свободы для всего дизайна.

Смотрите также

Заметки

^ Лоури, Ричард. «Односторонний дисперсионный анализ - независимые образцы» . Vassar.edu . Архивировано из оригинального 17 октября 2008 года . Проверено 4 декабря 2008 года . Также иногда в качестве «честно» см., Например, Morrison, S .; Соснов, JJ; Хеффернан, Канзас; Jae, SY; Фернхолл, Б. (2013). «Старение, гипертония и физиологический тремор: вклад кардиобаллистического импульса в треморгенез у пожилых людей». Журнал неврологических наук . 326 (1–2): 68–74. DOI : 10.1016 / j.jns.2013.01.016 .
^ Тьюки, Джон (1949). «Сравнение индивидуальных средств в дисперсионном анализе». Биометрия . 5 (2): 99–114. JSTOR 3001913 .
^ ^a ^b Линтон, Л. Р., Хардер, Л. Д. (2007) Биология 315 - Примечания к лекциям по количественной биологии. Университет Калгари, Калгари, AB

дальнейшее чтение

Монтгомери, Дуглас К. (2013). Дизайн и анализ экспериментов (восьмое изд.). Вайли. Раздел 3.5.7.

Внешние ссылки

Электронный справочник статистических методов NIST / SEMATECH: метод Тьюки

[Vassar-1] Лоури, Ричард. «Односторонний дисперсионный анализ - независимые образцы» . Vassar.edu . Архивировано из оригинального 17 октября 2008 года . Проверено 4 декабря 2008 года . Также иногда в качестве «честно» см., Например, Morrison, S .; Соснов, JJ; Хеффернан, Канзас; Jae, SY; Фернхолл, Б. (2013). «Старение, гипертония и физиологический тремор: вклад кардиобаллистического импульса в треморгенез у пожилых людей». Журнал неврологических наук . 326 (1–2): 68–74. DOI : 10.1016 / j.jns.2013.01.016 .

[2] Тьюки, Джон (1949). «Сравнение индивидуальных средств в дисперсионном анализе». Биометрия . 5 (2): 99–114. JSTOR 3001913 .

[Calgary-3] Линтон, Л. Р., Хардер, Л. Д. (2007) Биология 315 - Примечания к лекциям по количественной биологии. Университет Калгари, Калгари, AB

[1]