F-тест


F - тест — это любой статистический тест, в котором тестовая статистика имеет F - распределение при нулевой гипотезе . Чаще всего он используется при сравнении статистических моделей , которые были подобраны к набору данных , чтобы определить модель, которая лучше всего подходит для совокупности , из которой были взяты данные. Точные « F -тесты» в основном возникают, когда модели подгоняются к данным с использованием метода наименьших квадратов . Название было придумано Джорджем У. Снедекором в честь сэра Рональда А. Фишера.. Первоначально Фишер разработал статистику как коэффициент дисперсии в 1920-х годах. [1]

Кроме того, некоторые статистические процедуры, такие как метод Шеффе для корректировки множественных сравнений в линейных моделях, также используют F -тесты.

F - тест чувствителен к ненормальности . [2] [3] В дисперсионном анализе (ANOVA) альтернативные тесты включают тест Левена, тест Бартлетта и тест Брауна -Форсайта . Однако, когда какой-либо из этих тестов проводится для проверки лежащего в основе предположения о гомоскедастичности ( т . е . однородности дисперсии), в качестве предварительного шага к проверке на средние эффекты, происходит увеличение экспериментальной частоты ошибок типа I. [4]

Большинство F -тестов возникает при рассмотрении разложения изменчивости в наборе данных с точки зрения суммы квадратов . Статистика теста в F -тесте представляет собой отношение двух масштабированных сумм квадратов, отражающих различные источники изменчивости. Эти суммы квадратов построены таким образом, что статистика имеет тенденцию быть больше, когда нулевая гипотеза неверна. Чтобы статистика соответствовала F - распределению при нулевой гипотезе, суммы квадратов должны быть статистически независимыми , и каждый должен следовать масштабированному χ²-распределению . Последнее условие гарантируется, если значения данных независимы инормально распределены с общей дисперсией .

F - критерий в одностороннем дисперсионном анализе используется для оценки того, отличаются ли ожидаемые значения количественной переменной в нескольких заранее определенных группах друг от друга. Например, предположим, что в медицинском испытании сравниваются четыре вида лечения. дисперсионный анализ F-критерий можно использовать для оценки того, является ли какой-либо из методов лечения в среднем лучше или хуже других по сравнению с нулевой гипотезой о том, что все четыре метода лечения дают один и тот же средний ответ. Это пример «омнибусного» теста, означающего, что один тест выполняется для обнаружения любого из нескольких возможных различий. В качестве альтернативы мы могли бы провести попарные тесты между видами лечения (например, в примере с медицинским испытанием с четырьмя видами лечения мы могли бы провести шесть тестов среди пар методов лечения). Преимущество F -теста ANOVA заключается в том, что нам не нужно заранее указывать, какие методы лечения следует сравнивать, и нам не нужно делать поправку на множественные сравнения . Недостатком F -теста ANOVA является то, что если мы отвергаемнулевая гипотеза , мы не знаем, какие методы лечения можно назвать значительно отличающимися от других, и, если F - тест выполняется на уровне α, мы не можем утверждать, что пара методов лечения с наибольшей средней разницей значительно отличается на уровне а.