F -тест

F -test любой статистический тест , в котором тестовая статистика имеет F -распределение под нулевой гипотезой . Чаще всего он используется при сравнении статистических моделей , которые были подогнаны к набору данных , чтобы определить модель, которая наилучшим образом соответствует совокупности, из которой были взяты данные. Точные « F- тесты» в основном возникают, когда модели подгоняются к данным с использованием метода наименьших квадратов . Название было придумано Джорджем Снедекором в честь сэра Рональда А. Фишера.. Фишер первоначально разработал статистику как коэффициент дисперсии в 1920-х годах. ^[1]

Общие примеры

Распространенные примеры использования F- тестов включают изучение следующих случаев:

Гипотеза о том, что средние значения данного набора нормально распределенных популяций, имеющих одинаковое стандартное отклонение , равны. Это, пожалуй, самый известный F- тест, который играет важную роль в дисперсионном анализе (ANOVA).
Гипотеза о том, что предложенная регрессионная модель хорошо соответствует данным . См. Неподходящая сумма квадратов .
Гипотеза о том, что набор данных в регрессионном анализе следует более простой из двух предложенных линейных моделей, вложенных друг в друга.

Кроме того, некоторые статистические процедуры, такие как метод Шеффе для корректировки множественных сравнений в линейных моделях, также используют F- тесты.

F -тест равенства двух дисперсий

F -test является чувствительным к ненормальности . ^[2]^[3] В дисперсионного анализа (ANOVA), альтернативные тесты включают тест Levene в , тест Бартлетта , и тест Брауна-Форсайт . Однако, когда любой из этих тестов проводится для проверки основного предположения о гомоскедастичности ( т. Е. Однородности дисперсии), в качестве предварительного шага к проверке средних эффектов, наблюдается увеличение количества ошибок типа I с точки зрения эксперимента . ^[4]

Формула и расчет

Большинство F- тестов возникает при рассмотрении разложения вариативности набора данных на суммы квадратов . Тестовая статистика в F -test представляет собой отношение двух масштабированных сумм квадратов , отражающие различные источники изменчивости. Эти суммы квадратов построены так, что статистика имеет тенденцию быть больше, когда нулевая гипотеза не верна. Чтобы статистика следовала F- распределению при нулевой гипотезе, суммы квадратов должны быть статистически независимыми , и каждая из них должна соответствовать масштабированному χ²-распределению . Последнее условие гарантируется, если значения данных независимы и нормально распределены с общей дисперсией .

Задачи ANOVA с множественным сравнением

F -test в одну сторону дисперсионного анализа используется для оценки ли ожидаемые значения количественной переменной в пределах нескольких предварительно определенных групп отличаются друг от друга. Например, предположим, что медицинское испытание сравнивает четыре лечения. F- тест ANOVA может использоваться для оценки того, является ли какой-либо из методов лечения в среднем лучше или хуже других по сравнению с нулевой гипотезой о том, что все четыре лечения дают одинаковый средний ответ. Это пример «комплексного» теста, означающего, что один тест выполняется для обнаружения любого из нескольких возможных различий. В качестве альтернативы, мы могли бы провести попарные тесты между лечением (например, в примере медицинского испытания с четырьмя курсами лечения мы могли бы провести шесть тестов среди пар курсов лечения). Преимущество F- теста ANOVA состоит в том, что нам не нужно заранее указывать, какие методы лечения будут сравниваться, и нам не нужно настраивать для выполнения множественных сравнений . Недостатком F- теста ANOVA является то, что, если мы отклоняем нулевую гипотезу , мы не знаем, какие методы лечения могут значительно отличаться от других, а также, если F- тест выполняется на уровне α, мы не можем утверждать что пара лечения с наибольшей разницей в средних значимо отличается на уровне α.

Формула для одностороннего дисперсионного анализа F -теста статистики является

{\ displaystyle F = {\ frac {\ text {объясненная дисперсия}} {\ text {необъяснимая дисперсия}}},}

или же

{\ displaystyle F = {\ frac {\ text {межгрупповая изменчивость}} {\ text {внутригрупповая изменчивость}}}.}

«Объясненная дисперсия» или «межгрупповая изменчивость»

{\ displaystyle \ sum _ {i = 1} ^ {K} n_ {i} ({\ bar {Y}} _ {i \ cdot} - {\ bar {Y}}) ^ {2} / (K- 1)}

где ${\ displaystyle {\ bar {Y}} _ {я \ cdot}}$ обозначает выборочное среднее в i-й группе, ${\ displaystyle n_ {i}}$ - количество наблюдений в i -й группе, ${\ displaystyle {\ bar {Y}}}$ обозначает общее среднее значение данных, а ${\ displaystyle K}$ обозначает количество групп.

«Необъяснимая дисперсия» или «внутригрупповая изменчивость» - это

{\ displaystyle \ sum _ {i = 1} ^ {K} \ sum _ {j = 1} ^ {n_ {i}} \ left (Y_ {ij} - {\ bar {Y}} _ {i \ cdot } \ right) ^ {2} / (NK),}

где ${\ displaystyle Y_ {ij}}$ это j- ^е наблюдение в i- ^м из ${\ displaystyle K}$ группы и ${\ displaystyle N}$ - общий размер выборки. Эта F- статистика следует F -распределению со степенями свободы ${\ displaystyle d_ {1} = K-1}$ а также ${\ displaystyle d_ {2} = NK}$ при нулевой гипотезе. Статистика будет большой, если вариабельность между группами велика по сравнению с вариабельностью внутри группы, что маловероятно, если средние значения совокупности групп имеют одинаковое значение.

Обратите внимание, что когда есть только две группы для одностороннего F- теста ANOVA , ${\ Displaystyle F = т ^ {2}}$ где t - студенческий ${\ displaystyle t}$ статистика .

Проблемы регрессии

Рассмотрим две модели, 1 и 2, где модель 1 «вложена» в модель 2. Модель 1 - это ограниченная модель, а модель 2 - неограниченная. То есть модель 1 имеет параметры p ₁ , а модель 2 имеет параметры p ₂ , где p ₁ < p ₂ , и для любого выбора параметров в модели 1 такая же кривая регрессии может быть получена путем некоторого выбора параметров модели. 2.

Одним из распространенных контекстов в этом отношении является решение о том, соответствует ли модель данным значительно лучше, чем наивная модель, в которой единственным поясняющим термином является термин перехват, так что все прогнозируемые значения для зависимой переменной устанавливаются равными значениям этой переменной. выборочное среднее. Наивная модель - это модель с ограничениями, поскольку коэффициенты всех потенциальных независимых переменных ограничены равными нулю.

Другой общий контекст - это решение, есть ли структурный разрыв в данных: здесь ограниченная модель использует все данные в одной регрессии, тогда как неограниченная модель использует отдельные регрессии для двух разных подмножеств данных. Такое использование F-теста известно как тест Чоу .

Модель с большим количеством параметров всегда сможет соответствовать данным как минимум так же хорошо, как модель с меньшим количеством параметров. Таким образом, как правило, модель 2 дает лучшее (то есть меньшую ошибку) соответствие данным, чем модель 1. Но часто требуется определить, дает ли модель 2 значительно лучшее соответствие данным. Один из подходов к этой проблеме - использовать F -тест.

Если есть n точек данных для оценки параметров обеих моделей, то можно рассчитать статистику F , заданную следующим образом:

{\ displaystyle F = {\ frac {\ left ({\ frac {{\ text {RSS}} _ {1} - {\ text {RSS}} _ {2}} {p_ {2} -p_ {1}) }} \ right)} {\ left ({\ frac {{\ text {RSS}} _ {2}} {n-p_ {2}}} \ right)}},}

где RSS _i - остаточная сумма квадратов модели i . Если регрессионная модель была рассчитана с весами, замените RSS _i на χ ² , взвешенную сумму квадратов остатков. При нулевой гипотезе о том, что модель 2 не обеспечивает значительно лучшего соответствия, чем модель 1, F будет иметь F- распределение с ( p ₂ - p ₁ , n - p ₂ ) степенями свободы . Нулевая гипотеза отклоняется, если F, вычисленное на основе данных, больше критического значения F- распределения для некоторой желаемой вероятности ложного отклонения (например, 0,05). F -test является тест Вальда .

Смотрите также

Доброта подгонки

дальнейшее чтение

Фокс, Карл А. (1980). Промежуточная экономическая статистика (второе изд.). Нью-Йорк: Джон Вили и сыновья. С. 290–310. ISBN 0-88275-521-8.
Джонстон, Джон (1972). Эконометрические методы (второе изд.). Нью-Йорк: Макгроу-Хилл. С. 35–38.
Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. С. 147–148. ISBN 0-02-365070-2.
Маддала, GS ; Лахири, Каджал (2009). Введение в эконометрику (Четвертое изд.). Чичестер: Вайли. С. 155–160. ISBN 978-0-470-01512-4.

Внешние ссылки

Таблица критических значений F- критерия
Бесплатный калькулятор для F- тестирования
F -TEST для линейной регрессии
Эконометрика лекции (тема: проверка гипотез) на YouTube с помощью Mark Thoma

[1] Ломакс, Ричард Г. (2007). Статистические концепции: второй курс . п. 10 . ISBN 0-8058-5850-4.

[2] Коробка, GEP (1953). «Ненормальность и тесты на отклонения». Биометрика . 40 (3/4): 318–335. DOI : 10.1093 / Biomet / 40.3-4.318 . JSTOR 2333350 .

[3] Марковски, Кэрол А; Марковский, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. DOI : 10.2307 / 2684360 . JSTOR 2684360 .

[4] Савиловский, С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс – Фишер: вероятная разница между двумя средствами при σ 1 2 ≠ σ 2 2 » . Журнал современных прикладных статистических методов . 1 (2): 461–472. Архивировано 03 апреля 2015 года . Проверено 30 марта 2015 .

[1]