В статистике , то мультиномиальный тест является проверкой нулевой гипотезы о том , что параметры полиномиального распределения сравняться заданными значения. Используется для категориальных данных; см. Рид и Кресси. [1]
Начиная с образца предметы, каждый из которых попадает в одну из категории. Можно определитькак наблюдаемое количество предметов в каждой ячейке. Следовательно.
Далее, определение вектора параметров , где :. Это значения параметров при нулевой гипотезе .
Точная вероятность наблюдаемой конфигурации при нулевой гипотезе дается выражением
Вероятность значимости для теста - это вероятность появления наблюдаемого набора данных или набора данных с меньшей вероятностью, чем наблюдаемый, если нулевая гипотеза верна. Используя точный тест , это вычисляется как
где сумма колеблется по всем исходам с такой же или меньшей вероятностью, чем наблюдаемые. На практике это становится обременительным с точки зрения вычислений, поскольку а также увеличиваются, поэтому, вероятно, стоит использовать точные тесты только для небольших образцов. Для больших выборок асимптотические приближения достаточно точны и их легче вычислить.
Одним из таких приближений является отношение правдоподобия . Альтернативная гипотеза может быть определена в соответствии с которым каждое значение заменяется его оценкой максимального правдоподобия . Точная вероятность наблюдаемой конфигурации при альтернативной гипотезе дается выражением
Натуральный логарифм отношения между этими двумя вероятностями, умноженный на - тогда статистика для теста отношения правдоподобия
- [ требуется разъяснение ]
Если нулевая гипотеза верна, то как увеличивается, распределение сходится к хи-квадрат сстепени свободы. Однако давно известно (например, Lawley 1956), что для конечных размеров выборки моментыбольше, чем у хи-квадрат, что увеличивает вероятность ошибок типа I (ложных срабатываний). Разница между моментами хи-квадрат и моментами тестовой статистики зависит от. Уильямс (1976) показал, что первый момент может быть сопоставлен, насколько это возможно. если тестовая статистика делится на коэффициент, равный
В частном случае, когда нулевая гипотеза состоит в том, что все значения равны (т.е. он предусматривает равномерное распределение), это упрощает
Впоследствии Smith et al. (1981) вывели делительный множитель, который соответствует первому моменту, насколько это возможно.. В случае равных значений, этот коэффициент
Нулевая гипотеза также может быть проверена с помощью критерия хи-квадрат Пирсона.
где ожидаемое количество дел в категории при нулевой гипотезе. Эта статистика также сходится к распределению хи-квадрат с степеней свободы, когда нулевая гипотеза верна, но делает это как бы снизу, а не сверху, как делает, поэтому может быть предпочтительнее неисправленной версии для небольших образцов. [ необходима цитата ]
Рекомендации
- Лоули, Д. Н. (1956). «Общий метод аппроксимации распределения критериев отношения правдоподобия». Биометрика . 43 : 295–303. DOI : 10.1093 / Biomet / 43.3-4.295 .
- Смит П.Дж., Рэй Д.С., Мандершайд Р.В. и Силбергельд С. (1981). «Аппроксимация моментов и распределение статистики отношения правдоподобия для полиномиального согласия». Журнал Американской статистической ассоциации . Американская статистическая ассоциация. 76 (375): 737–740. DOI : 10.2307 / 2287541 . JSTOR 2287541 .CS1 maint: несколько имен: список авторов ( ссылка )
- Уильямс, Д.А. (1976). «Улучшенные тесты отношения правдоподобия для полных таблиц непредвиденных обстоятельств». Биометрика . 63 : 33–37. DOI : 10.1093 / Biomet / 63.1.33 .