Тест Boschloo в этом статистический тест гипотезы для анализа 2х2 таблицы сопряженности . Он исследует ассоциацию двух распределенных по Бернулли случайных величин и является более мощной альтернативой точному критерию Фишера . Он был предложен в 1970 году RD Boschloo. [1]
Параметр
Таблица непредвиденных обстоятельств 2x2 визуализирует независимые наблюдения двух бинарных переменных а также :
Распределение вероятностей таких таблиц можно разделить на три различных случая. [2]
- Суммы строк и суммы столбцов фиксируются заранее, а не случайным образом.
Тогда все определяются . Если а также независимы, следует гипергеометрическому распределению с параметрами:
. - Суммы строк фиксируются заранее, но сумма столбца не.
Тогда все случайные параметры определяются как а также а также следовать биномиальному распределению с вероятностями:
- Только общее количество фиксировано, но сумма строк и суммы столбца не.
Тогда случайный векторследует полиномиальному распределению с вектором вероятности.
Точный тест Фишера разработан для первого случая и, следовательно, является точным условным тестом (поскольку он определяет суммы столбцов). Типичным примером такого случая является дегустация чая Леди : женщина пробует 8 чашек чая с молоком. В 4 из этих чашек наливают молоко перед чаем. В остальные 4 чашки в первую очередь наливается чай. Дама пытается разделить кубки на две категории. Следуя нашим обозначениям, случайная величина представляет используемый метод (1 = молоко сначала, 0 = молоко в последнюю очередь) и представляет собой предположения женщины (1 = молоко первое предположение, 0 = молоко последнее предположение). Тогда суммы строк - это фиксированное количество чашек, приготовленных каждым методом:. Женщина знает, что в каждой категории 4 чашки, поэтому назначит по 4 чашки каждому методу. Таким образом, заранее фиксируются и суммы столбцов:. Если она не может отличить, а также независимы, а число правильно классифицированных чашек с молоком сначала следует гипергеометрическому распределению .
Тест Boschloo разработан для второго случая и, следовательно, является точным безусловным тестом. Примеры такого случая часто встречаются в медицинских исследованиях, где бинарная конечная точка сравнивается между двумя группами пациентов. Следуя нашим обозначениям, представляет первую группу, которая получает какое-либо интересующее лекарство. представляет вторую группу, получающую плацебо .указывает на излечение пациента (1 = излечение, 0 = нет лечения). Тогда суммы строк равны размерам групп и обычно фиксируются заранее. Суммы столбцов - это общее количество вылеченных или продолжений болезни, а не фиксированные заранее.
Пример для третьего случая можно построить следующим образом: одновременно подбросьте две различимые монеты. а также и сделай это раз. Если мы посчитаем количество результатов в нашей таблице 2x2 (1 = голова, 0 = хвост), мы не знаем заранее, как часто показывает голову или хвост (суммы строк случайны), и мы не знаем, как часто монеты показывает голову или хвост (случайные суммы столбцов).
Проверить гипотезу
Нулевая гипотеза о Boschloo в один хвост тест (высокие значения в пользу альтернативной гипотезы):
Нулевая гипотеза одностороннего теста может быть сформулирована и в другом направлении (небольшие значения поддерживают альтернативную гипотезу):
Нулевая гипотеза двустороннего теста:
Универсального определения двусторонней версии точного критерия Фишера не существует. [3] Поскольку тест Босхлоо основан на точном тесте Фишера, универсальной двусторонней версии теста Босхлоо также не существует. Далее мы имеем дело с односторонним тестом и.
Идея Босхлоо
Обозначим желаемый уровень значимости через. Точный тест Фишера является условным тестом и подходит для первого из вышеупомянутых случаев. Но если мы рассмотрим наблюдаемую сумму столбцакак установлено заранее, точный критерий Фишера также может быть применен ко второму случаю. Таким образом, истинный размер теста зависит от мешающих параметров. а также . Можно показать, что максимальный размер принимается в равных пропорциях [4] и по-прежнему контролируется. [1] Однако Boschloo заявил, что для малых размеров выборки максимальный размер часто значительно меньше, чем. Это приводит к нежелательной потере мощности .
Компания Boschloo предложила использовать точный тест Фишера с более высоким номинальным уровнем . Здесь, следует выбирать как можно больше, чтобы максимальный размер по-прежнему контролировался : . Этот метод был особенно выгоден во время публикации Boschloo, потому что можно найти общие ценности а также . Это упростило выполнение теста Boschloo в вычислительном отношении.
Статистика теста
Правило принятия решений подхода Boschloo основано на точном тест Фишера. Эквивалентный способ сформулировать тест - использовать p-значение точного критерия Фишера в качестве статистики теста . Значение p Фишера вычисляется из гипергеометрического распределения (для простоты обозначений мы пишем вместо ):
Распределение определяется биномиальным распределением а также и зависит от неизвестного мешающего параметра . Для заданного уровня значимостикритическое значение из это максимальное значение это удовлетворяет . Критическое значение соответствует номинальному уровню оригинального подхода Boschloo.
Модификация
Тест Boschloo имеет дело с неизвестным мешающим параметром взяв максимум по всему пространству параметров . Процедура Бергера и Бооса использует другой подход, максимизируя через доверительный интервал от и добавление . [5]обычно представляет собой небольшое значение, например 0,001 или 0,0001. В результате получается модифицированный тест Бошлоо, который также является точным. [6]
Сравнение с другими точными тестами
Все точные тесты имеют указанный уровень значимости, но могут иметь разную мощность в разных ситуациях. Mehrotra et al. сравнил мощность некоторых точных тестов в разных ситуациях. [6] Результаты теста Boschloo резюмируются ниже.
Модифицированный тест Босхлоо
Тест Boschloo и модифицированный тест Boschloo имеют одинаковую мощность во всех рассмотренных сценариях. В некоторых случаях тест Boschloo имеет немного большую мощность, а в некоторых - наоборот.
Точный тест Фишера
Тест Boschloo по своей конструкции намного мощнее точного теста Фишера. Для небольших размеров выборки (например, 10 на группу) разница в мощности велика и составляет от 16 до 20 процентных пунктов в рассматриваемых случаях. Разница в мощности меньше для больших размеров выборки.
Точный -Пул тест
Этот тест основан на статистике теста
где - частота групповых событий и - объединенная частота событий.
По мощности этот тест аналогичен тесту Boschloo в большинстве сценариев. В некоторых случаях- Объединенный тест имеет большую мощность, с различиями в основном от 1 до 5 процентных пунктов. В очень редких случаях разница достигает 9 процентных пунктов.
Этот тест также можно изменить с помощью процедуры Бергера и Бооса. Однако результирующий тест во всех сценариях имеет такую же мощность, что и неизмененный тест.
Точный -Не объединенный тест
Этот тест основан на статистике теста
где - частота групповых событий.
По мощности этот тест аналогичен тесту Boschloo во многих сценариях. В некоторых случаях-Не объединенный тест имеет большую мощность с разницей от 1 до 5 процентных пунктов. Однако в некоторых других случаях тест Boschloo имеет заметно большую мощность с разницей до 68 процентных пунктов.
Этот тест также можно изменить с помощью процедуры Бергера и Бооса. Результирующий тест в большинстве сценариев имеет мощность, аналогичную немодифицированному. В некоторых случаях модификация значительно улучшает мощность, но общее сравнение мощности с тестом Boschloo остается неизменным.
Программное обеспечение
Расчет теста Boschloo можно выполнить в следующем программном обеспечении:
Смотрите также
Рекомендации
- ^ а б Boschloo RD (1970). «Повышенный условный уровень значимости для таблицы 2 x 2 при проверке равенства двух вероятностей». Statistica Neerlandica . 24 : 1–35. DOI : 10.1111 / j.1467-9574.1970.tb00104.x .
- ^ Лидерсен, С., Фагерланд, М.В. и Лааке, П. (2009). «Рекомендуемые тесты для объединения в таблицы 2 × 2». Статист. Med . 28 (7): 1159–1175. DOI : 10.1002 / sim.3531 . PMID 19170020 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Мартин Андрес, А. и И. Эрранц Техедор (1995). «Точный тест Фишера очень консервативен?». Вычислительная статистика и анализ данных . 19 (5): 579–591. DOI : 10.1016 / 0167-9473 (94) 00013-9 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Финнер, Х., Страсбургер, К. (2002). «Структурные свойства УМПУ-тестов для таблиц 2х2 и некоторых приложений». Журнал статистического планирования и вывода . 104 : 103–120. DOI : 10.1016 / S0378-3758 (01) 00122-7 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Бергер, Р.Л., и Боос, Д.Д. (1994). «Значения P, максимизированные по набору достоверности для мешающего параметра» . Журнал Американской статистической ассоциации . 89 (427): 1012–1016. DOI : 10.2307 / 2290928 . JSTOR 2290928 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ а б Мехротра, Д.В., Чан, ISF, и Бергер, Р.Л. (2003). «Предупреждение о точном безусловном выводе разницы между двумя независимыми биномиальными пропорциями». Биометрия . 59 (2): 441–450. DOI : 10.1111 / 1541-0420.00051 . PMID 12926729 .CS1 maint: несколько имен: список авторов ( ссылка )