Тест Макнемара

Эта статья может быть слишком технической, чтобы ее могло понять большинство читателей . Пожалуйста, помогите улучшить его, чтобы он был понятен неспециалистам , не удаляя технических деталей. ( Ноябрь 2012 г. ) ( Узнайте, как и когда удалить этот шаблон сообщения )

В статистике , тест McNemar в этом статистический тест , используемый на спаренных номинальных данных . Он применяется к таблицам сопряженности 2 × 2 с дихотомическим признаком, с совпадающими парами субъектов, чтобы определить, равны ли граничные частоты строки и столбца (то есть, есть ли «предельная однородность»). Он назван в честь Куинна Макнемара , который представил его в 1947 году. ^[1] Применение теста в генетике - это тест на нарушение равновесия передачи для обнаружения неравновесия по сцеплению . ^[2]Обычно используемые параметры для оценки диагностического теста в медицинских науках - это чувствительность и специфичность. Чувствительность - это способность теста правильно идентифицировать людей с болезнью. Специфичность - это способность теста правильно определять людей, не страдающих заболеванием. Теперь предположим, что на одной и той же группе пациентов проводятся два теста. А также предполагаем, что эти тесты имеют одинаковую чувствительность и специфичность. В этой ситуации можно увлечься этими выводами и предположить, что оба теста эквивалентны. Однако это может быть не так. Для этого мы должны изучить пациентов с болезнью и пациентов без болезни (с помощью эталонного теста). Мы также должны выяснить, где эти два теста не согласуются друг с другом. Это и есть основа теста Макнемара.Этот тест сравнивает чувствительность и специфичность двух диагностических тестов на одной и той же группе пациентов.^[3]

Определение [ править ]

Тест применяется к таблице непредвиденных обстоятельств 2 × 2, в которой представлены результаты двух тестов на выборке из N субъектов, как показано ниже.

	Тест 2 положительный	Тест 2 отрицательный	Итого по строке
Тест 1 положительный	а	б	а + б
Тест 1 отрицательный	c	d	c + d
Итого по столбцу	а + с	б + г	N

Нулевая гипотеза предельных состояний однородности , что две предельные вероятности для каждого результата являются одинаковыми, то есть р + р _б = р + р _с и р _с + р _д = р _б + р _д .

Таким образом, нулевая и альтернативная гипотезы ^[1]

{\ displaystyle {\ begin {align} H_ {0} &: ~ p_ {b} = p_ {c} \\ H_ {1} &: ~ p_ {b} \ neq p_ {c} \ end {align}} }

Здесь p _a и т. Д. Обозначают теоретическую вероятность попадания в ячейки с соответствующей меткой.

Статистика теста Макнемара :

{\ displaystyle \ chi ^ {2} = {(bc) ^ {2} \ over b + c}.}

При нулевой гипотезе с достаточно большим количеством дискордантов (ячейки b и c) имеет распределение хи-квадрат с 1 степенью свободы . Если результат значительный , это обеспечивает достаточное свидетельство, чтобы отклонить нулевую гипотезу в пользу альтернативной гипотезы, что p _b ≠ p _c , что будет означать, что предельные пропорции значительно отличаются друг от друга. ${\ displaystyle \ chi ^ {2}}$ ${\ displaystyle \ chi ^ {2}}$

Варианты [ править ]

Если либо b, либо c мало ( b + c <25), то оно плохо аппроксимируется распределением хи-квадрат. ^[^{необходима цитата}^] Затем можно использовать точный биномиальный тест, где b сравнивается с биномиальным распределением с параметром размера n = b + c и p = 0,5. По сути, точный биномиальный тест оценивает дисбаланс дискордантных b и c . Чтобы получить двустороннее значение P, значение P крайнего хвоста следует умножить на 2. Для b ≥ ${\ displaystyle \ chi ^ {2}}$ c :

{\ displaystyle {\ text {точное значение P}} = 2 \ sum _ {i = b} ^ {n} {n \ choose i} 0,5 ^ {i} (1-0,5) ^ {ni},}

что просто вдвое больше кумулятивной функции распределения биномиального распределения с p = 0,5 и n = b + c .

Эдвардс ^[4] предложил следующую исправленную версию теста Макнемара для аппроксимации биномиального точного P-значения:

{\ displaystyle \ chi ^ {2} = {(| bc | -1) ^ {2} \ over b + c}.}

Тест Макнемара среднего значения P (биномиальный критерий среднего значения p) рассчитывается путем вычитания половины вероятности наблюдаемого b из точного одностороннего значения P, затем удваивается, чтобы получить двустороннее среднее значение P: ^{[ 5]}^[6]

{\ displaystyle {\ text {mid-p-value}} = 2 \ left (\ sum _ {i = b} ^ {n} {n \ choose i} 0,5 ^ {i} (1-0,5) ^ {ni } -0,5 {n \ choose b} 0,5 ^ {b} (1-0,5) ^ {nb} \ right)}

Это эквивалентно:

{\ displaystyle {\ text {среднее значение p}} = {\ text {точное значение p}} - {n \ choose b} 0,5 ^ {b} (1-0,5) ^ {nb}}

где второй член представляет собой функцию массы вероятности биномиального распределения и n = b + c . Функции биномиального распределения легко доступны в обычных пакетах программного обеспечения, и тест McNemar mid-P может быть легко рассчитан. ^[6]

Традиционный совет - использовать точный биномиальный тест, когда b + c <25. Однако моделирование показало, что как точный биномиальный тест, так и тест МакНемара с поправкой на непрерывность являются чрезмерно консервативными. ^[6] Когда b + c <6, точное значение P всегда превышает общепринятый уровень значимости 0,05. Первоначальный тест Макнемара был наиболее действенным, но часто несколько либеральным. Версия mid-P была почти такой же мощной, как и асимптотический тест Макнемара, и не превышала номинального уровня значимости.

Примеры [ править ]

В первом примере исследователь пытается определить, влияет ли лекарство на конкретное заболевание. Количество людей приведено в таблице, причем диагноз (заболевание: присутствует или отсутствует ) до лечения указан в строках, а диагноз после лечения - в столбцах. Тест требует, чтобы одни и те же испытуемые были включены в измерения до и после (согласованные пары).

	После: настоящее	После: отсутствует	Итого по строке
Раньше: присутствует	101	121	222
Раньше: отсутствовал	59	33	92
Итого по столбцу	160	154	314

В этом примере нулевая гипотеза «предельной однородности» будет означать, что никакого эффекта от лечения не было. Из приведенных выше данных статистика теста Макнемара:

\chi ^{2}={(121-59)^{2} \over {121+59}}

имеет значение 21,35, что крайне маловероятно, чтобы сформировать распределение, подразумеваемое нулевой гипотезой ( P <0,001). Таким образом, тест предоставляет убедительные доказательства для отклонения нулевой гипотезы об отсутствии эффекта от лечения.

Второй пример иллюстрирует различия между асимптотическим тестом Макнемара и альтернативами. ^[6] Таблица данных отформатирована, как и раньше, с разными числами в ячейках:

	После: настоящее	После: отсутствует	Итого по строке
Раньше: присутствует	59	6	65
Раньше: отсутствовал	16	80	96
Итого по столбцу	75	86	161

С этими данными размер выборки (161 пациент) не мал, однако результаты теста Макнемара и других версий отличаются. Точный биномиальный тест дает P = 0,053, а тест Макнемара с поправкой на непрерывность дает = 3,68 и P = 0,055. Асимптотический тест МакНемара дает = 4,55 и P = 0,033, а тест МакНемара со средним значением P дает P = 0,035. Как тест Макнемара, так и версия со средним уровнем P обеспечивают более убедительные доказательства статистически значимого лечебного эффекта во втором примере. $\chi ^{2}$ $\chi ^{2}$

Обсуждение [ править ]

Интересное наблюдение при интерпретации теста Макнемара заключается в том, что элементы главной диагонали не влияют на решение о том, является ли (в приведенном выше примере) более благоприятным состояние до или после лечения. Таким образом, сумма b + c может быть небольшой, а статистическая мощность описанных выше тестов может быть низкой, даже если количество пар a + b + c + d велико (см. Второй пример выше).

Расширение теста Макнемара существует в ситуациях, когда независимость не обязательно сохраняется между парами; вместо этого есть кластеры парных данных, где пары в кластере могут не быть независимыми, но независимость сохраняется между разными кластерами. ^[7] Примером является анализ эффективности стоматологической процедуры; в этом случае пара соответствует лечению отдельного зуба у пациентов, которым возможно лечение нескольких зубов; Эффективность лечения двух зубов у одного и того же пациента вряд ли будет независимой, но лечение двух зубов у разных пациентов, скорее всего, будет независимым. ^[8]

Информация в парах [ править ]

В 1970-х годах было высказано предположение, что сохранение миндалин может защитить от лимфомы Ходжкина . Джон Райс писал: ^[9]

85 Пациенты Ходжкина [...] имели брата или сестру того же пола, который не болел болезнью и чей возраст был в пределах 5 лет от возраста пациента. Эти исследователи представили следующую таблицу:
${\begin{array}{c|c|c}\hline &{\text{Tonsillectomy}}&{\text{No tonsillectomy}}\\\hline {\text{Hodgkins}}&41&44\\\hline {\text{Control}}&33&52\end{array}}$
Они вычислили статистику хи-квадрат [...] [они] допустили ошибку в своем анализе, проигнорировав пары. [...] [их] выборки не были независимыми, потому что братья и сестры были парными [...] мы устанавливаем таблицу, которая показывает пары:
${\begin{array}{cc}&{\text{Sibling}}\\{\text{Patient}}&{\begin{array}{c|c|c}\hline &{\text{No tonsillectomy}}&{\text{Tonsillectomy}}\\\hline {\text{No tonsillectomy}}&37&7\\\hline {\text{Tonsillectomy}}&15&26\end{array}}\end{array}}$

Ко второй таблице можно применить тест Макнемара. Обратите внимание, что сумма чисел во второй таблице равна 85 - количество пар братьев и сестер, тогда как сумма чисел в первой таблице вдвое больше, 170 - количество индивидуумов. Вторая таблица дает больше информации, чем первая. Числа в первой таблице можно найти, используя числа во второй таблице, но не наоборот. Цифры в первой таблице дают только предельные суммы чисел во второй таблице.

Связанные тесты [ править ]

Тест биномиального знака дает точный тест для теста Макнемара.
В критерий кохрена является продолжением теста Мак - Немара более двух «лечения».
В точном тесте Лидделла в является точной альтернативой теста Мака - Немара. ^[10]^[11]
Тест Стюарта – Максвелла - это другое обобщение теста Макнемара, используемого для проверки предельной однородности в квадратной таблице с более чем двумя строками / столбцами. ^[12]^[13]^[14]
Тест Бхапкара (1966) - более мощная альтернатива тесту Стюарта – Максвелла ^[15]^[16], но имеет тенденцию к либерализации. Существуют конкурентные альтернативы существующим методам. ^[17]
Тест Макнемара является частным случаем теста Кокрана – Мантеля – Хензеля ; он эквивалентен тесту CMH с одним слоем для каждой из N пар и таблицей 2x2 в каждом слое, показывающей парные бинарные ответы. ^[18]

См. Также [ править ]

Критерий хи-квадрат Пирсона
Распределение хи-квадрат

Ссылки [ править ]

^ a b МакНемар, Куинн (18 июня 1947 г.). «Обратите внимание на ошибку выборки разницы между коррелированными пропорциями или процентами». Психометрика . 12 (2): 153–157. DOI : 10.1007 / BF02295996 . PMID 20254758 .
^ Spielman RS; McGinnis RE; Юэнс WJ (март 1993 г.). «Тест на передачу неравновесия по сцеплению: область гена инсулина и инсулинозависимый сахарный диабет (IDDM)» . Am J Hum Genet . 52 (3): 506–16. PMC 1682161 . PMID 8447318 .
Перейти ↑ Hawass, NE (апрель 1997 г.). «Сравнение чувствительности и специфики двух диагностических процедур, выполненных на одной и той же группе пациентов». Британский журнал радиологии . 70 (832): 360–366. DOI : 10.1259 / bjr.70.832.9166071 . ISSN 0007-1285 . PMID 9166071 .
Перейти ↑ Edwards, A (1948). «Примечание о« поправке на непрерывность »при проверке значимости разницы между коррелированными пропорциями». Психометрика . 13 (3): 185–187. DOI : 10.1007 / bf02289261 . PMID 18885738 .
^ Ланкастер, HO (1961). «Тесты значимости в дискретных распределениях». J Am Stat Assoc . 56 (294): 223–234. DOI : 10.1080 / 01621459.1961.10482105 .
^ a b c d Fagerland, МВт; Lydersen, S .; Лааке, П. (2013). «Тест МакНемара для двоичных данных совпадающих пар: среднее значение p и асимптотика лучше, чем точное условное» . BMC Medical Research Methodology . 13 : 91. DOI : 10,1186 / 1471-2288-13-91 . PMC 3716987 . PMID 23848987 .
^ Ян, З .; Солнце, X .; Хардин, JW (2010). «Примечание о тестах для кластеризованных двоичных данных согласованных пар». Биометрический журнал . 52 (5): 638–652. DOI : 10.1002 / bimj.201000035 . PMID 20976694 .
^ Дуркальский, ВЛ; Палеш, ГГ; Липсиц, SR; Ржавчина, П.Ф. (2003). «Анализ сгруппированных данных согласованных пар» . Статистика в медицине . 22 (15): 2417–28. DOI : 10.1002 / sim.1438 . PMID 12872299 . Архивировано из оригинала на 5 января 2013 года . Проверено 1 апреля 2009 года .
^ Райс, Джон (1995). Математическая статистика и анализ данных (второе изд.). Белмонт, Калифорния: Duxbury Press . стр. 492 -494. ISBN 978-0-534-20934-6.
Перейти ↑ Liddell, D. (1976). «Практические испытания таблиц на случай непредвиденных обстоятельств 2 × 2». Журнал Королевского статистического общества . 25 (4): 295–304. JSTOR 2988087 .
^ «Тест Максвелла, тест Макнемара, тест Каппа» . Rimarcik.com . Проверено 22 ноября 2012 .
^ Сунь, Сюэчжэн; Ян, Чжао (2008). «Обобщенный тест Макнемара на однородность маржинальных распределений» (PDF) . Глобальный форум SAS .
^ Стюарт, Алан (1955). «Тест на однородность маржинальных распределений в двухсторонней классификации». Биометрика . 42 (3/4): 412–416. DOI : 10.1093 / Biomet / 42.3-4.412 . JSTOR 2333387 .
^ Максвелл, AE (1970). «Сравнение классификации предметов двумя независимыми судьями». Британский журнал психиатрии . 116 (535): 651–655. DOI : 10.1192 / bjp.116.535.651 . PMID 5452368 .
^ "Макнемара Тесты предельной однородности" . John-uebersax.com. 2006-08-30 . Проверено 22 ноября 2012 .
^ Bhapkar, В. П. (1966). «Примечание об эквивалентности двух критериев проверки гипотез в категориальных данных». Журнал Американской статистической ассоциации . 61 (313): 228–235. DOI : 10.1080 / 01621459.1966.10502021 . JSTOR 2283057 .
^ Ян, З .; Солнце, X .; Хардин, JW (2012). "Проверка предельной однородности политомных данных согласованной пары". Терапевтические инновации и нормативная наука . 46 (4): 434–438. DOI : 10.1177 / 0092861512442021 .
^ Агрести, Алан (2002). Категориальный анализ данных (PDF) . Хукен, Нью-Джерси: John Wiley & Sons, Inc., стр. 413. ISBN 978-0-471-36093-3.

Внешние ссылки [ править ]

Сетка Макнемара 2 × 2 Колледжа Вассара с онлайн-калькулятором
Макнемара Тесты маргинальной однородности

[McNemar1947-1] МакНемар, Куинн (18 июня 1947 г.). «Обратите внимание на ошибку выборки разницы между коррелированными пропорциями или процентами». Психометрика . 12 (2): 153–157. DOI : 10.1007 / BF02295996 . PMID 20254758 .

[Spielman93-2] Spielman RS; McGinnis RE; Юэнс WJ (март 1993 г.). «Тест на передачу неравновесия по сцеплению: область гена инсулина и инсулинозависимый сахарный диабет (IDDM)» . Am J Hum Genet . 52 (3): 506–16. PMC 1682161 . PMID 8447318 .

[3] Перейти ↑ Hawass, NE (апрель 1997 г.). «Сравнение чувствительности и специфики двух диагностических процедур, выполненных на одной и той же группе пациентов». Британский журнал радиологии . 70 (832): 360–366. DOI : 10.1259 / bjr.70.832.9166071 . ISSN 0007-1285 . PMID 9166071 .

[Edwards1948-4] Перейти ↑ Edwards, A (1948). «Примечание о« поправке на непрерывность »при проверке значимости разницы между коррелированными пропорциями». Психометрика . 13 (3): 185–187. DOI : 10.1007 / bf02289261 . PMID 18885738 .

[Lancaster1961-5] Ланкастер, HO (1961). «Тесты значимости в дискретных распределениях». J Am Stat Assoc . 56 (294): 223–234. DOI : 10.1080 / 01621459.1961.10482105 .

[Fagerland2013-6] Fagerland, МВт; Lydersen, S .; Лааке, П. (2013). «Тест МакНемара для двоичных данных совпадающих пар: среднее значение p и асимптотика лучше, чем точное условное» . BMC Medical Research Methodology . 13 : 91. DOI : 10,1186 / 1471-2288-13-91 . PMC 3716987 . PMID 23848987 .

[7] Ян, З .; Солнце, X .; Хардин, JW (2010). «Примечание о тестах для кластеризованных двоичных данных согласованных пар». Биометрический журнал . 52 (5): 638–652. DOI : 10.1002 / bimj.201000035 . PMID 20976694 .

[8] Дуркальский, ВЛ; Палеш, ГГ; Липсиц, SR; Ржавчина, П.Ф. (2003). «Анализ сгруппированных данных согласованных пар» . Статистика в медицине . 22 (15): 2417–28. DOI : 10.1002 / sim.1438 . PMID 12872299 . Архивировано из оригинала на 5 января 2013 года . Проверено 1 апреля 2009 года .

[Rice1995-9] Райс, Джон (1995). Математическая статистика и анализ данных (второе изд.). Белмонт, Калифорния: Duxbury Press . стр. 492 -494. ISBN 978-0-534-20934-6.

[10] Перейти ↑ Liddell, D. (1976). «Практические испытания таблиц на случай непредвиденных обстоятельств 2 × 2». Журнал Королевского статистического общества . 25 (4): 295–304. JSTOR 2988087 .

[11] «Тест Максвелла, тест Макнемара, тест Каппа» . Rimarcik.com . Проверено 22 ноября 2012 .

[12] Сунь, Сюэчжэн; Ян, Чжао (2008). «Обобщенный тест Макнемара на однородность маржинальных распределений» (PDF) . Глобальный форум SAS .

[13] Стюарт, Алан (1955). «Тест на однородность маржинальных распределений в двухсторонней классификации». Биометрика . 42 (3/4): 412–416. DOI : 10.1093 / Biomet / 42.3-4.412 . JSTOR 2333387 .

[14] Максвелл, AE (1970). «Сравнение классификации предметов двумя независимыми судьями». Британский журнал психиатрии . 116 (535): 651–655. DOI : 10.1192 / bjp.116.535.651 . PMID 5452368 .

[15] "Макнемара Тесты предельной однородности" . John-uebersax.com. 2006-08-30 . Проверено 22 ноября 2012 .

[16] Bhapkar, В. П. (1966). «Примечание об эквивалентности двух критериев проверки гипотез в категориальных данных». Журнал Американской статистической ассоциации . 61 (313): 228–235. DOI : 10.1080 / 01621459.1966.10502021 . JSTOR 2283057 .

[17] Ян, З .; Солнце, X .; Хардин, JW (2012). "Проверка предельной однородности политомных данных согласованной пары". Терапевтические инновации и нормативная наука . 46 (4): 434–438. DOI : 10.1177 / 0092861512442021 .

[18] Агрести, Алан (2002). Категориальный анализ данных (PDF) . Хукен, Нью-Джерси: John Wiley & Sons, Inc., стр. 413. ISBN 978-0-471-36093-3.

[1]