Показатели ошибки при проверке гипотез

При статистической проверке гипотез показатель ошибки процедуры проверки гипотез - это скорость, с которой вероятности типов I и II экспоненциально убывают с размером выборки, используемой в тесте. Например, если вероятность ошибки теста уменьшается как , где - размер выборки, показатель ошибки равен . ${\ displaystyle P _ {\ mathrm {error}}}$ ${\ Displaystyle е ^ {- п \ бета}}$ ${\ displaystyle n}$ ${\ displaystyle \ beta}$

Формально показатель ошибки теста определяется как предельное значение отношения отрицательного логарифма вероятности ошибки в образце размера для больших размеров выборки: . Показатели ошибки для различных проверок гипотез вычисляются с использованием теоремы Санова и других результатов теории больших уклонений . $\lim _{n\to \infty }{\frac {-\ln P_{\text{error}}}{n}}$

Показатели ошибок при проверке бинарных гипотез [ править ]

Рассмотрим задачу проверки бинарной гипотезы, в которой наблюдения моделируются как независимые и одинаково распределенные случайные величины при каждой гипотезе. Обозначим через наблюдения. Позвольте обозначить функцию плотности вероятности каждого наблюдения при нулевой гипотезе и позвольте обозначить функцию плотности вероятности каждого наблюдения при альтернативной гипотезе . $Y_{1},Y_{2},\ldots ,Y_{n}$ $f_{0}$ $Y_{i}$ $H_{0}$ $f_{1}$ $Y_{i}$ $H_{1}$

В этом случае возможны два события ошибки . Ошибка типа 1, также называемая ложным срабатыванием , возникает, когда нулевая гипотеза верна и ошибочно отклоняется. Ошибка типа 2, также называемая ложноотрицательной, возникает, когда альтернативная гипотеза верна, а нулевая гипотеза не отклоняется. Обозначается вероятность ошибки 1-го типа и обозначается вероятность ошибки 2-го типа . $P(\mathrm {error} \mid H_{0})$ $P(\mathrm {error} \mid H_{1})$

Оптимальная экспонента ошибки для тестирования Неймана – Пирсона [ править ]

В версии проверки бинарных гипотез по версии Неймана – Пирсона ^[1] каждый заинтересован в минимизации вероятности ошибки 2-го типа при условии, что вероятность ошибки 1-го типа меньше или равна заранее заданному уровню . В этом случае оптимальной процедурой тестирования является тест отношения правдоподобия . ^[2] Кроме того, оптимальный тест гарантирует, что вероятность ошибки 2-го типа экспоненциально убывает в размере выборки в соответствии с . ^[3] Показатель ошибки - это расхождение Кульбака – Лейблера. $P({\text{error}}\mid H_{1})$ $P({\text{error}}\mid H_{0})$ $\alpha$ $n$ $\lim _{n\to \infty }{\frac {-\ln P(\mathrm {error} \mid H_{1})}{n}}=D(f_{0}\parallel f_{1})$ $D(f_{0}\parallel f_{1})$ между распределениями вероятностей наблюдений при двух гипотезах. Этот показатель также называют показателем леммы Чернова – Стейна.

Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы [ править ]

В байесовской версии проверки бинарных гипотез каждый заинтересован в минимизации средней вероятности ошибки при обеих гипотезах, предполагая априорную вероятность появления каждой гипотезы. Пусть обозначает априорную вероятность гипотезы . В этом случае средняя вероятность ошибки равна . В этой настройке снова оптимальным является тест отношения правдоподобия, и оптимальная ошибка уменьшается, поскольку где представляет информацию Чернова между двумя распределениями, определенными как . ^[3] $\pi _{0}$ $H_{0}$ $P_{\text{ave}}=\pi _{0}P({\text{error}}\mid H_{0})+(1-\pi _{0})P({\text{error}}\mid H_{1})$ $\lim _{n\to \infty }{\frac {-\ln P_{\text{ave}}}{n}}=C(f_{0},f_{1})$ $C(f_{0},f_{1})$ $C(f_{0},f_{1})=\max _{\lambda \in [0,1]}\left[-\ln \int (f_{0}(x))^{\lambda }(f_{1}(x))^{(1-\lambda )}\,dx\right]$

Ссылки [ править ]

^ Нейман, Дж . ; Пирсон, ES (1933), «О проблеме наиболее эффективных проверок статистических гипотез» (PDF) , Philosophical Transactions of the Royal Society of London A , 231 (694–706): 289–337, Bibcode : 1933RSPTA.231 ..289N , DOI : 10.1098 / rsta.1933.0009 , JSTOR 91247 CS1 maint: discouraged parameter (link)
^ Lehmann, EL ; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1. CS1 maint: discouraged parameter (link)
^ a b Обложка, Томас М .; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Нью-Йорк: Wiley-Interscience. CS1 maint: discouraged parameter (link)

[NeymanPearson1933-1] Нейман, Дж . ; Пирсон, ES (1933), «О проблеме наиболее эффективных проверок статистических гипотез» (PDF) , Philosophical Transactions of the Royal Society of London A , 231 (694–706): 289–337, Bibcode : 1933RSPTA.231 ..289N , DOI : 10.1098 / rsta.1933.0009 , JSTOR 91247 CS1 maint: discouraged parameter (link)

[LR-2] Lehmann, EL ; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1. CS1 maint: discouraged parameter (link)

[CT-3] Обложка, Томас М .; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Нью-Йорк: Wiley-Interscience. CS1 maint: discouraged parameter (link)

[1]