Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

При статистической проверке гипотез показатель ошибки процедуры проверки гипотез - это скорость, с которой вероятности типов I и II экспоненциально убывают с размером выборки, используемой в тесте. Например, если вероятность ошибки теста уменьшается как , где - размер выборки, показатель ошибки равен .

Формально показатель ошибки теста определяется как предельное значение отношения отрицательного логарифма вероятности ошибки в образце размера для больших размеров выборки: . Показатели ошибки для различных проверок гипотез вычисляются с использованием теоремы Санова и других результатов теории больших уклонений .

Показатели ошибок при проверке бинарных гипотез [ править ]

Рассмотрим задачу проверки бинарной гипотезы, в которой наблюдения моделируются как независимые и одинаково распределенные случайные величины при каждой гипотезе. Обозначим через наблюдения. Позвольте обозначить функцию плотности вероятности каждого наблюдения при нулевой гипотезе и позвольте обозначить функцию плотности вероятности каждого наблюдения при альтернативной гипотезе .

В этом случае возможны два события ошибки . Ошибка типа 1, также называемая ложным срабатыванием , возникает, когда нулевая гипотеза верна и ошибочно отклоняется. Ошибка типа 2, также называемая ложноотрицательной, возникает, когда альтернативная гипотеза верна, а нулевая гипотеза не отклоняется. Обозначается вероятность ошибки 1-го типа и обозначается вероятность ошибки 2-го типа .

Оптимальная экспонента ошибки для тестирования Неймана – Пирсона [ править ]

В версии проверки бинарных гипотез по версии Неймана – Пирсона [1] каждый заинтересован в минимизации вероятности ошибки 2-го типа при условии, что вероятность ошибки 1-го типа меньше или равна заранее заданному уровню . В этом случае оптимальной процедурой тестирования является тест отношения правдоподобия . [2] Кроме того, оптимальный тест гарантирует, что вероятность ошибки 2-го типа экспоненциально убывает в размере выборки в соответствии с . [3] Показатель ошибки - это расхождение Кульбака – Лейблера.между распределениями вероятностей наблюдений при двух гипотезах. Этот показатель также называют показателем леммы Чернова – Стейна.

Оптимальный показатель ошибки для средней вероятности ошибки при проверке байесовской гипотезы [ править ]

В байесовской версии проверки бинарных гипотез каждый заинтересован в минимизации средней вероятности ошибки при обеих гипотезах, предполагая априорную вероятность появления каждой гипотезы. Пусть обозначает априорную вероятность гипотезы . В этом случае средняя вероятность ошибки равна . В этой настройке снова оптимальным является тест отношения правдоподобия, и оптимальная ошибка уменьшается, поскольку где представляет информацию Чернова между двумя распределениями, определенными как . [3]

Ссылки [ править ]

  1. ^ Нейман, Дж . ; Пирсон, ES (1933), «О проблеме наиболее эффективных проверок статистических гипотез» (PDF) , Philosophical Transactions of the Royal Society of London A , 231 (694–706): 289–337, Bibcode : 1933RSPTA.231 ..289N , DOI : 10.1098 / rsta.1933.0009 , JSTOR  91247 CS1 maint: discouraged parameter (link)
  2. ^ Lehmann, EL ; Романо, Джозеф П. (2005). Проверка статистических гипотез (3-е изд.). Нью-Йорк: Спрингер. ISBN 978-0-387-98864-1. CS1 maint: discouraged parameter (link)
  3. ^ a b Обложка, Томас М .; Томас, Джой А. (2006). Элементы теории информации (2-е изд.). Нью-Йорк: Wiley-Interscience. CS1 maint: discouraged parameter (link)