тест Граббса


В статистике тест Граббса или тест Граббса (названный в честь Фрэнка Э. Граббса , опубликовавшего тест в 1950 году [1] ), также известный как тест максимального нормализованного остатка или тест экстремального студенческого отклонения , является тестом , используемым для обнаружения выбросов в одномерный набор данных, который, как предполагается, поступает из нормально распределенной совокупности.

Тест Граббса основан на предположении о нормальности . То есть, прежде чем применять критерий Граббса, следует сначала убедиться, что данные могут быть разумно аппроксимированы нормальным распределением. [2]

Тест Граббса обнаруживает по одному выбросу за раз. Этот выброс удаляется из набора данных, и тест повторяется до тех пор, пока выбросы не будут обнаружены. Однако несколько итераций изменяют вероятность обнаружения, и тест не следует использовать для выборок размером шесть или меньше, поскольку он часто помечает большинство точек как выбросы. [3]

где и обозначают выборочное среднее и стандартное отклонение соответственно. Статистика критерия Граббса представляет собой наибольшее абсолютное отклонение от среднего значения выборки в единицах стандартного отклонения выборки.

Это двусторонний тест , для которого гипотеза об отсутствии выбросов отвергается на уровне значимости α, если

где t α/(2 N ), где N −2 обозначает верхнее критическое значение t -распределения с N  − 2 степенями свободы и уровнем значимости α/(2 N ).