Выброс (статистика)


Выброс (англ. outlier), промах[1] — в статистике результат измерения, выделяющийся из общей выборки.

Статистический метод, способный действовать в условиях выбросов, называется робастным. Медиана является робастной характеристикой, а выборочное среднее — нет. Существует пример (квартет Энскомба), демонстрирующий, насколько неробастные методы обработки статистических данных способны «врать», даже если выброс всего один на 10 «обычных» результатов.

Поскольку множество статистических методов «буксуют» на выборках с выбросами, выбросы приходится обнаруживать (желательно — автоматически) и исключать из выборки. Простейшие способы основаны на межквартильном расстоянии — например, всё, что не попадает в диапазон

Более тонкие критерии — критерий Шовене[англ.], критерий Граббса, критерий Пирса[англ.], критерий Диксона[англ.].