Влиятельное наблюдение


В статистике влиятельное наблюдение — это наблюдение для статистического расчета , удаление которого из набора данных заметно изменило бы результат расчета. [1] В частности, в регрессионном анализе важным наблюдением является такое наблюдение, удаление которого оказывает большое влияние на оценки параметров. [2]

Для измерения влияния были предложены различные методы. [3] [4] Предположим, что регрессия оценивается , где — вектор-столбец n × 1 для переменной отклика, — матрица плана n × k независимых переменных (включая константу), — остаточный вектор n × 1, и вектор k × 1 оценок некоторого параметра совокупности . Также определите , проекционную матрицу . Тогда имеем следующие меры воздействия:

Выброс может быть определен как точка данных , которая значительно отличается от других наблюдений. [6] [7] Точка высокого рычага — это наблюдения, сделанные при экстремальных значениях независимых переменных. [8] Оба типа нетипичных наблюдений заставят линию регрессии быть близкой к точке. [2] В квартете Анскомба нижнее правое изображение имеет точку с высоким рычагом, а нижнее левое изображение имеет отдаленную точку.


В квартете Анскомба два нижних набора данных содержат важные моменты. Все четыре набора идентичны при анализе с использованием простой сводной статистики, но значительно различаются при графическом отображении. Если убрать одну точку, линия будет выглядеть совсем иначе.