Обнаружение изменений


В статистическом анализе обнаружение изменений или обнаружение точек изменения пытается определить моменты времени, когда изменяется распределение вероятностей стохастического процесса или временного ряда . В целом проблема касается как определения того, произошло ли изменение или могло произойти несколько изменений, так и определения времени любых таких изменений.

Конкретные приложения, такие как обнаружение ступеней и обнаружение краев , могут быть связаны с изменениями среднего значения , дисперсии , корреляции или спектральной плотности процесса. В более общем смысле обнаружение изменений также включает обнаружение аномального поведения: обнаружение аномалий .

Временной ряд измеряет изменение одной или нескольких величин во времени. Например, на приведенном выше рисунке показан уровень воды в реке Нил между 1870 и 1970 годами. Обнаружение точки изменения связано с определением того, существенно ли изменяется поведение ряда, и если да, то когда . В примере с рекой Нил объем воды значительно меняется после того, как на реке была построена плотина. Важно отметить, что аномальные наблюдения, которые отличаются от текущего поведения временного ряда, обычно не считаются точками изменения, если после этого ряд возвращается к своему прежнему поведению.

Математически мы можем описать временной ряд как упорядоченную последовательность наблюдений . Мы можем записать совместное распределение подмножества временного ряда как . Если цель состоит в том, чтобы определить, произошла ли точка изменения в определенный момент времени в конечном временном ряду длины , то мы действительно спрашиваем, равны ли . Эту проблему можно обобщить на случай более чем одной точки разладки.

Проблема обнаружения точки изменения может быть сведена к более конкретным задачам. При автономном обнаружении точек изменения предполагается, что доступна последовательность определенной длины, и цель состоит в том, чтобы определить, возникли ли какие-либо точки изменения в серии. Это пример апостериорного анализа , к которому часто подходят с использованием методов проверки гипотез . Напротив, обнаружение точек изменения в режиме онлайн связано с обнаружением точек изменения во входящем потоке данных.

Используя подход последовательного анализа («онлайн»), любой тест на изменение должен найти компромисс между этими общими показателями:


График зависимости годового объема реки Нил в Асуане от времени, пример данных временных рядов, обычно используемых для обнаружения изменений.
Годовой объем реки Нил в Асуане , пример данных временных рядов, обычно используемых для обнаружения изменений. Пунктирная линия обозначает обнаруженную точку изменения. [1]