Автокорреляция

Автокорреляции , также известные как серийная корреляция , представляют собой корреляцию из сигнала с задержанной копией себя как функция задержки. Неформально это сходство между наблюдениями как функция временного интервала между ними. Анализ автокорреляции - это математический инструмент для поиска повторяющихся паттернов, таких как наличие периодического сигнала, скрытого шумом , или определения отсутствующей основной частоты в сигнале, подразумеваемой его гармоническими частотами. Он часто используется при обработке сигналов для анализа функций или серий значений, таких как сигналы во временной области .

Вверху: график серии из 100 случайных чисел, скрывающих синусоидальную функцию. Ниже: функция синуса, отображаемая на коррелограмме, полученной с помощью автокорреляции.

Визуальное сравнение свертки, взаимной корреляции и автокорреляции . Для операций с функцией

f

и при условии, что высота

f

равна 1,0, значение результата в 5 различных точках указывается заштрихованной областью под каждой точкой. Кроме того, симметрия

f

является причиной

{\ displaystyle g * f}

а также

{\ displaystyle f \ star g}

идентичны в этом примере.

В разных областях исследования автокорреляция определяется по-разному, и не все эти определения эквивалентны. В некоторых областях этот термин используется как синоним автоковариации .

Процессы единичного корня , стационарные по тренду процессы , авторегрессионные процессы и процессы скользящего среднего - это специфические формы процессов с автокорреляцией.

Автокорреляция случайных процессов

В статистике автокорреляция реального или сложного случайного процесса - это корреляция Пирсона между значениями процесса в разное время, как функция двух моментов времени или временной задержки. Позволять ${\ displaystyle \ left \ {X_ {t} \ right \}}$ быть случайным процессом, и ${\ displaystyle t}$ быть в любой момент времени ( ${\ displaystyle t}$ может быть целым числом для процесса с дискретным временем или действительным числом для процесса с непрерывным временем ). потом ${\ displaystyle X_ {t}}$ это ценность (или реализация ), произведенная данным запуском процесса во время ${\ displaystyle t}$ . Предположим, что процесс имеет среднее значение ${\ displaystyle \ mu _ {t}}$ и дисперсия ${\ Displaystyle \ sigma _ {т} ^ {2}}$ вовремя ${\ displaystyle t}$ , для каждого ${\ displaystyle t}$ . Тогда определение автокорреляционной функции между временами ${\ displaystyle t_ {1}}$ а также ${\ displaystyle t_ {2}}$ is ^[1]^{: стр.388}^[2]^{: стр.165}

{\ displaystyle \ operatorname {R} _ {XX} (t_ {1}, t_ {2}) = \ operatorname {E} \ left [X_ {t_ {1}} {\ overline {X}} _ {t_ { 2}} \ right]}

( Уравнение 1 )

где ${\ displaystyle \ operatorname {E}}$ - оператор ожидаемого значения, а полоса представляет комплексное сопряжение. Обратите внимание, что ожидание не может быть четко определено.

Вычитание среднего перед умножением дает функцию автоковариации между временами ${\ displaystyle t_ {1}}$ а также ${\ displaystyle t_ {2}}$ : ^[1]^{: стр.392}^[2]^{: стр.168}

{\ displaystyle \ operatorname {K} _ {XX} (t_ {1}, t_ {2}) = \ operatorname {E} \ left [(X_ {t_ {1}} - \ mu _ {t_ {1}}) ) {\ overline {(X_ {t_ {2}} - \ mu _ {t_ {2}})}} \ right] = \ operatorname {E} \ left [X_ {t_ {1}} {\ overline {X }} _ {t_ {2}} \ right] - \ mu _ {t_ {1}} {\ overline {\ mu}} _ {t_ {2}}}

( Уравнение 2 )

Обратите внимание, что это выражение не является четко определенным для всех временных рядов или процессов, потому что среднее значение может не существовать, или дисперсия может быть нулевой (для постоянного процесса) или бесконечной (для процессов с распределением, не имеющим хороших моментов, таких как как некоторые виды степенного закона).

Определение стационарного случайного процесса в широком смысле

Если ${\ displaystyle \ left \ {X_ {t} \ right \}}$ является стационарным процессом в широком смысле, то среднее ${\ displaystyle \ mu}$ и дисперсия ${\ displaystyle \ sigma ^ {2}}$ не зависят от времени, и далее автоковариационная функция зависит только от запаздывания между ${\ displaystyle t_ {1}}$ а также ${\ displaystyle t_ {2}}$ : автоковариация зависит только от расстояния во времени между парой значений, но не от их положения во времени. Это также означает, что автоковариация и автокорреляция могут быть выражены как функция запаздывания, и что это будет четная функция запаздывания. ${\ displaystyle \ tau = t_ {2} -t_ {1}}$ . Это дает более знакомые формы для функции автокорреляции ^[1]^{: стр.395}

{\ displaystyle \ operatorname {R} _ {XX} (\ tau) = \ operatorname {E} \ left [X_ {t} {\ overline {X}} _ {t + \ tau} \ right]}

( Уравнение 3 )

и функция автоковариации :

{\ displaystyle \ operatorname {K} _ {XX} (\ tau) = \ operatorname {E} \ left [(X_ {t} - \ mu) {\ overline {(X_ {t + \ tau} - \ mu)} } \ right] = \ operatorname {E} \ left [X_ {t} {\ overline {X}} _ {t + \ tau} \ right] - \ mu {\ overline {\ mu}}}

( Уравнение 4 )

Нормализация

В некоторых дисциплинах (например, в статистике и анализе временных рядов ) обычной практикой является нормализация функции автоковариации для получения зависящего от времени коэффициента корреляции Пирсона . Однако в других дисциплинах (например, инженерии) от нормализации обычно отказываются, и термины «автокорреляция» и «автоковариация» используются как взаимозаменяемые.

Определение коэффициента автокорреляции случайного процесса ^[2]^{: с.169}

{\ displaystyle \ rho _ {XX} (t_ {1}, t_ {2}) = {\ frac {\ operatorname {K} _ {XX} (t_ {1}, t_ {2})} {\ sigma _ {t_ {1}} \ sigma _ {t_ {2}}}} = {\ frac {\ operatorname {E} \ left [(X_ {t_ {1}} - \ mu _ {t_ {1}}) { \ overline {(X_ {t_ {2}} - \ mu _ {t_ {2}})}} \ right]} {\ sigma _ {t_ {1}} \ sigma _ {t_ {2}}}}. }

Если функция ${\ displaystyle \ rho _ {XX}}$ четко определено, его значение должно лежать в диапазоне ${\ displaystyle [-1,1]}$ , где 1 указывает на идеальную корреляцию, а -1 указывает на полную антикорреляцию .

Для процесса стационарности в слабом смысле и стационарности в широком смысле (WSS) определение таково:

{\ displaystyle \ rho _ {XX} (\ tau) = {\ frac {\ operatorname {K} _ {XX} (\ tau)} {\ sigma ^ {2}}} = {\ frac {\ operatorname {E } \ left [(X_ {t} - \ mu) {\ overline {(X_ {t + \ tau} - \ mu)}} \ right]} {\ sigma ^ {2}}}}

где

{\ displaystyle \ operatorname {K} _ {XX} (0) = \ sigma ^ {2}.}

Нормализация важна как потому, что интерпретация автокорреляции как корреляции обеспечивает безмасштабную меру силы статистической зависимости , так и потому, что нормализация влияет на статистические свойства оцененных автокорреляций.

Характеристики

Свойство симметрии

Тот факт, что функция автокорреляции ${\ displaystyle \ operatorname {R} _ {XX}}$ является четной функцией, можно записать как ^[2]^{: с.171}

{\ displaystyle \ operatorname {R} _ {XX} (t_ {1}, t_ {2}) = {\ overline {\ operatorname {R} _ {XX} (t_ {2}, t_ {1})}} }

Соответственно для процесса WSS: ^[2]^{: с.173}

{\ displaystyle \ operatorname {R} _ {XX} (\ tau) = {\ overline {\ operatorname {R} _ {XX} (- \ tau)}}.}

Максимум на нуле

Для процесса WSS: ^[2]^{: стр.174}

{\ displaystyle \ left | \ operatorname {R} _ {XX} (\ tau) \ right | \ leq \ operatorname {R} _ {XX} (0)}

Заметь ${\ displaystyle \ operatorname {R} _ {XX} (0)}$ всегда реально.

Неравенство Коши – Шварца.

Неравенство Коши-Шварца , неравенство для случайных процессов: ^[1]^{: p.392}

{\ displaystyle \ left | \ OperatorName {R} _ {XX} (t_ {1}, t_ {2}) \ right | ^ {2} \ leq \ operatorname {E} \ left [| X_ {t_ {1} } | ^ {2} \ right] \ OperatorName {E} \ left [| X_ {t_ {2}} | ^ {2} \ right]}

Автокорреляция белого шума

Автокорреляция непрерывного сигнала белого шума будет иметь сильный пик (представленный дельта-функцией Дирака ) на ${\ Displaystyle \ тау = 0}$ и будет ровно 0 для всех остальных ${\ Displaystyle \ тау}$ .

Теорема Винера – Хинчина.

Теорема Винера – Хинчина связывает автокорреляционную функцию ${\ displaystyle \ operatorname {R} _ {XX}}$ к мощности спектральной плотности ${\ displaystyle S_ {XX}}$ через преобразование Фурье :

{\ displaystyle \ operatorname {R} _ {XX} (\ tau) = \ int _ {- \ infty} ^ {\ infty} S_ {XX} (f) e ^ {i2 \ pi f \ tau} \, { \ rm {d}} f}

{\ Displaystyle S_ {XX} (е) = \ int _ {- \ infty} ^ {\ infty} \ operatorname {R} _ {XX} (\ tau) e ^ {- i2 \ pi f \ tau} \, {\ rm {d}} \ tau.}

Для действительных функций симметричная автокорреляционная функция имеет действительное симметричное преобразование, поэтому теорема Винера – Хинчина может быть выражена только через вещественные косинусы:

{\ displaystyle \ operatorname {R} _ {XX} (\ tau) = \ int _ {- \ infty} ^ {\ infty} S_ {XX} (f) \ cos (2 \ pi f \ tau) \, { \ rm {d}} f}

{\ Displaystyle S_ {XX} (е) = \ int _ {- \ infty} ^ {\ infty} \ OperatorName {R} _ {XX} (\ tau) \ cos (2 \ pi f \ tau) \, { \ rm {d}} \ tau.}

Автокорреляция случайных векторов

Автокорреляционная матрица (также называемый второй момент) из случайного вектора ${\ Displaystyle \ mathbf {X} = (X_ {1}, \ ldots, X_ {n}) ^ {\ rm {T}}}$ является ${\ Displaystyle п \ раз п}$ матрица, содержащая в качестве элементов автокорреляции всех пар элементов случайного вектора ${\ displaystyle \ mathbf {X}}$ . Матрица автокорреляции используется в различных алгоритмах цифровой обработки сигналов.

Для случайного вектора ${\ Displaystyle \ mathbf {X} = (X_ {1}, \ ldots, X_ {n}) ^ {\ rm {T}}}$ матрица автокорреляции, содержащая случайные элементы, для которых существуют ожидаемое значение и дисперсия , определяется как ^[3]^:^p.190^[1]^:^p.334

{\ displaystyle \ operatorname {R} _ {\ mathbf {X} \ mathbf {X}} \ треугольник \ \ operatorname {E} \ left [\ mathbf {X} \ mathbf {X} ^ {\ rm {T}} \верно]}

( Уравнение 1 )

где ${\ displaystyle {} ^ {\ rm {T}}}$ обозначает транспонирование и имеет размеры ${\ Displaystyle п \ раз п}$ .

Написано покомпонентно:

{\ displaystyle \ operatorname {R} _ {\ mathbf {X} \ mathbf {X}} = {\ begin {bmatrix} \ operatorname {E} [X_ {1} X_ {1}] & \ operatorname {E} [ X_ {1} X_ {2}] & \ cdots & \ operatorname {E} [X_ {1} X_ {n}] \\\\\ имя оператора {E} [X_ {2} X_ {1}] & \ operatorname {E} [X_ {2} X_ {2}] & \ cdots & \ operatorname {E} [X_ {2} X_ {n}] \\\\\ vdots & \ vdots & \ ddots & \ vdots \\\ \\ имя оператора {E} [X_ {n} X_ {1}] & \ имя оператора {E} [X_ {n} X_ {2}] & \ cdots & \ имя оператора {E} [X_ {n} X_ {n} ] \\\\\ конец {bmatrix}}}

Если ${\ displaystyle \ mathbf {Z}}$ является сложным случайным вектором , матрица автокорреляции вместо этого определяется как

{\ displaystyle \ operatorname {R} _ {\ mathbf {Z} \ mathbf {Z}} \ треугольник \ \ operatorname {E} [\ mathbf {Z} \ mathbf {Z} ^ {\ rm {H}}]. }

Здесь ${\ displaystyle {} ^ {\ rm {H}}}$ обозначает эрмитову транспозицию .

Например, если ${\ displaystyle \ mathbf {X} = \ left (X_ {1}, X_ {2}, X_ {3} \ right) ^ {\ rm {T}}}$ - случайный вектор, то ${\ Displaystyle \ OperatorName {R} _ {\ mathbf {X} \ mathbf {X}}}$ это ${\ displaystyle 3 \ times 3}$ матрица, чья ${\ displaystyle (я, j)}$ -я запись ${\ displaystyle \ operatorname {E} [X_ {i} X_ {j}]}$ .

Свойства автокорреляционной матрицы

Матрица автокорреляции - это эрмитова матрица для комплексных случайных векторов и симметричная матрица для вещественных случайных векторов. ^[3]^{: с.190}
Матрица автокорреляции - это положительно полуопределенная матрица, ^[3]^{: стр.190,} т.е. ${\ displaystyle \ mathbf {a} ^ {\ mathrm {T}} \ operatorname {R} _ {\ mathbf {X} \ mathbf {X}} \ mathbf {a} \ geq 0 \ quad {\ text {для всех }} \ mathbf {a} \ in \ mathbb {R} ^ {n}}$ для реального случайного вектора соответственно ${\ displaystyle \ mathbf {a} ^ {\ mathrm {H}} \ operatorname {R} _ {\ mathbf {Z} \ mathbf {Z}} \ mathbf {a} \ geq 0 \ quad {\ text {для всех }} \ mathbf {a} \ in \ mathbb {C} ^ {n}}$ в случае сложного случайного вектора.
Все собственные значения автокорреляционной матрицы действительны и неотрицательны.
Матрица автоматического ковариационная связана с матрицей автокорреляции следующим образом :

{\ displaystyle \ operatorname {K} _ {\ mathbf {X} \ mathbf {X}} = \ operatorname {E} [(\ mathbf {X} - \ operatorname {E} [\ mathbf {X}]) (\ mathbf {X} - \ operatorname {E} [\ mathbf {X}]) ^ {\ rm {T}}] = \ operatorname {R} _ {\ mathbf {X} \ mathbf {X}} - \ operatorname { E} [\ mathbf {X}] \ OperatorName {E} [\ mathbf {X}] ^ {\ rm {T}}}

Соответственно для сложных случайных векторов:

{\ displaystyle \ operatorname {K} _ {\ mathbf {Z} \ mathbf {Z}} = \ operatorname {E} [(\ mathbf {Z} - \ operatorname {E} [\ mathbf {Z}]) (\ mathbf {Z} - \ operatorname {E} [\ mathbf {Z}]) ^ {\ rm {H}}] = \ operatorname {R} _ {\ mathbf {Z} \ mathbf {Z}} - \ operatorname { E} [\ mathbf {Z}] \ operatorname {E} [\ mathbf {Z}] ^ {\ rm {H}}}

Автокорреляция детерминированных сигналов

При обработке сигналов приведенное выше определение часто используется без нормализации, то есть без вычитания среднего и деления на дисперсию. Когда автокорреляционная функция нормирована на среднее значение и дисперсию, ее иногда называют коэффициентом автокорреляции ^[4] или функцией автоковариации.

Автокорреляция сигнала непрерывного времени

Учитывая сигнал ${\ displaystyle f (t)}$ , непрерывная автокорреляция ${\ Displaystyle R_ {ff} (\ тау)}$ чаще всего определяется как непрерывный интеграл взаимной корреляции ${\ displaystyle f (t)}$ с собой, с запаздыванием ${\ Displaystyle \ тау}$ . ^[1]^{: с.411}

{\ Displaystyle R_ {ff} (\ tau) = \ int _ {- \ infty} ^ {\ infty} f (t + \ tau) {\ overline {f (t)}} \, {\ rm {d}} t = \ int _ {- \ infty} ^ {\ infty} f (t) {\ overline {f (t- \ tau)}} \, {\ rm {d}} t}

( Уравнение 6 )

где ${\ Displaystyle {\ overline {е (т)}}}$ представляет комплексное сопряжение из ${\ displaystyle f (t)}$ . Обратите внимание, что параметр ${\ displaystyle t}$ в интеграле является фиктивной переменной и необходима только для вычисления интеграла. Это не имеет особого значения.

Автокорреляция дискретного сигнала времени

Дискретная автокорреляция ${\ displaystyle R}$ с запаздыванием ${\ displaystyle \ ell}$ для сигнала с дискретным временем ${\ Displaystyle у (п)}$ является

{\ Displaystyle R_ {yy} (\ ell) = \ sum _ {n \ in Z} y (n) \, {\ overline {y (n- \ ell)}}}

( Ур.7 )

Приведенные выше определения работают для сигналов, которые интегрируются в квадрате или суммируются в квадрате, то есть с конечной энергией. Сигналы, которые «длятся вечно», вместо этого рассматриваются как случайные процессы, и в этом случае требуются другие определения, основанные на ожидаемых значениях. Для стационарных случайных процессов в широком смысле автокорреляции определяются как

{\ Displaystyle R_ {ff} (\ tau) = \ operatorname {E} \ left [f (t) {\ overline {f (t- \ tau)}} \ right]}

{\ displaystyle R_ {yy} (\ ell) = \ operatorname {E} \ left [y (n) \, {\ overline {y (n- \ ell)}} \ right].}

Для нестационарных процессов они также будут функциями ${\ displaystyle t}$ , или же ${\ displaystyle n}$ .

Для процессов, которые также являются эргодическими , математическое ожидание можно заменить пределом среднего времени. Автокорреляция эргодического процесса иногда определяется как или приравнивается к ^[4]

{\ displaystyle R_ {ff} (\ tau) = \ lim _ {T \ rightarrow \ infty} {\ frac {1} {T}} \ int _ {0} ^ {T} f (t + \ tau) {\ надчеркнуть {f (t)}} \, {\ rm {d}} t}

{\ Displaystyle R_ {yy} (\ ell) = \ lim _ {N \ rightarrow \ infty} {\ frac {1} {N}} \ sum _ {n = 0} ^ {N-1} y (n) \, {\ overline {y (n- \ ell)}}.}

Преимущество этих определений состоит в том, что они дают разумные и четко определенные однопараметрические результаты для периодических функций, даже если эти функции не являются выходом стационарных эргодических процессов.

В качестве альтернативы сигналы, которые длятся вечно, можно обрабатывать с помощью анализа краткосрочной автокорреляционной функции с использованием интегралов за конечное время. (См. Кратковременное преобразование Фурье для связанного процесса.)

Определение периодических сигналов

Если ${\ displaystyle f}$ является непрерывной периодической функцией периода ${\ displaystyle T}$ , интеграция из ${\ displaystyle - \ infty}$ к ${\ displaystyle \ infty}$ заменяется интегрированием по любому интервалу ${\ displaystyle [t_ {0}, t_ {0} + T]}$ длины ${\ displaystyle T}$ :

{\ Displaystyle R_ {ff} (\ тау) \ треугольник q \ int _ {t_ {0}} ^ {t_ {0} + T} f (t + \ tau) {\ overline {f (t)}} \, dt }

что эквивалентно

{\ Displaystyle R_ {FF} (\ тау) \ треугольник \ int _ {т_ {0}} ^ {т_ {0} + Т} е (т) {\ overline {е (т- \ тау)}} \, dt}

Характеристики

Далее мы будем описывать свойства только одномерных автокорреляций, поскольку большинство свойств легко переносятся из одномерного случая в многомерный. Эти свойства сохраняются для стационарных процессов в широком смысле . ^[5]

Основное свойство автокорреляции - симметрия, ${\ Displaystyle R_ {ff} (\ tau) = R_ {ff} (- \ tau)}$ , что легко доказать из определения. В непрерывном случае

автокорреляция - четная функция

{\ Displaystyle R_ {ff} (- \ tau) = R_ {ff} (\ tau) \,}

когда

{\ displaystyle f}

это реальная функция,

а автокорреляция - эрмитова функция

{\ Displaystyle R_ {ff} (- \ tau) = R_ {ff} ^ {*} (\ tau) \,}

когда

{\ displaystyle f}

- сложная функция .

Непрерывная автокорреляционная функция достигает своего пика в начале координат, где она принимает реальное значение, то есть для любой задержки. ${\ Displaystyle \ тау}$ , ${\ Displaystyle | R_ {ff} (\ tau) | \ leq R_ {ff} (0)}$ . ^[1]^{: с.410} Это следствие перестановки неравенства . Тот же результат имеет место и в дискретном случае.
Автокорреляция периодической функции сама по себе периодична с тем же периодом.
Автокорреляция суммы двух полностью некоррелированных функций (взаимная корреляция равна нулю для всех ${\ Displaystyle \ тау}$ ) - сумма автокорреляций каждой функции в отдельности.
Поскольку автокорреляция является особым типом взаимной корреляции , она сохраняет все свойства взаимной корреляции.
Используя символ ${\ displaystyle *}$ представлять свертку и ${\ displaystyle g _ {- 1}}$ это функция, которая управляет функцией ${\ displaystyle f}$ и определяется как ${\ Displaystyle г _ {- 1} (е) (т) = е (-t)}$ , определение для ${\ Displaystyle R_ {ff} (\ тау)}$ можно записать как:

{\ Displaystyle R_ {ff} (\ tau) = (f * g _ {- 1} ({\ overline {f}})) (\ tau)}

Многомерная автокорреляция

Multi - мерная автокорреляция определяются аналогично. Например, в трех измерениях автокорреляция дискретного сигнала с суммированием квадратов будет

{\ Displaystyle R (J, K, \ ell) = \ sum _ {n, q, r} x_ {n, q, r} \, {\ overline {x}} _ {nj, qk, r- \ ell }.}

Когда средние значения вычитаются из сигналов перед вычислением функции автокорреляции, результирующая функция обычно называется функцией автоковариации.

Эффективное вычисление

Для данных, выраженных в виде дискретной последовательности, часто необходимо вычислить автокорреляцию с высокой вычислительной эффективностью . Метод грубой силы, основанный на определении обработки сигнала ${\ displaystyle R_ {xx} (j) = \ sum _ {n} x_ {n} \, {\ overline {x}} _ {nj}}$ может использоваться при небольшом размере сигнала. Например, для расчета автокорреляции реальной сигнальной последовательности ${\ Displaystyle х = (2,3, -1)}$ (т.е. ${\ displaystyle x_ {0} = 2, x_ {1} = 3, x_ {2} = - 1}$ , а также ${\ displaystyle x_ {i} = 0}$ для всех других значений $i$ ) вручную мы сначала узнаем, что только что данное определение такое же, как «обычное» умножение, но со сдвигом вправо, где каждое вертикальное добавление дает автокорреляцию для определенных значений запаздывания:

{\ displaystyle {\ begin {array} {rrrrrr} & 2 & 3 & -1 \\\ times & 2 & 3 & -1 \\\ hline & -2 & -3 & 1 \\ && 6 & 9 & -3 \\ + &&& 4 & 6 & -2 \\\ hline & -2 & 3 & 14 & 3 & - 2 \ end {array}}}

Таким образом, требуемая последовательность автокорреляции ${\ Displaystyle R_ {xx} = (- 2,3,14,3, -2)}$ , где ${\ displaystyle R_ {xx} (0) = 14,}$ ${\ Displaystyle R_ {xx} (- 1) = R_ {xx} (1) = 3,}$ а также ${\ Displaystyle R_ {xx} (- 2) = R_ {xx} (2) = - 2,}$ автокорреляция для других значений запаздывания равна нулю. В этом вычислении мы не выполняем операцию переноса во время сложения, как это обычно бывает при обычном умножении. Обратите внимание, что мы можем вдвое сократить количество необходимых операций, используя симметрию, присущую автокорреляции. Если сигнал будет периодическим, т. Е. ${\ Displaystyle х = (\ ldots, 2,3, -1,2,3, -1, \ ldots),}$ тогда мы получаем круговую автокорреляцию (похожую на круговую свертку ), где левый и правый хвосты предыдущей автокорреляционной последовательности будут перекрываться и давать ${\ Displaystyle R_ {хх} = (\ ldots, 14,1,1,14,1,1, \ ldots)}$ который имеет тот же период, что и сигнальная последовательность ${\ displaystyle x.}$ Процедуру можно рассматривать как применение свойства свертки z-преобразования дискретного сигнала.

Хотя алгоритм грубой силы имеет порядок $n 2$ , существует несколько эффективных алгоритмов, которые могут вычислять автокорреляцию в порядке $n log (n)$ . Например, теорема Винера – Хинчина позволяет вычислить автокорреляцию из необработанных данных $X (t)$ с помощью двух быстрых преобразований Фурье (БПФ): ^[6]

{\ Displaystyle {\ begin {align} F_ {R} (f) & = \ operatorname {FFT} [X (t)] \\ S (f) & = F_ {R} (f) F_ {R} ^ { *} (f) \\ R (\ tau) & = \ operatorname {IFFT} [S (f)] \ end {align}}}

где IFFT обозначает обратное быстрое преобразование Фурье . Звездочка означает комплексное сопряжение .

В качестве альтернативы, множественная корреляция $τ$ может быть выполнена с использованием вычисления грубой силы для низких значений $τ$ , а затем постепенного объединения данных $X (t)$ с логарифмической плотностью для вычисления более высоких значений, что приводит к той же эффективности $n log (n)$ , но с меньшими требованиями к памяти. ^[7]^[8]

Оценка

Для дискретного процесса с известным средним и дисперсией, для которого мы наблюдаем ${\ displaystyle n}$ наблюдения ${\ Displaystyle \ {X_ {1}, \, X_ {2}, \, \ ldots, \, X_ {n} \}}$ , оценка автокорреляции может быть получена как

{\ displaystyle {\ hat {R}} (k) = {\ frac {1} {(nk) \ sigma ^ {2}}} \ sum _ {t = 1} ^ {nk} (X_ {t} - \ mu) (X_ {t + k} - \ mu)}

для любого положительного целого числа ${\ Displaystyle к <п}$ . Когда истинное среднее ${\ displaystyle \ mu}$ и дисперсия ${\ displaystyle \ sigma ^ {2}}$ известны, эта оценка беспристрастна . Если истинное среднее значение и дисперсия процесса неизвестны, существует несколько возможностей:

Если ${\ displaystyle \ mu}$ а также ${\ displaystyle \ sigma ^ {2}}$ заменяются стандартными формулами для выборочного среднего и выборочной дисперсии, то это смещенная оценка .
Оценка на основе периодограммы заменяет ${\ displaystyle nk}$ в приведенной выше формуле с ${\ displaystyle n}$ . Эта оценка всегда необъективна; однако обычно он имеет меньшую среднеквадратичную ошибку. ^[9]^[10]
Другие возможности связаны с обработкой двух частей данных. ${\ Displaystyle \ {X_ {1}, \, X_ {2}, \, \ ldots, \, X_ {nk} \}}$ а также ${\ Displaystyle \ {X_ {к + 1}, \, X_ {k + 2}, \, \ ldots, \, X_ {n} \}}$ отдельно и вычисление отдельных выборочных средних и / или выборочных дисперсий для использования при определении оценки. ^{[ необходима цитата ]}

Преимущество оценок последнего типа состоит в том, что набор предполагаемых автокорреляций как функция ${\ displaystyle k}$ , затем сформируйте функцию, которая является действительной автокорреляцией в том смысле, что можно определить теоретический процесс, имеющий именно эту автокорреляцию. Другие оценки могут страдать от проблемы, заключающейся в том, что, если они используются для вычисления дисперсии линейной комбинации ${\ displaystyle X}$ s, рассчитанная дисперсия может оказаться отрицательной. ^[11]

Регрессионный анализ

В регрессионном анализе с использованием данных временных рядов автокорреляция в интересующей переменной обычно моделируется либо с помощью авторегрессионной модели (AR), либо модели скользящего среднего (MA), либо их комбинации в качестве модели авторегрессионного скользящего среднего (ARMA) или расширение последней называется авторегрессионной интегрированной моделью скользящего среднего (ARIMA). Для нескольких взаимосвязанных рядов данных используется векторная авторегрессия (VAR) или ее расширения.

В обычном методе наименьших квадратов (МНК) адекватность спецификации модели можно частично проверить, установив, существует ли автокорреляция остатков регрессии . Проблемную автокорреляцию ошибок, которые сами по себе не наблюдаются, обычно можно обнаружить, потому что она вызывает автокорреляцию наблюдаемых остатков. (Ошибки в эконометрике также известны как «члены ошибок» .) Автокорреляция ошибок нарушает обычное предположение наименьших квадратов о том, что члены ошибок некоррелированы, что означает, что теорема Гаусса-Маркова не применяется, и что оценки МНК больше не являются лучшими Линейные объективные оценки ( СИНИЙ ). Хотя это не влияет на оценки коэффициента OLS, стандартные ошибки обычно недооцениваются (и t-баллы завышаются), когда автокорреляция ошибок при малых лагах положительна.

Традиционным тестом на наличие автокорреляции первого порядка является статистика Дарбина – Ватсона или, если независимые переменные включают запаздывающую зависимую переменную, h-статистику Дарбина . Однако Дарбина-Ватсона можно линейно отобразить на корреляцию Пирсона между значениями и их лагами. ^[12] Более гибким тестом, охватывающим автокорреляцию более высоких порядков и применимым независимо от того, включают ли регрессоры лаги зависимой переменной, является тест Бреуша – Годфри . Это включает в себя вспомогательную регрессию, в котором остатки , полученные из оценки модели интерес регрессировали на (а) исходных регрессоров и (б) K лагов остатков, где «К» порядок испытания. Самая простая версия тестовой статистики из этой вспомогательной регрессии - TR ² , где T - размер выборки, а R ² - коэффициент детерминации . При нулевой гипотезе об отсутствии автокорреляции эта статистика асимптотически распределяется как ${\ displaystyle \ chi ^ {2}}$ с k степенями свободы.

Отклики на ненулевую автокорреляцию включают обобщенный метод наименьших квадратов и оценку HAC Ньюи – Уэста (гетероскедастичность и согласованность автокорреляции). ^[13]

При оценке модели скользящего среднего (MA) автокорреляционная функция используется для определения подходящего количества включенных слагаемых ошибок. Это основано на том факте, что для процесса МА порядка q мы имеем ${\ Displaystyle Р (\ тау) \ neq 0}$ , для ${\ Displaystyle \ тау = 0,1, \ ldots, q}$ , а также ${\ Displaystyle Р (\ тау) = 0}$ , для ${\ displaystyle \ tau> q}$ .

Приложения

Автокорреляционный анализ широко используется в флуоресцентной корреляционной спектроскопии ^[14], чтобы обеспечить количественное понимание диффузии на молекулярном уровне и химических реакций. ^[15]
Еще одно применение автокорреляции - измерение оптических спектров и измерение очень коротких световых импульсов, производимых лазерами , в обоих случаях с использованием оптических автокорреляторов .
Автокорреляция используется для анализа данных динамического светорассеяния , что, в частности, позволяет определять гранулометрический состав частиц нанометрового размера или мицелл, взвешенных в жидкости. Лазер, освещающий смесь, создает спекл-узор , возникающий в результате движения частиц. Автокорреляцию сигнала можно проанализировать с точки зрения диффузии частиц. Исходя из этого, зная вязкость жидкости, можно рассчитать размеры частиц.
Используется в системе GPS для коррекции задержки распространения или временного сдвига между моментом времени при передаче несущего сигнала на спутниках и моментом времени на приемнике на земле. Это выполняется приемником, генерирующим реплику сигнала 1023-битного кода C / A (курс / получение) и генерирующих строки кодовых чипов [-1,1] в пакетах по десять за раз, или 10230 чипов (1023 x 10), слегка смещаясь по мере продвижения, чтобы приспособиться к доплеровскому сдвигу входящего спутникового сигнала, до тех пор, пока сигнал реплики приемника и коды спутникового сигнала не совпадут. ^[16]
Малоуглового рентгеновского рассеяния интенсивность наноструктурированного системы является преобразование Фурье пространственной автокорреляционной функции электронной плотности.
В науке о поверхности и в сканирующей зондовой микроскопии автокорреляция используется для установления связи между морфологией поверхности и функциональными характеристиками. ^[17]
В оптике нормированные автокорреляции и кросс-корреляции определяют степень когерентности электромагнитного поля.
При обработке сигналов автокорреляция может дать информацию о повторяющихся событиях, таких как музыкальные ритмы (например, для определения темпа ) или частоты пульсаров , хотя она не может определить положение во времени биения. Его также можно использовать для оценки высоты звука музыкального тона .
При записи музыки автокорреляция используется как алгоритм определения высоты звука перед обработкой голоса, как эффект искажения или для устранения нежелательных ошибок и неточностей. ^[18]

Автокорреляция в пространстве, а не во времени, через функцию Паттерсона , используется специалистами по дифракции рентгеновских лучей, чтобы помочь восстановить «фазовую информацию Фурье» о положениях атомов, недоступную только посредством дифракции.
В статистике пространственная автокорреляция между местоположениями выборки также помогает оценить неопределенности среднего значения при выборке гетерогенной совокупности.
Sequest алгоритм для анализа масс - спектров позволяет использовать автокорреляции в сочетании с кросс-корреляции , чтобы выиграть сходство наблюдаемого спектра идеализированной спектра , представляющего собой пептид .
В астрофизике автокорреляция используется для изучения и описания пространственного распределения галактик во Вселенной, а также для многоволновых наблюдений за маломассивными рентгеновскими двойными системами .
В панельных данных пространственная автокорреляция относится к корреляции переменной с самой собой в пространстве.
При анализе данных цепи Маркова методом Монте-Карло необходимо учитывать автокорреляцию для правильного определения ошибки.
В науках о Земле (в частности, в геофизике) его можно использовать для вычисления автокорреляционного сейсмического атрибута на основе трехмерной сейсмической разведки под землей.
В медицинской ультразвуковой визуализации автокорреляция используется для визуализации кровотока.
При выборе межвременного портфеля наличие или отсутствие автокорреляции в норме доходности актива может повлиять на оптимальную часть портфеля для удержания в этом активе.

Серийная зависимость

Серийная зависимость тесно связана с понятием автокорреляции, но представляет собой отдельную концепцию (см. Корреляция и зависимость ). В частности, возможна серийная зависимость, но не (линейная) корреляция. Однако в некоторых областях эти два термина используются как синонимы.

Временной ряд из случайной величины имеет последовательную зависимость , если значение в какой - то момент ${\ displaystyle t}$ в серии статистически зависит от значения в другое время ${\ displaystyle s}$ . Серия является серийно независимой, если нет зависимости между какой-либо парой.

Если временной ряд ${\ displaystyle \ left \ {X_ {t} \ right \}}$ является стационарным , то статистическая зависимость между парой ${\ displaystyle (X_ {t}, X_ {s})}$ означало бы, что существует статистическая зависимость между всеми парами значений с одинаковым запаздыванием ${\ displaystyle \ tau = st}$ .

Смотрите также

Матрица автокорреляции
Автокорреляционная техника
Автокорреляция формального слова
Автокоррелятор
Корреляционная функция
Коррелограмма
Взаимная корреляция
Проблема Гальтона
Функция частичной автокорреляции
Флуоресцентная корреляционная спектроскопия
Оптическая автокорреляция
Алгоритм определения высоты тона
Тройная корреляция
CUSUM
Оценка Кокрейна – Оркатта (преобразование для автокоррелированных членов ошибки)
Преобразование Прайса – Винстена
Масштабированная корреляция
Беспристрастная оценка стандартного отклонения

дальнейшее чтение

Кмента, Ян (1986). Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. С. 298–334 . ISBN 978-0-02-365070-3.
Марно Вербеек (10 августа 2017 г.). Руководство по современной эконометрике . Вайли. ISBN 978-1-119-40110-0.
Моджтаба Солтаналиан и Петре Стойка. « Вычислительный дизайн последовательностей с хорошими корреляционными свойствами ». IEEE Transactions on Signal Processing, 60.5 (2012): 2180–2193.
Соломон В. Голомб и Гуан Гун. Дизайн сигнала для хорошей корреляции: для беспроводной связи, криптографии и радара . Издательство Кембриджского университета, 2005.
Клапетек, Петр (2018). Количественная обработка данных в сканирующей зондовой микроскопии: приложения СЗМ для нанометрологии (второе изд.). Эльзевир. стр. 108–112 ISBN 9780128133477 .
Вайсштейн, Эрик В. «Автокорреляция» . MathWorld .

[Gubner-1] Губнер, Джон А. (2006). Вероятность и случайные процессы для инженеров-электриков и компьютерщиков . Издательство Кембриджского университета. ISBN 978-0-521-86470-1.

[KunIlPark-2] Кун Иль Парк, Основы вероятности и случайных процессов с приложениями к коммуникациям, Springer, 2018, ISBN 978-3-319-68074-3

[Papoulis-3] Папулис, Афанасиус, Вероятность, случайные величины и случайные процессы , McGraw-Hill, 1991

[dunn-4] а б Данн, Патрик Ф. (2005). Измерение и анализ данных для техники и науки . Нью-Йорк: Макгроу – Хилл. ISBN 978-0-07-282538-1.

[5] Проакис, Джон (31 августа 2001 г.). Инженерия систем связи (2-е издание) (2-е изд.). Пирсон. п. 168. ISBN 978-0130617934.

[6] Коробка, ГЭП; Дженкинс, GM; Рейнзель, GC (1994). Анализ временных рядов: прогнозирование и контроль (3-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Прентис – Холл. ISBN 978-0130607744.^{[ требуется страница ]}

[7] Френкель, Д .; Смит, Б. (2002). «глава 4.4.2». Понимание молекулярного моделирования (2-е изд.). Лондон: Academic Press. ISBN 978-0122673511.

[8] Colberg, P .; Хёфлинг, Ф. (2011). «Высокоускоренное моделирование гладкой динамики с использованием графических процессоров: предостережения в отношении ограниченной точности с плавающей запятой». Комп. Phys. Comm. 182 (5): 1120–1129. arXiv : 0912.3824 . Bibcode : 2011CoPhC.182.1120C . DOI : 10.1016 / j.cpc.2011.01.009 . S2CID 7173093 .

[9] Пристли, МБ (1982). Спектральный анализ и временные ряды . Лондон, Нью-Йорк: Academic Press. ISBN 978-0125649018.

[10] Персиваль, Дональд Б.; Эндрю Т. Уолден (1993). Спектральный анализ для физических приложений: многоканальные и стандартные одномерные методы . Издательство Кембриджского университета. стр. 190 -195. ISBN 978-0-521-43541-3.

[11] Персиваль, Дональд Б. (1993). «Три любопытных свойства выборочной дисперсии и автоковариантности для стационарных процессов с неизвестным средним». Американский статистик . 47 (4): 274–276. DOI : 10.1080 / 00031305.1993.10475997 .

[12] «Методы последовательной корреляции» . Статистические идеи . 26 мая 2014.

[13] Баум, Кристофер Ф. (2006). Введение в современную эконометрику с использованием Stata . Stata Press. ISBN 978-1-59718-013-9.

[14] Элсон, Эллиот Л. (декабрь 2011 г.). «Флуоресцентная корреляционная спектроскопия: прошлое, настоящее, будущее» . Биофизический журнал . 101 (12): 2855–2870. Bibcode : 2011BpJ ... 101.2855E . DOI : 10.1016 / j.bpj.2011.11.012 . PMC 3244056 . PMID 22208184 .

[15] Холист, Роберт; Поневерский, Анджей; Чжан, Сюйчжу (2017). «Аналитическая форма автокорреляционной функции для флуоресцентной корреляционной спектроскопии» . Мягкая материя . 13 (6): 1267–1275. Bibcode : 2017SMat ... 13.1267H . DOI : 10.1039 / C6SM02643E . ISSN 1744-683X . PMID 28106203 .

[16] Ван Сикл, январь (2008). GPS для землеустроителей (Третье изд.). CRC Press. С. 18–19. ISBN 978-0-8493-9195-8.

[17] Калвани, Паям Раджаби; Джахангири, Али Реза; Шапури, Самане; Сари, Амирхоссейн; Джалили, Юсеф Сейед (август 2019 г.). «Многомодовый АСМ-анализ тонких пленок оксида цинка, легированных алюминием, распыленных при различных температурах подложки для оптоэлектронных приложений». Сверхрешетки и микроструктуры . 132 : 106173. DOI : 10.1016 / j.spmi.2019.106173 .

[18] Тирангил, Джош (05.02.2009). «Автонастройка: почему поп-музыка звучит идеально» . Журнал Time .

[1]

Автокорреляция

Автокорреляция случайных процессов

Определение стационарного случайного процесса в широком смысле

Нормализация

Характеристики

Свойство симметрии

Максимум на нуле

Неравенство Коши – Шварца.

Автокорреляция белого шума

Теорема Винера – Хинчина.

Автокорреляция случайных векторов

Свойства автокорреляционной матрицы

Автокорреляция детерминированных сигналов

Автокорреляция сигнала непрерывного времени

Автокорреляция дискретного сигнала времени

Определение периодических сигналов

Характеристики

Многомерная автокорреляция

Эффективное вычисление

Оценка

Регрессионный анализ

Приложения

Серийная зависимость

Смотрите также

Рекомендации

дальнейшее чтение