Модель авторегрессии – скользящего среднего

В статистическом анализе временных рядов , авторегрессия-скользящее средняя ( ARMA ) модели обеспечивают экономное описание (слабо) стационарного случайного процесс в терминах двух полиномов, один для авторегрессии (AR) , а второй для скользящего среднего ( MA). Общая модель ARMA была описана в 1951 г. диссертации Питера Уиттла , тестирования гипотез в анализе временных рядов , и она стала популярной в 1970 книги Джорджа EP Box и Гвилим Дженкинс .

Учитывая временной ряд данных X _t , модель ARMA является инструментом для понимания и, возможно, прогнозирования будущих значений в этом ряду. Часть AR включает регрессию переменной по ее собственным запаздывающим (т. Е. Прошлым) значениям. Часть MA включает моделирование члена ошибки как линейной комбинации членов ошибки, возникающих одновременно и в разное время в прошлом. Модель обычно называется моделью ARMA ( p , q ), где p - это порядок части AR, а q - порядок части MA (как определено ниже).

Модели ARMA можно оценить с помощью метода Бокса – Дженкинса .

Авторегрессионная модель

Обозначение AR ( p ) относится к авторегрессионной модели порядка p . Модель AR ( p ) записывается

{\ displaystyle X_ {t} = c + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ varepsilon _ {t}. \,}

где ${\ displaystyle \ varphi _ {1}, \ ldots, \ varphi _ {p}}$ являются параметры , ${\ displaystyle c}$ - константа, а случайная величина ${\ displaystyle \ varepsilon _ {t}}$ это белый шум .

Необходимы некоторые ограничения на значения параметров, чтобы модель оставалась неподвижной . Например, процессы в модели AR (1) с ${\ displaystyle | \ varphi _ {1} | \ geq 1}$ не являются стационарными.

Модель скользящего среднего

Обозначение MA ( q ) относится к модели скользящего среднего порядка q :

{\ displaystyle X_ {t} = \ mu + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti} \,}

где θ ₁ , ..., θ _q - параметры модели, μ - математическое ожидание ${\ displaystyle X_ {t}}$ (часто принимается равным 0), а ${\ displaystyle \ varepsilon _ {t}}$ , ${\ Displaystyle \ varepsilon _ {т-1}}$ , ... снова являются членами ошибки белого шума .

Модель ARMA

Обозначение ARMA ( p , q ) относится к модели с p членами авторегрессии и q членами скользящего среднего. Эта модель содержит модели AR ( p ) и MA ( q ),

{\ displaystyle X_ {t} = c + \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q } \ theta _ {i} \ varepsilon _ {ti}. \,}

Общая модель ARMA была описана в диссертации Питера Уиттла 1951 года , который использовал математический анализ ( ряд Лорана и анализ Фурье ) и статистический вывод. ^[1]^[2] Модели ARMA были популяризированы в 1970 году в книге Джорджа Е.П. Бокса и Дженкинса, которые изложили итерационный ( Бокса – Дженкинс ) метод их выбора и оценки. Этот метод был полезен для полиномов низкого порядка (степени три или меньше). ^[3]

Модель ARMA - это, по сути, фильтр с бесконечной импульсной характеристикой, применяемый к белому шуму с некоторой дополнительной интерпретацией.

Примечание об условиях ошибки

Условия ошибки ${\ displaystyle \ varepsilon _ {t}}$ обычно считаются независимыми одинаково распределенными случайными величинами (iid), выбранными из нормального распределения с нулевым средним: ${\ displaystyle \ varepsilon _ {t}}$ ~ N (0, σ ² ), где σ ² - дисперсия. Эти предположения могут быть ослаблены, но это изменит свойства модели. В частности, изменение предположения об идентификаторе идентификатора существенно изменит ситуацию.

Спецификация в терминах оператора запаздывания

В некоторых текстах модель будет определена в терминах оператора задержки L . В этих терминах модель AR ( p ) задается следующим образом:

{\ displaystyle \ varepsilon _ {t} = \ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ varphi (L ) X_ {t} \,}

где ${\ displaystyle \ varphi}$ представляет собой многочлен

{\ displaystyle \ varphi (L) = 1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i}. \,}

Модель MA ( q ) задается формулой

{\ displaystyle X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} = \ theta (L ) \ varepsilon _ {t}, \,}

где θ представляет собой многочлен

{\ displaystyle \ theta (L) = 1 + \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i}. \,}

Наконец, комбинированная модель ARMA ( p , q ) имеет вид

{\ displaystyle \ left (1- \ sum _ {i = 1} ^ {p} \ varphi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} \ ,,}

или более кратко,

{\ Displaystyle \ varphi (L) X_ {t} = \ theta (L) \ varepsilon _ {t} \,}

или же

{\ displaystyle {\ frac {\ varphi (L)} {\ theta (L)}} X_ {t} = \ varepsilon _ {t} \ ,.}

Альтернативная нотация

Некоторые авторы, в том числе Бокс , Дженкинс и Рейнсел, используют другое соглашение для коэффициентов авторегрессии. ^[4] Это позволяет всем многочленам, содержащим оператор запаздывания, появляться повсюду в одинаковой форме. Таким образом, модель ARMA будет записана как

{\ displaystyle \ left (1- \ sum _ {i = 1} ^ {p} \ phi _ {i} L ^ {i} \ right) X_ {t} = \ left (1+ \ sum _ {i = 1} ^ {q} \ theta _ {i} L ^ {i} \ right) \ varepsilon _ {t} \ ,.}

Более того, начиная суммирования с ${\ displaystyle i = 0}$ и установка ${\ displaystyle \ phi _ {0} = - 1}$ а также ${\ displaystyle \ theta _ {0} = 1}$ , то мы получаем еще более элегантную формулировку: ${\ displaystyle - \ sum _ {i = 0} ^ {p} \ phi _ {i} L ^ {i} \; X_ {t} = \ sum _ {i = 0} ^ {q} \ theta _ { i} L ^ {i} \; \ varepsilon _ {t} \ ,.}$

Примерочные модели

Выбор p и q

Нахождение подходящих значений p и q в модели ARMA ( p , q ) может быть облегчено путем построения графиков частичных автокорреляционных функций для оценки p , а также использования автокорреляционных функций для оценки q . Расширенные функции автокорреляции (EACF) могут использоваться для одновременного определения p и q. ^[5] Дополнительную информацию можно получить, рассматривая те же функции для остатков модели, оснащенной начальным выбором p и q .

Brockwell и Davis рекомендуют использовать информационный критерий Акаике (AIC) для нахождения p и q . ^[6] Другой возможный выбор для определения заказа - это критерий BIC .

Оценочные коэффициенты

Модели ARMA в целом могут быть после выбора p и q аппроксимированы регрессией наименьших квадратов, чтобы найти значения параметров, которые минимизируют член ошибки. Обычно считается хорошей практикой находить наименьшие значения p и q, которые обеспечивают приемлемое соответствие данным. Для чистой модели AR можно использовать уравнения Юла-Уокера для подгонки.

Реализации в статистических пакетах

В R , то арима функция (в стандартных пакетах статистики ) описана в ARIMA моделировании временных рядов . Пакеты расширения содержат связанные и расширенные функциональные возможности , например, tseries пакет включает в себя АРМУ функцию, документированной в «Fit ARMA моделей для временных рядов» ; fracdiff пакет содержит fracdiff () для дробно интегрированных процессов АРМА; и пакет прогнозов включает auto.arima для выбора экономного набора p, q . Представление задач CRAN на временных рядах содержит ссылки на большинство из них.
Mathematica имеет полную библиотеку функций временных рядов, включая ARMA. ^[7]
MATLAB включает такие функции, как arma и ar для оценки моделей AR, ARX (авторегрессионная экзогенная) и ARMAX. См. Раздел System Identification Toolbox и Econometrics Toolbox для получения дополнительной информации.
Джулия имеет некоторые сообщества приводом пакеты, реализующие посаженные с моделью ARMA , таких как arma.jl .
Модуль Statsmodels Python включает множество моделей и функций для анализа временных рядов, включая ARMA. Раньше часть Scikit-learn, теперь она автономна и хорошо интегрируется с Pandas . Подробнее см. Здесь .
PyFlux имеет основанную на Python реализацию моделей ARIMAX, включая байесовские модели ARIMAX.
Числовые библиотеки IMSL - это библиотеки функций численного анализа, включая процедуры ARMA и ARIMA, реализованные на стандартных языках программирования, таких как C, Java, C # .NET и Fortran.
gretl также может оценить модель ARMA, см. здесь, где это упоминается .
GNU Octave может оценивать модели AR, используя функции из дополнительного пакета octave-forge .
Stata включает функцию arima, которая может оценивать модели ARMA и ARIMA . Подробнее см. Здесь .
SuanShu - это Java-библиотека численных методов, включая комплексные статистические пакеты, в которых одномерные / многомерные модели ARMA, ARIMA, ARMAX и т. Д. Реализованы в объектно-ориентированном подходе. Эти реализации задокументированы в «SuanShu, числовой и статистической библиотеке Java» .
У SAS есть эконометрический пакет ETS, который оценивает модели ARIMA. Подробнее см. Здесь .

Приложения

ARMA подходит, когда система является функцией серии ненаблюдаемых шоков (MA или часть скользящей средней), а также ее собственного поведения. Например, цены на акции могут быть шокированы фундаментальной информацией, а также проявлением технических тенденций и эффектов возврата к среднему из- за участников рынка. ^{[ необходима цитата ]}

Обобщения

Зависимость X _t от прошлых значений и членов ошибки ε _t считается линейной, если не указано иное. Если зависимость является нелинейной, модель конкретно называется моделью нелинейного скользящего среднего (NMA), нелинейной авторегрессионной (NAR) или нелинейной авторегрессивно-скользящей средней (NARMA) моделью.

Модели авторегрессии – скользящего среднего могут быть обобщены и другими способами. См. Также модели авторегрессионной условной гетероскедастичности (ARCH) и модели авторегрессионного интегрированного скользящего среднего (ARIMA). Если необходимо подобрать несколько временных рядов, можно подобрать векторную модель ARIMA (или VARIMA). Если рассматриваемый временной ряд демонстрирует длинную память, тогда может быть подходящим моделирование дробного ARIMA (FARIMA, иногда называемого ARFIMA): см. Авторегрессионное дробно-интегрированное скользящее среднее . Если предполагается, что данные содержат сезонные эффекты, они могут быть смоделированы с помощью SARIMA (сезонный ARIMA) или периодической модели ARMA.

Еще одно обобщение - модель многомасштабной авторегрессии (MAR). Модель MAR индексируется узлами дерева, тогда как стандартная (дискретная по времени) модель авторегрессии индексируется целыми числами.

Обратите внимание, что модель ARMA является одномерной . Расширениями для многомерного случая являются векторная авторегрессия (VAR) и векторная авторегрессия Moving-Average (VARMA).

Модель авторегрессии – скользящего среднего с моделью экзогенных входов (модель ARMAX)

Обозначение ARMAX ( p , q , b ) относится к модели с p членами авторегрессии, q членами скользящего среднего и b условиями экзогенных входов. Эта модель содержит модели AR ( p ) и MA ( q ) и линейную комбинацию последних b членов известного и внешнего временных рядов. ${\ displaystyle d_ {t}}$ . Это дает:

{\ displaystyle X_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} X_ {ti} + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti} + \ sum _ {i = 1} ^ {b} \ eta _ {i} d_ {ti}. \,}

где ${\ displaystyle \ eta _ {1}, \ ldots, \ eta _ {b}}$ являются параметры экзогенного ввода ${\ displaystyle d_ {t}}$ .

Определены некоторые нелинейные варианты моделей с экзогенными переменными: см. Например, Нелинейная авторегрессионная экзогенная модель .

Статистические пакеты реализуют модель ARMAX за счет использования «экзогенных» (то есть независимых) переменных. Следует проявлять осторожность при интерпретации вывода этих пакетов, потому что предполагаемые параметры обычно (например, в R ^[8] и gretl ) относятся к регрессии:

{\ displaystyle X_ {t} -m_ {t} = \ varepsilon _ {t} + \ sum _ {i = 1} ^ {p} \ varphi _ {i} (X_ {ti} -m_ {ti}) + \ sum _ {i = 1} ^ {q} \ theta _ {i} \ varepsilon _ {ti}. \,}

где m _t включает все экзогенные (или независимые) переменные:

{\ displaystyle m_ {t} = c + \ sum _ {i = 0} ^ {b} \ eta _ {i} d_ {ti}. \,}

Смотрите также

Авторегрессионная интегрированная скользящая средняя (ARIMA)
Экспоненциальное сглаживание
Кодирование с линейным прогнозированием
Прогнозная аналитика
Бесконечный импульсный отклик
Конечный импульсный отклик

дальнейшее чтение

Миллс, Теренс С. (1990). Методы временных рядов для экономистов . Издательство Кембриджского университета. ISBN 0521343399.
Персиваль, Дональд Б.; Уолден, Эндрю Т. (1993). Спектральный анализ для физических приложений . Издательство Кембриджского университета. ISBN 052135532X.
Francq, C .; Закоян, Ж.-М. (2005), «Недавние результаты для моделей линейных временных рядов с независимыми инновациями», в Duchesne, P .; Ремиллард Б. (ред.), Статистическое моделирование и анализ сложных проблем с данными , Springer, стр. 241–265, CiteSeerX 10.1.1.721.1754.

[1] Ханнан, Эдвард Джеймс (1970). Множественные временные ряды . Ряды Уайли по вероятности и математической статистике. Нью-Йорк: Джон Уайли и сыновья.

[2] Уиттл, П. (1951). Проверка гипотез в анализе временных рядов . Альмквист и Виксель.Уиттл, П. (1963). Прогнозирование и регулирование . English Universities Press. ISBN 0-8166-1147-5.
Переиздано как: Уиттл, П. (1983). Прогнозирование и регулирование линейными методами наименьших квадратов . Университет Миннесоты Press. ISBN 0-8166-1148-3.

[3] Хэннэн & Deistler (1988 , стр 227.): Hannan, EJ ; Дайстлер, Манфред (1988). Статистическая теория линейных систем . Ряды Уайли по вероятности и математической статистике. Нью-Йорк: Джон Уайли и сыновья.

[4] Коробка, Джордж; Jenkins, Gwilym M .; Рейнзель, Грегори С. (1994). Анализ временных рядов: прогнозирование и контроль (Третье изд.). Прентис-Холл. ISBN 0130607746.

[5] Государственный университет Миссури. «Спецификация модели, анализ временных рядов» (PDF) .

[6] Brockwell, PJ; Дэвис, РА (2009). Временные ряды: теория и методы (2-е изд.). Нью-Йорк: Спрингер. п. 273. ISBN. 9781441903198.

[7] Особенности временных рядов в системе Mathematica. Архивировано 24 ноября 2011 г. в Wayback Machine.

[R.stats.arima-8] Моделирование временных рядов ARIMA , документация R

[1]