Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистическом анализе временных рядов , авторегрессия-скользящее средняя ( ARMA ) модели обеспечивают экономное описание (слабо) стационарного случайного процесс в терминах двух полиномов, один для авторегрессии (AR) , а второй для скользящего среднего ( MA). Общая модель ARMA была описана в 1951 г. диссертации Питера Уиттла , тестирования гипотез в анализе временных рядов , и она стала популярной в 1970 книги Джорджа EP Box и Гвилим Дженкинс .

Учитывая временной ряд данных X t , модель ARMA является инструментом для понимания и, возможно, прогнозирования будущих значений в этом ряду. Часть AR включает регрессию переменной по ее собственным запаздывающим (т. Е. Прошлым) значениям. Часть MA включает моделирование члена ошибки как линейной комбинации членов ошибки, возникающих одновременно и в разное время в прошлом. Модель обычно называется моделью ARMA ( p , q ), где p - это порядок части AR, а q - порядок части MA (как определено ниже).

Модели ARMA можно оценить с помощью метода Бокса – Дженкинса .

Модель авторегрессии [ править ]

Обозначение AR ( p ) относится к авторегрессионной модели порядка p . Модель AR ( p ) записывается

где - параметры , - постоянная, а случайная величина - белый шум .

Необходимы некоторые ограничения на значения параметров, чтобы модель оставалась неподвижной . Например, процессы в модели AR (1) с не стационарны.

Модель скользящего среднего [ править ]

Обозначение MA ( q ) относится к модели скользящего среднего порядка q :

где θ 1 , ..., θ д являются параметрами модели, μ является ожидание (часто принимают равным 0), и , , ... снова, белый шум , векторы ошибок.

Модель ARMA [ править ]

Обозначение ARMA ( p , q ) относится к модели с p членами авторегрессии и q членами скользящего среднего. Эта модель содержит модели AR ( p ) и MA ( q ),

Общая модель ARMA была описана в диссертации Питера Уиттла 1951 года , который использовал математический анализ ( ряд Лорана и анализ Фурье ) и статистический вывод. [1] [2] Модели ARMA были популяризированы в 1970 году в книге Джорджа Е.П. Бокса и Дженкинса, которые изложили итерационный метод ( Бокса – Дженкинса ) для их выбора и оценки. Этот метод был полезен для полиномов низкого порядка (степени три или меньше). [3]

Модель ARMA - это, по сути, фильтр с бесконечной импульсной характеристикой, применяемый к белому шуму с некоторой дополнительной интерпретацией.

Примечание об условиях ошибки [ править ]

Члены ошибки обычно считаются независимыми одинаково распределенными случайными величинами (iid), выбранными из нормального распределения с нулевым средним: ~ N (0, σ 2 ), где σ 2 - дисперсия. Эти предположения могут быть ослаблены, но это изменит свойства модели. В частности, изменение предположения об идентификаторе идентификатора существенно изменит ситуацию.

Спецификация в терминах оператора задержки [ править ]

В некоторых текстах модель будет определена в терминах оператора задержки L . В этих терминах модель AR ( p ) задается следующим образом:

где представляет собой многочлен

Модель MA ( q ) задается формулой

где θ представляет собой многочлен

Наконец, комбинированная модель ARMA ( p , q ) имеет вид

или более кратко,

или же

Альтернативная нотация [ править ]

Некоторые авторы, в том числе Бокс , Дженкинс и Рейнсел, используют другое соглашение для коэффициентов авторегрессии. [4] Это позволяет всем многочленам, содержащим оператор запаздывания, появляться повсюду в одинаковой форме. Таким образом, модель ARMA будет записана как

Более того, начав суммирование с и, установив и , мы получим еще более элегантную формулировку:

Подгонка моделей [ править ]

Выбор p и q [ править ]

Нахождение подходящих значений p и q в модели ARMA ( p , q ) может быть облегчено путем построения графиков частичных автокорреляционных функций для оценки p , а также использования автокорреляционных функций для оценки q . Расширенные функции автокорреляции (EACF) могут использоваться для одновременного определения p и q. [5] Дополнительную информацию можно получить, рассматривая те же функции для остатков модели, оснащенной начальным выбором p и q .

Brockwell и Davis рекомендуют использовать информационный критерий Акаике (AIC) для нахождения p и q . [6] Другой возможный выбор для определения заказа - это критерий BIC .

Оценочные коэффициенты [ править ]

Модели ARMA в целом могут быть после выбора p и q аппроксимированы регрессией наименьших квадратов, чтобы найти значения параметров, которые минимизируют член ошибки. Обычно считается хорошей практикой находить наименьшие значения p и q, которые обеспечивают приемлемое соответствие данным. Для чистой модели AR можно использовать уравнения Юла-Уокера для подгонки.

Реализации в статистических пакетах [ править ]

  • В R , то арима функция (в стандартных пакетах статистики ) описана в ARIMA моделировании временных рядов . Пакеты расширения содержат связанные и расширенные функциональные возможности , например, tseries пакет включает в себя АРМУ функцию, документированной в «Fit ARMA моделей для временных рядов» ; fracdiff пакет содержит fracdiff () для дробно интегрированных процессов АРМА; и пакет прогнозов включает auto.arima для выбора экономного набора p, q . Представление задачи CRAN на временных рядах содержит ссылки на большинство из них.
  • Mathematica имеет полную библиотеку функций временных рядов, включая ARMA. [7]
  • MATLAB включает такие функции, как arma и ar для оценки моделей AR, ARX (авторегрессионная экзогенная) и ARMAX. См. Раздел System Identification Toolbox и Econometrics Toolbox для получения дополнительной информации.
  • Джулия имеет некоторые сообщества приводом пакеты, реализующие посаженные с моделью ARMA , таких как arma.jl .
  • Модуль Statsmodels Python включает множество моделей и функций для анализа временных рядов, включая ARMA. Раньше часть Scikit-learn, теперь она автономна и хорошо интегрируется с Pandas . Подробнее см. Здесь .
  • PyFlux имеет основанную на Python реализацию моделей ARIMAX, включая байесовские модели ARIMAX.
  • Числовые библиотеки IMSL - это библиотеки функций численного анализа, включая процедуры ARMA и ARIMA, реализованные на стандартных языках программирования, таких как C, Java, C # .NET и Fortran.
  • gretl также может оценить модель ARMA, см. здесь, где это упоминается .
  • GNU Octave может оценивать модели AR, используя функции из дополнительного пакета octave-forge .
  • Stata включает функцию arima, которая может оценивать модели ARMA и ARIMA . Подробнее см. Здесь .
  • SuanShu - это Java-библиотека численных методов, включая комплексные статистические пакеты, в которых одномерные / многомерные модели ARMA, ARIMA, ARMAX и т. Д. Реализованы в объектно-ориентированном подходе. Эти реализации задокументированы в «SuanShu, числовой и статистической библиотеке Java» .
  • У SAS есть эконометрический пакет ETS, который оценивает модели ARIMA. Подробнее см. Здесь .

Приложения [ править ]

ARMA подходит, когда система является функцией серии ненаблюдаемых шоков (MA или часть скользящей средней), а также ее собственного поведения. Например, цены на акции могут быть шокированы фундаментальной информацией, а также проявлением технических тенденций и эффектов возврата к среднему из- за участников рынка. [ необходима цитата ]

Обобщения [ править ]

Зависимость X t от прошлых значений и членов ошибки ε t считается линейной, если не указано иное. Если зависимость является нелинейной, модель конкретно называется моделью нелинейного скользящего среднего (NMA), нелинейной авторегрессионной (NAR) или нелинейной авторегрессивно-скользящей средней (NARMA) моделью.

Модели авторегрессии – скользящего среднего могут быть обобщены и другими способами. См. Также модели авторегрессионной условной гетероскедастичности (ARCH) и модели авторегрессионного интегрированного скользящего среднего (ARIMA). Если необходимо подобрать несколько временных рядов, можно подобрать векторную модель ARIMA (или VARIMA). Если рассматриваемый временной ряд демонстрирует длинную память, тогда может быть подходящим моделирование дробного ARIMA (FARIMA, иногда называемого ARFIMA): см. Авторегрессионное дробно-интегрированное скользящее среднее . Если предполагается, что данные содержат сезонные эффекты, они могут быть смоделированы с помощью SARIMA (сезонный ARIMA) или периодической модели ARMA.

Еще одно обобщение - модель многомасштабной авторегрессии (MAR). Модель MAR индексируется узлами дерева, тогда как стандартная (дискретная по времени) модель авторегрессии индексируется целыми числами.

Обратите внимание, что модель ARMA является одномерной . Расширениями для многомерного случая являются векторная авторегрессия (VAR) и векторная авторегрессия Moving-Average (VARMA).

Модель авторегрессии – скользящего среднего с моделью экзогенных входов (модель ARMAX) [ править ]

Обозначение ARMAX ( p , q , b ) относится к модели с p членами авторегрессии, q членами скользящего среднего и b условиями экзогенных входов. Эта модель содержит модели AR ( p ) и MA ( q ) и линейную комбинацию последних b членов известного и внешнего временных рядов . Это дает:

где - параметры экзогенного входа .

Определены некоторые нелинейные варианты моделей с экзогенными переменными: см. Например, Нелинейная авторегрессионная экзогенная модель .

Статистические пакеты реализуют модель ARMAX за счет использования «экзогенных» (то есть независимых) переменных. Следует проявлять осторожность при интерпретации вывода этих пакетов, потому что предполагаемые параметры обычно (например, в R [8] и gretl ) относятся к регрессии:

где m t включает все экзогенные (или независимые) переменные:

См. Также [ править ]

  • Авторегрессионная интегрированная скользящая средняя (ARIMA)
  • Экспоненциальное сглаживание
  • Кодирование с линейным прогнозированием
  • Прогнозная аналитика
  • Бесконечный импульсный отклик
  • Конечный импульсный отклик

Ссылки [ править ]

  1. ^ Ханнан, Эдвард Джеймс (1970). Множественные временные ряды . Ряды Уайли по вероятности и математической статистике. Нью-Йорк: Джон Уайли и сыновья.
  2. ^ Уиттл, П. (1951). Проверка гипотез в анализе временных рядов . Альмквист и Виксель.Уиттл, П. (1963). Прогнозирование и регулирование . English Universities Press. ISBN 0-8166-1147-5.
    Переиздано как: Whittle, P. (1983). Прогнозирование и регулирование линейными методами наименьших квадратов . Университет Миннесоты Press. ISBN 0-8166-1148-3.
  3. ^ Хэннэн & Deistler (1988 , стр 227.): Хэннэн, Е.Ю. ; Дайстлер, Манфред (1988). Статистическая теория линейных систем . Ряды Уайли по вероятности и математической статистике. Нью-Йорк: Джон Уайли и сыновья.
  4. ^ Коробка, Джордж; Jenkins, Gwilym M .; Рейнзель, Грегори С. (1994). Анализ временных рядов: прогнозирование и контроль (Третье изд.). Прентис-Холл. ISBN 0130607746.
  5. ^ Государственный университет Миссури. «Спецификация модели, анализ временных рядов» (PDF) .
  6. ^ Brockwell, PJ; Дэвис, РА (2009). Временные ряды: теория и методы (2-е изд.). Нью-Йорк: Спрингер. п. 273. ISBN. 9781441903198.
  7. Особенности временных рядов в системе Mathematica. Архивировано 24 ноября 2011 г. в Wayback Machine.
  8. ^ Моделирование временных рядов ARIMA , документация R

Дальнейшее чтение [ править ]

  • Миллс, Теренс С. (1990). Методы временных рядов для экономистов . Издательство Кембриджского университета. ISBN 0521343399.
  • Персиваль, Дональд Б.; Уолден, Эндрю Т. (1993). Спектральный анализ для физических приложений . Издательство Кембриджского университета. ISBN 052135532X.
  • Francq, C .; Закоян, Ж.-М. (2005), «Недавние результаты для моделей линейных временных рядов с независимыми инновациями», в Duchesne, P .; Ремиллард Б. (ред.), Статистическое моделирование и анализ сложных проблем с данными , Springer, стр. 241–265, CiteSeerX  10.1.1.721.1754.