Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
График, показывающий 100 случайных чисел со «скрытой» синусоидальной функцией и автокорреляцией (коррелограммой) ряда внизу.
Пример коррелограммы

При анализе данных, Коррелограмма является диаграммой из корреляционных статистики. Например, при анализе временных рядов график зависимости выборки автокорреляций от (временного лага) является автокоррелограммой . Если построена взаимная корреляция , результат называется кросс-коррелограммой .

Коррелограмма - это часто используемый инструмент для проверки случайности в наборе данных . Если он случайный, автокорреляция должна быть близка к нулю для всех без исключения разделений по времени. Если неслучайно, то одна или несколько автокорреляций будут значительно отличны от нуля.

Кроме того, коррелограммы используются на этапе идентификации модели для моделей временных рядов авторегрессионного скользящего среднего Бокса – Дженкинса . Автокорреляция должна быть близкой к нулю для случайности; если аналитик не проверяет случайность, тогда достоверность многих статистических выводов становится сомнительной. Коррелограмма - отличный способ проверить такую ​​случайность.

Иногда, corrgrams , цветные отображенные матрицы корреляции сильных в многомерном анализе , [1] также называют коррелограммы. [2] [3]

Приложения [ править ]

Коррелограмма может помочь ответить на следующие вопросы:

  • Данные случайны?
  • Связано ли наблюдение с соседним наблюдением?
  • Дважды удаляется наблюдение, связанное с наблюдением? (так далее.)
  • Является ли наблюдаемый временной ряд белым шумом ?
  • Является ли наблюдаемый временной ряд синусоидальным?
  • Является ли наблюдаемый временной ряд авторегрессией?
  • Какая модель подходит для наблюдаемых временных рядов?
  • Модель
действительный и достаточный?
  • Формула действительна?

[4]

Важность [ править ]

Случайность (наряду с фиксированной моделью, фиксированной вариацией и фиксированным распределением) - одно из четырех предположений, которые обычно лежат в основе всех процессов измерения. Предположение о случайности критически важно по следующим трем причинам:

  • Большинство стандартных статистических тестов зависят от случайности. Достоверность выводов теста напрямую связана с достоверностью предположения о случайности.
  • Многие часто используемые статистические формулы зависят от предположения о случайности, наиболее распространенной формулой является формула для определения стандартного отклонения выборочного среднего:

где s - стандартное отклонение данных. Несмотря на интенсивное использование, результаты использования этой формулы не имеют ценности, если не выполняется предположение о случайности.

  • Для одномерных данных модель по умолчанию

Если данные не случайны, эта модель неверна и недействительна, а оценки параметров (например, константы) становятся бессмысленными и недействительными.

Оценка автокорреляций [ править ]

Коэффициент автокорреляции при запаздывании h определяется выражением

где c h - функция автоковариации

а c 0 - функция дисперсии

Результирующее значение r h будет находиться в диапазоне от -1 до +1.

Альтернативная оценка [ править ]

Некоторые источники могут использовать следующую формулу для функции автоковариации:

Хотя это определение менее предвзято , формулировка (1 / N ) обладает некоторыми желательными статистическими свойствами и является формой, наиболее часто используемой в статистической литературе. См. Подробности на страницах 20 и 49–50 в Chatfield.

Статистический вывод с коррелограммами [ править ]

На этом же графике можно провести верхнюю и нижнюю границы автокорреляции с уровнем значимости :

с оценкой автокорреляции с запаздыванием .

Если автокорреляция выше (ниже), чем эта верхняя (нижняя) граница, нулевая гипотеза об отсутствии автокорреляции на заданном лаге и за его пределами отклоняется на уровне значимости . Этот тест является приблизительным и предполагает, что временной ряд является гауссовым .

Выше z 1 - α / 2 - квантиль нормального распределения ; SE - это стандартная ошибка, которую можно вычислить по формуле Бартлетта для процессов MA ( ):

за

На рисунке выше мы можем отклонить нулевую гипотезу об отсутствии автокорреляции между соседними временными точками (лаг = 1). Для других периодов нельзя отвергать нулевую гипотезу об отсутствии автокорреляции.

Обратите внимание, что есть две различные формулы для создания доверительных интервалов:

1. Если коррелограмма используется для проверки на случайность (т. Е. В данных нет зависимости от времени), рекомендуется следующая формула:

где N является размером выборки , г является функцией квантиля из стандартного нормального распределения и α является уровнем значимости . В этом случае доверительные интервалы имеют фиксированную ширину, которая зависит от размера выборки.

2. Коррелограммы также используются на этапе идентификации модели для подгонки моделей ARIMA . В этом случае для данных предполагается модель скользящего среднего и должны быть сгенерированы следующие доверительные интервалы:

где k - отставание. В этом случае доверительные интервалы увеличиваются с увеличением задержки.

Программное обеспечение [ править ]

Коррелограммы доступны в большинстве статистических библиотек общего назначения.

Коррелограммы:

  • python pandas : pandas.plotting.autocorrelation_plot[5]
  • R : функции acfиpacf

Коррограммы:

  • питон Сиборн : heatmap,pairplot
  • Р : corrgram[2] [3]

Связанные методы [ править ]

  • График частичной автокорреляции
  • График лага
  • Спектральный сюжет
  • Сюжет сезонной подсерии
  • Масштабированная корреляция
  • Вариограмма

Ссылки [ править ]

  1. Friendly, Майкл (19 августа 2002 г.). «Коррограммы: исследовательские дисплеи для корреляционных матриц» (PDF) . Американский статистик . Тейлор и Фрэнсис . 56 (4): 316–324. DOI : 10,1198 / 000313002533 . Проверено 19 января 2014 года .
  2. ^ a b "CRAN - Ошибка пакета" . cran.r-project.org . 29 августа 2013 . Проверено 19 января 2014 года .
  3. ^ a b "Quick-R: Коррелограммы" . statmethods.net . Проверено 19 января 2014 года .
  4. ^ «1.3.3.1. График автокорреляции» . www.itl.nist.gov . Проверено 20 августа 2018 .
  5. ^ «Визуализация § Автокорреляционный график» .

Дальнейшее чтение [ править ]

  • Ханке, Джон Э .; Reitsch, Arthur G .; Уичерн, Дин В. Бизнес-прогнозирование (7-е изд.). Река Аппер Сэдл, Нью-Джерси: Prentice Hall.
  • Коробка, ГЭП; Дженкинс, Г. (1976). Анализ временных рядов: прогнозирование и контроль . Холден-Дэй.
  • Чатфилд, К. (1989). Анализ временных рядов: Введение (Четвертое изд.). Нью-Йорк, Нью-Йорк: Чепмен и Холл.

Внешние ссылки [ править ]

  • График автокорреляции

 Эта статья включает материалы, являющиеся  общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov .