Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Экспоненциальное сглаживание является эмпирическим правилом техники для разглаживания времени серии данных с использованием экспоненциальной функции окна . В то время как в простой скользящей средней прошлые наблюдения имеют одинаковый вес, экспоненциальные функции используются для назначения экспоненциально убывающих весов с течением времени. Это легко усваиваемая и легко применяемая процедура для выполнения некоторых определений на основе предварительных предположений пользователя, таких как сезонность. Экспоненциальное сглаживание часто используется для анализа данных временных рядов.

Экспоненциальное сглаживание - одна из многих оконных функций, обычно применяемых для сглаживания данных при обработке сигналов , действующих как фильтры нижних частот для удаления высокочастотного шума . Этому методу предшествовало использование Пуассоном рекурсивных экспоненциальных оконных функций в свертках из 19 века, а также использование Колмогоровым и Зурбенко рекурсивных скользящих средних из их исследований турбулентности в 1940-х годах.

Последовательность необработанных данных часто представляется как начало в момент времени , а результат алгоритма экспоненциального сглаживания обычно записывается как , что можно рассматривать как наилучшую оценку того, каким будет следующее значение . Когда последовательность наблюдений начинается во времени , простейшая форма экспоненциального сглаживания задается формулами: [1]

где - коэффициент сглаживания , а .

Базовое (простое) экспоненциальное сглаживание (линейное по Холту) [ править ]

Использование экспоненциальной оконной функции было впервые приписано Пуассону [2] как расширение метода численного анализа 17 века, а позже было принято сообществом обработки сигналов в 1940-х годах. Здесь экспоненциальное сглаживание - это применение экспоненциальной, или оконной функции Пуассона . Экспоненциальное сглаживание было впервые предложено в статистической литературе без ссылок на предыдущую работу Роберта Гуделла Брауна в 1956 году [3], а затем расширено Чарльзом К. Холтом в 1957 году. [4] Приведенная ниже формулировка, которая является наиболее часто используемой, является приписывается Брауну и известен как «простое экспоненциальное сглаживание Брауна».[5] Все методы Холта, Винтерса и Брауна можно рассматривать как простое применение рекурсивной фильтрации, впервые обнаруженной в 1940-х годах [2] для преобразованияфильтров с конечной импульсной характеристикой (FIR) в фильтры с бесконечной импульсной характеристикой .

Простейший вид экспоненциального сглаживания дается формулой:

где - коэффициент сглаживания , а . Другими словами, сглаженная статистика - это простое средневзвешенное значение текущего наблюдения и предыдущей сглаженной статистики . Простое экспоненциальное сглаживание легко применяется, и оно дает сглаженную статистику, как только доступны два наблюдения. Термин « коэффициент сглаживания», применяемый здесь, является чем-то вроде неправильного употребления, так как большие значения фактически снижают уровень сглаживания, а в предельном случае с = 1 выходной ряд является просто текущим наблюдением. Значения, близкие к единице, имеют меньший эффект сглаживания и придают больший вес недавним изменениям в данных, в то время как значения ближе к нулю имеют больший эффект сглаживания и меньше реагируют на недавние изменения.

Формально правильной процедуры выбора не существует . Иногда для выбора подходящего фактора используется суждение статистика. В качестве альтернативы можно использовать статистический метод для оптимизации значения . Например, метод наименьших квадратов может использоваться для определения значения, для которого минимизируется сумма количеств . [6]

В отличие от некоторых других методов сглаживания, таких как простое скользящее среднее, этот метод не требует выполнения какого-либо минимального количества наблюдений, прежде чем он начнет давать результаты. Однако на практике «хорошее среднее значение» не будет достигнуто, пока несколько образцов не будут усреднены вместе; например, постоянный сигнал займет примерноэтапов, чтобы достичь 95% фактического значения. Чтобы точно восстановить исходный сигнал без потери информации, все этапы экспоненциального скользящего среднего также должны быть доступны, потому что более старые образцы теряют вес по экспоненте. Это отличается от простого скользящего среднего, в котором некоторые выборки могут быть пропущены без большой потери информации из-за постоянного взвешивания выборок в пределах среднего. Если известное количество выборок будет пропущено, можно также скорректировать средневзвешенное значение для этого, придав одинаковый вес новой выборке и всем тем, которые должны быть пропущены.

Эта простая форма экспоненциального сглаживания также известна как экспоненциально взвешенное скользящее среднее (EWMA). Технически ее также можно классифицировать как модель авторегрессионного интегрированного скользящего среднего (ARIMA) (0,1,1) без постоянного члена. [7]

Постоянная времени [ править ]

Постоянная времени экспоненциальной скользящей средней - это количество времени, за которое сглаженный отклик функции единичного шага достигает исходного сигнала. Связь между этой постоянной времени и коэффициентом сглаживания задается формулой:

где - интервал времени дискретизации дискретной временной реализации. Если время выборки мало по сравнению с постоянной времени ( ), то

Выбор начального сглаженного значения [ править ]

Обратите внимание, что в приведенном выше определении инициализируется как . Поскольку экспоненциальное сглаживание требует, чтобы на каждом этапе у нас был предыдущий прогноз, неясно, как запустить метод. Можно предположить, что первоначальный прогноз равен первоначальному значению спроса; однако у этого подхода есть серьезный недостаток. Экспоненциальное сглаживание придает большое значение прошлым наблюдениям, поэтому первоначальное значение спроса будет иметь неоправданно большое влияние на ранние прогнозы. Эту проблему можно преодолеть, если позволить процессу развиваться в течение разумного количества периодов (10 или более) и использовать среднее значение спроса за эти периоды в качестве первоначального прогноза. Есть много других способов установить это начальное значение, но важно отметить, что чем меньше значение, тем более чувствительным будет ваш прогноз при выборе этого начального более гладкого значения . [8] [9]

Оптимизация [ править ]

Для каждого метода экспоненциального сглаживания нам также необходимо выбрать значение для параметров сглаживания. Для простого экспоненциального сглаживания существует только один параметр сглаживания ( α ), но для последующих методов обычно используется более одного параметра сглаживания.

Бывают случаи, когда параметры сглаживания могут выбираться субъективно - прогнозист указывает значение параметров сглаживания на основе предыдущего опыта. Однако более надежным и объективным способом получения значений неизвестных параметров, включенных в любой метод экспоненциального сглаживания, является их оценка по наблюдаемым данным.

Неизвестные параметры и начальные значения для любого метода экспоненциального сглаживания могут быть оценены путем минимизации суммы квадратов ошибок (SSE). Ошибки определяются как для (на один шаг впереди внутри выборки ошибок прогнозирования). Отсюда находим значения неизвестных параметров и начальные значения, которые минимизируют

[10]

В отличие от случая регрессии (где у нас есть формулы для непосредственного вычисления коэффициентов регрессии, которые минимизируют SSE), здесь возникает проблема нелинейной минимизации, и для этого нам нужно использовать инструмент оптимизации .

"Экспоненциальное" именование [ править ]

Название «экспоненциальное сглаживание» связано с использованием экспоненциальной оконной функции во время свертки. Его больше не приписывают Holt, Winters & Brown.

Путем прямой подстановки определяющего уравнения для простого экспоненциального сглаживания обратно в себя находим, что

Другими словами, по прошествии времени сглаженная статистика становится средневзвешенным значением все большего и большего числа прошлых наблюдений , а веса, присвоенные предыдущим наблюдениям, пропорциональны условиям геометрической прогрессии.

Геометрическая прогрессия является дискретной версией экспоненциальной функции , так это то , где имя для этого сглаживающего метода возникло согласно статистике знаниям.

Сравнение со скользящей средней [ править ]

Экспоненциальное сглаживание и скользящее среднее имеют схожие дефекты, заключающиеся в появлении запаздывания относительно входных данных. Хотя это можно исправить, сдвинув результат на половину длины окна для симметричного ядра, такого как скользящее среднее или гауссово, неясно, насколько это подходит для экспоненциального сглаживания. Они также имеют примерно одинаковое распределение ошибки прогноза при α = 2 / ( k  + 1). Они отличаются тем, что экспоненциальное сглаживание учитывает все прошлые данные, тогда как скользящее среднее учитывает только k прошлых точек данных. С точки зрения вычислений, они также отличаются тем, что для скользящего среднего требуется, чтобы последние k точек данных или точка данных с запаздыванием k + 1 плюс самое последнее значение прогноза, чтобы сохранить, в то время как для экспоненциального сглаживания необходимо сохранить только последнее значение прогноза. [11]

В литературе по обработке сигналов использование непричинных (симметричных) фильтров является обычным явлением, и экспоненциальная оконная функция широко используется в этом виде, но используется другая терминология: экспоненциальное сглаживание эквивалентно бесконечному импульсу первого порядка. фильтр отклика (БИХ) и скользящее среднее эквивалентны фильтру с конечной импульсной характеристикой с равными весовыми коэффициентами.

Двойное экспоненциальное сглаживание [ править ]

Простое экспоненциальное сглаживание не работает, когда в данных есть тренд , что неудобно. [1] В таких ситуациях было разработано несколько методов под названием «двойное экспоненциальное сглаживание» или «экспоненциальное сглаживание второго порядка», которые представляют собой рекурсивное применение экспоненциального фильтра дважды, что называется «двойным экспоненциальным сглаживанием». Эта номенклатура похожа на четырехкратное экспоненциальное сглаживание, которое также ссылается на его глубину рекурсии. [12] Основная идея двойного экспоненциального сглаживания состоит во введении члена, учитывающего возможность ряда, демонстрирующего некоторую форму тренда. Сама эта составляющая наклона обновляется посредством экспоненциального сглаживания.

Один метод, иногда называемый «двойным экспоненциальным сглаживанием Холта – Винтерса», работает следующим образом: [13]

Опять же, последовательность необработанных данных наблюдений представлена ​​как начало в момент времени . Мы используем для представления сглаженного значения для времени , и это наша лучшая оценка тенденции во времени . Выходные данные алгоритма теперь записываются как оценка значения в определенный момент времени, основанная на необработанных данных в данный момент . Двойное экспоненциальное сглаживание дается формулами

И по

где ( ) - коэффициент сглаживания данных , а ( ) - коэффициент сглаживания тренда .

Прогноз дальше дается приближением:

Установка начального значения - дело предпочтений. Вариант, кроме одного , перечисленных выше, для некоторых .

Обратите внимание, что F 0 не определено (нет оценки для времени 0), и в соответствии с определением F 1 = s 0 + b 0 , которое хорошо определено, таким образом, можно оценивать дальнейшие значения.

Второй метод, называемый либо линейным экспоненциальным сглаживанием Брауна (LES), либо двойным экспоненциальным сглаживанием Брауна, работает следующим образом. [14]

где a t - расчетный уровень в момент времени t, а b t - оценочный тренд во время t :

Тройное экспоненциальное сглаживание (Холт Винтерс) [ править ]

При тройном экспоненциальном сглаживании применяется трехкратное экспоненциальное сглаживание, которое обычно используется, когда из исследуемого временного ряда нужно удалить три высокочастотных сигнала. Есть разные типы сезонности: «мультипликативная» и «аддитивная» по своей природе, так же как сложение и умножение являются основными операциями в математике.

Если каждый декабрь мы продаем на 10 000 квартир больше, чем в ноябре, сезонность носит аддитивный характер. Однако если мы продаем в летние месяцы на 10% больше квартир, чем в зимние, сезонность носит мультипликативный характер. Мультипликативная сезонность может быть представлена ​​как постоянный фактор, а не абсолютная величина. [15]

Тройное экспоненциальное сглаживание было впервые предложено учеником Холта Питером Винтерсом в 1960 году после прочтения книги 1940-х годов по обработке сигналов об экспоненциальном сглаживании. [16] Новая идея Холта заключалась в том, чтобы повторить фильтрацию нечетное количество раз больше 1 и меньше 5, что было популярно среди ученых предыдущих эпох. [16] Хотя рекурсивная фильтрация использовалась ранее, она применялась дважды и четыре раза, чтобы совпасть с гипотезой Адамара , в то время как тройное применение требовало более чем удвоения операций сингулярной свертки. Использование тройного приложения считается практическим правилом.метод, а не тот, который основан на теоретических основах, и практикующие часто переоценивают его. - Предположим, у нас есть последовательность наблюдений , начинающаяся во времени с циклом сезонного изменения длины .

Метод вычисляет линию тренда для данных, а также сезонные индексы, которые взвешивают значения в линии тренда в зависимости от того, где этот момент времени попадает в цикл длины .

Пусть представляет сглаженное значение постоянной части для времени , это последовательность наилучших оценок линейного тренда, которые накладываются на сезонные изменения, и это последовательность сезонных поправочных коэффициентов. Мы хотим оценить в каждый момент времени мод в цикле , что наблюдения взять на себя . Как показывает практика, для инициализации набора сезонных факторов необходимо минимум два полных сезона (или периода) исторических данных.

Выходные данные алгоритма снова записываются как оценка значения в определенный момент времени, основанная на необработанных данных в определенный момент времени . Тройное экспоненциальное сглаживание с мультипликативной сезонностью задается формулами [1]

где ( ) - коэффициент сглаживания данных , ( ) - коэффициент сглаживания тренда , а ( ) - коэффициент сглаживания сезонных изменений .

Общая формула для первоначальной оценки тренда :

Установка начальных оценок для сезонных индексов для немного сложнее. Если в ваших данных присутствует количество полных циклов, то:

куда

Обратите внимание , что среднее значение в цикле данных.

Тройное экспоненциальное сглаживание с аддитивной сезонностью определяется по формуле:

Реализации в статистических пакетах [ править ]

  • R : функция HoltWinters в пакете статистики [17] и функция ets в пакете прогнозов [18] (более полная реализация, обычно приводящая к лучшей производительности [19] ).
  • Python : модуль holtwinters пакета statsmodels позволяет выполнять простое, двойное и тройное экспоненциальное сглаживание.
  • IBM SPSS включает простой, простой сезонный, линейный тренд Холта, линейный тренд Брауна, затухающий тренд, добавку Винтерса и мультипликатив Винтерса в процедуру моделирования временных рядов в своих статистических пакетах Statistics и Modeler. Функция Expert Modeler по умолчанию оценивает все семь моделей экспоненциального сглаживания и модели ARIMA с диапазоном несезонных и сезонных значений p , d и q и выбирает модель с самым низким статистическим значением байесовского информационного критерия.
  • Stata : команда tssmooth [20]
  • LibreOffice 5.2 [21]
  • Microsoft Excel 2016 [22]

См. Также [ править ]

  • Модель авторегрессионного скользящего среднего (ARMA)
  • Ошибки и неточности в статистике
  • Скользящее среднее
  • Непрерывная дробь

Примечания [ править ]

  1. ^ a b c «Электронное руководство по статистическим методам NIST / SEMATECH» . NIST . Проверено 23 мая 2010 года .
  2. ^ а б Оппенгейм, Алан В .; Шафер, Рональд В. (1975). Цифровая обработка сигналов . Прентис Холл . п. 5. ISBN 0-13-214635-5.
  3. ^ Браун, Роберт Г. (1956). Экспоненциальное сглаживание для прогнозирования спроса . Кембридж, Массачусетс: Arthur D. Little Inc., стр. 15.
  4. ^ Холт, Чарльз С. (1957). «Прогнозирование тенденций и сезонности с помощью экспоненциально взвешенных средних». Меморандум Управления военно-морских исследований . 52 .перепечатано в Holt, Charles C. (январь – март 2004 г.). «Прогнозирование тенденций и сезонности с помощью экспоненциально взвешенных средних». Международный журнал прогнозирования . 20 (1): 5–10. DOI : 10.1016 / j.ijforecast.2003.09.015 .
  5. ^ Браун, Роберт Гуделл (1963). Сглаживающее прогнозирование и прогнозирование дискретных временных рядов . Энглвуд Клиффс, Нью-Джерси: Прентис-Холл.
  6. ^ "Электронный справочник статистических методов NIST / SEMATECH, 6.4.3.1. Одноэкспоненциальное сглаживание" . NIST . Дата обращения 5 июля 2017 .
  7. Нау, Роберт. «Модели усреднения и экспоненциального сглаживания» . Проверено 26 июля 2010 года .
  8. ^ "Производство и анализ операций" Nahmias. 2009 г.
  9. ^ Císař, P., & Císař, SM (2011). «Методы оптимизации статистики EWMA». Acta Polytechnica Hungarica , 8 (5), 73–87. Стр.78.
  10. ^ 7.1 Простое экспоненциальное сглаживание | Прогнозирование: принципы и практика .
  11. ^ Nahmias, Стивен (3 марта 2008). Анализ производства и операций (6-е изд.). ISBN 0-07-337785-6.[ требуется страница ]
  12. ^ "Модель: экспоненциальное сглаживание второго порядка" . SAP AG . Проверено 23 января 2013 года .
  13. ^ «6.4.3.3. Двойное экспоненциальное сглаживание» . itl.nist.gov . Проверено 25 сентября 2011 года .
  14. ^ «Модели усреднения и экспоненциального сглаживания» . duke.edu . Проверено 25 сентября 2011 года .
  15. ^ Kalehar, Prajakta S. "Прогнозирование временных рядов с использованием экспоненциального сглаживания Холта – Винтерса" (PDF) . Проверено 23 июня 2014 .
  16. ^ a b Winters, PR (апрель 1960 г.). «Прогнозирование продаж по экспоненциально взвешенным скользящим средним». Наука управления . 6 (3): 324–342. DOI : 10.1287 / mnsc.6.3.324 .
  17. ^ "R: Фильтрация Холта – Винтерса" . stat.ethz.ch . Проверено 5 июня +2016 .
  18. ^ "ets {прогноз} | inside-R | Сайт сообщества для R" . inside-r.org . Архивировано от оригинала 16 июля 2016 года . Проверено 5 июня +2016 .
  19. ^ «Сравнение HoltWinters () и ets ()» . Hyndsight . 29 мая 2011г . Проверено 5 июня +2016 .
  20. ^ tssmooth в руководстве Stata
  21. ^ «LibreOffice 5.2: Примечания к выпуску - вики Document Foundation» .
  22. ^ «Функции прогнозирования Excel 2016 | Реальная статистика с использованием Excel» .

Внешние ссылки [ править ]

  • Конспект лекций по экспоненциальному сглаживанию (Роберт Нау, Университет Дьюка)
  • Сглаживание данных Джон Маклоун, Демонстрационный проект Вольфрама
  • Подход Холта – Уинтерса к экспоненциальному сглаживанию: 50 лет назад и становится сильным , Пол Гудвин (2010) Форсайт: Международный журнал прикладного прогнозирования
  • Алгоритмы для неравномерно разнесенных временных рядов: скользящие средние и другие скользящие операторы Андреаса Экнера