Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Пример двух кривых скользящего среднего

В статистике , скользящее среднее ( скользящее среднее или скользящее среднее ) является расчет для анализа точек данных путем создания ряда средних различных подмножеств полного набора данных. Его также называют скользящим средним ( MM ) [1] или скользящим средним и представляет собой тип фильтра с конечной импульсной характеристикой . Варианты включают: простые и накопительные или взвешенные формы (описаны ниже).

Учитывая ряд чисел и фиксированный размер подмножества, первый элемент скользящего среднего получается путем взятия среднего значения начального фиксированного подмножества числового ряда. Затем подмножество модифицируется «смещением вперед»; то есть исключение первого числа ряда и включение следующего значения в подмножестве.

Скользящее среднее обычно используется с данными временных рядов для сглаживания краткосрочных колебаний и выделения долгосрочных тенденций или циклов. Порог между краткосрочным и долгосрочным зависит от приложения, и параметры скользящей средней будут установлены соответственно. Например, он часто используется в техническом анализе финансовых данных, таких как цены на акции , доходность или объемы торгов. Он также используется в экономике для изучения валового внутреннего продукта, занятости или других макроэкономических временных рядов. Математически скользящее среднее - это тип свертки, поэтому его можно рассматривать как пример фильтра нижних частот, используемого вобработка сигналов . При использовании с данными, не относящимися к временным рядам, скользящее среднее фильтрует высокочастотные компоненты без какой-либо конкретной привязки ко времени, хотя обычно подразумевается некоторый вид упорядочения. В упрощенном виде это можно рассматривать как сглаживание данных.

Простая скользящая средняя (фильтр товарных вагонов) [ править ]

Сравнение типов скользящих средних - Simple и Exponential.png

В финансовых приложениях простая скользящая средняя ( SMA ) - это невзвешенное среднее значение предыдущих точек данных. Однако в науке и технике среднее значение обычно берется из равного количества данных по обе стороны от центрального значения. Это гарантирует, что вариации среднего значения совпадают с вариациями данных, а не смещаются во времени.Примером простого равновзвешенного скользящего среднего для дневной выборки цены закрытия является среднее значение цен закрытия предыдущих дней. Пусть такие цены будут . Пусть среднее значение по первым точкам данных будет . Таким образом, среднее значение по всем точкам данных рассчитывается как:

Это означает, что фильтр скользящего среднего можно довольно дешево вычислить для данных в реальном времени с FIFO / кольцевым буфером.

При вычислении последовательных значений новое значение входит в сумму, а самое старое значение выпадает. Это означает, что полное суммирование каждый раз не требуется. Таким образом, новое среднее значение можно рассчитать как:

Выбранный период зависит от типа интересующего вас движения, например, краткосрочного, среднесрочного или долгосрочного. С финансовой точки зрения уровни скользящей средней можно интерпретировать как поддержку на падающем рынке или сопротивление на растущем рынке.

Если используемые данные не центрированы вокруг среднего, простое скользящее среднее отстает от последней точки отсчета на половину ширины выборки. На SMA также может непропорционально влиять выпадение старых опорных точек или поступление новых данных. Одной из характеристик SMA является то, что если данные имеют периодические колебания, то применение SMA этого периода устранит это изменение (среднее всегда содержит один полный цикл). Но совершенно регулярный цикл встречается редко. [2]

Для ряда приложений полезно избегать сдвига, вызванного использованием только «прошлых» данных. Следовательно, центральное скользящее среднее может быть вычислено с использованием данных, равномерно распределенных по обе стороны от точки в ряду, где вычисляется среднее значение. [3] Это требует использования нечетного числа опорных точек в окне выборки.

Основным недостатком SMA является то, что он пропускает значительную часть сигнала короче, чем длина окна. Хуже того, он фактически переворачивает его . Это может привести к неожиданным артефактам, таким как пики сглаженного результата, появляющиеся там, где в данных были впадины. Это также приводит к тому, что результат оказывается менее плавным, чем ожидалось, поскольку некоторые из высоких частот не удаляются должным образом.

Кумулятивная скользящая средняя [ править ]

В кумулятивном скользящем среднем ( CMA ) данные поступают в виде упорядоченного потока данных, и пользователь хотел бы получить среднее значение всех данных до текущей точки данных. Например, инвестору может потребоваться средняя цена всех операций с акциями для конкретной акции до текущего времени. Когда происходит каждая новая транзакция, средняя цена на момент транзакции может быть рассчитана для всех транзакций до этого момента с использованием кумулятивного среднего, обычно равновзвешенного среднего значения последовательности из n значений до текущего времени:

Метод грубой силы для вычисления этого будет заключаться в том, чтобы сохранить все данные и вычислить сумму и разделить на количество опорных точек каждый раз, когда приходит новая опорная точка. Однако можно просто обновить кумулятивное среднее значение по мере того, как новое значение станет доступным, используя формулу

Таким образом, текущее совокупное среднее значение для новой точки отсчета равно предыдущему накопленному среднему значению, умноженному на n , плюс последняя точка отсчета, все, разделенное на количество точек, полученных на данный момент, n +1. Когда все опорные точки прибывают ( n = N ), совокупное среднее значение будет равно окончательному среднему. Кроме того , можно сохранить текущую сумму базовой точки, а также количество баллов и деление общего количества точек нулевых точек , чтобы получить МНМ каждый раз , когда новая нулевая точка приходит.

Вывести формулу кумулятивного среднего значения несложно. С помощью

и аналогично для n + 1 видно, что

Решение этого уравнения приводит к

Средневзвешенное скользящее среднее [ править ]

Средневзвешенное значение - это среднее значение, которое имеет коэффициенты умножения, позволяющие присвоить разный вес данным в разных положениях в окне выборки. Математически взвешенное скользящее среднее - это свертка опорных точек с фиксированной весовой функцией. Одно приложение устраняет пикселизацию цифрового графического изображения. [ необходима цитата ]

В техническом анализе финансовых данных взвешенная скользящая средняя (WMA) имеет особое значение весов, которые уменьшаются в арифметической прогрессии. [4] В n- дневном WMA последний день имеет вес n , второй после n  - 1 и т. Д. С точностью до единицы.

Веса WMA n  = 15

Знаменатель - это число в треугольнике, равное В более общем случае знаменателем всегда будет сумма отдельных весов.

При вычислении WMA для последовательных значений разница между числителями WMA M +1 и WMA M составляет np M +1  -  p M  - ⋅⋅⋅ -  p M −n + 1 . Если обозначить сумму p M  + ⋅⋅⋅ +  p M - n +1 через Total M , то

График справа показывает, как веса уменьшаются от максимального веса для самых последних опорных точек до нуля. Его можно сравнить с весами в следующей экспоненциальной скользящей средней.

Экспоненциальная скользящая средняя [ править ]

Веса EMA  N  = 15

Экспоненциальной скользящей средней (EMA) , также известный как экспоненциально взвешенное скользящее среднее (EWMA) , [5] является первого порядка с бесконечной импульсной характеристикой фильтра , который применяет весовые коэффициенты , которые уменьшают в геометрической прогрессии . Вес для каждого более старого элемента данных уменьшается экспоненциально, никогда не достигая нуля. На графике справа показан пример снижения веса.

EMA для серии Y можно вычислить рекурсивно:

Где:

  • Коэффициент α представляет собой степень уменьшения веса, постоянный коэффициент сглаживания от 0 до 1. Чем выше значение α, тем быстрее отсчитываются старые наблюдения.
  • Y t - значение в период времени t .
  • S t - значение EMA в любой период времени t .

S 1 может быть инициализирован множеством различных способов, чаще всего путем установки S 1 на Y 1, как показано выше, хотя существуют и другие методы, такие как установка S 1 на среднее значение первых 4 или 5 наблюдений. Важность эффекта инициализации S 1 для результирующего скользящего среднего зависит от α ; меньший альфа значение делает выбор S 1 относительно более важного , чем большой альфа значений, так как более высокого альфа скидки старых наблюдений быстрее.

Что бы ни было сделано для S 1, оно предполагает что-то о значениях, предшествующих доступным данным, и обязательно является ошибкой. Ввиду этого первые результаты следует рассматривать как ненадежные до тех пор, пока итерации не сойдутся . Иногда это называют интервалом «раскрутки». Один из способов оценить, когда он может считаться надежным, - это рассмотреть требуемую точность результата. Например, если требуется точность 3%, инициализация с помощью Y 1 и получение данных после пяти постоянных времени (определенных выше) обеспечит сходимость вычислений с точностью до 3% (только <3% от Y 1.останется в результате). Иногда с очень маленьким альфа-каналом это может означать, что результат мало полезен. Это аналогично проблеме использования фильтра свертки (например, средневзвешенного) с очень длинным окном.

Эта формулировка соответствует Хантеру (1986). [6] При повторном применении этой формулы в разное время мы можем в конечном итоге записать S t как взвешенную сумму опорных точек Y t , как:

для любого подходящего k ∈ {0, 1, 2, ...} Вес общей точки отсчета равен .

Эта формула может быть выражена в терминах технического анализа следующим образом, показывая, как шаги EMA в направлении последней точки начала отсчета, а только пропорцией разности (каждый раз):

Расширение из каждый результат времени в следующей степенной ряд, показывающий , как весовой коэффициент на каждой опорной точки р 1 , р 2 , и т.д., экспоненциально убывает:

куда

  • является
  • является
  • и так далее

с тех пор .

Его также можно вычислить рекурсивно без введения ошибки при инициализации первой оценки (n начинается с 1):

Предполагать

Это бесконечная сумма с убывающими членами.

Приближение EMA с ограниченным количеством условий [ править ]

Вопрос о том, как далеко отойти от начального значения, в худшем случае зависит от данных. Большие значения цен в старых данных повлияют на общую сумму, даже если их вес очень мал. Если цены имеют небольшие вариации, можно рассмотреть только взвешивание. Приведенная выше формула мощности дает начальное значение для конкретного дня, после которого может быть применена формула последовательных дней, показанная первой. Вес, пропущенный при остановке после k членов, равен

который

т.е. дробь

[7]

из общего веса.

Например, чтобы получить 99,9% веса, установите вышеуказанное соотношение равным 0,1% и решите для k :

чтобы определить, сколько терминов следует использовать. Поскольку as , мы знаем, что приближается по мере увеличения N. [8] Это дает:

Когда относится к N как , это упрощается приблизительно до [9]

для этого примера (99,9% вес.).

Связь между SMA и EMA [ править ]

Обратите внимание, что не существует «приемлемого» значения, которое следует выбирать , хотя есть некоторые рекомендуемые значения, основанные на применении. Обычно используемое значение является . Это потому, что веса SMA и EMA имеют одинаковый «центр масс», когда .

[Доказательство]

Веса дневной SMA имеют «центр масс» в день, где

(или , если мы используем индексирование с нуля)

В оставшейся части этого доказательства мы будем использовать индексирование с единицей.

Между тем, веса EMA имеют центр масс

 

То есть,

  

Мы также знаем серию Маклорена.

 

Взятие производных от обеих сторон по дает:

  

или же

   

Подставляя , получаем

или же

 

Таким образом, значение этих наборов на самом деле:

или же

То же самое и значение, которое создает EMA, веса которой имеют тот же центр тяжести, что и эквивалентная N-дневная SMA.

Вот почему иногда EMA называют N- дневной EMA. Несмотря на название, предполагающее, что существует N периодов, терминология указывает только фактор α . N не является точкой остановки для вычислений, как в SMA или WMA . Для достаточно большого N первые N опорных точек в EMA составляют около 86% от общего веса в расчетах, когда :

[Доказательство]

Сумма весов всех членов (т. Е. Бесконечного числа членов) в экспоненциальной скользящей средней равна 1. Сумма весов членов равна . Обе эти суммы могут быть получены с помощью формулы суммы геометрического ряда. Вес, пропущенный после терминов, дается путем вычитания его из 1, и вы получаете (по сути, это формула, приведенная ранее для пропущенного веса).

Теперь заменим обычно используемое значение на формулу веса терминов. Если вы сделаете эту замену и воспользуетесь [10] , то вы получите

[11]
то есть упрощенно, [12] стремится к .

приближение 0,8647. Интуитивно это говорит нам о том, что вес после членов « -периодной» экспоненциальной скользящей средней сходится к 0,8647.

Обозначение не является обязательным. (К примеру, аналогичное доказательство можно было бы использовать , чтобы так же легко определить , что ЕМА с периодом полураспада от N -days является или что ЕМА с той же медиане как N -дня SMA является ). Фактически, 2 / (N + 1) - это просто общее соглашение для формирования интуитивного понимания взаимосвязи между EMA и SMA для отраслей, где оба обычно используются вместе в одних и тех же наборах данных. На самом деле можно использовать EMA с любым значением , и ей можно дать имя, указав значение или используя более знакомую терминологию N- day EMA .

Экспоненциально взвешенная скользящая дисперсия и стандартное отклонение [ править ]

Помимо среднего, нас также могут интересовать дисперсия и стандартное отклонение для оценки статистической значимости отклонения от среднего.

EWMVar можно легко вычислить вместе со скользящей средней. Начальными значениями являются и , а затем мы вычисляем последующие значения, используя: [13]

Исходя из этого, экспоненциально взвешенное скользящее стандартное отклонение может быть вычислено как . Затем мы можем использовать стандартную оценку для нормализации данных относительно скользящего среднего и дисперсии. Этот алгоритм основан на алгоритме Велфорда для вычисления дисперсии .

Модифицированная скользящая средняя [ править ]

Модифицированного скользящего среднего (ММА), работает скользящей средней (RMA), или сглаженное скользящее среднее (SMMA) определяется как:

Короче говоря, это экспоненциальная скользящая средняя с .

Приложение для измерения производительности компьютера [ править ]

Некоторые показатели производительности компьютера, например средняя длина очереди процесса или средняя загрузка ЦП, используют форму экспоненциального скользящего среднего.

Здесь α определяется как функция времени между двумя измерениями. Примером коэффициента, придающего больший вес текущим показаниям и меньший вес старым показаниям, является

где exp () - экспоненциальная функция , время считывания t n выражается в секундах, а W - период времени в минутах, в течение которого показание считается усредненным (среднее время жизни каждого показания в среднем). Учитывая приведенное выше определение α , скользящую среднюю можно выразить как

Например, среднее значение L длины очереди обработки Q за 15 минут , измеряемое каждые 5 секунд (разница во времени составляет 5 секунд), вычисляется как

Другие веса [ править ]

Иногда используются другие системы взвешивания - например, при торговле акциями объемный вес будет взвешивать каждый период времени пропорционально его торговому объему.

Еще одно взвешивание, используемое актуариями, - это 15-точечная скользящая средняя Спенсера [14] (центральная скользящая средняя). Его симметричные весовые коэффициенты равны [−3, −6, −5, 3, 21, 46, 67, 74, 67, 46, 21, 3, −5, −6, −3], которые разлагаются как [1, 1 , 1, 1] * [1, 1, 1, 1] * [1, 1, 1, 1, 1] * [- 3, 3, 4, 3, −3] / 320 и оставляет выборки любого кубического полинома без изменений. [15]

За пределами мира финансов средства взвешенного управления имеют множество форм и применений. Каждая весовая функция или «ядро» имеет свои особенности. В технике и науке частота и фазовая характеристика фильтра часто имеют первостепенное значение для понимания желаемых и нежелательных искажений, которые конкретный фильтр будет применять к данным.

Средство не просто «сглаживает» данные. Среднее - это разновидность фильтра нижних частот. Следует понимать влияние конкретного используемого фильтра, чтобы сделать соответствующий выбор. По этому поводу во французской версии этой статьи обсуждаются спектральные эффекты трех видов средних (кумулятивных, экспоненциальных, гауссовских).

Подвижная медиана [ править ]

Со статистической точки зрения скользящее среднее, когда оно используется для оценки основного тренда во временном ряду, подвержено редким событиям, таким как быстрые потрясения или другие аномалии. Более надежной оценкой тренда является простая скользящая медиана по n временным точкам:

где медиана находится, например, путем сортировки значений внутри скобок и нахождения значения в середине. Для больших значений n медиана может быть эффективно вычислена путем обновления индексируемого списка пропусков . [16]

Статистически скользящая средняя оптимальна для восстановления основного тренда временного ряда, когда колебания тренда распределены нормально . Однако нормальное распределение не дает высокой вероятности очень большим отклонениям от тренда, что объясняет, почему такие отклонения будут иметь непропорционально большое влияние на оценку тренда. Можно показать, что если вместо этого предполагается, что флуктуации распределены по Лапласу , то скользящая медиана является статистически оптимальной. [17] Для данной дисперсии распределение Лапласа предполагает более высокую вероятность редких событий, чем нормальное, что объясняет, почему скользящая медиана лучше переносит удары, чем скользящая средняя.

Когда простая скользящая медиана, приведенная выше, является центральной, сглаживание идентично среднему фильтру, который применяется, например, в обработке сигналов изображения.

Модель регрессии скользящего среднего [ править ]

В модели регрессии скользящего среднего предполагается, что интересующая переменная представляет собой взвешенное скользящее среднее ненаблюдаемых независимых членов ошибки; веса в скользящей средней являются параметрами, которые необходимо оценить.

Эти два понятия часто путают из-за их названия, но, хотя у них много общего, они представляют разные методы и используются в очень разных контекстах.

См. Также [ править ]

  • Экспоненциальное сглаживание
  • Индикатор схождения / расхождения скользящих средних
  • Оконная функция
  • Скользящий средний кроссовер
  • Растущая скользящая средняя
  • Прокручивающийся хеш
  • Общая сумма
  • Локальная регрессия (МЕНЬШЕ и МЕНЬШЕ)
  • Сглаживание ядра
  • Перемещение наименьших квадратов
  • Экспоненциальная скользящая средняя с нулевым запаздыванием

Примечания и ссылки [ править ]

  1. ^ Гидрологическая изменчивость поймы реки Косумнес (Бут и др., San Francisco Estuary and Watershed Science, Volume 4, Issue 2, 2006)
  2. ^ Статистический анализ , Ya-lun Chou, Holt International, 1975, ISBN  0-03-089422-0 , раздел 17.9.
  3. ^ Вывод и свойства простой центральной скользящей средней полностью даны в фильтре Савицки – Голея .
  4. ^ «Взвешенные скользящие средние: основы» . Инвестопедия.
  5. ^ "Архивная копия" . Архивировано из оригинала на 2010-03-29 . Проверено 26 октября 2010 .CS1 maint: archived copy as title (link)
  6. ^ Электронный справочник NIST / SEMATECH по статистическим методам: одноэкспоненциальное сглаживание в Национальном институте стандартов и технологий
  7. ^ Маклорена серии для IS
  8. ^ Это означает, и ряд Тейлора изподходов.
  9. ^ журнал е (0,001) / 2 = -3,45
  10. ^ См. Следующую ссылку для доказательства.
  11. ^ Знаменатель на стороне левой руки должно быть единство, а числитель станет правая ( геометрическая прогрессия ),.
  12. ^ Поскольку (1 +  x / n ) n стремится к пределу e x для больших n .
  13. ^ Финч, Тони. «Инкрементальный расчет взвешенного среднего и дисперсии» (PDF) . Кембриджский университет . Проверено 19 декабря 2019 .
  14. ↑ Скользящее среднее по 15 пунктам Спенсера - от Wolfram MathWorld
  15. Роб Дж. Хайндман. « Скользящие средние ». 2009-11-08. Проверено 20 августа 2020 г.
  16. ^ «Эффективная бегущая медиана с использованием индексируемого Skiplist« Рецепты Python «ActiveState Code» » .
  17. ^ GR Arce, "Нелинейная обработка сигналов: статистический подход", Wiley: Нью-Джерси, США, 2005.

Внешние ссылки [ править ]