Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , то средняя абсолютная ошибка масштабируется ( MASE ) является мерой точности в прогнозах . Это средняя абсолютная ошибка значений прогноза, деленная на среднюю абсолютную ошибку одношагового наивного прогноза внутри выборки. Он был предложен в 2005 году статистиком Робом Дж. Хайндманом и профессором Decision Sciences Энн Б. Келер, которые описали его как «общеприменимое измерение точности прогноза без проблем, наблюдаемых в других измерениях». [1] Средняя абсолютная масштабированная ошибка имеет благоприятные свойства по сравнению с другими методами расчета ошибок прогноза , такими как среднеквадратичное отклонение., и поэтому рекомендуется для определения сравнительной точности прогнозов. [2]

Обоснование [ править ]

Средняя абсолютная масштабированная ошибка имеет следующие желательные свойства: [3]

  1. Масштабная инвариантность : средняя абсолютная масштабированная ошибка не зависит от масштаба данных, поэтому может использоваться для сравнения прогнозов по наборам данных с разными масштабами.
  2. Предсказуемое поведение как  : Показатели точности прогноза в процентах, такие как средняя абсолютная процентная ошибка (MAPE), основаны на делении , искажая распределение MAPE для значений, близких или равных 0. Это особенно проблематично для наборов данных, шкалы которых не имеют значимый 0, такой как температура в градусах Цельсия или Фаренгейта, и для наборов данных периодического спроса, когда встречается часто.
  3. Симметрия: средняя абсолютная масштабированная ошибка одинаково наказывает как положительные, так и отрицательные ошибки прогнозов, а также наказывает ошибки как в больших, так и в малых прогнозах. Напротив, MAPE и средняя абсолютная процентная ошибка (MdAPE) не соответствуют обоим этим критериям, в то время как «симметричные» sMAPE и sMdAPE [4] не соответствуют второму критерию.
  4. Интерпретируемость: среднюю абсолютную масштабированную ошибку можно легко интерпретировать, поскольку значения, превышающие единицу, указывают на то, что одношаговые прогнозы по выборке, полученные с помощью наивного метода, работают лучше, чем рассматриваемые прогнозные значения.
  5. Асимптотическая нормальность MASE: тест Дибольда-Мариано для одношаговых прогнозов используется для проверки статистической значимости разницы между двумя наборами прогнозов. [5] [6] [7] Для выполнения проверки гипотез с использованием статистики критерия Дибольда-Мариано желательно для , где - значение статистики критерия. Эмпирически показано, что статистика DM для MASE аппроксимирует это распределение, в то время как средняя относительная абсолютная ошибка (MRAE), MAPE и sMAPE нет. [2]


Несезонный временной ряд [ править ]

Для несезонного временного ряда [8] средняя абсолютная масштабированная ошибка оценивается как

[3]

где числитель e j - ошибка прогноза для данного периода (где J - количество прогнозов), определяемая как фактическое значение ( Y j ) минус значение прогноза ( F j ) для этого периода: e j  =  Y j  -  F j , а знаменатель - это средняя абсолютная ошибка одношагового " метода наивного прогноза " на обучающем наборе (здесь определенном как t = 1..T ) [8], который использует фактическое значение за предыдущий период как прогноз: F t  =  Yт -1 [9]

Сезонный временной ряд [ править ]

Для сезонных временных рядов средняя абсолютная масштабированная ошибка оценивается аналогично методу для несезонных временных рядов:

[8]

Основное отличие метода для несезонных временных рядов состоит в том, что знаменатель представляет собой среднюю абсолютную ошибку одношагового « сезонного наивного метода прогноза » на обучающем наборе [8], который использует фактическое значение из предыдущего сезона. в качестве прогноза: F t  =  Y t −m , [9] где m - сезонный период.

Эту безмасштабную метрику ошибок "можно использовать для сравнения методов прогноза по одному ряду, а также для сравнения точности прогнозов между рядами. Эта метрика хорошо подходит для серий с прерывистым спросом [ требуется пояснение ], поскольку она никогда не дает бесконечных или неопределенных значений [ 1], за исключением несущественного случая, когда все исторические данные равны. [3]

При сравнении методов прогнозирования предпочтительным является метод с наименьшим MASE.

См. Также [ править ]

Ссылки [ править ]

  1. ^ a b Hyndman, RJ (2006). «Другой взгляд на меры точности прогнозов», FORESIGHT, выпуск 4 июня 2006 г., стр. 46 [1]
  2. ^ a b Franses, Филип Ганс (01.01.2016). «Примечание о средней абсолютной погрешности шкалы» . Международный журнал прогнозирования . 32 (1): 20–22. DOI : 10.1016 / j.ijforecast.2015.03.008 . hdl : 1765/78815 .
  3. ^ a b c Hyndman, RJ и Koehler AB (2006). «Еще один взгляд на меры точности прогнозов». Международный журнал прогнозирования, том 22, выпуск 4, страницы 679-688. DOI : 10.1016 / j.ijforecast.2006.03.001
  4. ^ Макридакис, Спирос (1993-12-01). «Меры точности: теоретические и практические вопросы». Международный журнал прогнозирования . 9 (4): 527–529. DOI : 10.1016 / 0169-2070 (93) 90079-3 .
  5. ^ Дибольд, Фрэнсис X .; Мариано, Роберто С. (1995). «Сравнение точности прогнозов». Журнал деловой и экономической статистики . 13 (3): 253–263. DOI : 10.1080 / 07350015.1995.10524599 .
  6. ^ Дибольд, Фрэнсис X .; Мариано, Роберто С. (2002). «Сравнение точности прогнозов». Журнал деловой и экономической статистики . 20 (1): 134–144. DOI : 10.1198 / 073500102753410444 .
  7. ^ Diebold, Фрэнсис X. (2015). «Сравнение точности прогнозов, двадцать лет спустя: личный взгляд на использование и злоупотребление тестами Дибольда – Мариано» (PDF) . Журнал деловой и экономической статистики . 33 (1): 1. DOI : 10,1080 / 07350015.2014.983236 .
  8. ^ a b c d "2.5 Оценка точности прогнозов | OTexts" . www.otexts.org . Проверено 15 мая 2016 .
  9. ^ a b Хайндман, Роб и др., Прогнозирование с экспоненциальным сглаживанием: подход к государственному пространству , Берлин: Springer-Verlag, 2008. ISBN 978-3-540-71916-8 .