В статистике средний квадрат ошибки предсказания или средний квадрат ошибки предсказания одного сглаживания или аппроксимации кривой процедуры является ожидаемое значение квадрата разности между подобранными значениями подразумевается прогнозирующей функциии значения (ненаблюдаемой) функции g . Это обратная мера объяснительной силыи может использоваться в процессе перекрестной проверки оценочной модели.
Если процедура сглаживания или аппроксимации имеет матрицу проекции (т.е. матрицу шляпы) L , которая отображает вектор наблюдаемых значений к вектору прогнозируемых значений через тогда
MSPE можно разложить на два члена: среднее квадратов систематических ошибок подобранных значений и среднее значение дисперсии подобранных значений:
Знание g требуется для точного расчета MSPE; в противном случае его можно оценить.
Вычисление MSPE по данным вне выборки
Среднеквадратичная ошибка прогноза может быть вычислена точно в двух контекстах. Во- первых, с выборки данных длины п , то аналитик данных может запустить регрессии по сравнению только д точек данных (с д < п ), сдерживая другие п - д точек данных с конкретной целью их использования для вычисления оценка MSPE модели вне выборки (т. е. без использования данных, которые использовались в процессе оценки модели). Поскольку процесс регрессии адаптирован к q точкам в выборке, обычно MSPE в выборке будет меньше, чем MSPE вне выборки, вычисленной по n - q точкам задержки . Если увеличение MSPE вне выборки по сравнению с в выборке относительно невелико, это приводит к положительному обзору модели. А если нужно сравнить две модели, то модель с более низким значением MSPE по сравнению с n - q точками данных вне выборки будет рассматриваться более благоприятно, независимо от относительных характеристик моделей в выборке. MSPE вне выборки в этом контексте является точным для точек данных вне выборки, по которым он был вычислен, но является просто оценкой MSPE модели для в основном ненаблюдаемой популяции, из которой были взяты данные.
Во-вторых, со временем аналитику данных может стать доступно больше данных, и тогда MSPE может быть вычислен на основе этих новых данных.
Оценка MSPE по населению
Когда модель была оценена по всем доступным данным без каких-либо задержек, MSPE модели по всей совокупности в основном ненаблюдаемых данных можно оценить следующим образом.
Для модели где можно написать
При использовании значений данных в выборке первый член справа эквивалентен
Таким образом,
Если известен или хорошо оценен , становится возможным оценить MSPE как
Колин Мэллоуз поддержал этот метод при построении своей статистики выбора модели C p , которая является нормализованной версией оцененной MSPE:
где p количество оцениваемых параметров p ивычисляется из версии модели, включающей все возможные регрессоры. Это завершает доказательство.
Смотрите также
дальнейшее чтение
- Пиндик, Роберт С .; Рубинфельд, Даниэль Л. (1991). «Прогнозирование с использованием моделей временных рядов». Эконометрические модели и экономические прогнозы (3-е изд.). Нью-Йорк: Макгроу-Хилл. С. 516–535 . ISBN 0-07-050098-3.