Среднеквадратичная ошибка прогноза

В статистике средний квадрат ошибки предсказания или средний квадрат ошибки предсказания одного сглаживания или аппроксимации кривой процедуры является ожидаемое значение квадрата разности между подобранными значениями подразумевается прогнозирующей функции ${\ displaystyle {\ widehat {g}}}$ и значения (ненаблюдаемой) функции g . Это обратная мера объяснительной силы ${\ displaystyle {\ widehat {g}},}$ и может использоваться в процессе перекрестной проверки оценочной модели.

Если процедура сглаживания или аппроксимации имеет матрицу проекции (т.е. матрицу шляпы) L , которая отображает вектор наблюдаемых значений ${\ displaystyle y}$ к вектору прогнозируемых значений ${\ displaystyle {\ hat {y}}}$ через ${\ displaystyle {\ hat {y}} = Ly,}$ тогда

{\ displaystyle \ operatorname {MSPE} (L) = \ operatorname {E} \ left [\ left (g (x_ {i}) - {\ widehat {g}} (x_ {i}) \ right) ^ {2 }\верно].}

MSPE можно разложить на два члена: среднее квадратов систематических ошибок подобранных значений и среднее значение дисперсии подобранных значений:

{\ displaystyle n \ cdot \ operatorname {MSPE} (L) = \ sum _ {i = 1} ^ {n} \ left (\ operatorname {E} \ left [{\ widehat {g}} (x_ {i}) ) \ right] -g (x_ {i}) \ right) ^ {2} + \ sum _ {i = 1} ^ {n} \ operatorname {var} \ left [{\ widehat {g}} (x_ { Я прав].}

Знание g требуется для точного расчета MSPE; в противном случае его можно оценить.

Вычисление MSPE по данным вне выборки

Среднеквадратичная ошибка прогноза может быть вычислена точно в двух контекстах. Во- первых, с выборки данных длины п , то аналитик данных может запустить регрессии по сравнению только д точек данных (с д < п ), сдерживая другие п - д точек данных с конкретной целью их использования для вычисления оценка MSPE модели вне выборки (т. е. без использования данных, которые использовались в процессе оценки модели). Поскольку процесс регрессии адаптирован к q точкам в выборке, обычно MSPE в выборке будет меньше, чем MSPE вне выборки, вычисленной по n - q точкам задержки . Если увеличение MSPE вне выборки по сравнению с в выборке относительно невелико, это приводит к положительному обзору модели. А если нужно сравнить две модели, то модель с более низким значением MSPE по сравнению с n - q точками данных вне выборки будет рассматриваться более благоприятно, независимо от относительных характеристик моделей в выборке. MSPE вне выборки в этом контексте является точным для точек данных вне выборки, по которым он был вычислен, но является просто оценкой MSPE модели для в основном ненаблюдаемой популяции, из которой были взяты данные.

Во-вторых, со временем аналитику данных может стать доступно больше данных, и тогда MSPE может быть вычислен на основе этих новых данных.

Оценка MSPE по населению

Когда модель была оценена по всем доступным данным без каких-либо задержек, MSPE модели по всей совокупности в основном ненаблюдаемых данных можно оценить следующим образом.

Для модели ${\ Displaystyle у_ {я} = г (х_ {я}) + \ сигма \ varepsilon _ {я}}$ где ${\ Displaystyle \ varepsilon _ {я} \ sim {\ mathcal {N}} (0,1)}$ можно написать

{\ Displaystyle п \ cdot \ OperatorName {MSPE} (L) = g ^ {\ text {T}} (IL) ^ {\ text {T}} (IL) g + \ sigma ^ {2} \ operatorname {tr} \ left [L ^ {\ text {T}} L \ right].}

При использовании значений данных в выборке первый член справа эквивалентен

{\ displaystyle \ sum _ {i = 1} ^ {n} \ left (\ operatorname {E} \ left [g (x_ {i}) - {\ widehat {g}} (x_ {i}) \ right]) \ right) ^ {2} = \ operatorname {E} \ left [\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i}) \ right) ^ {2} \ right] - \ sigma ^ {2} \ operatorname {tr} \ left [\ left (IL \ right) ^ {T} \ left (IL \ right) \ right].}

Таким образом,

{\ displaystyle n \ cdot \ operatorname {MSPE} (L) = \ operatorname {E} \ left [\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}}) (x_ {i}) \ right) ^ {2} \ right] - \ sigma ^ {2} \ left (n- \ operatorname {tr} \ left [L \ right] \ right).}

Если ${\ displaystyle \ sigma ^ {2}}$ известен или хорошо оценен ${\ Displaystyle {\ widehat {\ sigma}} ^ {2}}$ , становится возможным оценить MSPE как

{\ displaystyle n \ cdot \ operatorname {\ widehat {MSPE}} (L) = \ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i }) \ right) ^ {2} - {\ widehat {\ sigma}} ^ {2} \ left (n- \ operatorname {tr} \ left [L \ right] \ right).}

Колин Мэллоуз поддержал этот метод при построении своей статистики выбора модели C _p , которая является нормализованной версией оцененной MSPE:

{\ displaystyle C_ {p} = {\ frac {\ sum _ {i = 1} ^ {n} \ left (y_ {i} - {\ widehat {g}} (x_ {i}) \ right) ^ { 2}} {{\ widehat {\ sigma}} ^ {2}}} - n + 2p.}

где p количество оцениваемых параметров p и ${\ Displaystyle {\ widehat {\ sigma}} ^ {2}}$ вычисляется из версии модели, включающей все возможные регрессоры. Это завершает доказательство.

Смотрите также

дальнейшее чтение

Пиндик, Роберт С .; Рубинфельд, Даниэль Л. (1991). «Прогнозирование с использованием моделей временных рядов». Эконометрические модели и экономические прогнозы (3-е изд.). Нью-Йорк: Макгроу-Хилл. С. 516–535 . ISBN 0-07-050098-3.