Обобщенный метод наименьших квадратов

В статистике , обобщенные наименьших квадратов ( GLS ) представляет собой метод оценки неизвестных параметров в линейной регрессии модели , когда существует определенная степень корреляции между остатками в регрессионной модели . В этих случаях обычные методы наименьших квадратов и взвешенных наименьших квадратов могут быть статистически неэффективными или даже давать вводящие в заблуждение выводы . GLS был впервые описан Александром Эйткеном в 1936 году. ^[1]

Схема метода

В стандартных моделях линейной регрессии мы наблюдаем данные ${\ displaystyle \ {y_ {i}, x_ {ij} \} _ {i = 1, \ dots, n, j = 2, \ dots, k}}$ по n статистическим единицам . Значения ответа помещаются в вектор ${\ displaystyle \ mathbf {y} = \ left (y_ {1}, \ dots, y_ {n} \ right) ^ {\ mathsf {T}}}$ , а значения предикторов помещаются в матрицу дизайна ${\ displaystyle \ mathbf {X} = \ left (\ mathbf {x} _ {1} ^ {\ mathsf {T}}, \ dots, \ mathbf {x} _ {n} ^ {\ mathsf {T}} \ right) ^ {\ mathsf {T}}}$ , где ${\ displaystyle \ mathbf {x} _ {i} = \ left (1, x_ {i2}, \ dots, x_ {ik} \ right)}$ - вектор k переменных-предикторов (включая константу) для i- го блока. Модель заставляет условное среднее значение из ${\ displaystyle \ mathbf {y}}$ дано ${\ displaystyle \ mathbf {X}}$ быть линейной функцией ${\ displaystyle \ mathbf {X}}$ , и предполагает условную дисперсию члена ошибки, заданного ${\ displaystyle \ mathbf {X}}$ является известной неособой ковариационной матрицей ${\ displaystyle \ mathbf {\ Omega}}$ . Обычно это записывается как

{\ displaystyle \ mathbf {y} = \ mathbf {X} \ mathbf {\ beta} + \ mathbf {\ varepsilon}, \ qquad \ operatorname {E} [\ varepsilon \ mid \ mathbf {X}] = 0, \ \ operatorname {Cov} [\ varepsilon \ mid \ mathbf {X}] = \ mathbf {\ Omega}.}

Здесь ${\ displaystyle \ beta \ in \ mathbb {R} ^ {k}}$ представляет собой вектор неизвестных констант (известных как «коэффициенты регрессии»), которые необходимо оценить на основе данных.

Предполагать ${\ displaystyle \ mathbf {b}}$ это примерная оценка для ${\ displaystyle \ mathbf {\ beta}}$ . Тогда остаточный вектор для ${\ displaystyle \ mathbf {b}}$ будет ${\ displaystyle \ mathbf {y} - \ mathbf {X} \ mathbf {b}}$ . Оценки методом обобщенных наименьших квадратов ${\ displaystyle \ mathbf {\ beta}}$ минимизируя квадрат длины Махаланобиса этого остаточного вектора:

{\ displaystyle \ mathbf {\ hat {\ beta}} = {\ underset {b} {\ operatorname {argmin}}} \, (\ mathbf {y} - \ mathbf {X} \ mathbf {b}) ^ { \ mathsf {T}} \, \ mathbf {\ Omega} ^ {- 1} (\ mathbf {y} - \ mathbf {X} \ mathbf {b}),}

Поскольку цель - квадратичная форма от ${\ displaystyle \ mathbf {b}}$ , оценка имеет явную формулу:

{\ displaystyle \ mathbf {\ hat {\ beta}} = \ left (\ mathbf {X} ^ {\ mathsf {T}} \ mathbf {\ Omega} ^ {- 1} \ mathbf {X} \ right) ^ {-1} \ mathbf {X} ^ {\ mathsf {T}} \ mathbf {\ Omega} ^ {- 1} \ mathbf {y}.}

Характеристики

Оценщик GLS является несмещенным , непротиворечивым , эффективным и асимптотически нормальным с ${\ displaystyle \ operatorname {E} [{\ hat {\ beta}} \ mid \ mathbf {X}] = \ beta}$ а также ${\ displaystyle \ operatorname {Cov} [{\ hat {\ beta}} \ mid \ mathbf {X}] = (\ mathbf {X} ^ {\ mathsf {T}} \ Omega ^ {- 1} \ mathbf { X}) ^ {- 1}}$ . GLS эквивалентен применению обычного метода наименьших квадратов к линейно преобразованной версии данных. Чтобы увидеть это, фактор ${\ Displaystyle \ mathbf {\ Omega} = \ mathbf {C} \ mathbf {C} ^ {\ mathsf {T}}}$ , например, используя разложение Холецкого . Тогда, если мы предварительно умножим обе части уравнения ${\ displaystyle \ mathbf {y} = \ mathbf {X} \ mathbf {\ beta} + \ mathbf {\ varepsilon}}$ от ${\ displaystyle \ mathbf {C} ^ {- 1}}$ , получаем эквивалентную линейную модель ${\ Displaystyle \ mathbf {y} ^ {*} = \ mathbf {X} ^ {*} \ mathbf {\ beta} + \ mathbf {\ varepsilon} ^ {*}}$ где ${\ Displaystyle \ mathbf {y} ^ {*} = \ mathbf {C} ^ {- 1} \ mathbf {y}}$ , ${\ Displaystyle \ mathbf {X} ^ {*} = \ mathbf {C} ^ {- 1} \ mathbf {X}}$ , а также ${\ Displaystyle \ mathbf {\ varepsilon} ^ {*} = \ mathbf {C} ^ {- 1} \ mathbf {\ varepsilon}}$ . В этой модели ${\ displaystyle \ operatorname {Var} [\ varepsilon ^ {*} \ mid \ mathbf {X}] = \ mathbf {C} ^ {- 1} \ mathbf {\ Omega} \ left (\ mathbf {C} ^ { -1} \ right) ^ {\ mathsf {T}} = \ mathbf {I}}$ , где ${\ displaystyle \ mathbf {I}}$ - единичная матрица . Таким образом, мы можем эффективно оценить ${\ displaystyle \ mathbf {\ beta}}$ путем применения обыкновенных наименьших квадратов (МНК) к преобразованным данным, что требует минимизации

{\ displaystyle \ left (\ mathbf {y} ^ {*} - \ mathbf {X} ^ {*} \ mathbf {\ beta} \ right) ^ {\ mathsf {T}} (\ mathbf {y} ^ { *} - \ mathbf {X} ^ {*} \ mathbf {\ beta}) = (\ mathbf {y} - \ mathbf {X} \ mathbf {b}) ^ {\ mathsf {T}} \, \ mathbf {\ Omega} ^ {- 1} (\ mathbf {y} - \ mathbf {X} \ mathbf {b}).}

Это приводит к стандартизации шкалы ошибок и их «декорреляции». Поскольку OLS применяется к данным с гомоскедастическими ошибками, применяется теорема Гаусса – Маркова , и поэтому оценка GLS является наилучшей линейной несмещенной оценкой для β .

Взвешенный метод наименьших квадратов

Частный случай GLS, называемый взвешенным методом наименьших квадратов (WLS), возникает, когда все недиагональные элементы Ω равны 0. Эта ситуация возникает, когда дисперсии наблюдаемых значений неравны (т.е. присутствует гетероскедастичность ), но когда между ними нет корреляции. наблюдаемые отклонения. Вес для единицы i пропорционален обратной величине дисперсии ответа для единицы i . ^[2]

Возможные обобщенные методы наименьших квадратов

Если ковариация ошибок ${\ displaystyle \ Omega}$ неизвестно, можно получить непротиворечивую оценку ${\ displaystyle \ Omega}$ , сказать ${\ displaystyle {\ widehat {\ Omega}}}$ , ^[3] с использованием реализуемой версии GLS, известной как допустимая обобщенная оценка методом наименьших квадратов ( FGLS ). В FGLS моделирование осуществляется в два этапа: (1) модель оценивается с помощью OLS или другого согласованного (но неэффективного) средства оценки, а остатки используются для построения согласованного средства оценки ковариационной матрицы ошибок (для этого часто требуется для изучения модели с добавлением дополнительных ограничений, например, если ошибки следуют процессу временных рядов, статистику обычно требуются некоторые теоретические допущения по этому процессу, чтобы гарантировать, что доступна непротиворечивая оценка); и (2) используя согласованную оценку ковариационной матрицы ошибок, можно реализовать идеи GLS.

В то время как GLS более эффективен, чем OLS при гетероскедастичности или автокорреляции , это неверно для FGLS. Возможная оценка, при условии, что матрица ковариации ошибок оценивается последовательно, асимптотически более эффективна, но для выборки малого или среднего размера она может быть на самом деле менее эффективной, чем OLS. Вот почему некоторые авторы предпочитают использовать OLS и переформулировать свои выводы, просто рассматривая альтернативную оценку дисперсии оценки, устойчивую к гетероскедастичности или последовательной автокорреляции. Но для больших выборок FGLS предпочтительнее OLS при гетероскедастичности или серийной корреляции. ^[3] ^[4] Предупреждение: оценка FGLS не всегда согласована. Один случай, когда FGLS может быть непоследовательным, - это наличие индивидуальных фиксированных эффектов. ^[5]

В общем, этот оценщик имеет свойства, отличные от GLS. Для больших выборок (т. Е. Асимптотически) все свойства (при соответствующих условиях) являются общими по отношению к GLS, но для конечных выборок свойства оценок FGLS неизвестны: они сильно различаются для каждой конкретной модели и, как правило, их точные распределения не могут быть получены аналитически. Для конечных выборок FGLS может быть даже менее эффективным, чем OLS в некоторых случаях. Таким образом, хотя GLS можно сделать осуществимым, не всегда разумно применять этот метод, когда образец небольшой. Метод, который иногда используется для повышения точности оценок в конечных выборках, заключается в повторении, то есть взятии остатков из FGLS для обновления оценки ковариации ошибок, а затем обновлении оценки FGLS, итеративно применяя ту же идею до тех пор, пока оценки не изменятся меньше, чем некоторые толерантность. Но этот метод не обязательно значительно повышает эффективность оценщика, если исходная выборка была небольшой. Разумным вариантом, когда выборки не слишком большие, является применение МНК, но отказ от классической оценки дисперсии.

{\ Displaystyle \ sigma ^ {2} * (X'X) ^ {- 1}}

(что несовместимо в этой структуре) и с использованием оценки HAC (Heteroskedasticity and Autocorrelation Consistent). Например, в контексте автокорреляции мы можем использовать оценку Бартлетта (часто известную как оценка Ньюи-Уэста, поскольку эти авторы популяризировали использование этой оценки среди эконометристов в своей статье Econometrica 1987 года ), а в гетероскедастическом контексте мы можем использовать оценку Эйкера-Уайта. . Этот подход намного безопаснее, и это подходящий путь, если выборка не большая, а «большой» иногда является скользкой проблемой (например, если распределение ошибок асимметрично, требуемая выборка будет намного больше).

В обычных наименьших квадратов (МНК) оценка вычисляется , как обычно,

{\ displaystyle {\ widehat {\ beta}} _ {\ text {OLS}} = (X'X) ^ {- 1} X'y}

и оценки остатков ${\ displaystyle {\ widehat {u}} _ {j} = (YX {\ widehat {\ beta}} _ {\ text {OLS}}) _ {j}}$ построены.

Для простоты рассмотрим модель гетероскедастических ошибок. Предположим, что матрица дисперсии-ковариации ${\ displaystyle \ Omega}$ вектора ошибок диагонален, или, что то же самое, ошибки отдельных наблюдений некоррелированы. Тогда каждая диагональная запись может быть оценена с помощью подобранных остатков ${\ displaystyle {\ widehat {u}} _ {j}}$ так ${\ displaystyle {\ widehat {\ Omega}} _ {OLS}}$ может быть построен

{\ displaystyle {\ widehat {\ Omega}} _ {\ text {OLS}} = \ operatorname {diag} ({\ widehat {\ sigma}} _ {1} ^ {2}, {\ widehat {\ sigma} } _ {2} ^ {2}, \ dots, {\ widehat {\ sigma}} _ {n} ^ {2}).}

Важно отметить, что возведенные в квадрат остатки нельзя использовать в предыдущем выражении; нам нужен оценщик дисперсии ошибок. Для этого мы можем использовать параметрическую модель гетероскедастичности или непараметрическую оценку. Как только этот шаг будет выполнен, мы можем продолжить:

Оценивать ${\ displaystyle \ beta _ {FGLS1}}$ с использованием ${\ displaystyle {\ widehat {\ Omega}} _ {\ text {OLS}}}$ с использованием ^[4] взвешенных наименьших квадратов

{\ displaystyle {\ widehat {\ beta}} _ {FGLS1} = (X '{\ widehat {\ Omega}} _ {\ text {OLS}} ^ {- 1} X) ^ {- 1} X' { \ widehat {\ Omega}} _ {\ text {OLS}} ^ {- 1} y}

Процедуру можно повторять. Первая итерация дается формулой

{\ displaystyle {\ widehat {u}} _ {FGLS1} = YX {\ widehat {\ beta}} _ {FGLS1}}

{\ displaystyle {\ widehat {\ Omega}} _ {FGLS1} = \ operatorname {diag} ({\ widehat {\ sigma}} _ {FGLS1,1} ^ {2}, {\ widehat {\ sigma}} _ {FGLS1,2} ^ {2}, \ dots, {\ widehat {\ sigma}} _ {FGLS1, n} ^ {2})}

{\ displaystyle {\ widehat {\ beta}} _ {FGLS2} = (X '{\ widehat {\ Omega}} _ {FGLS1} ^ {- 1} X) ^ {- 1} X' {\ widehat {\ Омега}} _ {FGLS1} ^ {- 1} y}

Эта оценка ${\ displaystyle {\ widehat {\ Omega}}}$ можно повторить до сходимости.

В условиях регулярности любая оценка FGLS (или оценка любой из ее итераций, если мы повторяем конечное число раз) асимптотически распределена как

{\ displaystyle {\ sqrt {n}} ({\ hat {\ beta}} _ {FGLS} - \ beta) \ {\ xrightarrow {d}} \ {\ mathcal {N}} \! \ left (0, \, V \ right).}

где n - размер выборки, а

{\ Displaystyle V = \ OperatorName {p-lim} (X '\ Omega ^ {- 1} X / T)}

здесь p-lim означает предел вероятности

Смотрите также

дальнейшее чтение

Амемия, Такеши (1985). «Обобщенная теория наименьших квадратов» . Продвинутая эконометрика . Издательство Гарвардского университета. ISBN 0-674-00560-0.
Джонстон, Джон (1972). «Обобщенные наименьшие квадраты» . Эконометрические методы (второе изд.). Нью-Йорк: Макгроу-Хилл. С. 208–242.
Кмента, Ян (1986). «Обобщенная модель линейной регрессии и ее приложения» . Элементы эконометрики (второе изд.). Нью-Йорк: Макмиллан. С. 607–650. ISBN 0-472-10886-7.

[1] Перейти ↑ Aitken, AC (1936). «О методах наименьших квадратов и линейных комбинациях наблюдений». Труды Королевского общества Эдинбурга . 55 : 42–48.

[2] Струтц, Т. (2016). Подгонка данных и неопределенность (практическое введение в метод взвешенных наименьших квадратов и другие аспекты) . Springer Vieweg. ISBN 978-3-658-11455-8., Глава 3

[Baltagi2008-3] Baltagi, BH (2008). Эконометрика (4-е изд.). Нью-Йорк: Спрингер.

[Greene2003-4] а ^б Грин, WH (2003). Эконометрический анализ (5-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Prentice Hall.

[5] Хансен, Кристиан Б. (2007). «Обобщенный вывод наименьших квадратов в панельных и многоуровневых моделях с последовательной корреляцией и фиксированными эффектами». Журнал эконометрики . 140 (2): 670–694. DOI : 10.1016 / j.jeconom.2006.07.011 .

[1]