Тема стандартных ошибок, согласующихся с гетероскедастичностью ( HC ), возникает в статистике и эконометрике в контексте линейной регрессии и анализа временных рядов . Они также известны как стандартные ошибки Eicker-Huber-White (также стандартные ошибки Huber-белой или стандартные ошибки White ), [1] , чтобы отметить вклад Фредхеого Эикер , [2] Питер Дж Huber , [3] и Halbert White . [4]
При моделировании регрессии и временных рядов в базовых формах моделей используется предположение, что ошибки или возмущения u i имеют одинаковую дисперсию во всех точках наблюдения. Когда это не так, ошибки считаются гетероскедастичными или имеют гетероскедастичность , и это поведение будет отражено в остатках, оцененных на основе подобранной модели. Стандартные ошибки, согласованные с гетероскедастичностью, используются для подбора модели, которая действительно содержит гетероскедастические остатки. Первый такой подход был предложен Хубером (1967), и с тех пор были разработаны дальнейшие усовершенствованные процедуры для данных поперечного сечения, данных временных рядов и оценки GARCH .
Стандартные ошибки, согласующиеся с гетероскедастичностью, которые отличаются от классических стандартных ошибок, являются индикатором неправильной спецификации модели. Эта ошибка в спецификации не исправляется простой заменой классического стандартными ошибками, согласованными с гетероскедастичностью; для всех представляющих интерес количеств, кроме нескольких, неправильная спецификация может привести к смещению. В большинстве случаев проблему следует найти и устранить. [5] Другие типы корректировок стандартных ошибок, такие как кластерные стандартные ошибки , могут рассматриваться как расширения стандартных ошибок HC.
История [ править ]
Гетероскедастичность-согласованная стандартные ошибки вводятся Фредхелм Эикером , [6] [7] и популяризировал в эконометрике по Halbert White .
Проблема [ править ]
Предположим, что мы изучаем модель линейной регрессии.
где X - вектор независимых переменных, а β - вектор-столбец k × 1 параметров, подлежащих оценке.
В обычных наименьших квадратов (МНК) оценщик
где обозначает матрицу суммированных значений, наблюдаемых в данных.
Если ошибки выборки имеют одинаковую дисперсию σ 2 и некоррелированы , то оценка β методом наименьших квадратов является СИНИМ (наилучшая линейная несмещенная оценка), а ее дисперсия оценивается с помощью
где - остатки регрессии.
Когда члены ошибки не имеют постоянной дисперсии (т. Е. Предположение неверно), оценщик OLS теряет свои желаемые свойства. Формулу дисперсии теперь нельзя упростить:
куда
Хотя точечная оценка OLS остается несмещенной, она не является «лучшей» в смысле наличия минимальной среднеквадратичной ошибки, а оценка дисперсии OLS не обеспечивает согласованной оценки дисперсии оценок OLS.
Однако для любой нелинейной модели (например, логит- модели и пробит- модели) гетероскедастичность имеет более серьезные последствия: оценки максимального правдоподобия параметров будут смещены (в неизвестном направлении), а также непоследовательны (если функция правдоподобия не определена). изменен для правильного учета точной формы гетероскедастичности). [8] [9] Как указал Грин , «простое вычисление устойчивой ковариационной матрицы для иначе несовместимой оценки не дает ей выгоды». [10]
Решение [ править ]
Если ошибки регрессии независимы, но имеют различную дисперсию σ i 2 , то это можно оценить с помощью . Это дает оценку Уайта (1980), часто называемую HCE (оценка, согласованная с гетероскедастичностью):
где, как указано выше, обозначает матрицу сложенных значений из данных. Оценка может быть получена с помощью обобщенного метода моментов (GMM).
Обратите внимание , что также часто обсуждается в литературе ( в том числе и в самой статье Уайта) является ковариационная матрица из -consistent предельного распределения:
куда
и
Таким образом,
и
Какая именно ковариационная матрица вызывает беспокойство, зависит от контекста.
Альтернативные оценки были предложены в MacKinnon & White (1985), которые корректируют неравные дисперсии остатков регрессии из-за разного кредитного плеча . [11] В отличие от асимптотической оценки Уайта, их оценки несмещены, когда данные гомоскедастичны.
См. Также [ править ]
- Дельта-метод
- Обобщенный метод наименьших квадратов
- Обобщенные оценочные уравнения
- Взвешенный метод наименьших квадратов , альтернативная формулировка
- Белый тест - тест на наличие гетероскедастичности.
- Оценка Ньюи – Уэста
- Оценка квази-максимального правдоподобия
Программное обеспечение [ править ]
- EViews : EViews версии 8 предлагает три различных метода для робастных наименьших квадратов: M-оценка (Huber, 1973), S-оценка (Rousseeuw and Yohai, 1984) и MM-оценка (Yohai 1987). [12]
- MATLAB : см.
hac
Функцию в наборе инструментов эконометрики. [13] - Python : пакет Statsmodel предлагает различные надежные стандартные оценки ошибок, дополнительные описания см. В statsmodels.regression.linear_model.RegressionResults
- R :
vcovHC()
команда из пакета сэндвичей . [14] [15] - Крысы : robusterrors опция доступна во многих регрессии и оптимизации команд ( linreg , НМНК и т.д.).
- Stata :
robust
опция, применимая во многих процедурах, основанных на псевдо-правдоподобии. [16] - Гретль : опция
--robust
для нескольких команд оценки (например,ols
) в контексте набора данных сечения дает устойчивые стандартные ошибки. [17]
Ссылки [ править ]
- ^ Kleiber, C .; Зейлис, А. (2006). «Прикладная эконометрика с R» (PDF) . Конференция UseR-2006 . Архивировано из оригинального (PDF) 22 апреля 2007 года.
- ^ Eicker, Friedhelm (1967). «Предельные теоремы для регрессии с неравными и зависимыми ошибками» . Труды Пятого симпозиума Беркли по математической статистике и вероятности . С. 59–82. Руководство по ремонту 0214223 . Zbl 0217.51201 .
- ^ Хубер, Питер Дж. (1967). «Поведение оценок максимального правдоподобия в нестандартных условиях» . Труды Пятого симпозиума Беркли по математической статистике и вероятности . С. 221–233. Руководство по ремонту 0216620 . Zbl 0212.21504 .
- ^ White, Halbert (1980). «Матрица оценки согласованной с гетероскедастичностью ковариации и прямой тест на гетероскедастичность». Econometrica . 48 (4): 817–838. CiteSeerX 10.1.1.11.7646 . DOI : 10.2307 / 1912934 . JSTOR 1912934 . Руководство по ремонту 0575027 .
- ^ Король, Гэри; Робертс, Маргарет Э. (2015). «Насколько надежные стандартные ошибки выявляют методологические проблемы, которые они не исправляют, и что с этим делать» . Политический анализ . 23 (2): 159–179. DOI : 10,1093 / панорамирование / mpu015 . ISSN 1047-1987 .
- ^ "Асимптотическая нормальность и согласованность оценок наименьших квадратов для семейств линейных регрессий" . Cite journal requires
|journal=
(help) - ^ «Предельные теоремы для регрессий с неравными и зависимыми ошибками» . Cite journal requires
|journal=
(help) - ↑ Джайлз, Дэйв (8 мая 2013 г.). «Робастные стандартные ошибки для нелинейных моделей» . Эконометрика Beat .
- ^ Гуггисберг, Майкл (2019). «Неправильно указанные модели дискретного выбора и стандартные ошибки Хубера-Уайта». Журнал эконометрических методов . 8 (1). DOI : 10,1515 / ДСР-2016-0002 .
- ^ Грин, Уильям Х. (2012). Эконометрический анализ (седьмое изд.). Бостон: образование Пирсона. С. 692–693. ISBN 978-0-273-75356-8.
- ^ Маккиннон, Джеймс Г .; Белый, Халберт (1985). "Некоторые гетероскедастично-согласованные матричные оценки ковариаций с улучшенными свойствами конечной выборки". Журнал эконометрики . 29 (3): 305–325. DOI : 10.1016 / 0304-4076 (85) 90158-7 . hdl : 10419/189084 .
- ^ http://www.eviews.com/EViews8/ev8ecrobust_n.html
- ^ "Гетероскедастичность и автокорреляционные согласованные оценки ковариации" . Инструменты эконометрики .
- ^ сэндвич: робастные оценщики ковариационной матрицы
- ^ Клейбер, Кристиан; Зейлейс, Ахим (2008). Прикладная эконометрика с R . Нью-Йорк: Спрингер. С. 106–110. ISBN 978-0-387-77316-2.
- ^ См. Интерактивную справку по_robustпараметрам иregressкомандам.
- ^ «Робастная оценка ковариационной матрицы» (PDF) . Руководство пользователя Gretl, глава 19 .
Дальнейшее чтение [ править ]
- Фридман, Дэвид А. (2006). «О так называемой« сэндвичевой оценке Хубера »и« устойчивых стандартных ошибках » ». Американский статистик . 60 (4): 299–302. DOI : 10.1198 / 000313006X152207 .
- Хардин, Джеймс У. (2003). «Оценка дисперсии сэндвича». В Fomby, Thomas B .; Хилл, Р. Картер (ред.). Оценка максимальной вероятности моделей с ошибками: двадцать лет спустя . Амстердам: Эльзевир. С. 45–74. ISBN 0-7623-1075-8.
- Хейс, Эндрю Ф .; Цай, Ли (2007). «Использование оценок стандартной ошибки, согласованной с гетероскедастичностью, в регрессии OLS: введение и программная реализация» . Методы исследования поведения . 39 (4): 709–722. DOI : 10.3758 / BF03192961 . PMID 18183883 .
- Кинг, Гэри ; Робертс, Маргарет Э. (2015). «Насколько надежные стандартные ошибки выявляют методологические проблемы, которые они не исправляют, и что с этим делать» . Политический анализ . 23 (2): 159–179. DOI : 10,1093 / панорамирование / mpu015 .
- Вулдридж, Джеффри М. (2009). "Гетероскедастичность-робастный вывод после оценки МНК". Вводная эконометрика: современный подход (четвертое изд.). Мейсон: Юго-Западный. С. 265–271. ISBN 978-0-324-66054-8.