В статистике модель фиксированных эффектов - это статистическая модель, в которой параметры модели являются фиксированными или неслучайными величинами. Это контрастирует с моделями случайных эффектов и смешанными моделями, в которых все или некоторые параметры модели являются случайными величинами. Во многих приложениях, включая эконометрику [1] и биостатистику [2] [3] [4] [5], модель фиксированных эффектов относится к регрессионной модели, в которой групповые средние значения фиксированы (неслучайны) в отличие от модели случайных эффектов. в котором средние значения группы представляют собой случайную выборку из генеральной совокупности. [6]Как правило, данные можно сгруппировать по нескольким наблюдаемым факторам. Групповые средние могут быть смоделированы как фиксированные или случайные эффекты для каждой группы. В модели фиксированных эффектов среднее значение каждой группы является фиксированной величиной для конкретной группы.
В панельных данных, где существуют продольные наблюдения за одним и тем же предметом, фиксированные эффекты представляют собой средства, зависящие от предмета. В анализе панельных данных термин « оценщик фиксированных эффектов» (также известный как « внутренний оценщик» ) используется для обозначения оценщика для коэффициентов в регрессионной модели, включая эти фиксированные эффекты (один инвариантный по времени перехват для каждого объекта).
Качественное описание
Такие модели помогают контролировать погрешность пропущенных переменных из-за ненаблюдаемой неоднородности, когда эта неоднородность постоянна во времени. Эту неоднородность можно удалить из данных путем проведения различий, например, путем вычитания среднего на уровне группы во времени или путем взятия первой разницы, которая удалит любые инвариантные во времени компоненты модели.
Есть два распространенных предположения об индивидуальном конкретном эффекте: предположение о случайных эффектах и предположение о фиксированных эффектах. Случайных эффектов предположение , что отдельные специфические эффекты коррелируют с независимыми переменными. Предположение о фиксированном эффекте состоит в том, что индивидуальные эффекты коррелируют с независимыми переменными. Если выполняется предположение о случайных эффектах, то оценщик случайных эффектов более эффективен, чем оценщик с фиксированными эффектами. Однако, если это предположение не выполнено, то случайные эффекты оценка не соответствует . Тест Дарбина – Ву – Хаусмана часто используется для различения моделей фиксированных и случайных эффектов. [7] [8]
Формальная модель и предположения
Рассмотрим модель линейных ненаблюдаемых эффектов для наблюдения и периоды времени:
- для а также
Где:
- зависимая переменная, наблюдаемая для отдельных вовремя .
- это временной вариант (количество независимых переменных) вектор регрессора.
- это матрица параметров.
- - ненаблюдаемый инвариантный во времени индивидуальный эффект. Например, врожденные способности отдельных лиц или исторические и институциональные факторы для стран.
- это термин ошибки .
в отличие , нельзя непосредственно наблюдать.
В отличие от модели случайных эффектов, где ненаблюдаемые не зависит от для всех , модель фиксированных эффектов (FE) позволяет коррелировать с матрицей регрессора . Строгая экзогенность по отношению к термину идиосинкразической ошибки по-прежнему требуется.
Статистическая оценка
Оценщик фиксированных эффектов
С не наблюдается, его нельзя напрямую контролировать . Модель FE исключаетуменьшив значение переменных с помощью преобразования внутри :
где , , а также .
С постоянно, и, следовательно, эффект устраняется. Оценщик FE затем получается регрессией OLS на .
Существуют по крайней мере три альтернативы внутренней трансформации с вариациями.
Один из них - добавить фиктивную переменную для каждого индивидуума. (исключая первую особь из-за мультиколлинеарности ). Это численно, но не вычислительно, эквивалентно модели фиксированного эффекта и работает только в том случае, если сумма количества серий и количества глобальных параметров меньше количества наблюдений. [9] Подход с фиктивной переменной особенно требователен к использованию памяти компьютера и не рекомендуется для задач, размер которых превышает объем доступной ОЗУ и компиляции прикладной программы.
Вторая альтернатива - использовать метод последовательных повторений для локальных и глобальных оценок. [10] Этот подход очень подходит для систем с низким объемом памяти, в которых он намного более эффективен с точки зрения вычислений, чем подход с фиктивной переменной.
Третий подход - это вложенная оценка, при которой локальная оценка для отдельных рядов программируется как часть определения модели. [11] Этот подход является наиболее эффективным с точки зрения вычислений и памяти, но он требует хороших навыков программирования и доступа к программному коду модели; правда, его можно запрограммировать даже в SAS. [12] [13]
Наконец, каждая из вышеперечисленных альтернатив может быть улучшена, если оценка для конкретной серии является линейной (в рамках нелинейной модели), и в этом случае прямое линейное решение для отдельной серии может быть запрограммировано как часть определения нелинейной модели. [14]
Оценщик первой разницы
Альтернативой внутреннему преобразованию является преобразование первой разности , которое дает другую оценку. Для:
Оценщик ФД затем получается регрессией OLS на .
Когда , оценки первой разности и фиксированных эффектов численно эквивалентны. Для, это не так. Если условия ошибкиявляются гомоскедастичными без какой - либо серийной корреляции , с фиксированными эффектами оценка является более эффективной , чем первая разностью оценка. Еслиследует случайному блужданию , однако оценка первой разности более эффективна. [15]
Равенство фиксированных эффектов и оценок первой разности при T = 2
Для особого двухпериодного случая (), оценщик фиксированных эффектов (FE) и оценщик первой разности (FD) численно эквивалентны. Это связано с тем, что оценщик FE эффективно «удваивает набор данных», используемый в оценщике FD. Чтобы убедиться в этом, установите, что оценка фиксированных эффектов:
Поскольку каждый можно переписать как , мы перепишем строку как:
Метод Чемберлена
Гэри Чемберлен «s метод, обобщение в оценщик, заменяетс его линейной проекцией на объясняющие переменные. Записывая линейную проекцию как:
это приводит к следующему уравнению:
которое можно оценить по оценке минимального расстояния . [16]
Метод Хаусмана – Тейлора
Требуется более одного регрессора, зависящего от времени () и инвариантный во времени регрессор () и хотя бы один и один которые не коррелируют с .
Разделить а также такие переменные, что где а также не коррелируют с . Нужно.
Оценка через OLS на с использованием а также как инструменты дает непротиворечивую оценку.
Обобщение с входной неопределенностью
Когда есть входная неопределенность для данные, , то значение, а не сумму квадратов остатков, следует минимизировать. [17] Это может быть непосредственно достигнуто с помощью правил замены:
- ,
тогда значения и стандартные отклонения для а также могут быть определены с помощью классического обычного анализа наименьших квадратов и дисперсионно-ковариационной матрицы .
Тестирование фиксированных эффектов (FE) и случайных эффектов (RE)
Мы можем проверить, подходит ли модель фиксированных или случайных эффектов, используя тест Дарбина – Ву – Хаусмана .
- :
- :
Если правда, оба а также последовательны, но только эффективен. Если правда, последовательна и не является.
- где
Тест Хаусмана - это тест спецификации, поэтому большая статистика теста может указывать на то, что могут быть ошибки в переменных (EIV) или наша модель неверно указана. Если предположение FE верно, мы должны обнаружить, что.
Простая эвристика состоит в том, что если может быть EIV.
Смотрите также
- Модель случайных эффектов
- Смешанная модель
- Модель динамических ненаблюдаемых эффектов
- Модель Пуассона с фиксированным эффектом
Заметки
- ^ Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall
- ^ Диггл, Питер Дж .; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. С. 169–171. ISBN 0-19-852484-6.
- ^ Fitzmaurice, Garrett M .; Laird, Nan M .; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: Джон Уайли и сыновья. С. 326–328. ISBN 0-471-21487-6.
- ^ Laird, Nan M .; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. JSTOR 2529876 .
- ^ Гардинер, Джозеф С .; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем разница?». Статистика в медицине . 28 : 221–239. DOI : 10.1002 / sim.3478 .
- ^ Рэмси, Ф., Шафер, Д., 2002. Статистический сыщик: курс методов анализа данных , 2-е изд. Duxbury Press
- ^ Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения . Издательство Кембриджского университета. С. 717–19.
- ^ Нерлов, Марк (2005). Очерки по эконометрике панельных данных . Издательство Кембриджского университета. С. 36–39.
- ^ Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для высотного роста древостоев». Биометрия : 1059–1072.
- ^ Тейт, Дэвид; Cieszewski, Chris J .; Белла, Имре Э. (1986). «Динамика древостоя сосны лесной». Может. J. For. Res . 18 : 1255–1260.
- ^ Страб, Майк; Цешевский, Крис Дж. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса сайта». Лесоводство . 52 (2): 182–186.
- ^ Страб, Майк; Цешевский, Крис Дж. (2003). «Подбор параметров глобального индекса сайта, когда индекс участка или дерева рассматривается как местный мешающий параметр. В: Burkhart HA, редактор. Труды симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г .; Блэксбург, Вирджиния: Политехнический институт Вирджинии. Институт и государственный университет »: 97–107. Цитировать журнал требует
|journal=
( помощь ) - ^ Cieszewski, Chris J .; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки непредвзятых параметров в саморегулирующихся моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.
- ^ Шнуте, Джон; Маккиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Может. J. Fish. Акват. Sci . 41 : 936–953.
- ^ Вулдридж, Джеффри М. (2001). Эконометрический анализ поперечных и панельных данных . MIT Press. стр. 279 -291. ISBN 978-0-262-23219-7.
- ^ Чемберлен, Гэри (1984). «Глава 22 Панельные данные». 2 : 1247–1318. DOI : 10.1016 / S1573-4412 (84) 02014-6 . ISSN 1573-4412 . Цитировать журнал требует
|journal=
( помощь ) - ^ Рен, Бин; Донг, Руобин; Эспозито, Томас М .; Пуэйо, Лоран; Дебес, Джон Х .; Poteet, Charles A .; Шоке, Элоди; Бенисти, Мириам; Чан, Юджин; Грэди, Кэрол А .; Hines, Dean C .; Шнайдер, Гленн; Суммер, Реми (2018). "Десятилетие образов дисков MWC 758: где находятся планеты, вращающие спиральные рукава?". Письма в астрофизический журнал . 857 : L9. arXiv : 1803.06776 . Bibcode : 2018ApJ ... 857L ... 9R . DOI : 10.3847 / 2041-8213 / aab7f5 .
Рекомендации
- Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: теория линейных моделей (Третье изд.). Нью-Йорк: Спрингер. ISBN 0-387-95361-2.
- Гуджарати, Damodar N .; Портер, Дон С. (2009). «Панельные модели регрессии данных». Основы эконометрики (Пятое международное изд.). Бостон: Макгроу-Хилл. С. 591–616. ISBN 978-007-127625-2.
- Сяо, Чэн (2003). «Модели с фиксированными эффектами» . Анализ панельных данных (2-е изд.). Нью-Йорк: Издательство Кембриджского университета. С. 95–103. ISBN 0-521-52271-4.
- Вулдридж, Джеффри М. (2013). «Оценка фиксированных эффектов». Вводная эконометрика: современный подход (Пятое международное изд.). Мейсон, Огайо: Юго-запад. С. 466–474. ISBN 978-1-111-53439-4.
Внешние ссылки
- Модели с фиксированными и случайными эффектами
- Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, а также их анализ в R