Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике модель фиксированных эффектов - это статистическая модель, в которой параметры модели являются фиксированными или неслучайными величинами. Это контрастирует с моделями случайных эффектов и смешанными моделями, в которых все или некоторые параметры модели являются случайными величинами. Во многих приложениях, включая эконометрику [1] и биостатистику [2] [3] [4] [5], модель фиксированных эффектов относится к регрессионной модели, в которой групповые средние значения фиксированы (неслучайны) в отличие от модели случайных эффектов. в котором средние значения группы являются случайной выборкой из генеральной совокупности. [6]Как правило, данные можно сгруппировать по нескольким наблюдаемым факторам. Групповые средние могут быть смоделированы как фиксированные или случайные эффекты для каждой группы. В модели фиксированных эффектов среднее значение каждой группы является фиксированной величиной для конкретной группы.

В панельных данных, где существуют продольные наблюдения за одним и тем же предметом, фиксированные эффекты представляют собой средства, зависящие от предмета. В анализе панельных данных термин « оценщик фиксированных эффектов» (также известный как « внутренний оценщик» ) используется для обозначения оценщика для коэффициентов в регрессионной модели, включая эти фиксированные эффекты (один инвариантный по времени перехват для каждого объекта).

Качественное описание [ править ]

Такие модели помогают контролировать погрешность пропущенных переменных из-за ненаблюдаемой неоднородности, когда эта неоднородность постоянна во времени. Эту неоднородность можно удалить из данных путем проведения различий, например, путем вычитания среднего на уровне группы во времени или путем взятия первой разницы, которая удалит любые инвариантные во времени компоненты модели.

Есть два распространенных предположения об индивидуальном конкретном эффекте: предположение о случайных эффектах и ​​предположение о фиксированных эффектах. Случайных эффектов предположение , что отдельные специфические эффекты коррелируют с независимыми переменными. Предположение о фиксированном эффекте состоит в том, что индивидуальные эффекты коррелируют с независимыми переменными. Если выполняется предположение о случайных эффектах, то оценщик случайных эффектов более эффективен, чем оценщик с фиксированными эффектами. Однако, если это предположение не выполнено, то случайные эффекты оценка не соответствует . Тест Дарбина – Ву – Хаусмана часто используется для различения моделей фиксированных и случайных эффектов. [7] [8]

Формальная модель и предположения [ править ]

Рассмотрим модель линейных ненаблюдаемых эффектов для наблюдений и периодов времени:

для и

Где:

  • - зависимая переменная, наблюдаемая для человека во время .
  • - вектор регрессора, зависящий от времени (количество независимых переменных).
  • - матрица параметров.
  • - ненаблюдаемый инвариантный во времени индивидуальный эффект. Например, врожденные способности отдельных лиц или исторические и институциональные факторы для стран.
  • это термин ошибки .

В отличие от , нельзя непосредственно наблюдать.

В отличие от модели случайных эффектов, где ненаблюдаемое не зависит от всех , модель фиксированных эффектов (FE) позволяет коррелировать с матрицей регрессора . По- прежнему требуется строгая экзогенность по отношению к термину идиосинкразической ошибки .

Статистическая оценка [ править ]

Оценщик фиксированных эффектов [ править ]

Поскольку не наблюдается, его нельзя напрямую контролировать . Модель FE устраняет , унизив переменные с помощью преобразования внутри :

где , , и .

Поскольку является постоянным, а значит, эффект устранен. Затем оценка FE получается с помощью регрессии OLS на .

Существуют по крайней мере три альтернативы внутренней трансформации с вариациями.

Один из них - добавить фиктивную переменную для каждого индивидуума (пропуская первую особь из-за мультиколлинеарности ). Это численно, но не вычислительно, эквивалентно модели фиксированного эффекта и работает только в том случае, если сумма количества серий и количества глобальных параметров меньше количества наблюдений. [9] Подход с фиктивной переменной особенно требователен к использованию памяти компьютера и не рекомендуется для задач, размер которых превышает объем доступной ОЗУ и компиляции прикладной программы.

Вторая альтернатива - использовать метод последовательных повторений для локальных и глобальных оценок. [10] Этот подход очень подходит для систем с низким объемом памяти, в которых он намного более эффективен с точки зрения вычислений, чем подход с фиктивной переменной.

Третий подход - это вложенная оценка, при которой локальная оценка для отдельных рядов программируется как часть определения модели. [11] Этот подход является наиболее эффективным с точки зрения вычислений и памяти, но он требует хороших навыков программирования и доступа к программному коду модели; правда, его можно запрограммировать даже в SAS. [12] [13]

Наконец, каждая из вышеперечисленных альтернатив может быть улучшена, если оценка для конкретной серии является линейной (в рамках нелинейной модели), и в этом случае прямое линейное решение для отдельной серии может быть запрограммировано как часть определения нелинейной модели. [14]

Оценщик первой разницы [ править ]

Альтернативой внутреннему преобразованию является преобразование первой разности , которое дает другую оценку. Для :

Затем оценка FD получается с помощью регрессии OLS на .

Когда , оценки первой разности и фиксированных эффектов численно эквивалентны. Ибо это не так. Если условие ошибки является гомоскедастичным , без последовательной корреляции , с фиксированными эффектами оценкой является более эффективной , чем первая разностью оценка. Однако, если следует случайное блуждание , первая оценка разности более эффективна. [15]

Равенство фиксированных эффектов и оценок первой разности при T = 2 [ править ]

Для специального двухпериодного случая ( ) оценщик с фиксированными эффектами (FE) и оценщик первой разности (FD) численно эквивалентны. Это связано с тем, что оценщик FE эффективно «удваивает набор данных», используемый в оценщике FD. Чтобы убедиться в этом, установите, что оценка фиксированных эффектов:

Поскольку каждый может быть переписан как , мы перепишем строку как:

Метод Чемберлена [ править ]

Метод Гэри Чемберлена , обобщение внутренней оценки, заменяет ее линейной проекцией на независимые переменные. Записывая линейную проекцию как:

это приводит к следующему уравнению:

которое можно оценить по оценке минимального расстояния . [16]

Метод Хаусмана – Тейлора [ править ]

Необходимо иметь более одного регрессора, зависящего от времени ( ) и неизменного во времени регрессора ( ), и по крайней мере один и один, которые не коррелируют с .

Разделяю и переменные , такие , что , где и некоррелированны с . Нужно .

Оценка с помощью OLS при использовании и в качестве инструментов дает непротиворечивую оценку.

Обобщение с входной неопределенностью [ править ]

Если имеется входная неопределенность для данных, то следует минимизировать значение, а не сумму квадратов остатков. [17] Это может быть непосредственно достигнуто с помощью правил замены:

,

тогда значения и стандартные отклонения для и могут быть определены с помощью классического обычного анализа наименьших квадратов и дисперсионно-ковариационной матрицы .

Тестирование фиксированных эффектов (FE) и случайных эффектов (RE) [ править ]

Мы можем проверить, подходит ли модель фиксированных или случайных эффектов, используя тест Дарбина – Ву – Хаусмана .

:
:

Если истинно, оба и согласованы, но только эффективно. Если верно, то непротиворечиво, а нет.

куда

Тест Хаусмана - это тест спецификации, поэтому большая статистика теста может указывать на то, что могут быть ошибки в переменных (EIV) или наша модель неверно указана. Если предположение FE верно, мы должны это выяснить .

Простая эвристика состоит в том, что если бы могла быть EIV.

См. Также [ править ]

  • Модель случайных эффектов
  • Смешанная модель
  • Модель динамических ненаблюдаемых эффектов
  • Модель Пуассона с фиксированным эффектом

Заметки [ править ]

  1. ^ Грин, WH, 2011. Эконометрический анализ , 7-е изд., Prentice Hall
  2. ^ Диггл, Питер Дж .; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. С. 169–171. ISBN 0-19-852484-6.
  3. ^ Фитцморис, Гаррет М .; Laird, Nan M .; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: Джон Уайли и сыновья. С. 326–328. ISBN 0-471-21487-6.
  4. ^ Laird, Nan M .; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. JSTOR 2529876 . 
  5. ^ Гардинер, Джозеф С .; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем разница?». Статистика в медицине . 28 : 221–239. DOI : 10.1002 / sim.3478 .
  6. ^ Рэмси, Ф., Шафер, Д., 2002. Статистический сыщик: курс методов анализа данных , 2-е изд. Duxbury Press
  7. ^ Кэмерон, А. Колин; Триведи, Правин К. (2005). Микроэконометрика: методы и приложения . Издательство Кембриджского университета. С. 717–19.
  8. ^ Nerlove, Марк (2005). Очерки по эконометрике панельных данных . Издательство Кембриджского университета. С. 36–39.
  9. ^ Гарсия, Оскар. (1983). «Модель стохастического дифференциального уравнения для высотного роста древостоев». Биометрия : 1059–1072.
  10. ^ Тейт, Дэвид; Cieszewski, Chris J .; Белла, Имре Э. (1986). «Динамика древостоя сосны лесной». Может. J. For. Res . 18 : 1255–1260.
  11. ^ Strub, Майк; Цешевски, Крис Дж. (2006). «Свойства инвариантности базового возраста двух методов оценки параметров моделей индекса сайта». Лесоводство . 52 (2): 182–186.
  12. ^ Strub, Майк; Цешевский, Крис Дж. (2003). «Подбор параметров глобального индекса сайта, когда индекс участка или дерева рассматривается как местный мешающий параметр. В: Burkhart HA, редактор. Материалы симпозиума по статистике и информационным технологиям в лесном хозяйстве; 8–12 сентября 2002 г .; Блэксбург, Вирджиния: Политехнический институт Вирджинии Институт и государственный университет »: 97–107. Cite journal requires |journal= (help)
  13. ^ Cieszewski, Крис Дж .; Харрисон, Майк; Мартин, Стейси В. (2000). «Практические методы оценки непредвзятых параметров в саморегулирующихся моделях роста и урожайности» (PDF) . Технический отчет PMRC . 2000 (7): 12.
  14. ^ Шнуте, Джон; Маккиннелл, Скип (1984). «Биологически значимый подход к анализу поверхности отклика». Может. J. Fish. Акват. Sci . 41 : 936–953.
  15. ^ Вулдридж, Джеффри М. (2001). Эконометрический анализ поперечных и панельных данных . MIT Press. стр.  279 -291. ISBN 978-0-262-23219-7.
  16. ^ Чемберлен, Гэри (1984). «Глава 22 Панельные данные». 2 : 1247–1318. DOI : 10.1016 / S1573-4412 (84) 02014-6 . ISSN 1573-4412 .  Cite journal requires |journal= (help)
  17. ^ Рен, Бин; Донг, Руобин; Эспозито, Томас М .; Пуэйо, Лоран; Дебес, Джон Х .; Poteet, Charles A .; Шоке, Элоди; Бенисти, Мириам; Чан, Юджин; Грейди, Кэрол А .; Hines, Dean C .; Шнайдер, Гленн; Суммер, Реми (2018). "Десятилетие образов дисков MWC 758: где находятся планеты, вращающие спиральные рукава?". Письма в астрофизический журнал . 857 : L9. arXiv : 1803.06776 . Bibcode : 2018ApJ ... 857L ... 9R . DOI : 10.3847 / 2041-8213 / aab7f5 .

Ссылки [ править ]

  • Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: теория линейных моделей (Третье изд.). Нью-Йорк: Спрингер. ISBN 0-387-95361-2.
  • Гуджарати, Damodar N .; Портер, Дон С. (2009). «Панельные модели регрессии данных». Основы эконометрики (Пятое международное изд.). Бостон: Макгроу-Хилл. С. 591–616. ISBN 978-007-127625-2.
  • Сяо, Чэн (2003). «Модели с фиксированными эффектами» . Анализ панельных данных (2-е изд.). Нью-Йорк: Издательство Кембриджского университета. С. 95–103. ISBN 0-521-52271-4.
  • Вулдридж, Джеффри М. (2013). «Оценка фиксированных эффектов». Вводная эконометрика: современный подход (Пятое международное издание). Мейсон, Огайо: Юго-запад. С. 466–474. ISBN 978-1-111-53439-4.

Внешние ссылки [ править ]

  • Модели с фиксированными и случайными эффектами
  • Примеры всех моделей ANOVA и ANCOVA с тремя факторами обработки, включая рандомизированный блок, разделенный график, повторные измерения и латинские квадраты, а также их анализ в R