Оценка инструментальных переменных

В статистике , эконометрике , эпидемиологии и смежных дисциплинах метод инструментальных переменных ( IV ) используется для оценки причинно-следственных связей, когда контролируемые эксперименты неосуществимы или когда лечение не проводится успешно для каждого подразделения в рандомизированном эксперименте. ^[1] Интуитивно IV используются, когда представляющая интерес независимая переменная коррелирует с ошибкой, и в этом случае обычные наименьшие квадраты и ANOVA дают смещение.полученные результаты. Действительный инструмент вызывает изменения в объясняющей переменной, но не оказывает независимого воздействия на зависимую переменную, позволяя исследователю выявить причинный эффект объясняющей переменной на зависимую переменную.

Методы инструментальных переменных позволяют проводить согласованную оценку, когда объясняющие переменные (ковариаты) коррелируют с ошибочными членами в регрессионной модели. Такая корреляция может возникнуть, когда:

изменения в зависимой переменной изменяют значение хотя бы одной из ковариат («обратная» причинность),
Есть опущенные переменные , которые влияют как на зависимые и независимые переменные, или
в ковариаты подлежат неслучайной ошибки измерения .

Объясняющие переменные, которые страдают от одной или нескольких из этих проблем в контексте регрессии, иногда называют эндогенными . В этой ситуации обычный метод наименьших квадратов дает смещенные и непоследовательные оценки. ^[2] Однако, если инструмент доступен, согласованные оценки все же могут быть получены. Инструмент - это переменная, которая сама по себе не входит в объясняющее уравнение, но коррелируется с эндогенными объясняющими переменными, при условии, что значения других ковариант.

В линейных моделях есть два основных требования к использованию IV:

Инструмент должен быть коррелирован с эндогенными независимыми переменными, при условии, что другие ковариаты. Если эта корреляция сильная, то говорят, что у инструмента сильная первая стадия . Слабая корреляция может привести к ошибочным выводам об оценках параметров и стандартных ошибках. ^[3] ^[4]
Инструмент не может быть коррелирован с ошибкой в пояснительном уравнении, при условии, что другие ковариаты. Другими словами, инструмент не может иметь тех же проблем, что и исходная прогнозирующая переменная. Если это условие выполняется, считается, что инструмент удовлетворяет ограничению исключения .

Введение [ править ]

Концепция инструментальных переменных была впервые получена Филипом Г. Райтом , возможно, в соавторстве с его сыном Сьюоллом Райтом , в контексте одновременных уравнений в его книге 1928 года «Тарифы на животные и растительные масла» . ^[5]^[6] В 1945 году Олав Рейерсол применил тот же подход в контексте моделей ошибок в переменных в своей диссертации, дав этому методу название. ^[7]

Хотя идеи, лежащие в основе IV, распространяются на широкий класс моделей, очень распространенным контекстом для IV является линейная регрессия. Традиционно ^[8] инструментальная переменная определяется как переменная Z, которая коррелирует с независимой переменной X и некоррелирована с "ошибочным членом" U в линейном уравнении.

{\ Displaystyle Y = X \ бета + U}

${\ displaystyle Y}$ вектор. представляет собой матрицу, обычно со столбцом из единиц и, возможно, с дополнительными столбцами для других ковариат. Рассмотрим, как можно восстановить инструмент . Напомним, что OLS решает такие проблемы , что (когда мы минимизируем сумму квадратов ошибок, условие первого порядка точно .) Если истинная модель считается имеющей место по любой из перечисленных выше причин, например, если есть опущен переменный , которая влияет как и по отдельности, то это МНК процедура не дает причинное воздействие на ${\ displaystyle X}$ ${\ displaystyle \ beta}$ ${\ displaystyle {\ widehat {\ beta}}}$ ${\ displaystyle \ operatorname {cov} (X, {\ widehat {U}}) = 0}$ ${\ displaystyle \ min _ {\ widehat {\ beta}} (Y - {\ widehat {\ beta}} X) '(Y - {\ widehat {\ beta}} X)}$ ${\ displaystyle X '(Y - {\ widehat {\ beta}} X) = X' {\ widehat {U}} = 0}$ ${\ displaystyle \ operatorname {cov} (X, U) \ neq 0}$ ${\ displaystyle X}$ ${\ displaystyle Y}$ ${\ displaystyle X}$ ${\ displaystyle Y}$ . OLS просто выберет параметр, с которым полученные ошибки не коррелируют . ${\ displaystyle X}$

Рассмотрим для простоты случай с одной переменной. Предположим, мы рассматриваем регрессию с одной переменной и константой (возможно, никакие другие ковариаты не требуются , или, возможно, мы выделили любые другие соответствующие ковариаты):

{\ Displaystyle у = \ альфа + \ бета х + и}

В этом случае коэффициент при интересующем регрессоре равен . Замена на дает ${\ displaystyle {\ widehat {\ beta}} = {\ frac {\ operatorname {cov} (x, y)} {\ operatorname {var} (x)}}}$ ${\ displaystyle y}$

{\begin{aligned}{\widehat {\beta }}&={\frac {\operatorname {cov} (x,y)}{\operatorname {var} (x)}}={\frac {\operatorname {cov} (x,\alpha +\beta x+u)}{\operatorname {var} (x)}}\\[6pt]&={\frac {\operatorname {cov} (x,\alpha +\beta x)}{\operatorname {var} (x)}}+{\frac {\operatorname {cov} (x,u)}{\operatorname {var} (x)}}=\beta ^{*}+{\frac {\operatorname {cov} (x,u)}{\operatorname {var} (x)}},\end{aligned}}

где - каким был бы оценочный вектор коэффициентов, если бы x не коррелировал с u . В этом случае можно показать, что это объективная оценка If в базовой модели, которую мы считаем, тогда OLS дает коэффициент, который не отражает лежащий в основе причинный эффект, представляющий интерес. IV помогает решить эту проблему, определяя параметры не на основании того, не коррелирован ли с ним , а на основании того, не коррелирован ли с ним другая переменная . Если теория предполагает, что это связано с (первой стадией), но не коррелирует с $\beta ^{*}$ $\beta ^{*}$ $\beta .$ $\operatorname {cov} (x,u)\neq 0$ ${\beta }$ $x$ $u$ $z$ $u$ $z$ $x$ $u$ (ограничение исключения), тогда IV может определить интересующий причинный параметр, когда OLS не работает. Поскольку существует несколько конкретных способов использования и получения оценок IV даже в линейном случае (IV, 2SLS, GMM), мы сохраняем дальнейшее обсуждение в разделе « Оценка » ниже.

Пример [ править ]

Неформально, в попытке оценить причинный эффект некоторой переменной X на другой Y , инструмент является третьей переменной Z , которая влияет на Y только через его влияние на X . Например, предположим, что исследователь хочет оценить причинное влияние курения на общее состояние здоровья. ^[9] Корреляция между здоровьем и курением не означает, что курение вызывает плохое здоровье, потому что другие переменные, такие как депрессия, могут влиять как на здоровье, так и на курение, или потому что здоровье может влиять на курение. В лучшем случае сложно и дорого проводить контролируемые эксперименты по изучению статуса курения среди населения в целом. Исследователь может попытаться оценить причинное влияние курения на здоровье на основе данных наблюдений, используя ставку налога на табачные изделия в качестве инструмента для курения. Ставка налога на табачные изделия - разумный выбор в качестве инструмента, поскольку исследователь предполагает, что ее можно соотнести со здоровьем только через ее влияние на курение. Если исследователь обнаружит, что налоги на табак и состояние здоровья взаимосвязаны, это можно рассматривать как доказательство того, что курение вызывает изменения в здоровье.

Angrist и Krueger (2001) представляют обзор истории и использования методов инструментальных переменных. ^[10]

Графическое определение [ править ]

Конечно, методы IV были разработаны среди гораздо более широкого класса нелинейных моделей. Общие определения инструментальных переменных с использованием контрфактического и графического формализма были даны Перлом (Pearl, 2000; с. 248). ^[11] Графическое определение требует, чтобы Z удовлетворяла следующим условиям:

(Z\perp \!\!\!\perp Y)_{G_{\overline {X}}}\qquad (Z\not \!\!{\perp \!\!\!\perp }X)_{G}

где обозначает d- разделение и обозначает график, на котором все стрелки, входящие в X , обрезаны. $\perp \!\!\!\perp$ $G_{\overline {X}}$

Контрфактическое определение требует, чтобы Z удовлетворяла

(Z\perp \!\!\!\perp Y_{x})\qquad (Z\not \!\!{\perp \!\!\!\perp }X)

где Y _x обозначает значение, которое Y достиг бы, если бы X был x, и обозначает независимость. $\perp \!\!\!\perp$

Если есть дополнительные ковариаты W , то приведенные выше определения изменяются таким образом , что Z квалифицируется как инструмент , если заданные критерии провести обусловливающие Вт .

Суть определения Перла такова:

Представляющие интерес уравнения являются «структурными», а не «регрессионными».
Термин ошибки U обозначает все внешние факторы, которые влияют на Y, когда X остается постоянным.
Инструмент Z не должен зависеть от U.
Инструмент Z не должен влиять на Y, если X остается постоянным (ограничение исключения).
Инструмент Z не должен быть независимым от X.

Эти условия не зависят от конкретной функциональной формы уравнений и поэтому применимы к нелинейным уравнениям, где U может быть неаддитивным (см. Непараметрический анализ). Они также применимы к системе нескольких уравнений, в которой X (и другие факторы) влияют на Y через несколько промежуточных переменных. Инструментальная переменная не обязательно должна быть причиной X ; может также использоваться указание такой причины, если оно удовлетворяет условиям 1–5. ^[11] Ограничение исключения (условие 4) является избыточным; это следует из условий 2 и 3.

Выбор подходящих инструментов [ править ]

Поскольку U не наблюдается, требование, чтобы Z не зависело от U, не может быть выведено из данных и вместо этого должно быть определено из структуры модели, т. Е. Процесса генерации данных. Причинно графики являются представлением этой структуры, а также графическое определение , данное выше , можно использовать , чтобы быстро определить , является ли переменная а Z квалифицируется как инструментальной переменной задано множество ковариатами W . Чтобы увидеть, как это сделать, рассмотрим следующий пример.

Рисунок 1. Близость квалифицируется как инструментальная переменная с учетом часов библиотеки
Рисунок 2:, который используется для определения, является ли Proximity инструментальной переменной. $G_{\overline {X}}$
Рисунок 3: Близость не может считаться инструментальной переменной с учетом часов работы библиотеки
Рисунок 4: Близость квалифицируется как инструментальная переменная, если мы не включаем часы работы библиотеки в качестве ковариаты.

Предположим, мы хотим оценить влияние программы репетиторства в университете на средний балл ( GPA ). Взаимосвязь между посещением программы репетиторства и средним баллом успеваемости может быть нарушена рядом факторов. Учащиеся, посещающие программу репетиторства, могут больше заботиться о своих оценках или могут испытывать трудности с работой. Это смешение показано на рисунках 1–3 справа через двунаправленную дугу между программой наставничества и GPA. Если студентов распределяют по общежитиям наугад, близость студенческого общежития к программе репетиторства является естественным кандидатом на роль инструментальной переменной.

Однако что, если программа репетиторства находится в библиотеке колледжа? В этом случае близость может также побудить студентов проводить больше времени в библиотеке, что, в свою очередь, улучшает их средний балл (см. Рис. 1). Используя причинный граф, изображенный на рисунке 2, мы видим, что Proximity не квалифицируется как инструментальная переменная, потому что она связана с GPA через путь Proximity Library Hours GPA in . Однако, если мы контролируем часы работы библиотеки, добавляя их в качестве ковариаты, то Proximity становится инструментальной переменной, поскольку Proximity отделяется от GPA с учетом часов библиотеки в ^[^{необходима ссылка}^] . $\rightarrow$ $\rightarrow$ $G_{\overline {X}}$ $G_{\overline {X}}$

Теперь предположим, что мы замечаем, что «естественные способности» студента влияют на его или ее количество часов в библиотеке, а также на его или ее средний балл, как показано на рисунке 3. Используя причинно-следственный график, мы видим, что количество часов библиотеки является коллайдером и кондиционирование на нем открывает путь Proximity Library Hours GPA. В результате близость не может использоваться в качестве инструментальной переменной. $\rightarrow$ $\leftrightarrow$

Наконец, предположим, что часы работы библиотеки на самом деле не влияют на средний балл, потому что студенты, которые не учатся в библиотеке, просто учатся в другом месте, как показано на рисунке 4. В этом случае контроль часов библиотеки по-прежнему открывает ложный путь от близости к среднему баллу. Однако, если мы не контролируем часы работы библиотеки и удаляем его как ковариату, то Proximity снова можно использовать в качестве инструментальной переменной.

Оценка [ править ]

Теперь мы вернемся к механике IV и подробнее остановимся на ней. Предположим, данные генерируются процессом вида

y_{i}=X_{i}\beta +e_{i},

куда

я индексирую наблюдения,
$y_{i}$ - i-е значение зависимой переменной,
$X_{i}$ - вектор i -ых значений независимой переменной (переменных) и константы,
$e_{i}$ является i -м значением ненаблюдаемого члена ошибки, представляющего все причины, кроме , и $y_{i}$ $X_{i}$
$\beta$ - ненаблюдаемый вектор параметров.

Вектор параметров - это причинный эффект изменения на одну единицу каждого элемента, при этом все остальные причины остаются постоянными. Эконометрическая цель - оценить . Для простоты предположим, что значения e некоррелированы и взяты из распределений с одинаковой дисперсией (т. Е. Что ошибки последовательно некоррелированы и гомоскедастичны ). $\beta$ $y_{i}$ $X_{i}$ $y_{i}$ $\beta$

Предположим также, что предлагается регрессионная модель номинально такой же формы. Для случайной выборки T наблюдений в результате этого процесса обычная оценка методом наименьших квадратов имеет вид

{\widehat {\beta }}_{\mathrm {OLS} }=(X^{\mathrm {T} }X)^{-1}X^{\mathrm {T} }y=(X^{\mathrm {T} }X)^{-1}X^{\mathrm {T} }(X\beta +e)=\beta +(X^{\mathrm {T} }X)^{-1}X^{\mathrm {T} }e

где Х , Y и е векторы - столбцы обозначают длины T . Это уравнение похоже на уравнение во введении (это матричная версия этого уравнения). Когда Х и е являются некоррелированными , при определенных условиях регулярности второго член имеет ожидаемое значение в зависимость X от нуля и сходится к нулю в пределе, так что оценка является несмещенной и последовательной. Когда X и другие неизмеряемые, причинные переменные, свернутые в член е , коррелированы, однако, оценка МНК обычно смещена и непоследовательна для $\operatorname {cov} (X,y)$ β . В этом случае допустимо использовать оценки для прогнозирования значений y при заданных значениях X , но оценка не восстанавливает причинное влияние X на y .

Чтобы восстановить базовый параметр , мы вводим набор переменных Z, который сильно коррелирует с каждым эндогенным компонентом X, но (в нашей базовой модели) не коррелирует с e . Для простоты можно было бы рассматривать X как матрицу T × 2, состоящую из столбца констант и одной эндогенной переменной, а Z как T × 2, состоящую из столбца констант и одной инструментальной переменной. Однако этот метод обобщается на X, являющийся матрицей констант и, скажем, 5 эндогенных переменных, причем Z $\beta$ являясь матрицей, состоящей из константы и 5 инструментов. В последующем обсуждении мы будем предполагать, что X является матрицей размером T × K, и оставим это значение K неопределенным. Оценщик, в котором X и Z обе являются матрицами T × K, называется только что идентифицированным .

Предположим, что взаимосвязь между каждым эндогенным компонентом x _i и инструментами определяется выражением

x_{i}=Z_{i}\gamma +v_{i},

Наиболее распространенная спецификация IV использует следующую оценку:

{\widehat {\beta }}_{\mathrm {IV} }=(Z^{\mathrm {T} }X)^{-1}Z^{\mathrm {T} }y

Эта спецификация приближается к истинному параметру по мере увеличения выборки, пока в истинной модели: $Z^{\mathrm {T} }e=0$

{\widehat {\beta }}_{\mathrm {IV} }=(Z^{\mathrm {T} }X)^{-1}Z^{\mathrm {T} }y=(Z^{\mathrm {T} }X)^{-1}Z^{\mathrm {T} }X\beta +(Z^{\mathrm {T} }X)^{-1}Z^{\mathrm {T} }e\rightarrow \beta

Пока в базовом процессе, который генерирует данные, соответствующее использование оценщика IV будет определять этот параметр. Это работает, потому что IV вычисляет уникальный параметр, который удовлетворяет , и, следовательно, оттачивает истинный базовый параметр по мере увеличения размера выборки. $Z^{\mathrm {T} }e=0$ $Z^{\mathrm {T} }e=0$

Теперь расширение: предположим , что есть больше инструментов , чем есть ковариат в уравнении интерес, так что Z является T × M матрица с M> K . Это часто называют сверхидентифицированным случаем. В этом случае можно использовать обобщенный метод моментов (ОММ). Оценка GMM IV:

{\widehat {\beta }}_{\mathrm {GMM} }=(X^{\mathrm {T} }P_{Z}X)^{-1}X^{\mathrm {T} }P_{Z}y,

где относится к матрице проекции . $P_{Z}$ $P_{Z}=Z(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }$

Это выражение сворачивается к первому, когда количество инструментов равно количеству ковариат в интересующем уравнении. Таким образом, чрезмерно идентифицированная IV является обобщением только что идентифицированной IV.

Доказательство того, что β _GMM коллапсирует до β _IV в только что указанном случае

Развитие выражения: $\beta _{GMM}$

{\widehat {\beta }}_{\mathrm {GMM} }=(X^{\mathrm {T} }Z(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }X)^{-1}X^{\mathrm {T} }Z(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }y

В только идентифицированной случае, у нас есть так много инструментов , как ковариат, так что размерность X такое же , как и Z . Следовательно, и - все квадратные матрицы одной размерности. Мы можем расширить обратные, используя тот факт , что для любого обратимого п матрицы с размерностью п матриц A и B , ( AB ) ^-1 = B ^-1A ^-1 (см обратимой матрицы # Свойства ): $X^{\mathrm {T} }Z,Z^{\mathrm {T} }Z$ $Z^{\mathrm {T} }X$

{\begin{aligned}{\widehat {\beta }}_{\mathrm {GMM} }&=(Z^{\mathrm {T} }X)^{-1}(Z^{\mathrm {T} }Z)(X^{\mathrm {T} }Z)^{-1}X^{\mathrm {T} }Z(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }y\\&=(Z^{\mathrm {T} }X)^{-1}(Z^{\mathrm {T} }Z)(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }y\\&=(Z^{\mathrm {T} }X)^{-1}Z^{\mathrm {T} }y\\&={\widehat {\beta }}_{\mathrm {IV} }\end{aligned}}

Ссылка: см. Davidson and Mackinnnon (1993) ^[12]^{: 218.}

Для случая m <k существует эквивалентная недоидентифицированная оценка . Поскольку параметры являются решениями набора линейных уравнений, недоидентифицированная модель, использующая набор уравнений , не имеет единственного решения. $Z'v=0$

Интерпретация как двухэтапный метод наименьших квадратов [ править ]

Одним из вычислительных методов, который можно использовать для расчета оценок IV, является двухэтапный метод наименьших квадратов (2SLS или TSLS). На первом этапе каждая независимая переменная, являющаяся эндогенной ковариатой в интересующем уравнении, подвергается регрессии по всем экзогенным переменным в модели, включая как экзогенные ковариаты в интересующем уравнении, так и исключенные инструменты. Прогнозируемые значения из этих регрессий получены:

Этап 1: Регрессируйте каждый столбец X на Z , ( ): $X=Z\delta +{\text{errors}}$

{\widehat {\delta }}=(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }X,\,

и сохраните прогнозируемые значения:

{\widehat {X}}=Z{\widehat {\delta }}={\color {ProcessBlue}Z(Z^{\mathrm {T} }Z)^{-1}Z^{\mathrm {T} }}X={\color {ProcessBlue}P_{Z}}X.\,

На втором этапе интересующая регрессия оценивается как обычно, за исключением того, что на этом этапе каждая эндогенная ковариата заменяется прогнозируемыми значениями из первого этапа:

Этап 2: Регресс Y по прогнозируемым значениям из первого этапа:

Y={\widehat {X}}\beta +\mathrm {noise} ,\,

который дает

\beta _{2SLS}=\left(X^{\mathrm {T} }{\color {ProcessBlue}P_{Z}}X\right)^{-1}X^{\mathrm {T} }{\color {ProcessBlue}P_{Z}}Y.

Этот метод действителен только в линейных моделях. Для категориальных эндогенных ковариат может возникнуть соблазн использовать первый этап, отличный от обычного метода наименьших квадратов, например, пробит-модель для первого этапа, за которым следует OLS для второго. Это обычно известно в эконометрической литературе как запрещенная регрессия , ^[13] , поскольку оценки параметров второй стадии IV соответствует только в особых случаях. ^[14]

Доказательство: вычисление оценки 2SLS

Обычная МНК - оценка является: . Заменив и отметив, что это симметричная и идемпотентная матрица, так что $({\widehat {X}}^{\mathrm {T} }{\widehat {X}})^{-1}{\widehat {X}}^{\mathrm {T} }Y$ ${\widehat {X}}=P_{Z}X$ $P_{Z}$ $P_{Z}^{\mathrm {T} }P_{Z}=P_{Z}P_{Z}=P_{Z}$

\beta _{2SLS}=({\widehat {X}}^{\mathrm {T} }{\widehat {X}})^{-1}{\widehat {X}}^{\mathrm {T} }Y=\left(X^{\mathrm {T} }P_{Z}^{\mathrm {T} }P_{Z}X\right)^{-1}X^{\mathrm {T} }P_{Z}^{\mathrm {T} }Y=\left(X^{\mathrm {T} }P_{Z}X\right)^{-1}X^{\mathrm {T} }P_{Z}Y.

Результирующая оценка численно идентична выражению, отображенному выше. Небольшая поправка должна быть сделана в сумму квадратов остатков в подобранной модели второго этапа, чтобы ковариационная матрица рассчитывалась правильно. $\beta$ $\beta$

Непараметрический анализ [ править ]

Когда форма структурных уравнений неизвестна, инструментальную переменную все еще можно определить с помощью уравнений: $Z$

x=g(z,u)\,

y=f(x,u)\,

где и - две произвольные функции и не зависит от . Однако, в отличие от линейных моделей, измерения и не позволяют идентифицировать средний причинный эффект включения , обозначенного ACE. $f$ $g$ $Z$ $U$ $Z,X$ $Y$ $X$ $Y$

{\text{ACE}}=\Pr(y\mid {\text{do}}(x))=\operatorname {E} _{u}[f(x,u)].

Balke и Pearl [1997] получили жесткие границы для ACE и показали, что они могут предоставить ценную информацию о знаке и размере ACE. ^[15]

В линейном анализе нет теста, чтобы опровергнуть предположение, что это инструментальная пара . Это не тот случай, когда дискретный. Перл (2000) показал, что для всех и следующее ограничение, называемое «Инструментальное неравенство», должно выполняться всякий раз, когда удовлетворяет двум приведенным выше уравнениям: ^[11] $Z$ $(X,Y)$ $X$ $f$ $g$ $Z$

\max _{x}\sum _{y}[\max _{z}\Pr(y,x\mid z)]\leq 1.

Интерпретация при неоднородности эффекта лечения [ править ]

Изложение выше предполагает, что причинный эффект, представляющий интерес, не меняется в зависимости от наблюдений, то есть является постоянным. Как правило, разные субъекты по-разному реагируют на изменения в «лечении» x . Когда эта возможность признается, средний эффект изменения x на y в популяции $\beta$ может отличаться от эффекта в данной подгруппе населения. Например, средний эффект программы профессионального обучения может существенно различаться для группы людей, которые фактически проходят обучение, и для группы, которая решает не проходить обучение. По этим причинам внутривенные методы предполагают неявные предположения о поведенческой реакции или, в более общем смысле, предположения о корреляции между реакцией на лечение и склонностью к лечению. ^[16]

Стандартная оценка IV может восстановить средние локальные эффекты лечения (ПОЗДНЕЕ), а не средние эффекты лечения (ATE). ^[1] Имбенс и Ангрист (1994) демонстрируют, что линейная оценка IV может быть интерпретирована в слабых условиях как средневзвешенное значение местных средних эффектов лечения, где веса зависят от эластичности эндогенного регрессора по отношению к изменениям инструментальных переменных. Грубо говоря, это означает, что влияние переменной выявляется только для субпопуляций, на которые влияют наблюдаемые изменения в инструментах, и что субпопуляции, которые больше всего реагируют на изменения в инструментах, будут иметь наибольшее влияние на величину оценки IV.

Например, если исследователь использует наличие колледжа, предоставившего землю, в качестве инструмента для получения высшего образования в регрессии доходов, он определяет влияние колледжа на заработки в подгруппе населения, которая получила бы высшее образование, если бы колледж присутствует, но которая могла бы не получить степень, если колледж отсутствует. Этот эмпирический подход без дополнительных предположений ничего не говорит исследователю о влиянии колледжа на людей, которые либо всегда, либо никогда не получат высшее образование, независимо от того, существует ли местный колледж.

Проблема слабых инструментов [ править ]

Как отмечают Баунд, Джегер и Бейкер (1995), проблема вызвана выбором «слабых» инструментов, инструментов, которые являются плохими предикторами предиктора эндогенного вопроса в уравнении первой стадии. ^[17] В этом случае инструмент прогнозирования вопроса будет плохим, и прогнозируемые значения будут иметь очень небольшие вариации. Следовательно, они вряд ли добьются большого успеха в прогнозировании конечного результата, если они используются для замены предиктора вопроса в уравнении второго этапа.

В контексте рассмотренного выше примера курения и здоровья табачные налоги являются слабым инструментом для борьбы с курением, если статус курения в значительной степени не зависит от изменений налогов. Если более высокие налоги не побуждают людей бросить курить (или не начать курить), то изменение налоговых ставок ничего не говорит нам о влиянии курения на здоровье. Если налоги влияют на здоровье по каналам, отличным от их воздействия на курение, тогда инструменты недействительны, и подход с использованием инструментальных переменных может привести к неверным результатам. Например, места и время с относительно заботящимся о своем здоровье населением могут одновременно вводить высокие налоги на табак и демонстрировать лучшее здоровье, даже при сохранении постоянного уровня курения, поэтому мы наблюдали бы корреляцию между налогами на здоровье и табак, даже если бы курение не имело никакого эффекта на здоровье. В этом случае,Было бы ошибкой сделать вывод о причинном влиянии курения на здоровье из наблюдаемой корреляции между налогами на табак и здоровьем.

Тестирование слабых инструментов [ править ]

Сила инструментов может быть непосредственно оценена, потому что и эндогенные ковариаты, и инструменты наблюдаемы. ^[18] Общее практическое правило для моделей с одним эндогенным регрессором: F-статистика против нуля, что исключенные инструменты не имеют отношения к первому этапу регрессии, должна быть больше 10.

Статистический вывод и проверка гипотез [ править ]

Когда ковариаты являются экзогенными, свойства малой выборки оценщика МНК могут быть получены прямым способом путем вычисления моментов оценщика, обусловленного X. Когда некоторые из ковариат являются эндогенными, так что оценка инструментальных переменных реализуется, простые выражения для моментов оценки не могут быть получены таким образом. Как правило, оценщики инструментальных переменных имеют только желаемые асимптотические, а не конечные выборочные свойства, и вывод основан на асимптотических приближениях к выборочному распределению оценщика. Даже когда инструменты не коррелируют с ошибкой в интересующем уравнении и когда инструменты не слабые, свойства конечной выборки оценщика инструментальных переменных могут быть плохими. Например, точно идентифицированные модели создают конечные выборочные оценки без моментов, поэтому можно сказать, что оценка не является ни смещенной, ни несмещенной, номинальный размер тестовой статистики может быть существенно искажен,и оценки обычно могут быть далеки от истинного значения параметра.^[19]

Проверка ограничения исключения [ править ]

Предположение о том, что инструменты не коррелируют с ошибкой в интересующем уравнении, нельзя проверить в точно идентифицированных моделях. Если модель переопределена, имеется информация, которая может быть использована для проверки этого предположения. Наиболее распространенный тест на эти ограничения сверхидентификации , называемый тестом Саргана – Хансена , основан на наблюдении, что остатки не должны коррелировать с набором экзогенных переменных, если инструменты действительно экзогенные. ^[20] Статистику критерия Саргана-Хансена можно рассчитать как (количество наблюдений, умноженное на коэффициент детерминации $TR^{2}$ ) от регрессии остатков на множестве экзогенных переменных. Эта статистика будет асимптотически возведена в хи-квадрат с m - k степенями свободы при нулевом значении, когда ошибка не коррелирует с инструментами.

Применение к моделям со случайными и фиксированными эффектами [ править ]

Было предложено объединить этот раздел в Панельный анализ . ( Обсудить ) Предлагается с августа 2020 года.

В стандартных моделях случайных эффектов (RE) и фиксированных эффектов (FE) для панельных данных предполагается, что независимые переменные не коррелируют с членами ошибки. При наличии действительных инструментов методы RE и FE распространяются на случай, когда некоторым независимым переменным разрешено быть эндогенными. Как и во внешнем окружении, модель RE с инструментальными переменными (REIV) требует более строгих допущений, чем модель FE с инструментальными переменными (FEIV), но она имеет тенденцию быть более эффективной при соответствующих условиях. ^[21]

Чтобы исправить идеи, рассмотрите следующую модель:

y_{it}=x_{it}\beta +c_{i}+u_{it}

где - это ненаблюдаемый неизменяющийся во времени эффект, зависящий от единицы (назовем его ненаблюдаемым эффектом), и его можно коррелировать с for s, возможно, отличным от t . Предположим, существует набор действительных инструментов . $c_{i}$ $x_{it}$ $u_{is}$ $z_{i}=(z_{i1},\ldots ,z_{it})$

При настройке REIV, основные допущения включают , что является коррелируют с , а также для . Фактически, для того, чтобы оценка REIV была эффективной, необходимы условия, более сильные, чем некоррелированность между инструментами и ненаблюдаемый эффект. $z_{i}$ $c_{i}$ $u_{it}$ $t=1,\ldots ,T$

С другой стороны, FeIV оценщик только требует , чтобы инструменты экзогенными с точки зрения ошибок после кондиционирования на ненаблюдаемой эффект т.е. . ^[21] Условие FEIV допускает произвольную корреляцию между инструментами и ненаблюдаемым эффектом. Однако эта общность не дается даром: не допускаются инвариантные во времени объясняющие и инструментальные переменные. Как и в обычном методе FE, оценщик использует зависимые от времени переменные, чтобы удалить ненаблюдаемый эффект. Следовательно, оценка FEIV будет иметь ограниченное применение, если интересующие переменные будут включать переменные, не зависящие от времени. $E[u_{it}\mid z_{i},c_{i}]=0[1]$

Вышеупомянутое обсуждение аналогично экзогенному случаю моделей RE и FE. В экзогенном случае RE предполагает некоррелированность между независимыми переменными и ненаблюдаемым эффектом, а FE допускает произвольную корреляцию между ними. Подобно стандартному случаю, REIV имеет тенденцию быть более эффективным, чем FEIV, при условии, что выполняются соответствующие допущения. ^[21]

См. Также [ править ]

Модель двоичного ответа с непрерывными эндогенными независимыми переменными
Функция управления (эконометрика)
Оптимальные инструменты

Ссылки [ править ]

^ a b Imbens, G .; Ангрист, Дж. (1994). «Выявление и оценка местных средних лечебных эффектов» (PDF) . Econometrica . 62 (2): 467–476. DOI : 10.2307 / 2951620 . JSTOR 2951620 .
^ Баллок, JG; Грин, ДП; Ха, С.Е. (2010). «Да, но каков механизм? (Не ждите простого ответа)». Журнал личности и социальной психологии . 98 (4): 550–558. CiteSeerX 10.1.1.169.5465 . DOI : 10.1037 / a0018933 . PMID 20307128 .
^ https://www.stata.com/meeting/5nasug/wiv.pdf
^ Николс, Остин (2006-07-23). «Слабые инструменты: обзор и новые методы» . Cite journal requires |journal= (help)
^ Эпштейн, Рой J (1989). «Падение OLS в структурной оценке». Oxford Economic Papers . 41 (1): 94–107. JSTOR 2663184 .
^ Сток, Джеймс Х .; Требби, Франческо (2003). «Ретроспективы: кто изобрел инструментальную регрессию переменных?» . Журнал экономических перспектив . 17 (3): 177–194. DOI : 10.1257 / 089533003769204416 .
^ Reiersøl, Олаф (1945). Анализ конфлюэнции с помощью инструментальных наборов переменных . Аркив для математики, астрономии, оч физ. 32А . Упсала: Almquist & Wiksells. OCLC 793451601 .
^ Bowden, RJ; Теркингтон, Д.А. (1984). Инструментальные переменные . Кембридж, Англия: Издательство Кембриджского университета.
^ Ли, JP; Шембри, М. (2004). «Метод инструментальных переменных: цена сигарет обеспечивает лучшую оценку воздействия курения на SF-12». Журнал клинической эпидемиологии . 57 (3): 284–293. DOI : 10.1016 / j.jclinepi.2003.08.006 . PMID 15066689 .
^ Angrist, J .; Крюгер, А. (2001). «Инструментальные переменные и поиски идентификации: от спроса и предложения к естественным экспериментам» . Журнал экономических перспектив . 15 (4): 69–85. DOI : 10,1257 / jep.15.4.69 .
^ a b c Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89560-6.
^ Дэвидсон, Рассел; Маккиннон, Джеймс (1993). Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. ISBN 978-0-19-506011-9.
^ Wooldridge, J. (2010). Эконометрический анализ поперечных и панельных данных. Эконометрический анализ поперечных и панельных данных. MIT Press.
^ Lergenmuller, S., 2017. Двухэтапная подстановка предикторов для данных времени до события.
^ Balke, A .; Перл, Дж. (1997). «Границы лечебных эффектов из исследований с несовершенным соблюдением режима». Журнал Американской статистической ассоциации . 92 (439): 1172–1176. CiteSeerX 10.1.1.26.3952 . DOI : 10.1080 / 01621459.1997.10474074 .
^ Хекман, Дж. (1997). «Инструментальные переменные: исследование неявных поведенческих предположений, используемых при оценке программ». Журнал человеческих ресурсов . 32 (3): 441–462. DOI : 10.2307 / 146178 . JSTOR 146178 .
^ Связанный, J .; Jaeger, DA; Бейкер, RM (1995). «Проблемы с оценкой инструментальных переменных при слабой корреляции между инструментами и эндогенной объясняющей переменной». Журнал Американской статистической ассоциации . 90 (430): 443. DOI : 10.1080 / 01621459.1995.10476536 .
^ Stock, J .; Wright, J .; Його, М. (2002). «Обзор слабых инструментов и слабая идентификация в обобщенном методе моментов». Журнал Американской статистической ассоциации . 20 (4): 518–529. CiteSeerX 10.1.1.319.2477 . DOI : 10.1198 / 073500102288618658 .
^ Нельсон, CR; Startz, R. (1990). «Некоторые дальнейшие результаты по точным свойствам малых выборок инструментальной оценки переменных» (PDF) . Econometrica . 58 (4): 967–976. DOI : 10.2307 / 2938359 . JSTOR 2938359 .
^ Hayashi, Фумио (2000). «Тестирование сверхидентификационных ограничений» . Эконометрика . Принстон: Издательство Принстонского университета. С. 217–221. ISBN 978-0-691-01018-2.
^ a b c Вулдридж, JM, Эконометрический анализ поперечных сечений и панельных данных, MIT Press, Cambridge, Mass.

Дальнейшее чтение [ править ]

Грин, Уильям Х. (2008). Эконометрический анализ (Шестое изд.). Река Аппер Сэдл: Пирсон Прентис-Холл. стр. 314 -353. ISBN 978-0-13-600383-0.
Гуджарати, Дамодар Н .; Портер, Дон С. (2009). Основы эконометрики (Пятое изд.). Нью-Йорк: Макгроу-Хилл Ирвин. стр. 711 -736. ISBN 978-0-07-337577-9.
Сарган, Денис (1988). Лекции по углубленной эконометрической теории . Оксфорд: Бэзил Блэквелл. С. 42–67. ISBN 978-0-631-14956-9.
Вулдридж, Джеффри М. (2013). Вводная эконометрика: современный подход (Пятое международное издание). Мейсон, Огайо: Юго-запад. С. 490–528. ISBN 978-1-111-53439-4.

Библиография [ править ]

Вулдридж, Дж. (1997): Методы квази-правдоподобия для подсчета данных, Справочник по прикладной эконометрике, том 2, изд. MH Pesaran and P. Schmidt, Oxford, Blackwell, стр. 352–406.
Терца, СП (1998): «Оценка моделей подсчета с эндогенным переключением: выбор образцов и эндогенные эффекты лечения». Journal of Econometrics (84), стр. 129–154.
Вулдридж, Дж. (2002): «Эконометрический анализ поперечных сечений и панельных данных», MIT Press , Кембридж, Массачусетс.

Внешние ссылки [ править ]

Глава из учебника Дэниела Макфаддена
Эконометрика лекции (тема: инструментальная переменная) на YouTube с помощью Mark Thoma .
Лекция по эконометрике (тема: двухэтапный метод наименьших квадратов) на YouTube Марка Тома

[Imbens:00-1] Imbens, G .; Ангрист, Дж. (1994). «Выявление и оценка местных средних лечебных эффектов» (PDF) . Econometrica . 62 (2): 467–476. DOI : 10.2307 / 2951620 . JSTOR 2951620 .

[Bullock:00-2] Баллок, JG; Грин, ДП; Ха, С.Е. (2010). «Да, но каков механизм? (Не ждите простого ответа)». Журнал личности и социальной психологии . 98 (4): 550–558. CiteSeerX 10.1.1.169.5465 . DOI : 10.1037 / a0018933 . PMID 20307128 .

[3] ttps://www.stata.com/meeting/5nasug/wiv.pdf

[4] Николс, Остин (2006-07-23). «Слабые инструменты: обзор и новые методы» . Cite journal requires |journal= (help)

[5] Эпштейн, Рой J (1989). «Падение OLS в структурной оценке». Oxford Economic Papers . 41 (1): 94–107. JSTOR 2663184 .

[stock:trebbi03-6] Сток, Джеймс Х .; Требби, Франческо (2003). «Ретроспективы: кто изобрел инструментальную регрессию переменных?» . Журнал экономических перспектив . 17 (3): 177–194. DOI : 10.1257 / 089533003769204416 .

[7] Reiersøl, Олаф (1945). Анализ конфлюэнции с помощью инструментальных наборов переменных . Аркив для математики, астрономии, оч физ. 32А . Упсала: Almquist & Wiksells. OCLC 793451601 .

[bowden:turkington84-8] Bowden, RJ; Теркингтон, Д.А. (1984). Инструментальные переменные . Кембридж, Англия: Издательство Кембриджского университета.

[Leigh:00-9] Ли, JP; Шембри, М. (2004). «Метод инструментальных переменных: цена сигарет обеспечивает лучшую оценку воздействия курения на SF-12». Журнал клинической эпидемиологии . 57 (3): 284–293. DOI : 10.1016 / j.jclinepi.2003.08.006 . PMID 15066689 .

[angrist:00-10] Angrist, J .; Крюгер, А. (2001). «Инструментальные переменные и поиски идентификации: от спроса и предложения к естественным экспериментам» . Журнал экономических перспектив . 15 (4): 69–85. DOI : 10,1257 / jep.15.4.69 .

[Pearl:00-11] Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89560-6.

[12] Дэвидсон, Рассел; Маккиннон, Джеймс (1993). Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. ISBN 978-0-19-506011-9.

[13] Wooldridge, J. (2010). Эконометрический анализ поперечных и панельных данных. Эконометрический анализ поперечных и панельных данных. MIT Press.

[14] Lergenmuller, S., 2017. Двухэтапная подстановка предикторов для данных времени до события.

[balke:pearl97-15] Balke, A .; Перл, Дж. (1997). «Границы лечебных эффектов из исследований с несовершенным соблюдением режима». Журнал Американской статистической ассоциации . 92 (439): 1172–1176. CiteSeerX 10.1.1.26.3952 . DOI : 10.1080 / 01621459.1997.10474074 .

[16] Хекман, Дж. (1997). «Инструментальные переменные: исследование неявных поведенческих предположений, используемых при оценке программ». Журнал человеческих ресурсов . 32 (3): 441–462. DOI : 10.2307 / 146178 . JSTOR 146178 .

[17] Связанный, J .; Jaeger, DA; Бейкер, RM (1995). «Проблемы с оценкой инструментальных переменных при слабой корреляции между инструментами и эндогенной объясняющей переменной». Журнал Американской статистической ассоциации . 90 (430): 443. DOI : 10.1080 / 01621459.1995.10476536 .

[Stock:00-18] Stock, J .; Wright, J .; Його, М. (2002). «Обзор слабых инструментов и слабая идентификация в обобщенном методе моментов». Журнал Американской статистической ассоциации . 20 (4): 518–529. CiteSeerX 10.1.1.319.2477 . DOI : 10.1198 / 073500102288618658 .

[Nelson_1990:00-19] Нельсон, CR; Startz, R. (1990). «Некоторые дальнейшие результаты по точным свойствам малых выборок инструментальной оценки переменных» (PDF) . Econometrica . 58 (4): 967–976. DOI : 10.2307 / 2938359 . JSTOR 2938359 .

[20] Hayashi, Фумио (2000). «Тестирование сверхидентификационных ограничений» . Эконометрика . Принстон: Издательство Принстонского университета. С. 217–221. ISBN 978-0-691-01018-2.

[Wooldridge-21] Вулдридж, JM, Эконометрический анализ поперечных сечений и панельных данных, MIT Press, Cambridge, Mass.

[1]