Идентифицируемость

В статистике , идентифицируемости является свойством которого модель должна удовлетворять для того , чтобы точного вывода возможным. Модель поддается идентификации, если теоретически возможно узнать истинные значения основных параметров этой модели после получения из нее бесконечного числа наблюдений. Математически это эквивалентно утверждению, что разные значения параметров должны генерировать разные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае набор этих требований называется условиями идентификации .

Модель , которая не может быть идентифицированы , как говорят, не идентифицирующая или неясный : два или более параметризация являются наблюдаемо эквивалентны . В некоторых случаях, даже если модель не идентифицируема, все же можно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируема . В других случаях можно узнать местоположение истинного параметра до определенной конечной области пространства параметров, и в этом случае модель устанавливается идентифицируемой .

Помимо строго теоретического исследования свойств модели, идентифицируемость можно рассматривать в более широком контексте, когда модель тестируется с экспериментальными наборами данных с использованием анализа идентифицируемости . ^[1]

Определение [ править ]

Позвольте быть статистической модели, в которой пространство параметров является либо конечномерным, либо бесконечномерным. Мы говорим , что это идентифицируемым , если отображение является один-к-одному : ^[2] ${\ Displaystyle {\ mathcal {P}} = \ {P _ {\ theta}: \ theta \ in \ Theta \}}$ ${\ displaystyle \ Theta}$ ${\ Displaystyle {\ mathcal {P}}}$ ${\ displaystyle \ theta \ mapsto P _ {\ theta}}$

{\ Displaystyle P _ {\ theta _ {1}} = P _ {\ theta _ {2}} \ quad \ Rightarrow \ quad \ theta _ {1} = \ theta _ {2} \ quad \ {\ text {для всех }} \ theta _ {1}, \ theta _ {2} \ in \ Theta.}

Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ ₁ ≠ θ ₂ , то также P _{θ ₁} ≠ P _{θ ₂} . ^[3] Если распределения определены в терминах функций плотности вероятности (PDF), то два PDF-файла должны считаться различными, только если они различаются по набору ненулевой меры (например, две функции ƒ ₁ ( x ) = 1 _{0 ≤ x <1} и ƒ ₂ ( x ) = 1 _{0 ≤ x ≤ 1} различаются только в одной точке x = 1 - наборенулевой меры - и поэтому не могут рассматриваться как отдельные PDF-файлы).

Идентифицируемость модели в смысле обратимости карты эквивалентна возможности узнать истинный параметр модели, если модель может наблюдаться бесконечно долго. Действительно, если { X _т } ⊆ S представляет собой последовательность наблюдений из модели, то по усиленному закону больших чисел , ${\ displaystyle \ theta \ mapsto P _ {\ theta}}$

{\frac {1}{T}}\sum _{t=1}^{T}\mathbf {1} _{\{X_{t}\in A\}}\ {\xrightarrow {\text{a.s.}}}\ \Pr[X_{t}\in A],

для любого измеримого множества A ⊆ S (здесь 1 _{...} - индикаторная функция ). Таким образом, с помощью бесконечного числа наблюдений мы сможем найти истинное распределение вероятностей P ₀ в модели, и, поскольку условие идентифицируемости выше требует, чтобы карта была обратимой, мы также сможем найти истинное значение параметра который порождал данное распределение P ₀ . $\theta \mapsto P_{\theta }$

Примеры [ править ]

Пример 1 [ править ]

Позвольте быть нормальным семейством масштаба местоположения : ${\mathcal {P}}$

{\mathcal {P}}={\Big \{}\ f_{\theta }(x)={\tfrac {1}{{\sqrt {2\pi }}\sigma }}e^{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}}\ {\Big |}\ \theta =(\mu ,\sigma ):\mu \in \mathbb {R} ,\,\sigma \!>0\ {\Big \}}.

потом

{\begin{aligned}&f_{\theta _{1}}=f_{\theta _{2}}\\[6pt]\Longleftrightarrow {}&{\frac {1}{{\sqrt {2\pi }}\sigma _{1}}}\exp \left(-{\frac {1}{2\sigma _{1}^{2}}}(x-\mu _{1})^{2}\right)={\frac {1}{{\sqrt {2\pi }}\sigma _{2}}}\exp \left(-{\frac {1}{2\sigma _{2}^{2}}}(x-\mu _{2})^{2}\right)\\[6pt]\Longleftrightarrow {}&{\frac {1}{\sigma _{1}^{2}}}(x-\mu _{1})^{2}+\ln \sigma _{1}={\frac {1}{\sigma _{2}^{2}}}(x-\mu _{2})^{2}+\ln \sigma _{2}\\[6pt]\Longleftrightarrow {}&x^{2}\left({\frac {1}{\sigma _{1}^{2}}}-{\frac {1}{\sigma _{2}^{2}}}\right)-2x\left({\frac {\mu _{1}}{\sigma _{1}^{2}}}-{\frac {\mu _{2}}{\sigma _{2}^{2}}}\right)+\left({\frac {\mu _{1}^{2}}{\sigma _{1}^{2}}}-{\frac {\mu _{2}^{2}}{\sigma _{2}^{2}}}+\ln \sigma _{1}-\ln \sigma _{2}\right)=0\end{aligned}}

Это выражение равно нулю для почти всех x только тогда, когда все его коэффициенты равны нулю, что возможно только при | σ ₁ | = | σ ₂ | и μ ₁ = μ ₂ . Поскольку в параметре масштаба σ ограничивается значением больше нуля, мы заключаем, что модель идентифицируема: ƒ _{θ ₁} = ƒ _{θ ₂} ⇔ θ ₁ = θ ₂ .

Пример 2 [ править ]

Позвольте быть стандартной модели линейной регрессии : ${\mathcal {P}}$

y=\beta 'x+\varepsilon ,\quad \mathrm {E} [\,\varepsilon \mid x\,]=0

(где 'означает транспонирование матрицы ). Тогда параметр β идентифицируем тогда и только тогда, когда матрица обратима. Таким образом, это условие идентификации в модели. $\mathrm {E} [xx']$

Пример 3 [ править ]

Предположим, что это классическая линейная модель ошибок в переменных : ${\mathcal {P}}$

{\begin{cases}y=\beta x^{*}+\varepsilon ,\\x=x^{*}+\eta ,\end{cases}}

где ( ε , η , x * ) - совместно нормальные независимые случайные величины с нулевым ожидаемым значением и неизвестными дисперсиями, и наблюдаются только переменные ( x , y ). Тогда эта модель не поддается идентификации, ^{[4] есть} только произведение βσ² _∗ (где σ² _∗ - дисперсия скрытого регрессора x * ). Это также пример модели, идентифицируемой по множеству : хотя точное значение β невозможно узнать, мы можем гарантировать, что оно должно лежать где-то в интервале ( β _yx , 1 ÷ β _xy ), где β_yx - это коэффициент регрессии y по x в OLS , а β _xy - коэффициент регрессии x по y в OLS . ^[5]

Если мы откажемся от предположения о нормальности и потребуем, чтобы x * не были нормально распределены, сохранив только условие независимости ε ⊥ η ⊥ x * , то модель станет идентифицируемой. ^[4]

Программное обеспечение [ править ]

В случае оценки параметров в частично наблюдаемых динамических системах правдоподобие профиля может также использоваться для структурного и практического анализа идентифицируемости. ^[6] Реализация [1] доступна в PottersWheel MATLAB Toolbox .

См. Также [ править ]

Наблюдаемость
Идентификация системы
Модель одновременных уравнений

Ссылки [ править ]

Цитаты [ править ]

^ Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Шиллинг, М .; Klingmuller, U .; Тиммер, Дж. (1 августа 2009 г.). «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля» . Биоинформатика . 25 (15): 1923–1929. DOI : 10.1093 / биоинформатики / btp358 . PMID 19505944 .
↑ Lehmann & Casella 1998 , Определение 1.5.2.
↑ van der Vaart 1998 , p. 62
^ a b Рейерсол 1950
↑ Casella & Berger 2001 , стр. 583
^ Рауэ, А; Kreutz, C; Maiwald, T; Бахманн, Дж; Шиллинг, М; Klingmüller, U; Тиммер, J (2009), "Структурные и практический анализ идентифицируемости частично наблюдаемых динамических моделей за счет использования профилей вероятности" , биоинформатики , 25 (15): 1923-9, DOI : 10,1093 / биоинформатики / btp358 , PMID 19505944 , заархивированы из оригинал от 13 января 2013 г.

Источники [ править ]

Казелла, Джордж ; Бергер, Роджер Л. (2002), Статистический вывод (2-е изд.), ISBN 0-534-24312-6, LCCN 2001025794
Сяо, Ченг (1983), Идентификация , Справочник по эконометрике, Vol. 1, глава 4, Издательство Северной Голландии
Lehmann, EL ; Каселла, Г. (1998), Теория точечного оценивания (2-е изд.), Springer, ISBN 0-387-98502-6
Reiersøl, Олав (1950), "Идентифицируемость линейной зависимости между переменными , которые подвержены ошибкам", Эконометрика , 18 (4): 375-389, DOI : 10,2307 / 1907835 , JSTOR 1907835
ван дер Ваарт, AW (1998), Асимптотическая статистика , Cambridge University Press , ISBN 978-0-521-49603-2

Дальнейшее чтение [ править ]

Вальтер, Э. ; Пронзато, Л. (1997), Идентификация параметрических моделей на основе экспериментальных данных , Springer

Эконометрика [ править ]

Левбель, Артур (01.12.2019). «Зоопарк идентификации: значения идентификации в эконометрике» . Журнал экономической литературы . Американская экономическая ассоциация. 57 (4): 835–903. DOI : 10,1257 / jel.20181361 . ISSN 0022-0515 .
Мацкин, Роза Л. (2013). «Непараметрическая идентификация в структурных экономических моделях». Ежегодный обзор экономики . 5 (1): 457–486. DOI : 10.1146 / Annurev-Economics-082912-110231 .
Ротенберг, Томас Дж. (1971). «Идентификация в параметрических моделях». Econometrica . 39 (3): 577–591. DOI : 10.2307 / 1913267 . ISSN 0012-9682 . JSTOR 1913267 .

[1] Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Шиллинг, М .; Klingmuller, U .; Тиммер, Дж. (1 августа 2009 г.). «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля» . Биоинформатика . 25 (15): 1923–1929. DOI : 10.1093 / биоинформатики / btp358 . PMID 19505944 .

[2] Lehmann & Casella 1998 , Определение 1.5.2.

[3] van der Vaart 1998 , p. 62

[riersol-4] Рейерсол 1950

[5] Casella & Berger 2001 , стр. 583

[6] Рауэ, А; Kreutz, C; Maiwald, T; Бахманн, Дж; Шиллинг, М; Klingmüller, U; Тиммер, J (2009), "Структурные и практический анализ идентифицируемости частично наблюдаемых динамических моделей за счет использования профилей вероятности" , биоинформатики , 25 (15): 1923-9, DOI : 10,1093 / биоинформатики / btp358 , PMID 19505944 , заархивированы из оригинал от 13 января 2013 г.

[1]