Причинный граф

В статистике, эконометрике, эпидемиологии, генетике и смежных дисциплинах причинно-следственные диаграммы (также известные как диаграммы путей , причинно-следственные байесовские сети или DAG) представляют собой вероятностные графические модели, используемые для кодирования предположений о процессе генерации данных. Их также можно рассматривать как схему алгоритма, с помощью которого Природа присваивает значения переменным в интересующей области.

Графики причинно-следственных связей можно использовать для связи и для вывода. Как устройства связи, графики обеспечивают формальное и прозрачное представление причинных предположений, которые исследователи могут пожелать передать и защитить. В качестве инструментов вывода графики позволяют исследователям оценивать величину эффекта на основе неэкспериментальных данных, ^[1]^[2]^[3]^[4]^[5] выводить проверяемые последствия закодированных предположений, ^[1]^[6]^{[7] »}^[8] проверка на внешнюю валидность, ^[9] и управление отсутствующими данными ^[10] и смещением выбора. ^[11]

Причинные графы впервые были использованы генетиком Сьюэлом Райтом ^[12] под рубрикой «путевые диаграммы». Позже они были приняты социологами ^[13]^[14]^[15]^[16]^[17]^[18] и, в меньшей степени, экономистами. ^[19] Эти модели изначально были ограничены линейными уравнениями с фиксированными параметрами. Современные разработки расширили графические модели до непараметрического анализа и, таким образом, достигли универсальности и гибкости, которые преобразовали причинный анализ в компьютерных науках, эпидемиологии ^[20] и социальных науках. ^[21]

Конструкция и терминология [ править ]

Причинный граф можно построить следующим образом. Каждая переменная в модели имеет соответствующую вершину или узел, и стрелка проводится от переменной X к переменной Y всякий раз, когда считается, что Y реагирует на изменения в X, когда все другие переменные остаются постоянными. Переменные , связанные с Y через прямые стрелки называются родители из Y , или «прямые причины Y » и обозначаются Па (Y) .

Причинные модели часто включают в себя «условия ошибки» или «пропущенные факторы», которые представляют все неизмеряемые факторы, которые влияют на переменную Y, когда Pa (Y) остается постоянным. В большинстве случаев ошибки исключаются из графика. Однако, если автор графа подозревает, что члены ошибок любых двух переменных являются зависимыми (например, две переменные имеют ненаблюдаемую или скрытую общую причину), то между ними рисуется двунаправленная дуга. Таким образом, наличие скрытых переменных учитывается посредством корреляций, которые они вызывают между ошибочными членами, представленными двунаправленными дугами.

Основные инструменты [ править ]

Основным инструментом графического анализа является d-разделение , которое позволяет исследователям определить путем проверки, подразумевает ли причинная структура независимость двух наборов переменных при наличии третьего набора. В рекурсивных моделях без коррелированных членов ошибок (иногда называемых марковскими ) эти условные независимости представляют все проверяемые следствия модели. ^[22]

Пример [ править ]

Предположим, мы хотим оценить влияние посещения элитного колледжа на будущие доходы. Простой регресс заработка на рейтинг колледжа не даст объективной оценки целевого эффекта, потому что элитные колледжи очень избирательны, и учащиеся их, вероятно, будут иметь квалификацию для высокооплачиваемой работы до посещения школы. Предполагая, что причинно-следственные связи линейны, эти базовые знания могут быть выражены в следующей спецификации модели структурных уравнений (SEM).

Модель 1

{\ displaystyle {\ begin {align} Q_ {1} & = U_ {1} \\ C & = a \ cdot Q_ {1} + U_ {2} \\ Q_ {2} & = c \ cdot C + d \ cdot Q_ {1} + U_ {3} \\ S & = b \ cdot C + e \ cdot Q_ {2} + U_ {4}, \ end {align}}}

где представляет квалификацию человека до поступления в колледж, представляет квалификацию после колледжа, содержит атрибуты, представляющие качество обучения в колледже и заработную плату человека. ${\ displaystyle Q_ {1}}$ ${\ displaystyle Q_ {2}}$ ${\ displaystyle C}$ ${\ displaystyle S}$

Рисунок 1: Неидентифицированная модель со скрытыми переменными ( и ), показанными явно

{\ displaystyle Q_ {1}}

{\ displaystyle Q_ {2}}

Рисунок 2: Неидентифицированная модель с обобщенными скрытыми переменными

Рисунок 1 представляет собой причинно-следственный график, представляющий эту спецификацию модели. Каждая переменная в модели имеет соответствующий узел или вершину в графе. Кроме того, для каждого уравнения стрелки нарисованы от независимых переменных к зависимым переменным. Эти стрелки отражают направление причинно-следственной связи. В некоторых случаях мы можем обозначить стрелку соответствующим структурным коэффициентом, как на рисунке 1.

Если и являются ненаблюдаемыми или скрытыми переменными, их влияние и может быть связано с их ошибочными условиями. Удалив их, мы получим следующую спецификацию модели: ${\ displaystyle Q_ {1}}$ ${\ displaystyle Q_ {2}}$ ${\ displaystyle C}$ ${\ displaystyle S}$

Модель 2

{\ displaystyle {\ begin {align} C & = U_ {C} \\ S & = \ beta C + U_ {S} \ end {align}}}

Справочная информация определяется Model 1 следует , что термин ошибка , , коррелирует с C» термина ошибки с, . В результате мы добавляем двунаправленную дугу между S и C , как на рисунке 2. ${\ displaystyle S}$ ${\ displaystyle U_ {S}}$ ${\ displaystyle U_ {C}}$

Рисунок 3: Идентифицированная модель со скрытыми переменными ( и ), показанными явно

{\ displaystyle Q_ {1}}

{\ displaystyle Q_ {2}}

Рисунок 4: Идентифицированная модель с обобщенными скрытыми переменными

Так как коррелирует с , и, следовательно, , является эндогенным и не идентифицированы в модели 2. Однако, если мы включаем силу применения колледжа индивидуума, как показано на рисунке 3, получаем следующую модель: ${\ displaystyle U_ {S}}$ ${\ displaystyle U_ {C}}$ ${\ displaystyle C}$ ${\ displaystyle C}$ ${\ displaystyle \ beta}$ ${\ displaystyle A}$

Модель 3

{\ displaystyle {\ begin {align} Q_ {1} & = U_ {1} \\ A & = a \ cdot Q_ {1} + U_ {2} \\ C & = b \ cdot A + U_ {3} \\ Q_ {2} & = e \ cdot Q_ {1} + d \ cdot C + U_ {4} \\ S & = c \ cdot C + f \ cdot Q_ {2} + U_ {5}, \ end {выровнено} }}

Удалив скрытые переменные из спецификации модели, мы получим:

Модель 4

{\ Displaystyle {\ begin {align} A & = a \ cdot Q_ {1} + U_ {A} \\ C & = b \ cdot A + U_ {C} \\ S & = \ beta \ cdot C + U_ {S} , \ end {выровнено}}}

с соотносится с . $U_{A}$ $U_{S}$

Теперь определяется и может быть оценено с помощью регрессии на и . Это может быть проверено с использованием критерия одной двери , ^[1]^[23] необходимое и достаточное условие для графического идентификации структурных коэффициентов, как , с помощью регрессии. $\beta$ $S$ $C$ $A$ $\beta$

Ссылки [ править ]

^ a b c Жемчуг, Иудея (2000). Причинная связь . Кембридж, Массачусетс: MIT Press.
^ Тиан, Джин; Жемчуг, Иудея (2002). «Общее условие идентификации причинных эффектов» . Труды восемнадцатой национальной конференции по искусственному интеллекту . ISBN 978-0-262-51129-2.
^ Шпицер, Илья; Жемчуг, Иудея (2008). «Полные методы идентификации причинной иерархии» (PDF) . Журнал исследований в области машинного обучения . 9 : 1941–1979.
^ Хуанг, Y .; Валторта, М. (2006). «Идентифицируемость в каузальных байесовских сетях: надежный и полный алгоритм». Труды AAAI .
^ Bareinboim, Элиас; Жемчуг, Иудея (2012). «Причинно-следственный вывод суррогатных экспериментов: z-идентификация». Труды Двадцать восьмой конференции по неопределенности в искусственном интеллекте . arXiv : 1210,4842 . Bibcode : 2012arXiv1210.4842B . ISBN 978-0-9749039-8-9.
^ Тиан, Джин; Жемчуг, Иудея (2002). «О проверяемых последствиях причинных моделей со скрытыми переменными». Труды восемнадцатой конференции по неопределенности в искусственном интеллекте . С. 519–27. arXiv : 1301.0608 . Bibcode : 2013arXiv1301.0608T . ISBN 978-1-55860-897-9.
^ Шпицер, Илья; Жемчуг, Иудея (2008). «Дремлющая независимость». Труды AAAI .
^ Чен, Брайант; Жемчуг, Иудея (2014). «Проверяемые последствия моделей линейных структурных уравнений». Труды AAAI .
^ Bareinmboim, Элиас; Жемчуг, Иудея (2014). «Внешняя валидность: от исчисления к переносимости между популяциями». Статистическая наука . 29 (4): 579–595. arXiv : 1503.01603 . DOI : 10.1214 / 14-sts486 .
^ Мохан, Картика; Перл, Иудея; Тиан, Джин (2013). «Графические модели для вывода с отсутствующими данными». Достижения в системах обработки нейронной информации .
^ Bareinboim, Элиас; Тиан, Джин; Жемчуг, Иудея (2014). «Восстановление от смещения отбора в причинно-следственных и статистических выводах». Труды AAAI .
^ Райт, С. (1921). «Корреляция и причинно-следственная связь». Журнал сельскохозяйственных исследований . 20 : 557–585.
^ Блэлок, HM (1960). «Корреляционный анализ и причинно-следственные выводы» . Американский антрополог . 62 (4): 624–631. DOI : 10.1525 / aa.1960.62.4.02a00060 .
^ Дункан, OD (1966). «Анализ пути: социологические примеры». Американский журнал социологии . 72 : 1–16. DOI : 10.1086 / 224256 .
^ Дункан, OD (1976). «Введение в модели структурных уравнений». Американский журнал социологии . 82 (3): 731–733. DOI : 10.1086 / 226377 .
^ Jöreskog, К. (1969). «Общий подход к подтверждающему анализу факторов максимального правдоподобия». Психометрика . 34 (2): 183–202. DOI : 10.1007 / bf02289343 .
^ Goldberger, AS; Дункан, О.Д. (1973). Модели структурных уравнений в социальных науках . Нью-Йорк: Seminar Press.
Перейти ↑ Goldberger, AS (1972). «Структурные модели уравнений в социальных науках». Econometrica . 40 (6): 979–1001. DOI : 10.2307 / 1913851 . JSTOR 1913851 .
^ Белый, Халберт; Чалак, Карим; Лу, Сюнь (2011). «Связывание причинности Грейнджера и жемчужной каузальной модели с устанавливаемыми системами». Причинная связь в вызовах временных рядов в машинном обучении . 5 .
^ Ротман, Кеннет Дж .; Гренландия, Сандер; Лэш, Тимоти (2008). Современная эпидемиология . Липпинкотт Уильямс и Уилкинс.
^ Морган, SL; Уиншип, К. (2007). Противоречия и причинный вывод: методы и принципы социальных исследований . Нью-Йорк: Издательство Кембриджского университета.
^ Гейгер, Дэн; Жемчуг, Иудея (1993). «Логико-алгоритмические свойства условной независимости». Анналы статистики . 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043 . DOI : 10.1214 / AOS / 1176349407 .
^ Chen, B .; Перл, Дж (2014). «Графические инструменты для моделирования линейных структурных уравнений». Технический отчет .

[causality-1] Жемчуг, Иудея (2000). Причинная связь . Кембридж, Массачусетс: MIT Press.

[2] Тиан, Джин; Жемчуг, Иудея (2002). «Общее условие идентификации причинных эффектов» . Труды восемнадцатой национальной конференции по искусственному интеллекту . ISBN 978-0-262-51129-2.

[3] Шпицер, Илья; Жемчуг, Иудея (2008). «Полные методы идентификации причинной иерархии» (PDF) . Журнал исследований в области машинного обучения . 9 : 1941–1979.

[4] Хуанг, Y .; Валторта, М. (2006). «Идентифицируемость в каузальных байесовских сетях: надежный и полный алгоритм». Труды AAAI .

[5] Bareinboim, Элиас; Жемчуг, Иудея (2012). «Причинно-следственный вывод суррогатных экспериментов: z-идентификация». Труды Двадцать восьмой конференции по неопределенности в искусственном интеллекте . arXiv : 1210,4842 . Bibcode : 2012arXiv1210.4842B . ISBN 978-0-9749039-8-9.

[6] Тиан, Джин; Жемчуг, Иудея (2002). «О проверяемых последствиях причинных моделей со скрытыми переменными». Труды восемнадцатой конференции по неопределенности в искусственном интеллекте . С. 519–27. arXiv : 1301.0608 . Bibcode : 2013arXiv1301.0608T . ISBN 978-1-55860-897-9.

[7] Шпицер, Илья; Жемчуг, Иудея (2008). «Дремлющая независимость». Труды AAAI .

[8] Чен, Брайант; Жемчуг, Иудея (2014). «Проверяемые последствия моделей линейных структурных уравнений». Труды AAAI .

[9] Bareinmboim, Элиас; Жемчуг, Иудея (2014). «Внешняя валидность: от исчисления к переносимости между популяциями». Статистическая наука . 29 (4): 579–595. arXiv : 1503.01603 . DOI : 10.1214 / 14-sts486 .

[10] Мохан, Картика; Перл, Иудея; Тиан, Джин (2013). «Графические модели для вывода с отсутствующими данными». Достижения в системах обработки нейронной информации .

[11] Bareinboim, Элиас; Тиан, Джин; Жемчуг, Иудея (2014). «Восстановление от смещения отбора в причинно-следственных и статистических выводах». Труды AAAI .

[12] Райт, С. (1921). «Корреляция и причинно-следственная связь». Журнал сельскохозяйственных исследований . 20 : 557–585.

[13] Блэлок, HM (1960). «Корреляционный анализ и причинно-следственные выводы» . Американский антрополог . 62 (4): 624–631. DOI : 10.1525 / aa.1960.62.4.02a00060 .

[14] Дункан, OD (1966). «Анализ пути: социологические примеры». Американский журнал социологии . 72 : 1–16. DOI : 10.1086 / 224256 .

[15] Дункан, OD (1976). «Введение в модели структурных уравнений». Американский журнал социологии . 82 (3): 731–733. DOI : 10.1086 / 226377 .

[16] Jöreskog, К. (1969). «Общий подход к подтверждающему анализу факторов максимального правдоподобия». Психометрика . 34 (2): 183–202. DOI : 10.1007 / bf02289343 .

[17] Goldberger, AS; Дункан, О.Д. (1973). Модели структурных уравнений в социальных науках . Нью-Йорк: Seminar Press.

[18] Перейти ↑ Goldberger, AS (1972). «Структурные модели уравнений в социальных науках». Econometrica . 40 (6): 979–1001. DOI : 10.2307 / 1913851 . JSTOR 1913851 .

[19] Белый, Халберт; Чалак, Карим; Лу, Сюнь (2011). «Связывание причинности Грейнджера и жемчужной каузальной модели с устанавливаемыми системами». Причинная связь в вызовах временных рядов в машинном обучении . 5 .

[20] Ротман, Кеннет Дж .; Гренландия, Сандер; Лэш, Тимоти (2008). Современная эпидемиология . Липпинкотт Уильямс и Уилкинс.

[21] Морган, SL; Уиншип, К. (2007). Противоречия и причинный вывод: методы и принципы социальных исследований . Нью-Йорк: Издательство Кембриджского университета.

[22] Гейгер, Дэн; Жемчуг, Иудея (1993). «Логико-алгоритмические свойства условной независимости». Анналы статистики . 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043 . DOI : 10.1214 / AOS / 1176349407 .

[23] Chen, B .; Перл, Дж (2014). «Графические инструменты для моделирования линейных структурных уравнений». Технический отчет .

[1]