Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Сравнение двух конкурирующих причинно-следственных моделей (DCM, GCM), используемых для интерпретации изображений фМРТ [1]

В философии науки , A причинная модель (или структурная причинная модель) представляет собой концептуальную модель , которая описывает причинные механизмы в системе . Причинно-следственные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том, какие независимые переменные необходимо включить / контролировать.

Они могут позволить ответить на некоторые вопросы на основе имеющихся данных наблюдений без необходимости интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования не подходят по этическим или практическим причинам, а это означает, что без причинной модели некоторые гипотезы не могут быть проверены.

Причинные модели могут помочь с вопросом о внешней валидности (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут позволить объединить данные из нескольких исследований (при определенных обстоятельствах), чтобы ответить на вопросы, на которые нельзя ответить с помощью какого-либо отдельного набора данных.

Причинно-следственные модели фальсифицируются в том смысле , что, если они не соответствуют данным, они должны быть отклонены как недействительные. Они также должны вызывать доверие у тех, кто близок к явлениям, которые модель намеревается объяснить. [2]

Причинные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . [3]

Определение [ править ]

Причинные модели - это математические модели, представляющие причинно-следственные связи внутри отдельной системы или совокупности. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут научить нас многому об эпистемологии причинно-следственной связи и о взаимосвязи между причинностью и вероятностью. Они также применялись к темам, представляющим интерес для философов, таким как логика контрфактов, теория принятия решений и анализ действительной причинно-следственной связи. [4]

-  Стэнфордская энциклопедия философии

Джудея Перл определяет причинную модель как упорядоченную тройку , где U - это набор экзогенных переменных , значения которых определяются факторами вне модели; V - это набор эндогенных переменных, значения которых определяются факторами в модели; и E представляет собой набор структурных уравнений, которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. [3]

История [ править ]

Аристотель определил таксономию причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу гипотез . В какой-то момент он отрицал, что объекты обладают «способностями», которые делают одно причиной, а другое - следствием. [5] : 264 Позже он принял «если бы первого объекта не было, второго никогда не существовало бы» (« кроме » причинности). [5] : 265

В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинных правил для таких областей, как биологическая наследственность, Гальтон ввел концепцию средней регрессии (воплощенной спадом в спорте на втором курсе ), которая позже привела его к непричинной концепции корреляции . [5]

Как позитивист , Пирсон исключил понятие причинности из большей части науки как недоказуемого частного случая ассоциации и ввел коэффициент корреляции в качестве метрики ассоциации. Он писал: «Сила как причина движения - это то же самое, что бог дерева как причина роста», и эта причинность была лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Biometrika и лабораторию биометрии в Университетском колледже Лондона , которая стала мировым лидером в области статистики. [5]

В 1908 году Харди и Вайнберг решили проблему стабильности черт, которая привела Гальтона к отказу от причинности, возродив менделевское наследование . [5]

В 1921 году Райт «s анализ пути стал теоретическим предок причинной моделировании и причинными графов. [6] Он разработал этот подход, пытаясь распутать относительное влияние наследственности , развития и окружающей среды на структуру шерсти морских свинок . Он подтвердил свои тогдашние еретические утверждения, показав, как такой анализ может объяснить взаимосвязь между весом при рождении морской свинки, внутриутробным временем и размером помета. Противодействие этим идеям со стороны выдающихся статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика) Фишера.. [5] Единственным исключением был Бёркс, студент, который в 1926 году первым применил диаграммы путей для представления опосредующего влияния ( посредника ) и утверждал, что поддержание константы посредника порождает ошибки. Возможно, она самостоятельно изобрела схемы путей. [5] : 304

В 1923 году Нейман представил концепцию потенциального результата, но его статья не была переведена с польского на английский до 1990 года. [5] : 271

В 1958 году Кокс предупредил, что контроль переменной Z действителен, только если маловероятно, что на него повлияют независимые переменные. [5] : 154

В 1960-х Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс. [5] : 308

Первоначально социологи называли каузальные модели моделированием структурных уравнений , но когда он стал механическим методом, он потерял свою полезность, что заставило некоторых практиков отвергнуть любую связь с причинностью. Экономисты взяли на вооружение алгебраическую часть анализа путей, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать своим уравнениям причинный смысл. [5]

Спустя шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой резюмировал ее, вслед за критикой Карлина и др., Которые возражали, что она обрабатывает только линейные отношения и что надежные, не модельные представления данных более показательны. [5]

В 1973 году Льюис выступал за замену корреляции на причинную связь (контрфакты). Он сослался на способность людей вообразить альтернативные миры, в которых причина возникла или не возникла, а следствие возникло только вслед за своей причиной. [5] : 266 В 1974 году Рубин ввел понятие «потенциальные результаты» как язык для постановки причинно-следственных вопросов. [5] : 269

В 1983 году Картрайт предложил обусловить любой фактор, который является «причинно релевантным» эффекту, выйдя за рамки простой вероятности в качестве единственного ориентира. [5] : 48

В 1986 году Барон и Кенни ввели принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по цитируемости за все время. [5] : 324 В том году Гренландия и Робинс представили подход «взаимозаменяемости» к устранению путаницы путем рассмотрения контрфактического факта. Они предложили оценить, что случилось бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатами контрольной группы. Если они совпадали, считалось, что смешение отсутствует. [5] : 154

В Колумбийском университете работает Лаборатория каузального искусственного интеллекта, которая пытается связать теорию каузального моделирования с искусственными нейронными сетями . [7]

Лестница причинности [ править ]

Причинная метамодель Перла включает трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, ассоциация (видение / наблюдение), влечет за собой восприятие закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Самый высокий уровень, контрфактуальность (воображение), включает построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные эффекты и что происходит в отсутствие таких действий. [5]

Ассоциация [ править ]

Один объект ассоциируется с другим, если наблюдение за одним изменяет вероятность наблюдения за другим. Пример: покупатели, покупающие зубную пасту, с большей вероятностью также купят зубную нить. Математически:

или вероятность (покупки) зубной нити с учетом (покупки) зубной пасты. Связи также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственных связей. Одно событие могло вызвать другое, обратное могло быть правдой, или оба события могли быть вызваны каким-то третьим событием (несчастный гигиенист заставляет покупателя лучше относиться к своему рту). [5]

Вмешательство [ править ]

Этот уровень устанавливает определенные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, влияющего на одно из событий. Пример: если бы мы удвоили цену на зубную пасту, какова была бы новая вероятность покупки? Причинно-следственная связь не может быть установлена ​​путем изучения истории (изменений цен), потому что изменение цены могло произойти по какой-то другой причине, которая сама могла повлиять на второе событие (тариф, увеличивающий цену на оба товара). Математически:

где do - оператор, сигнализирующий об экспериментальном вмешательстве (удвоение цены). [5] Оператор указывает выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операции» на модели с минимальными отклонениями от реальности. [8]

Противоречия [ править ]

Самый высокий уровень, контрфактический, включает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при разных обстоятельствах для той же экспериментальной единицы. Например, какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее?

Противоречия могут указывать на наличие причинно-следственной связи. Модели, которые могут дать ответ на опровержения, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как физические законы (как в законах физики, например, в законах инерции, которые гласят, что если к неподвижному объекту не приложить силу, он не будет двигаться). [5]

Причинность [ править ]

Причинно-следственная связь против корреляции [ править ]

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти отношения описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения в других. [3]

Определения причинности в двадцатом веке основывались исключительно на вероятностях / ассоциациях. Было сказано, что одно событие (X) вызывает другое, если оно увеличивает вероятность другого (Y). Математически это выражается как:

.

Такие определения неадекватны, потому что другие отношения (например, общая причина для X и Y) могут удовлетворять условию. Причинно-следственная связь актуальна для второй ступени лестницы. Ассоциации находятся на первом этапе и предоставляют только доказательства второму. [5]

В более позднем определении была предпринята попытка устранить эту двусмысленность путем учета фоновых факторов. Математически:

,

где K - набор фоновых переменных, а k представляет значения этих переменных в конкретном контексте. Однако требуемый набор фоновых переменных не определен (несколько наборов могут увеличить вероятность), пока вероятность является единственным критерием [ требуется пояснение ] . [5]

Другие попытки определить причинно-следственную связь включают причинность Грейнджера , статистический тест гипотезы, согласно которому причинность (в экономике ) может быть оценена путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. [5]

Типы [ править ]

Причина может быть необходимой, достаточной, способствующей или некоторой комбинацией. [9]

Необходимо [ править ]

Чтобы x был необходимой причиной y , наличие y должно означать предшествующее появление x . Однако наличие x не означает, что y произойдет. [10] Необходимые причины также известны как причины «кроме», так как в y не произошло бы, если бы не возникло x . [5] : 261

Достаточные причины [ править ]

Чтобы x был достаточной причиной y , наличие x должно означать последующее появление y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предшествующего появления x . [10]

Дополнительные причины [ править ]

Чтобы x был сопутствующей причиной y , присутствие x должно увеличивать вероятность y . Если вероятность равна 100%, то x называется достаточным. Также может потребоваться сопутствующая причина. [11]

Модель [ править ]

Причинно-следственная диаграмма [ править ]

Причинно-следственная диаграмма - это ориентированный граф, который отображает причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Острие стрелки очерчивает направление причинно-следственной связи, например, стрелка, соединяющая переменные A и B с острием стрелки в B, указывает, что изменение в A вызывает изменение в B (со связанной вероятностью). Путь является обходом графа между двумя узлами следующих причинных стрелками. [5]

Причинные диаграммы включают диаграммы причинных петель , ориентированные ациклические графы и диаграммы Исикавы . [5]

Диаграммы причинно-следственных связей не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений модели. [5]

Элементы модели [ править ]

Причинные модели имеют формальные структуры с элементами со специфическими свойствами. [5]

Узоры соединений [ править ]

Три типа соединений трех узлов - это линейные цепи, ответвления и объединяющиеся коллайдеры. [5]

Цепочка [ править ]

Цепи - это прямые соединения со стрелками, указывающими от причины к следствию. В этой модели B является посредником в том смысле, что он опосредует изменения, которые в противном случае A оказал бы на C. [5] : 113

Вилка [ править ]

В вилках одна причина имеет несколько последствий. Эти два эффекта имеют общую причину. Существует (не причинная) ложная корреляция между A и C, которую можно устранить, обусловив B (для определенного значения B). [5] : 114

«Условие на B» означает «при условии B» (т. Е. При значении B).

Доработка вилки мешает:

В таких моделях B является общей причиной A и C (что также вызывает A), что делает B мешающим фактором [ требуется пояснение ] . [5] : 114

Коллайдер [ править ]

В коллайдерах несколько причин влияют на один результат. Условие на B (для определенного значения B) часто выявляет непричинную отрицательную корреляцию между A и C. Эта отрицательная корреляция была названа смещением коллайдера и эффектом «объяснения без объяснения», как, например, B объясняет корреляцию между A и C. [5] : 115 Корреляция может быть положительной в случае, когда вклады от A и C необходимы для воздействия на B. [5] : 197

Типы узлов [ править ]

Посредник [ править ]

Узел-посредник изменяет влияние других причин на результат (в отличие от простого воздействия на результат). [5] : 113 Например, в приведенном выше примере цепочки B является посредником, потому что он изменяет эффект A (косвенная причина C) на C (результат).

Confounder [ править ]

Узел смешения влияет на несколько результатов, создавая между ними положительную корреляцию. [5] : 114

Инструментальная переменная [ править ]

Инструментальная переменная является тот , который: [5] : 246

  • есть путь к результату
  • не имеет другого пути к причинным переменным
  • не имеет прямого влияния на результат

Коэффициенты регрессии могут служить оценками причинного воздействия инструментальной переменной на результат, если этот эффект не искажен. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о влияющих факторах. [5] : 249

Например, учитывая модель:

Z - инструментальная переменная, потому что она имеет путь к результату Y и не связана, например, с U.

В приведенном выше примере, если Z и X принимают двоичные значения, то предположение, что Z = 0, X = 1 не выполняется, называется монотонностью [ требуется пояснение ] . [5] : 253

Усовершенствования методики [ необходимы пояснения ] включают создание инструмента [ требуется пояснение ] путем создания условий для другой переменной [ требуется пояснение ], чтобы заблокировать [ необходимо пояснение ] путей [ необходимо пояснение ] между инструментом и вмешивающимся фактором [ необходимо пояснение ] и объединение нескольких переменные для формирования единого инструмента [ требуется пояснение ] . [5] : 257

Менделирующая рандомизация [ править ]

Определение: Менделирующая рандомизация использует измеренные вариации в генах известной функции для изучения причинного воздействия изменяемого воздействия на заболевание в обсервационных исследованиях . [12] [13]

Поскольку гены варьируются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственная связь может быть определена количественно с использованием регрессии в наблюдательном исследовании. [5] : 255

Ассоциации [ править ]

Условия независимости [ править ]

Условия независимости - это правила определения независимости двух переменных друг от друга. Переменные независимы, если значения одной не влияют напрямую на значения другой. Множественные причинно-следственные модели могут разделять условия независимости. Например, модели

и

имеют те же условия независимости, потому что кондиционирование на B оставляет A и C независимыми. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между A и C после кондиционирования B, то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, потому что они имеют одинаковые условия независимости.

Обусловленность переменной - это механизм для проведения гипотетических экспериментов. Условие для переменной включает в себя анализ значений других переменных для данного значения условной переменной. В первом примере обусловливание B подразумевает, что наблюдения для данного значения B не должны показывать зависимости между A и C. Если такая зависимость существует, то модель неверна. Не-причинные модели не могут проводить такие различия, потому что они не делают причинных утверждений. [5] : 129–130

Confounder / deconfounder [ править ]

Важным элементом дизайна корреляционного исследования является выявление потенциально искажающих влияний на исследуемую переменную, например демографические данные. Эти переменные контролируются для устранения этих влияний. Однако правильный список смешивающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) исследуемую переменную. [5] : 139

Причинно-следственные модели предлагают надежный метод определения соответствующих смешивающих переменных. Формально Z является затруднительным, если «Y связан с Z путями, не проходящими через X». Их часто можно определить, используя данные, собранные для других исследований. Математически, если

тогда X является смешивающим фактором для Y. [5] : 151

Ранее к якобы неправильным определениям относятся: [5] : 152

  • «Любая переменная, которая коррелирует как с X, так и с Y».
  • Y связан с Z среди неэкспонированных.
  • Невозможность сворачивания: разница между «грубым относительным риском и относительным риском, возникающим после поправки на потенциальную помеху».
  • Эпидемиологический: переменная, связанная с X среди населения в целом и связанная с Y среди людей, не подвергавшихся воздействию X.

Последний недостаток в том, что в модели:

Z соответствует определению, но является посредником, а не мешающим фактором, и является примером контроля за результатом.

В модели

Традиционно B считалось вмешивающимся, потому что он связан с X и с Y, но не находится на причинном пути и не является потомком чего-либо на причинном пути. Контроль за B заставляет его становиться затруднительным. Это известно как M-смещение. [5] : 161

Настройка бэкдора [ править ]

Для анализа причинного воздействия X на Y в каузальной модели нам необходимо скорректировать все искажающие переменные (деконфаундирование). Чтобы идентифицировать набор мешающих факторов, нам нужно (1) заблокировать каждый не причинный путь между X и Y этим набором (2) без нарушения каких-либо причинных путей и (3) без создания каких-либо ложных путей. [5] : 158

Определение : черный ход от переменной X к Y - это любой путь от X к Y, который начинается со стрелки, указывающей на X. [5] : 158

Определение : Учитывая упорядоченную пару переменных (X, Y) в модели, набор смешивающих переменных Z удовлетворяет критерию бэкдора, если (1) никакая смешивающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором конфаунтеров.

Если критерий бэкдора удовлетворяется для (X, Y), X и Y деконфигурированы набором смешивающих переменных. Нет необходимости контролировать какие-либо переменные, кроме искажающих факторов. [5] : 158 Критерий «черного хода» является достаточным, но не необходимым условием, чтобы найти набор переменных Z, чтобы избавиться от анализа причинного воздействия X на y.

Когда причинная модель является правдоподобным представлением реальности и удовлетворяется критерий бэкдора, тогда коэффициенты частичной регрессии могут использоваться в качестве (причинных) коэффициентов пути (для линейных отношений). [5] : 223 [14]

[5] : 227

Регулировка входной двери [ править ]

Определение : входной путь - это прямой причинный путь, по которому доступны данные для всех переменных. [5] : 226

Следующее преобразует выражение do в выражение do-free путем определения переменных на пути входной двери. [5] : 226

Предполагая, что данные для этих наблюдаемых вероятностей доступны, конечную вероятность можно вычислить без эксперимента, независимо от существования других путаниц и без корректировки бэкдора. [5] : 226

Вмешательства [ править ]

Запросы [ править ]

Запросы - это вопросы, задаваемые на основе конкретной модели. Обычно на них отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): [5] : 8

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. На диаграмме это стирает все причинные стрелки, указывающие на экспериментальную переменную. [5] : 40

Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.

Сделайте расчет [ править ]

Исчисление do - это набор доступных манипуляций для преобразования одного выражения в другое с общей целью преобразования выражений, содержащих оператор do, в выражения, которые этого не делают. Выражения, которые не включают оператор do, можно оценить только на основании данных наблюдений без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, просить субъектов бросить курить). [5] : 231 Набор правил завершен (его можно использовать для получения каждого истинного утверждения в этой системе). [5] : 237 Алгоритм может определить, является ли решение для данной модели вычислимым за полиномиальное время . [5] : 238

Правила [ править ]

Исчисление включает три правила преобразования условных вероятностных выражений с использованием оператора do.

Правило 1 [ править ]

Правило 1 разрешает добавление или удаление наблюдений .: [5] : 235

в случае, если набор переменных Z блокирует все пути от W до Y и все стрелки, ведущие в X, были удалены. [5] : 234

Правило 2 [ править ]

Правило 2 допускает замену вмешательства наблюдением или наоборот .: [5] : 235

в случае, если Z удовлетворяет критерию черного хода . [5] : 234

Правило 3 [ править ]

Правило 3 разрешает удаление или добавление выступлений .: [5]

в случае, когда никакие причинные пути не соединяют X и Y. [5] : 234 : 235

Расширения [ править ]

Правила не подразумевают, что из любого запроса можно удалить операторы do. В этих случаях может оказаться возможным заменить переменную, которая является объектом манипуляции (например, диета), вместо переменной (например, холестерин в крови), которая затем может быть преобразована для удаления do. Пример:

Противоречия [ править ]

Противоречия учитывают возможности, не обнаруженные в данных, например, заболел бы некурящий рак, если бы он был заядлым курильщиком. Это высшая ступенька лестницы причинно-следственной связи Перл.

Возможный результат [ править ]

Определение: потенциальный результат для переменной Y - это «значение Y, которое принял бы для отдельного [ требуется пояснение ] u , если бы X было присвоено значение x». Математически: [5] : 270

или .

Потенциальный результат определяется на уровне индивидуума u. [5] : 270

Традиционный подход к потенциальным результатам основан на данных, а не на модели, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинные вопросы как проблемы с отсутствием данных и дает неправильные ответы даже на стандартные сценарии. [5] : 275

Причинный вывод [ править ]

В контексте причинно-следственных моделей потенциальные результаты интерпретируются скорее причинно, чем статистически.

Первый закон причинного вывода гласит, что потенциальный результат

можно вычислить, изменив причинную модель M (удалив стрелки в X) и вычислив результат для некоторого x . Формально: [5] : 280

Проведение контрфактов [ править ]

Изучение контрфактов с помощью причинно-следственной модели включает три этапа. [15] Подход действителен независимо от формы отношений модели, линейной или иной. Когда отношения модели полностью указаны, можно вычислить точечные значения. В других случаях (например, когда доступны только вероятности) может быть вычислено утверждение вероятностного интервала, например, некурящий x имел бы 10-20% шанс заболеть раком. [5] : 279

Учитывая модель:

могут применяться уравнения для вычисления значений A и C, полученные из регрессионного анализа, или другой метод, заменяя известные значения из наблюдения и фиксируя значения других переменных (контрфактические). [5] : 278

Похищение [ править ]

Примените абдуктивное рассуждение ( логический вывод, который использует наблюдение для поиска простейшего / наиболее вероятного объяснения) для оценки u , заместителя для ненаблюдаемых переменных в конкретном наблюдении, которое поддерживает контрфакты. [5] : 278 Вычислите вероятность u с учетом пропозиционального свидетельства.

Закон [ править ]

Для конкретного наблюдения используйте оператор do, чтобы установить противоречие (например, m = 0), соответствующим образом изменив уравнения. [5] : 278

Прогнозировать [ править ]

Рассчитайте значения выхода ( y ), используя модифицированные уравнения. [5] : 278

Посредничество [ править ]

Прямые и косвенные (опосредованные) причины можно различить только путем проведения контрфактов. [5] : 301 Чтобы понять, что такое посредничество, необходимо, чтобы посредник оставался постоянным, а вмешивалась в прямую причину. В модели

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, в то время как do (X) вычисляется.

Заблуждение посредничества вместо этого включает в себя обусловливание посредника, если посредник и результат смешаны, как в вышеприведенной модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает. [5] : 324

Прямой эффект [ править ]

В экспериментах с такой моделью контролируемый прямой эффект (CDE) вычисляется путем принудительного определения значения медиатора M (do (M = 0)) и случайного присвоения некоторым субъектам каждого из значений X (do (X = 0) ), do (X = 1), ...) и наблюдая за полученными значениями Y. [5] : 317

Каждому значению посредника соответствует CDE.

Однако лучший эксперимент - вычислить естественный прямой эффект. (NDE) Этот эффект определяется тем, что отношения между X и M не затрагиваются, а отношения между X и Y остаются неизменными [5] : 318

Например, рассмотрите прямой эффект увеличения посещений стоматолога-гигиениста (X) от одного раза к два года до каждого года, что способствует использованию зубной нити (M). Десны (Y) становятся более здоровыми благодаря гигиенисту (прямой) или нитью (посредник / непрямой). Эксперимент заключается в продолжении чистки зубной нитью без посещения гигиениста.

Косвенный эффект [ править ]

Косвенное влияние X на Y - это «увеличение, которое мы увидим в Y при сохранении X постоянным и увеличении M до любого значения, которое M может достичь при увеличении X на единицу». [5] : 328

Косвенные эффекты нельзя «контролировать», потому что прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) - это влияние на здоровье десен (Y) зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и без использования зубной нити) разницы между вероятностью использования зубной нити с учетом данных гигиениста и без него, или: [5] : 321

Приведенный выше расчет NDE включает контрфактические индексы ( ). Для нелинейных моделей кажущаяся очевидной эквивалентность [5] : 322

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Тем не мение,

работает для всех модельных отношений (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов. [5] : 326

Транспортабельность [ править ]

Причинные модели предоставляют средство для интеграции данных из наборов данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) различаются. Например, данные опроса можно объединить с данными рандомизированного контролируемого исследования. [5] : 352 Транспорт предлагает решение вопроса о внешней валидности , можно ли применить исследование в другом контексте.

Если две модели совпадают по всем релевантным переменным, а данные одной модели известны как объективные, данные одной популяции можно использовать для заключения о другой. В других случаях, когда известно, что данные смещены, повторное взвешивание может позволить перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях данные исследований нескольких популяций можно объединить (с помощью транспорта), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P (W | X)) из нескольких исследований может повысить точность заключения. [5] : 355

Do-исчисление обеспечивает общий критерий переноса: целевая переменная может быть преобразована в другое выражение с помощью серии операций do, которые не включают никаких «производящих различие» переменных (тех, которые различают две популяции). [5] : 355 Аналогичное правило применяется к исследованиям, в которых участвуют существенно разные участники. [5] : 356

Байесовская сеть [ править ]

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети могут использоваться для определения обратной вероятности события (учитывая исход, каковы вероятности конкретной причины). Это требует подготовки таблицы условной вероятности, показывающей все возможные входные данные и результаты с соответствующими вероятностями. [5] : 119

Например, для модели с двумя переменными - болезни и теста (для болезни) таблица условной вероятности принимает вид: [5] : 117

Согласно этой таблице, когда у пациента нет заболевания, вероятность положительного теста составляет 12%.

Хотя это можно решить для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ними время вычислений) увеличивается экспоненциально. [5] : 121

Байесовские сети коммерчески используются в таких приложениях, как исправление ошибок в беспроводных данных и анализ ДНК. [5] : 122

Инварианты / контекст [ править ]

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр значение контролируется формой цифры, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Других свойств нет (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинно-следственной связи) с использованием объединенных наборов данных обучение на одном и тестирование на другом может помочь отличить вариант от инвариантных свойств. [16]

См. Также [ править ]

  • Причинная сеть - байесовская сеть с явным требованием, чтобы отношения были причинными.
  • Моделирование структурным уравнением - статистический метод проверки и оценки причинно-следственных связей.
  • Анализ пути (статистика)
  • Байесовская сеть

Ссылки [ править ]

  1. ^ Карл Friston (февраль 2009). «Причинное моделирование и связь мозга в функциональной магнитно-резонансной томографии» . PLOS Биология . 7 (2): e1000033. DOI : 10.1371 / journal.pbio.1000033 . PMC  2642881 . PMID  19226186 .
  2. ^ Барлас, Яман; Карпентер, Стэнли (1990). «Философские корни валидации модели: две парадигмы». Обзор системной динамики . 6 (2): 148–166. DOI : 10.1002 / sdr.4260060203 .
  3. ^ a b c Жемчуг 2009
  4. Хичкок, Кристофер (2018), «Причинные модели» , в Zalta, Эдвард Н. (ред.), Стэнфордская энциклопедия философии (издание осень 2018 г.), Исследовательская лаборатория метафизики, Стэнфордский университет , получено 8 сентября 2018 г.
  5. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw топор ay az ba bb bc bd be bf bg bh bi bj bk bl bm bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl cm Pearl, Иудея; Маккензи, Дана (15.05.2018). Книга почему: новая наука о причине и следствии . Основные книги. ISBN 9780465097616.
  6. ^ Окаша, Самир (2012-01-12). «Причинность в биологии» . В Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (ред.). Оксфордский справочник причинно-следственной связи . 1 . ОУП Оксфорд. DOI : 10.1093 / oxfordhb / 9780199279739.001.0001 . ISBN 9780191629464.
  7. ^ Бергштейн, Брайан. «То, что AI до сих пор не может сделать» . Обзор технологий Массачусетского технологического института . Проверено 20 февраля 2020 .
  8. Перл, Иудея (29 октября 2019 г.). «Причинный и контрфактический вывод» (PDF) . Проверено 14 декабря 2020 года . Cite journal requires |journal= (help)
  9. Перейти ↑ Epp, Susanna S. (2004). Дискретная математика с приложениями . Томсон-Брукс / Коул. С. 25–26. ISBN 9780534359454.
  10. ^ a b «Причинное мышление» . www.istarassessment.org . Проверено 2 марта +2016 .
  11. ^ Riegelman, R. (1979). «Содействующая причина: ненужная и недостаточная». Аспирантура медицины . 66 (2): 177–179. DOI : 10.1080 / 00325481.1979.11715231 . PMID 450828 . 
  12. ^ Катан MB (март 1986). «Изоформы аполипопротеина Е, холестерин сыворотки и рак». Ланцет . 1 (8479): 507–8. DOI : 10.1016 / s0140-6736 (86) 92972-7 . PMID 2869248 . S2CID 38327985 .  
  13. ^ Смит, Джордж Дэйви; Ибрагим, Шах (2008). Менделирующая рандомизация: генетические варианты как инструменты для усиления причинно-следственных связей в обсервационных исследованиях . Национальная академия прессы (США).
  14. Жемчужина 2009 , глава 3-3 Контроль противоречивого предубеждения
  15. Жемчужина, Иудея (2009). Причинная связь . Кембридж: Издательство Кембриджского университета. п. 207. ISBN. 978-0-511-80316-1.
  16. Хао, Карен (8 мая 2019 г.). «Глубокое обучение может показать, почему мир устроен именно так» . Обзор технологий Массачусетского технологического института . Проверено 10 февраля 2020 года .

Источники [ править ]

  • Перл, Иудея (14 сентября 2009 г.). Причинная связь . Издательство Кембриджского университета. ISBN 9781139643986.

Внешние ссылки [ править ]

  • Перл, Иудея (26 февраля 2010 г.). «Введение в причинный вывод» . Международный журнал биостатистики . 6 (2): Статья 7. doi : 10.2202 / 1557-4679.1203 . ISSN  1557-4679 . PMC  2836213 . PMID  20305706 .
  • Причинное моделирование в PhilPapers
  • Фальк, Дэн (2019-03-17). «Алгоритмы AI теперь потрясающе хороши в науке» . Проводной . ISSN  1059-1028 . Проверено 20 марта 2019 .
  • Модлин, Тим (30.08.2019). «Почему мира» . Бостонский обзор . Проверено 9 сентября 2019 .
  • Хартнетт, Кевин. «Создавать действительно интеллектуальные машины, обучать их причине и следствию» . Журнал Quanta . Проверено 19 сентября 2019 .
  • [1]
  1. ^ Обучающие представления с использованием причинной инвариантности , ICLR, февраль 2020 г. , получено 10 февраля 2020 г.