Причинная модель - Causal model

Сравнение двух конкурирующих причинно-следственных моделей (DCM, GCM), используемых для интерпретации фМРТ изображений^[1]

В философия науки, а причинная модель (или структурная причинно-следственная модель) является концептуальная модель это описывает причинный механизмы система. Причинно-следственные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том, какие независимые переменные необходимо включить / контролировать.

Они могут позволить ответить на некоторые вопросы на основе существующих данных наблюдений без необходимости интервенционного исследования, такого как рандомизированное контролируемое исследование. Некоторые интервенционные исследования не подходят по этическим или практическим причинам, а это означает, что без причинной модели некоторые гипотезы не могут быть проверены.

Причинные модели могут помочь в вопросе внешняя валидность (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут позволить объединить данные из нескольких исследований (при определенных обстоятельствах), чтобы ответить на вопросы, на которые нельзя ответить с помощью какого-либо отдельного набора данных.

Причинные модели фальсифицируемыйв том, что если они не соответствуют данным, они должны быть отклонены как недействительные. Они также должны вызывать доверие у тех, кто близок к явлениям, которые модель намеревается объяснить.^[2]

Причинно-следственные модели нашли применение в обработка сигналов, эпидемиология и машинное обучение.^[3]

Определение

Причинно-следственные модели - это математические модели, представляющие причинно-следственные связи внутри отдельной системы или совокупности. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут научить нас многому об эпистемологии причинно-следственной связи и о взаимосвязи между причинностью и вероятностью. Они также применялись к темам, представляющим интерес для философов, таким как логика контрфактов, теория принятия решений и анализ действительной причинно-следственной связи.^[4]
— Стэнфордская энциклопедия философии

Жемчужина Иудеи определяет причинную модель как упорядоченную тройку ${displaystyle langle U, V, Eangle}$ , где U - множество экзогенные переменные значения которых определяются факторами вне модели; V - это набор эндогенных переменных, значения которых определяются факторами в модели; а E - набор структурные уравнения которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V.^[3]

История

Аристотель определила таксономию причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфакты. В какой-то момент он отрицал, что объекты обладают «способностями», которые делают одно причиной, а другое - следствием.^[5]^:264 Позже он принял «если бы первого объекта не было, второго никогда не существовало» («но для "причинно-следственная связь).^[5]^:265

В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинных правил для таких областей, как биологическая наследственность, Гальтон представил концепцию средняя регрессия (воплощенный спад на втором курсе в спорте), что позже привело его к беспричинной концепции корреляция.^[5]

Как позитивист, Пирсон исключили понятие причинности из большей части науки как недоказуемого частного случая ассоциации и представили коэффициент корреляции как показатель ассоциации. Он писал: «Сила как причина движения - это то же самое, что бог дерева как причина роста», и эта причинность была лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Биометрика и Биометрическая лаборатория в Университетский колледж Лондона, который стал мировым лидером по статистике.^[5]

В 1908 г. Харди и Вайнберг решил проблему стабильность черты это заставило Гальтона отказаться от причинности, воскресив Менделирующее наследование.^[5]

В 1921 г. Райт с анализ пути стал теоретическим предком каузального моделирования и причинных графиков.^[6] Он разработал этот подход, пытаясь распутать относительное влияние наследственность, разработка и окружающая среда на морская свинка выкройки пальто. Он подтвердил свои тогдашние еретические утверждения, показав, как такой анализ может объяснить взаимосвязь между весом морской свинки при рождении, в утробе время и размер помета. Противодействие этим идеям со стороны выдающихся статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика). Фишер.^[5] Единственным исключением был Бёркс, студент, который в 1926 году первым применил путевые диаграммы для представления опосредующего влияния (посредник) и утверждать, что поддержание постоянного посредника приводит к ошибкам. Возможно, она самостоятельно изобрела схемы путей.^[5]^:304

В 1923 г. Нейман представил концепцию потенциального результата, но его статья не была переведена с польского на английский до 1990 года.^[5]^:271

В 1958 г. Кокс предупредил, что контроль переменной Z действителен только в том случае, если маловероятно, что на него повлияют независимые переменные.^[5]^:154

В 1960-е гг. Дункан, Blalock, Гольдбергер и другие заново открыли анализ пути. Читая работу Блэлока о путевых диаграммах, Дункан вспомнил лекцию Огбурн двадцатью годами ранее там упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс.^[5]^:308

Социологи первоначально назвали причинные модели структурное моделирование уравнение, но когда он стал механическим методом, он потерял свою полезность, что привело к тому, что некоторые практики отвергли любую связь с причинностью. Экономисты приняли алгебраическую часть анализа путей, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать своим уравнениям причинный смысл.^[5]

Спустя шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой резюмировал ее. Карлин и др., которые возражали, что он обрабатывает только линейные отношения и что надежное представление данных без моделей было более показательным.^[5]

В 1973 г. Льюис выступал за замену корреляции на причинно-следственную связь (контрфакты). Он сослался на способность людей вообразить альтернативные миры, в которых причина возникла или не возникла, а следствие возникло только вслед за своей причиной.^[5]^:266 В 1974 г. Вбивать в голову ввел понятие «потенциальные результаты» как язык для постановки причинно-следственных вопросов.^[5]^:269

В 1983 г. Картрайт предложили, чтобы любой фактор, который "причинно релевантен" эффекту, был обусловлен, выходя за рамки простой вероятности как единственного ориентира.^[5]^:48

В 1986 году Барон и Кенни ввели принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья занимала 33-е место среди самых цитируемых за все время.^[5]^:324 Этот год Гренландия и Робинс представил подход "взаимозаменяемости" к устранению недоразумений путем рассмотрения контрфактического факта. Они предложили оценить, что случилось бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, считалось, что смешение отсутствует.^[5]^:154

В Колумбийском университете работает Лаборатория каузального искусственного интеллекта, которая пытается связать теорию причинного моделирования с искусственные нейронные сети.^[7]

Лестница причинно-следственной связи

Причинно-следственная метамодель включает трехуровневую абстракцию, которую он называет лестницей причинно-следственной связи. Самый низкий уровень, ассоциация (видение / наблюдение), влечет за собой восприятие закономерностей или закономерностей во входных данных, выраженных как корреляции. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Высший уровень, Контрольные факты (воображение) включает построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные эффекты и что происходит в отсутствие таких действий.^[5]

Ассоциация

Один объект ассоциируется с другим, если наблюдение за одним изменяет вероятность наблюдения за другим. Пример: покупатели, покупающие зубную пасту, с большей вероятностью также купят зубную нить. Математически:

{displaystyle P (зубная паста flossvline)}

или вероятность (покупки) зубной нити с учетом (покупки) зубной пасты. Связи также можно измерить, вычислив корреляция из двух событий. Ассоциации не имеют причинных последствий. Одно событие могло вызвать другое, обратное могло быть правдой, или оба события могли быть вызваны каким-то третьим событием (несчастный гигиенист заставляет покупателя лучше относиться к своему рту).^[5]

Вмешательство

На этом уровне устанавливаются определенные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, влияющего на одно из событий. Пример: если бы мы удвоили цену на зубную пасту, какова была бы новая вероятность покупки? Причинно-следственная связь не может быть установлена путем изучения истории (изменений цен), потому что изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, увеличивающий цену обоих товаров). Математически:

{displaystyle P (flossvline do (зубная паста))}

куда делать - оператор, сигнализирующий об экспериментальном вмешательстве (удвоение цены).^[5]

Контрольные факты

Самый высокий, контрфактический, уровень предполагает рассмотрение альтернативной версии прошлого события. Пример: какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее? Ответ «да» подтверждает существование причинно-следственной связи. Модели, которые могут дать ответ на опровержение фактов, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как законы физики (например, в законах физики, например, в законах инерции, которые гласят, что если к неподвижному объекту не приложить силу, он не будет двигаться).^[5]

Причинно-следственная связь

Причинность против корреляции

Статистика вращается вокруг анализа отношений между несколькими переменными. Традиционно эти отношения описываются как корреляции, ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения в других.^[3]

Определения двадцатого века причинность полагался исключительно на вероятности / ассоциации. Было сказано, что одно событие (X) вызывает другое, если оно увеличивает вероятность другого (Y). Математически это выражается как:

{displaystyle P (Yvline X)> P (Y)}

.

Такие определения неадекватны, потому что другие отношения (например, общая причина для X и Y) могут удовлетворять условию. Причинно-следственная связь актуальна для второй ступени лестницы. Ассоциации находятся на первом этапе и предоставляют только доказательства второму.^[5]

В более позднем определении была предпринята попытка устранить эту двусмысленность путем учета фоновых факторов. Математически:

{Displaystyle P (Yvline X, K = k)> P (Y | K = k)}

,

где K - набор фоновых переменных, а k - значения этих переменных в конкретном контексте. Однако требуемый набор фоновых переменных неопределен (несколько наборов могут увеличить вероятность), пока вероятность является единственным критерием.^{[требуется разъяснение ]}.^[5]

Другие попытки определить причинно-следственную связь включают: Причинность Грейнджера, а проверка статистической гипотезы который причинность (в экономика ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда.^[5]

Типы

Причина может быть необходимый, достаточный, способствующий или какая-то комбинация.^[8]

Необходимо

За Икс быть необходимой причиной у, Наличие у должно означать предшествующее возникновение Икс. Наличие Икс, однако, не означает, что у произойдет.^[9] Необходимые причины также известны как причины, вызывающие исключение, как в у не произошло бы, если бы не возникновение Икс.^[5]^:261

Достаточные причины

За Икс быть достаточной причиной у, Наличие Икс должно означать последующее возникновение у. Однако другая причина z может самостоятельно вызвать у. Таким образом, наличие у не требует предшествующего появления Икс.^[9]

Дополнительные причины

За Икс быть одной из причин у, Наличие Икс должен увеличить вероятность у. Если вероятность 100%, то Икс вместо этого называется достаточным. Также может потребоваться сопутствующая причина.^[10]

Модель

Причинно-следственная диаграмма

Причинно-следственная диаграмма - это ориентированный граф что отображает причинный отношения между переменные в причинной модели. Причинно-следственная диаграмма включает набор переменных (или узлы ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Острие стрелки обозначает направление причинно-следственной связи, например, стрелка, соединяющая переменные A и B со стрелкой в точке B, указывает, что изменение в A вызывает изменение в B (с соответствующей вероятностью). А дорожка представляет собой обход графа между двумя узлами по причинным стрелкам.^[5]

Причинно-следственные диаграммы включают: причинно-следственные диаграммы, ориентированные ациклические графы, и Диаграммы Исикавы.^[5]

Диаграммы причинно-следственных связей не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений модели.^[5]

Элементы модели

Причинные модели имеют формальные структуры с элементами со специфическими свойствами.^[5]

Узоры соединений

Три типа соединений трех узлов - это линейные цепи, ответвления и объединяющиеся коллайдеры.^[5]

Цепь

Цепи - это прямые соединения со стрелками, указывающими от причины к следствию. В этой модели B является посредником в том смысле, что он опосредует изменения, которые A в противном случае оказал бы на C.^[5]^:113

{displaystyle Aightarrow Bightarrow C}

Вилка

В вилках одна причина имеет несколько последствий. Эти два эффекта имеют общую причину. Существует (не причинно-следственная) ложная корреляция между A и C, что может быть устранено путем кондиционирования B (для определенного значения B).^[5]^:114

{displaystyle Aleftarrow Bightarrow C}

«Условие на B» означает «при условии B» (т. Е. При значении B).

Доработка вилки мешает:

{displaystyle Aleftarrow Bightarrow Cightarrow A}

В таких моделях B является частой причиной A и C (что также вызывает A), что делает B мешающим фактором.^{[требуется разъяснение ]}.^[5]^:114

Коллайдер

В коллайдерах несколько причин влияют на один результат. Условие на B (для определенного значения B) часто выявляет непричинную отрицательную корреляцию между A и C. Эта отрицательная корреляция была названа смещением коллайдера и эффектом «отстранения от объяснения», как, например, B объясняет корреляцию между A и С.^[5]^:115 Корреляция может быть положительной в том случае, когда необходимы вклады как от A, так и от C для воздействия на B.^[5]^:197

{displaystyle Aightarrow Bleftarrow C}

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат).^[5]^:113 Например, в приведенном выше примере цепочки B является посредником, потому что он изменяет эффект A (косвенная причина C) на C (результат).

Конфундер

Узел смешения влияет на несколько результатов, создавая между ними положительную корреляцию.^[5]^:114

Инструментальная переменная

An инструментальная переменная тот, который:^[5]^:246

есть путь к результату
не имеет другого пути к причинным переменным
не имеет прямого влияния на результат

Коэффициенты регрессии могут служить оценками причинного воздействия инструментальной переменной на результат, если этот эффект не смешивается. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о влияющих факторах.^[5]^:249

Например, учитывая модель:

{displaystyle Zightarrow Xightarrow Yleftarrow Uightarrow X}

Z - инструментальная переменная, потому что она имеет путь к результату Y и не связана, например, с U.

В приведенном выше примере, если Z и X принимают двоичные значения, то предположение, что Z = 0, X = 1 не выполняется, называется монотонность^{[требуется разъяснение ]}.^[5]^:253

Доработки техники^{[требуется разъяснение ]} включать создание инструмента^{[требуется разъяснение ]} обусловив другую переменную^{[требуется разъяснение ]} чтобы блокировать^{[требуется разъяснение ]} пути^{[требуется разъяснение ]} между инструментом и конфаундером^{[требуется разъяснение ]} и объединение нескольких переменных в один инструмент^{[требуется разъяснение ]}.^[5]^:257

Менделирующая рандомизация

Определение: Менделирующая рандомизация использует измеренные вариации в генах с известной функцией для изучения причинного эффекта изменяемого воздействия на заболевание наблюдательные исследования.^[11]^[12]

Поскольку гены в разных популяциях различаются случайным образом, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственная связь может быть определена количественно с использованием регрессии в наблюдательном исследовании.^[5]^:255

Ассоциации

Условия независимости

Условия независимости - это правила определения независимости двух переменных друг от друга. Переменные независимы, если значения одной не влияют напрямую на значения другой. Множественные причинные модели могут разделять условия независимости. Например, модели

{displaystyle Aightarrow Bightarrow C}

и

{displaystyle Aleftarrow Bightarrow C}

имеют те же условия независимости, потому что кондиционирование на B оставляет A и C независимыми. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основании данных (то есть, если данные наблюдений показывают связь между A и C после кондиционирования B, то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, потому что они имеют одинаковые условия независимости.

Использование переменной - это механизм для проведения гипотетических экспериментов. Условие для переменной включает анализ значений других переменных для данного значения условной переменной. В первом примере обусловливание B подразумевает, что наблюдения для данного значения B не должны показывать зависимости между A и C. Если такая зависимость существует, то модель неверна. Не-причинные модели не могут проводить такие различия, потому что они не делают причинных утверждений.^[5]^:129–130

Confounder / deconfounder

Важным элементом дизайна корреляционного исследования является выявление потенциально мешающих влияний на исследуемую переменную, например демографические данные. Эти переменные контролируются для устранения этих влияний. Однако правильный список смешивающих переменных не может быть определен. априори. Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) исследуемую переменную.^[5]^:139

Причинно-следственные модели предлагают надежную технику для определения соответствующих смешивающих переменных. Формально Z является затруднительным, если «Y связан с Z путями, не проходящими через X». Их часто можно определить, используя данные, собранные для других исследований. Математически, если

{displaystyle P (Y | X) eq P (Y | do (X))}

тогда X является смешивающим фактором для Y.^[5]^:151

Ранее к якобы неверным определениям относились:^[5]^:152

«Любая переменная, которая коррелирует как с X, так и с Y».
Y ассоциируется с Z среди неэкспонированных.
Невозможность сворачивания: разница между «грубым относительным риском и относительным риском, возникающим после поправки на потенциальную помеху».
Эпидемиологический: переменная, связанная с X среди населения в целом и связанная с Y среди людей, не подвергавшихся воздействию X.

Последний недостаток в том, что в модели:

{displaystyle Xightarrow Zightarrow Y}

Z соответствует определению, но является посредником, а не мешающим фактором, и является примером контроля за результатом.

В модели

{displaystyle Xleftarrow Aightarrow Bleftarrow Cightarrow Y}

Традиционно B считалось мешающим фактором, потому что он связан с X и Y, но не находится на причинном пути и не является потомком чего-либо на причинном пути. Контроль для B заставляет его стать помехой. Это известно как M-смещение.^[5]^:161

Регулировка бэкдора

Для анализа причинного воздействия X на Y в причинно-следственной модели нам необходимо скорректировать все искажающие переменные (деконфаундирование). Чтобы идентифицировать набор мешающих факторов, нам необходимо (1) заблокировать каждый не причинный путь между X и Y этим набором (2) без нарушения каких-либо причинных путей и (3) без создания каких-либо ложных путей.^[5]^:158

Определение: черный ход от переменной X до Y - это любой путь от X до Y, который начинается со стрелки, указывающей на X.^[5]^:158

Определение: Учитывая упорядоченную пару переменных (X, Y) в модели, набор смешивающих переменных Z удовлетворяет критерию бэкдора, если (1) никакая смешивающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором конфаунтеров.

Если критерий бэкдора удовлетворяется для (X, Y), X и Y деконфигурированы набором смешивающих переменных. Нет необходимости контролировать какие-либо переменные, кроме искажающих факторов.^[5]^:158 Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z, позволяющих избавиться от анализа причинного воздействия X на y.

Когда причинная модель является правдоподобным представлением реальности и удовлетворяется критерий бэкдора, тогда коэффициенты частичной регрессии могут использоваться в качестве (причинных) коэффициентов пути (для линейных отношений).^[5]^:223 ^[13]

{displaystyle P (Y | do (X)) = extstyle sum _ {z} displaystyle P (Y | X, Z = z) P (Z = z)}

^[5]^:227

Регулировка входной двери

Определение: входной путь - это прямой причинный путь, по которому доступны данные для всех переменных.^[5]^:226

Следующее преобразовывает выражение do в выражение do-free путем обработки переменных на пути входной двери.^[5]^:226

{displaystyle P (Y | do (X)) = extstyle sum _ {z} displaystyle P (Z = z, X) extstyle sum _ {x} displaystyle P (Y | X = x, Z = z) P (X = Икс)}

Предполагая, что данные для этих наблюдаемых вероятностей доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других путаниц и без корректировки бэкдора.^[5]^:226

Вмешательства

Запросы

Запросы - это вопросы, задаваемые на основе конкретной модели. Обычно на них отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера):^[5]^:8

{displaystyle P ({ext {floss}} vline do ({ext {зубная паста}}))}

где делать оператор указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. На диаграмме это стирает все причинные стрелки, указывающие на экспериментальную переменную.^[5]^:40

Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.

Сделайте расчет

Исчисление do - это набор доступных манипуляций для преобразования одного выражения в другое с общей целью преобразования выражений, содержащих оператор do, в выражения, которые этого не делают. Выражения, которые не включают оператор do, можно оценить только на основании данных наблюдений без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, просить субъектов бросить курить).^[5]^:231 Набор правил завершен (его можно использовать для получения каждого истинного утверждения в этой системе).^[5]^:237 Алгоритм может определить, является ли решение для данной модели вычислимым в полиномиальное время.^[5]^:238

Правила

Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавление или удаление наблюдений.^[5]^:235:

{displaystyle P (Y | do (X), Z, W) = P (Y | do (X), Z)}

в случае, если набор переменных Z блокирует все пути от W до Y, и все стрелки, ведущие в X, были удалены.^[5]^:234

Правило 2

Правило 2 допускает замену вмешательства наблюдением или наоборот.^[5]^:235:

{displaystyle P (Y | do (X), Z) = P (Y | X, Z)}

в случае, если Z удовлетворяет критерий задней двери.^[5]^:234

Правило 3

Правило 3 допускает удаление или добавление вмешательств.^[5]:

{displaystyle P (Y | do (X)) = P (Y)}

в случае, когда никакие причинные пути не соединяют X и Y.^[5]^:234 ^:235

Расширения

Правила не подразумевают, что из любого запроса можно удалить операторы do.В этих случаях может быть возможно заменить переменную, которая является объектом манипуляции (например, диета), вместо переменной, которой нет (например, холестерин в крови), которая затем может быть преобразована для удаления do. Пример:

{displaystyle P ({ext {болезнь сердца}} | делать ({ext {холестерин в крови}})) = P ({ext {болезнь сердца}} | делать ({ext {диета}}))}

Контрольные факты

Противоречия учитывают возможности, которые не обнаружены в данных, например, заболел бы некурящий рак, если бы он был заядлым курильщиком. Это высшая ступенька причинно-следственной лестницы Перл.

Возможный результат

Определение: потенциальный результат для переменной Y - это «значение, которое Y принял бы для индивидуума.^{[требуется разъяснение ]} ты, если бы X было присвоено значение x ". Математически:^[5]^:270

{displaystyle Y_ {X} = _ {x} (u)}

или же

{displaystyle Y_ {x} (u)}

.

Потенциальный результат определяется на уровне отдельного человека. ты^[5]^:270

Традиционный подход к потенциальным результатам основан на данных, а не на модели, что ограничивает его способность распутывать причинные связи. Он рассматривает причинно-следственные вопросы как проблемы с отсутствием данных и дает неправильные ответы даже на стандартные сценарии.^[5]^:275

Причинный вывод

В контексте причинно-следственных моделей потенциальные результаты интерпретируются скорее причинно, чем статистически.

Первый закон причинный вывод заявляет, что потенциальный результат

{displaystyle Y_ {X} (u)}

могут быть вычислены путем модификации причинной модели M (путем удаления стрелок в X) и вычисления результата для некоторых Икс. Формально:^[5]^:280

{displaystyle Y_ {X} (u) = Y_ {Mx} (u)}

Проведение контрфактического

Изучение контрфактов с помощью причинной модели включает три этапа. Подход действителен независимо от формы отношений модели (линейной или иной). Когда отношения модели полностью указаны, можно вычислить значения точек. В других случаях (например, когда доступны только вероятности) может быть вычислено утверждение вероятностного интервала (некурящий x будет иметь 10-20% шанс заболеть раком).^[5]^:279

Учитывая модель:

{displaystyle Yleftarrow Xightarrow Mightarrow Yleftarrow U}

могут применяться уравнения для расчета значений A и C, полученные из регрессионного анализа, или другой метод, заменяя известные значения из наблюдения и фиксируя значения других переменных (контрфактические).^[5]^:278

Похищать

Подать заявление похищающие рассуждения (логический вывод который использует наблюдение для поиска самого простого / наиболее вероятного объяснения) для оценки ты, прокси для ненаблюдаемых переменных в конкретном наблюдении, которое поддерживает противоречие.^[5]^:278

действовать

Для конкретного наблюдения используйте оператор do, чтобы установить противоречие (например, м= 0), соответствующим образом изменяя уравнения.^[5]^:278

Предсказывать

Рассчитайте значения выхода (у) с использованием модифицированных уравнений.^[5]^:278

Посредничество

Прямые и косвенные (опосредованные) причины можно различить только путем проведения контрфактов.^[5]^:301 Понимание посредничества требует, чтобы посредник оставался постоянным, пока он вмешивается в прямую причину. В модели

${displaystyle Yleftarrow Mleftarrow Xightarrow Y}$

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, а do (X) вычисляется.

Заблуждение посредничества вместо этого включает в себя обусловливание посредника, если посредник и результат смешаны, как в вышеупомянутой модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает.^[5]^:324

Прямой эффект

В экспериментах с такой моделью контролируемый прямой эффект (CDE) вычисляется путем принудительного определения значения медиатора M (do (M = 0)) и случайного присвоения некоторым субъектам каждого из значений X (do (X = 0) ), do (X = 1), ...) и наблюдая за полученными значениями Y.^[5]^:317

{displaystyle CDE (0) = P (Y = 1 | делать (X = 1), делать (M = 0)) - P (Y = 1 | делать (X = 0), делать (M = 0))}

Каждому значению посредника соответствует CDE.

Однако лучший эксперимент - вычислить естественный прямой эффект. (NDE) Этот эффект определяется тем, что отношения между X и M остаются неизменными, а отношения между X и Y остаются неизменными.^[5]^:318

{displaystyle NDE = P (Y_ {M = M0} = 1 | do (X = 1)) - P (Y_ {M = M0} = 1 | do (X = 0))}

Например, рассмотрите прямой эффект увеличения посещений стоматолога-гигиениста (X) от одного года к другому, что способствует использованию зубной нити (M). Десны (Y) становятся более здоровыми благодаря гигиенисту (прямой) или нитью (посредник / непрямой). Эксперимент заключается в продолжении чистки зубной нитью без посещения гигиениста.

Косвенный эффект

Косвенное влияние X на Y - это «увеличение, которое мы увидим в Y при сохранении X постоянным и увеличении M до любого значения, которое M может достичь при увеличении X на единицу».^[5]^:328

Косвенные эффекты нельзя «контролировать», потому что прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) - это влияние на здоровье десен (Y) зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и использования зубной нити) разницы между вероятностью использования зубной нити с учетом данных гигиениста и без него, или:^[5]^:321

{displaystyle NIE = сумма _ {m} [P (M = m | X = 1) -P (M = m | X = 0)] xxP (Y = 1 | X = 0, M = m)}

Приведенный выше расчет NDE включает контрфактические индексы ( ${displaystyle Y_ {M = M0}}$ ). Для нелинейных моделей кажущаяся очевидной эквивалентность^[5]^:322

{displaystyle {mathsf {Общий эффект = Прямой эффект + Косвенный эффект}}}

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Тем не мение,

{displaystyle {mathsf {Total effect}} (X = 0ightarrow X = 1) = NDE (X = 0ightarrow X = 1) - NIE (X = 1ightarrow X = 0)}

работает для всех модельных отношений (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов.^[5]^:326

Транспортабельность

Причинно-следственные модели предоставляют средство интеграции данных из наборов данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) различаются. Например, данные опроса могут быть объединены с данными рандомизированного контролируемого исследования.^[5]^:352 Транспорт предлагает решение вопроса внешняя валидность, можно ли применить исследование в другом контексте.

Если две модели совпадают по всем релевантным переменным, а данные одной модели известны как объективные, данные из одной группы населения можно использовать, чтобы сделать выводы о другой. В других случаях, когда известно, что данные предвзяты, повторное взвешивание может позволить перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях данные исследований нескольких популяций можно объединить (с помощью транспорта), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P (W | X)) из нескольких исследований может повысить точность заключения.^[5]^:355

Do-исчисление обеспечивает общий критерий переноса: целевая переменная может быть преобразована в другое выражение с помощью серии операций do, которые не включают никаких «производящих разницу» переменных (тех, которые различают две популяции).^[5]^:355 Аналогичное правило применяется к исследованиям, в которых участвуют разные участники.^[5]^:356

Байесовская сеть

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети могут использоваться для определения обратной вероятности события (учитывая исход, каковы вероятности конкретной причины). Это требует подготовки таблицы условной вероятности, в которой показаны все возможные входные данные и результаты с соответствующими вероятностями.^[5]^:119

Например, для модели с двумя переменными - болезни и теста (для болезни) таблица условной вероятности принимает вид:^[5]^:117

Вероятность положительного результата теста на данное заболевание
	Тест
Болезнь	Положительный	Отрицательный
Отрицательный	12	88
Положительный	73	27

Согласно этой таблице, когда у пациента нет заболевания, вероятность положительного результата теста составляет 12%.

Хотя это можно решить для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ними время вычислений) увеличивается экспоненциально.^[5]^:121

Байесовские сети коммерчески используются в таких приложениях, как исправление ошибок в беспроводных данных и анализ ДНК.^[5]^:122

Инварианты / контекст

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр значение контролируется формой цифры, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Другие свойства нет (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинно-следственной связи) с использованием объединенных наборов данных обучение на одном и тестирование на другом может помочь отличить вариант от инвариантных свойств.^[14]

Смотрите также

Причинная сеть - а Байесовская сеть с явным требованием, чтобы отношения были причинными
Структурное моделирование уравнение - статистический метод проверки и оценки причинно-следственных связей
Анализ пути (статистика)
Байесовская сеть

Источники

Перл, Иудея (14 сентября 2009 г.). Причинно-следственная связь. Издательство Кембриджского университета. ISBN 9781139643986.CS1 maint: ref = harv (связь)

внешняя ссылка

Перл, Иудея (26 февраля 2010 г.). «Введение в причинный вывод». Международный журнал биостатистики. 6 (2): Статья 7. Дои:10.2202/1557-4679.1203. ISSN 1557-4679. ЧВК 2836213. PMID 20305706.
Причинное моделирование в PhilPapers
Фальк, Дэн (2019-03-17). «Алгоритмы искусственного интеллекта теперь потрясающе хороши в науке». Проводной. ISSN 1059-1028. Получено 2019-03-20.
Модлин, Тим (30.08.2019). "Почему мира". Бостон Обзор. Получено 2019-09-09.
Хартнетт, Кевин. «Создавать действительно интеллектуальные машины, обучать их причине и следствию». Журнал Quanta. Получено 2019-09-19.
^[1]

^ Обучающие представления с использованием причинной инвариантности, ICLR, февраль 2020 г., получено 2020-02-10

[1] Карл Фристон (Февраль 2009 г.). «Причинное моделирование и взаимодействие мозга в функциональной магнитно-резонансной томографии». PLOS Биология. 7 (2): e1000033. Дои:10.1371 / journal.pbio.1000033. ЧВК 2642881. PMID 19226186.

[2] Барлас, Яман; Карпентер, Стэнли (1990). «Философские корни валидации модели: две парадигмы». Обзор системной динамики. 6 (2): 148–166. Дои:10.1002 / sdr.4260060203.

[:0-3] а ^б ^c Жемчуг 2009

[4] Хичкок, Кристофер (2018), «Причинные модели», в Залте, Эдвард Н. (ред.), Стэнфордская энциклопедия философии (Издание осенью 2018 г.), Исследовательская лаборатория метафизики, Стэнфордский университет, получено 2018-09-08

[:1-5] а ^б ^c ^d ^е ^ж ^грамм ^час ^я ^j ^k ^л ^м ^п ^о ^п ^q ^р ^s ^т ^ты ^v ^ш ^Икс ^у ^z ^аа ^ab ^ac ^{объявление} ^ае ^аф ^аг ^ах ^ай ^эй ^ак ^аль ^{являюсь} ^ан ^ао ^ap ^водный ^ар ^{в качестве} ^в ^au ^{средний} ^ау ^топор ^ай ^az ^ба ^bb ^{до н.э} ^bd ^быть ^парень ^bg ^бх ^би ^Ъ ^bk ^бл ^бм ^млрд ^бо ^бп ^бк ^br ^bs ^bt ^бу ^bv ^чб ^bx ^к ^bz ^ок ^cb ^cc ^CD ^ce ^ср ^cg ^ch ^ci ^cj ^ск ^cl ^см Жемчужина, Иудея; Маккензи, Дана (15.05.2018). Книга почему: новая наука о причине и следствии. Основные книги. ISBN 9780465097616.

[6] Окаша, Самир (12.01.2012). «Причинность в биологии». В Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (ред.). Оксфордский справочник причинно-следственной связи. 1. ОУП Оксфорд. Дои:10.1093 / oxfordhb / 9780199279739.001.0001. ISBN 9780191629464.

[7] Бергштейн, Брайан. «Чего ИИ до сих пор не может сделать». Обзор технологий MIT. Получено 2020-02-20.

[8] Эпп, Сюзанна С. (2004). Дискретная математика с приложениями. Томсон-Брукс / Коул. С. 25–26. ISBN 9780534359454.

[CR-9] а ^б "Причинное мышление". www.istarassessment.org. Получено 2 марта 2016.

[Riegelman-10] Ригельман Р. (1979). «Содействующая причина: ненужная и недостаточная». Последипломная медицина. 66 (2): 177–179. Дои:10.1080/00325481.1979.11715231. PMID 450828.

[Katan1986-11] Катан МБ (март 1986 г.). «Изоформы аполипопротеина Е, холестерин сыворотки и рак». Ланцет. 1 (8479): 507–8. Дои:10.1016 / с0140-6736 (86) 92972-7. PMID 2869248. S2CID 38327985.

[12] Смит, Джордж Дэйви; Эбрахим, Шах (2008). Менделирующая рандомизация: генетические варианты как инструменты усиления причинно-следственных связей в обсервационных исследованиях. Национальная академия прессы (США).

[13] Жемчуг 2009, Глава 3-3 Контроль противоречивого смещения

[14] Хао, Карен (8 мая 2019 г.). «Глубокое обучение может показать, почему мир устроен именно так». Обзор технологий MIT. Получено 10 февраля, 2020.

[15] Обучающие представления с использованием причинной инвариантности, ICLR, февраль 2020 г., получено 2020-02-10

[1]

[2]

[3]

[4]

[5]

264

265

[6]

304

271

154

308

266

269

48

324

[7]

[8]

[9]

261

[10]

113

114

115

197

246

249

253

257

[11]

[12]

255

129–130

139

151

152

161

158

223

[13]

227

226

8

40

231

237

238

235

234

270

275

280

279

278

301

317

318

328

321

322

326

352

355

356

119

117

121

122

[14]

[1]

Причинная модель - Causal model

Определение

История

Лестница причинно-следственной связи

Ассоциация

Вмешательство

Контрольные факты

Причинно-следственная связь

Причинность против корреляции

Типы

Необходимо

Достаточные причины

Дополнительные причины

Модель

Причинно-следственная диаграмма

Элементы модели

Узоры соединений

Цепь

Вилка

Коллайдер

Типы узлов

Посредник

Конфундер

Инструментальная переменная

Менделирующая рандомизация

Ассоциации

Условия независимости

Confounder / deconfounder

Регулировка бэкдора

Регулировка входной двери

Вмешательства

Запросы

Сделайте расчет

Правила

Правило 1

Правило 2

Правило 3

Расширения

Контрольные факты

Возможный результат

Причинный вывод

Проведение контрфактического

Похищать

действовать

Предсказывать

Посредничество

Прямой эффект

Косвенный эффект

Транспортабельность

Байесовская сеть

Инварианты / контекст

Смотрите также

Рекомендации

Источники

внешняя ссылка