Исследовательский причинно-следственный анализ - Exploratory causal analysis

Причинно-следственный анализ это область экспериментальная конструкция и статистика относящиеся к установлению причины и следствия.[1][2] Исследовательский причинно-следственный анализ (ECA), также известный как причинность данных или же причинное открытие[3] использование статистических алгоритмы сделать вывод о связях в наборах наблюдаемых данных, которые потенциально могут быть причинными при строгих предположениях. ЭКА - это разновидность причинный вывод в отличие от причинное моделирование и эффекты лечения в рандомизированные контролируемые испытания.[4] это поисковые исследования обычно предшествует более формальным причинное исследование таким же образом разведочный анализ данных часто предшествует статистическая проверка гипотез в анализ данных[5][6]

Мотивация

Анализ данных в первую очередь касается причинно-следственных связей.[3][4][7][8][9] Например, способствовало ли удобрение росту урожая?[10] Или можно ли предотвратить данное заболевание?[11] Или почему мой друг в депрессии?[12] В потенциальные результаты и регрессивный анализ методы обрабатывают такие запросы, когда данные собираются с помощью разработанных экспериментов. Данные, собранные в наблюдательный исследования требуют различных методов причинно-следственного вывода (потому что, например, по таким вопросам, как сбивать с толку ).[13] Методы причинного вывода, используемые с экспериментальными данными, требуют дополнительных предположений для получения разумных выводов с данными наблюдений.[14] Сложность причинно-следственного вывода в таких обстоятельствах часто описывается как "корреляция не подразумевает причинно-следственной связи ".

Обзор

ECA постулирует, что существуют процедуры анализа данных выполняется на определенных подмножествах переменные в пределах большего набора, выходные данные которого могут указывать на причинно-следственную связь между этими переменными.[3] Например, если мы предположим, что все соответствующие ковариантный в данных наблюдается, то соответствие баллов предрасположенности может быть использован для определения причинного эффекта между двумя переменными наблюдений.[4] Причинность Грейнджера может также использоваться для нахождения причинно-следственной связи между двумя наблюдаемыми переменными при различных, но столь же строгих предположениях.[15]

Два широких подхода к разработке таких процедур используют операциональные определения причинности[5] или же проверка "истиной" (т.е. явно игнорируя проблему определения причинность и показывая, что данный алгоритм подразумевает причинно-следственную связь в сценариях, когда известно, что причинно-следственные связи существуют, например, используя синтетические данные[3]).

Оперативные определения причинности

Клайв Грейнджер создал первое операциональное определение причинности в 1969 году.[16] Грейнджер дал определение вероятностная причинность предложено Норберт Винер операционная как сравнение отклонений.[17]

Некоторые авторы предпочитают использовать методы ECA, разработанные с использованием операционных определений причинности, потому что они считают, что это может помочь в поиске причинных механизмов.[5][18]

Проверка по «правде»

Питер Спиртес, Кларк Глимор, и Ричард Шайнс ввел идею явного отказа от определения причинности.[3] Спиртес и Глимур представили алгоритм ПК для обнаружения причин в 1990 году.[19] Многие недавние алгоритмы обнаружения причин следуют подходу Спиртеса-Глимора к проверке.[20]

Методы

Существует множество обзоров методов выявления причин.[3][5][20][21][22][23] В этом разделе перечислены известные техники.

Двумерный (или "попарный")

Многомерный

Многие из этих методов обсуждаются в учебных пособиях, предоставленных Центром выявления причин (CCD). [3].

Примеры использования

Социальная наука

Алгоритм ПК был применен к нескольким различным наборам данных социальных наук.[3]

Лекарство

Алгоритм ПК был применен к медицинским данным.[28] Причинность Грейнджера была применена к фМРТ данные.[29] CCD протестировали свои инструменты с использованием биомедицинских данных [4].

Физика

ECA используется в физике для понимания физических причинных механизмов системы, например, в геофизике с использованием стабильного алгоритма ПК (вариант исходного алгоритма ПК).[30] и в динамических системах с использованием попарного асимметричного вывода (вариант сходящегося перекрестного отображения).[31]

Критика

Ведутся споры о том, действительно ли отношения между данными, обнаруженными с помощью причинно-следственных связей, являются причинными.[3][25] Жемчужина Иудеи подчеркнул, что причинный вывод требует причинной модели, разработанной "интеллектом" посредством итеративного процесса проверки предположений и подгонки данных.[7]

В ответе на критику указывается, что допущения, использованные для разработки методов ECA, могут не соответствовать заданному набору данных.[3][14][32][33][34] и что любые причинно-следственные связи, обнаруженные во время ECA, зависят от истинности этих предположений.[25][35]

Программные пакеты

Комплексные инструменты

  • Тетрада [5]
Tetrad - это Java-программа с открытым исходным кодом, основанная на графическом интерфейсе пользователя, которая предоставляет набор алгоритмов обнаружения причин. [6]. Библиотека алгоритмов, используемая Tetrad, также доступна как командная строка инструмент, Python API, и р обертка [7].
  • Набор инструментов Java Information Dynamics (JIDT) [8]
JIDT - это библиотека Java с открытым исходным кодом для выполнения теоретико-информационного обнаружения причин (т.е. энтропии передачи, энтропии условной передачи и т. Д.)[9]. Примеры использования библиотеки в MATLAB, GNU Octave, Python, р, Юля и Clojure представлены в документации [10].
pcalg - это р пакет, который предоставляет некоторые из тех же алгоритмов обнаружения причин, которые есть в Tetrad [12].

Конкретные методы

Причинность Грейнджера

сходящееся перекрестное отображение

ЛИНГАМ

Существует также набор инструментов и данных, поддерживаемых командой Causality Workbench. [17] и команда CCD [18].

Рекомендации

  1. ^ Рольфинг, Инго; Шнайдер, Карстен К. (2018). «Объединяющая основа для причинного анализа в теоретико-множественных мультиметодных исследованиях» (PDF). Социологические методы и исследования. 47 (1): 37–63. Дои:10.1177/0049124115626170. Получено 29 февраля 2020.
  2. ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках». Оксфордский справочник по политологии. Дои:10.1093 / oxfordhb / 9780199604456.013.0049. Получено 29 февраля 2020.
  3. ^ а б c d е ж грамм час я j k Spirtes, P .; Glymour, C .; Шайнс, Р. (2012). Причинно-следственная связь, прогнозирование и поиск. Springer Science & Business Media. ISBN  978-1461227489.
  4. ^ а б c Розенбаум, Пол (2017). Наблюдение и эксперимент: введение в причинный вывод. Издательство Гарвардского университета. ISBN  9780674975576.
  5. ^ а б c d Маккракен, Джеймс (2016). Исследовательский причинно-следственный анализ с данными временных рядов (синтез лекций по интеллектуальному анализу данных и открытию знаний). Издатели Morgan & Claypool. ISBN  978-1627059343.
  6. ^ Тьюки, Джон В. (1977). Исследовательский анализ данных. Пирсон. ISBN  978-0201076165.
  7. ^ а б Перл, Иудея (2018). Книга почему: новая наука о причине и следствии. Основные книги. ISBN  978-0465097616.
  8. ^ Клейнберг, Саманта (2015). Зачем: руководство по поиску и использованию причин. O'Reilly Media, Inc. ISBN  978-1491952191.
  9. ^ Illari, P .; Руссо, Ф. (2014). Причинность: философская теория встречается с научной практикой. ОУП Оксфорд. ISBN  978-0191639685.
  10. ^ Фишер, Р. (1937). Дизайн экспериментов. Оливер и Бойд.
  11. ^ Хилл, Б. (1955). Принципы медицинской статистики. Ланцет Лимитед.
  12. ^ Халперн, Дж. (2016). Фактическая причинность. MIT Press. ISBN  978-0262035026.
  13. ^ Pearl, J .; Glymour, M .; Джуэлл, Н. П. (2016). Причинно-следственный вывод в статистике: учебник. Джон Вили и сыновья. ISBN  978-1119186847.
  14. ^ а б Стоун Р. (1993). «Предположения, на которых основываются причинные выводы». Журнал Королевского статистического общества. Серия B (Методологическая). 55 (2): 455–466. Дои:10.1111 / j.2517-6161.1993.tb01915.x.
  15. ^ Грейнджер, С. (1980). «Тестирование причинно-следственной связи: личная точка зрения». Журнал экономической динамики и управления. 2: 329–352. Дои:10.1016 / 0165-1889 (80) 90069-X.
  16. ^ Грейнджер, К. В. Дж. (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Econometrica. 37 (3): 424–438. Дои:10.2307/1912791. JSTOR  1912791.
  17. ^ Грейнджер, Клайв. «Лекция о премии. NobelPrize.org. Nobel Media AB 2018».
  18. ^ Вудворд, Джеймс (2004). Создание вещей: теория причинного объяснения (Oxford Studies in the Philosophy of Science). Издательство Оксфордского университета. ISBN  978-1435619999.
  19. ^ Spirtes, P .; Глимур, К. (1991). «Алгоритм быстрого восстановления разреженных причинных графов». Компьютерный обзор социальных наук. 9 (1): 62–72. Дои:10.1177/089443939100900106. S2CID  38398322.
  20. ^ а б Го, Руочэн; Ченг, Лу; Ли, Цзюньдун; Хан, П. Ричард; Лю, Хуань (2018). «Исследование причинно-следственной связи обучения с данными: проблемы и методы». arXiv:1809.09337. Cite имеет пустой неизвестный параметр: |1= (помощь)
  21. ^ Малинский, Даниил; Дэнкс, Дэвид (2018). «Алгоритмы обнаружения причин: практическое руководство». Философия Компас. 13 (1): e12470. Дои:10.1111 / phc3.12470.
  22. ^ Spirtes, P .; Чжан, К. (2016). «Причинное открытие и вывод: концепции и последние методологические достижения». Аппл Информ (Берл). 3: 3. Дои:10.1186 / с40535-016-0018-х. ЧВК  4841209. PMID  27195202.
  23. ^ Ю, Куи; Ли, Цзюён; Лю, Линь; Ричард Хан, П .; Лю, Хуан (2016). «Обзор алгоритмов обнаружения причинно-следственных связей на основе ограничений». arXiv:1611.03977 [cs.AI ].
  24. ^ Сун, Джи; Bollt, Erik M .; Ли, Цзюньдун; Ричард Хан, П .; Лю, Хуан (2014). «Энтропия причинно-следственной связи определяет косвенные влияния, доминирование соседей и упреждающие связи». Physica D: нелинейные явления. 267: 49–57. arXiv:1504.03769. Bibcode:2014PhyD..267 ... 49S. Дои:10.1016 / j.physd.2013.07.001.
  25. ^ а б c Фридман, Дэвид; Хамфрис, Пол (1999). «Существуют ли алгоритмы, обнаруживающие причинную структуру?». Синтез. 121 (1–2): 29–54. Дои:10.1023 / А: 1005277613752.
  26. ^ Рагху, В. К .; Ramsey, J.D .; Моррис, А .; Manatakis, D. V .; Sprites, P .; Chrysanthis, P.K .; Glymour, C .; Бенос, П. В. (2018). «Сравнение стратегий масштабируемого причинно-следственного обнаружения моделей скрытых переменных из смешанных данных». Международный журнал науки о данных и аналитики. 6 (33): 33–45. Дои:10.1007 / s41060-018-0104-3. ЧВК  6096780. PMID  30148202.
  27. ^ Симидзу, S (2014). «ЛИНГАМ: негауссовские методы оценки причинных структур». Бихевиорометрика. 41 (1): 65–98. Дои:10.2333 / bhmk.41.65. S2CID  49238101.
  28. ^ Щека, C .; Zheng, H .; Hallstrom, B.R .; Хьюз, Р. Э. (2018). «Применение алгоритма обнаружения причинно-следственной связи для анализа данных реестра артропластики». Биомед Eng Comput Biol. 9: 117959721875689. Дои:10.1177/1179597218756896. ЧВК  5826097. PMID  29511363.
  29. ^ Wen, X .; Rangarajan, G .; Дин, М. (2013). "Является ли причинно-следственная связь по Грейнджеру жизнеспособным методом анализа данных фМРТ?". PLOS ONE. 8 (7): e67428. Bibcode:2013PLoSO ... 867428W. Дои:10.1371 / journal.pone.0067428. ЧВК  3701552. PMID  23861763.
  30. ^ Эберт-Упхофф, Imme; Дэн, Йи (2017). «Причинное открытие в науках о Земле - использование синтетических данных, чтобы научиться интерпретировать результаты». Компьютеры и науки о Земле. 99: 50–60. Bibcode:2017CG ..... 99 ... 50E. Дои:10.1016 / j.cageo.2016.10.008.
  31. ^ McCracken, J.M .; Weigel, R. S .; Ли, Цзюньдун; Ричард Хан, П .; Лю, Хуан (2014). «Конвергентное перекрестное отображение и попарный асимметричный вывод». Phys. Ред. E. 90 (6): 062903. arXiv:1407.5696. Bibcode:2014PhRvE..90f2903M. Дои:10.1103 / PhysRevE.90.062903. PMID  25615160.
  32. ^ Шайнс, Р. (1997). «Введение в причинный вывод» (PDF). Причинно-следственная связь в кризисе: 185–199.
  33. ^ Холланд, П. В. (1986). «Статистика и причинно-следственный вывод». Журнал Американской статистической ассоциации. 81 (396): 945–960. Дои:10.1080/01621459.1986.10478354.
  34. ^ Imbens, G.W .; Рубин, Д. Б. (2015). Причинный вывод в статистике, социальных и биомедицинских науках. Издательство Кембриджского университета. ISBN  978-0521885881.
  35. ^ Morgan, S.L .; Уиншип, К. (2015). Противоречия и причинный вывод. Издательство Кембриджского университета. ISBN  978-1107065079.