Исследовательский причинно-следственный анализ - Exploratory causal analysis
Эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к сделать понятным для неспециалистов, не снимая технических деталей. (Февраль 2019 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Причинно-следственный анализ это область экспериментальная конструкция и статистика относящиеся к установлению причины и следствия.[1][2] Исследовательский причинно-следственный анализ (ECA), также известный как причинность данных или же причинное открытие[3] использование статистических алгоритмы сделать вывод о связях в наборах наблюдаемых данных, которые потенциально могут быть причинными при строгих предположениях. ЭКА - это разновидность причинный вывод в отличие от причинное моделирование и эффекты лечения в рандомизированные контролируемые испытания.[4] это поисковые исследования обычно предшествует более формальным причинное исследование таким же образом разведочный анализ данных часто предшествует статистическая проверка гипотез в анализ данных[5][6]
Мотивация
Анализ данных в первую очередь касается причинно-следственных связей.[3][4][7][8][9] Например, способствовало ли удобрение росту урожая?[10] Или можно ли предотвратить данное заболевание?[11] Или почему мой друг в депрессии?[12] В потенциальные результаты и регрессивный анализ методы обрабатывают такие запросы, когда данные собираются с помощью разработанных экспериментов. Данные, собранные в наблюдательный исследования требуют различных методов причинно-следственного вывода (потому что, например, по таким вопросам, как сбивать с толку ).[13] Методы причинного вывода, используемые с экспериментальными данными, требуют дополнительных предположений для получения разумных выводов с данными наблюдений.[14] Сложность причинно-следственного вывода в таких обстоятельствах часто описывается как "корреляция не подразумевает причинно-следственной связи ".
Обзор
ECA постулирует, что существуют процедуры анализа данных выполняется на определенных подмножествах переменные в пределах большего набора, выходные данные которого могут указывать на причинно-следственную связь между этими переменными.[3] Например, если мы предположим, что все соответствующие ковариантный в данных наблюдается, то соответствие баллов предрасположенности может быть использован для определения причинного эффекта между двумя переменными наблюдений.[4] Причинность Грейнджера может также использоваться для нахождения причинно-следственной связи между двумя наблюдаемыми переменными при различных, но столь же строгих предположениях.[15]
Два широких подхода к разработке таких процедур используют операциональные определения причинности[5] или же проверка "истиной" (т.е. явно игнорируя проблему определения причинность и показывая, что данный алгоритм подразумевает причинно-следственную связь в сценариях, когда известно, что причинно-следственные связи существуют, например, используя синтетические данные[3]).
Оперативные определения причинности
Клайв Грейнджер создал первое операциональное определение причинности в 1969 году.[16] Грейнджер дал определение вероятностная причинность предложено Норберт Винер операционная как сравнение отклонений.[17]
Некоторые авторы предпочитают использовать методы ECA, разработанные с использованием операционных определений причинности, потому что они считают, что это может помочь в поиске причинных механизмов.[5][18]
Проверка по «правде»
Питер Спиртес, Кларк Глимор, и Ричард Шайнс ввел идею явного отказа от определения причинности.[3] Спиртес и Глимур представили алгоритм ПК для обнаружения причин в 1990 году.[19] Многие недавние алгоритмы обнаружения причин следуют подходу Спиртеса-Глимора к проверке.[20]
Методы
Существует множество обзоров методов выявления причин.[3][5][20][21][22][23] В этом разделе перечислены известные техники.
Двумерный (или "попарный")
- Причинность Грейнджера (есть также запись в Scholarpedia [1] )
- перенос энтропии
- сходящееся перекрестное отображение
Многомерный
Многие из этих методов обсуждаются в учебных пособиях, предоставленных Центром выявления причин (CCD). [3].
Примеры использования
Социальная наука
Алгоритм ПК был применен к нескольким различным наборам данных социальных наук.[3]
Лекарство
Алгоритм ПК был применен к медицинским данным.[28] Причинность Грейнджера была применена к фМРТ данные.[29] CCD протестировали свои инструменты с использованием биомедицинских данных [4].
Физика
ECA используется в физике для понимания физических причинных механизмов системы, например, в геофизике с использованием стабильного алгоритма ПК (вариант исходного алгоритма ПК).[30] и в динамических системах с использованием попарного асимметричного вывода (вариант сходящегося перекрестного отображения).[31]
Критика
Ведутся споры о том, действительно ли отношения между данными, обнаруженными с помощью причинно-следственных связей, являются причинными.[3][25] Жемчужина Иудеи подчеркнул, что причинный вывод требует причинной модели, разработанной "интеллектом" посредством итеративного процесса проверки предположений и подгонки данных.[7]
В ответе на критику указывается, что допущения, использованные для разработки методов ECA, могут не соответствовать заданному набору данных.[3][14][32][33][34] и что любые причинно-следственные связи, обнаруженные во время ECA, зависят от истинности этих предположений.[25][35]
Программные пакеты
Комплексные инструменты
- Тетрада [5]
- Tetrad - это Java-программа с открытым исходным кодом, основанная на графическом интерфейсе пользователя, которая предоставляет набор алгоритмов обнаружения причин. [6]. Библиотека алгоритмов, используемая Tetrad, также доступна как командная строка инструмент, Python API, и р обертка [7].
- Набор инструментов Java Information Dynamics (JIDT) [8]
- JIDT - это библиотека Java с открытым исходным кодом для выполнения теоретико-информационного обнаружения причин (т.е. энтропии передачи, энтропии условной передачи и т. Д.)[9]. Примеры использования библиотеки в MATLAB, GNU Octave, Python, р, Юля и Clojure представлены в документации [10].
- pcalg [11]
- pcalg - это р пакет, который предоставляет некоторые из тех же алгоритмов обнаружения причин, которые есть в Tetrad [12].
Конкретные методы
Причинность Грейнджера
сходящееся перекрестное отображение
ЛИНГАМ
- MATLAB /GNU Octave упаковка [16]
Существует также набор инструментов и данных, поддерживаемых командой Causality Workbench. [17] и команда CCD [18].
Рекомендации
- ^ Рольфинг, Инго; Шнайдер, Карстен К. (2018). «Объединяющая основа для причинного анализа в теоретико-множественных мультиметодных исследованиях» (PDF). Социологические методы и исследования. 47 (1): 37–63. Дои:10.1177/0049124115626170. Получено 29 февраля 2020.
- ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках». Оксфордский справочник по политологии. Дои:10.1093 / oxfordhb / 9780199604456.013.0049. Получено 29 февраля 2020.
- ^ а б c d е ж грамм час я j k Spirtes, P .; Glymour, C .; Шайнс, Р. (2012). Причинно-следственная связь, прогнозирование и поиск. Springer Science & Business Media. ISBN 978-1461227489.
- ^ а б c Розенбаум, Пол (2017). Наблюдение и эксперимент: введение в причинный вывод. Издательство Гарвардского университета. ISBN 9780674975576.
- ^ а б c d Маккракен, Джеймс (2016). Исследовательский причинно-следственный анализ с данными временных рядов (синтез лекций по интеллектуальному анализу данных и открытию знаний). Издатели Morgan & Claypool. ISBN 978-1627059343.
- ^ Тьюки, Джон В. (1977). Исследовательский анализ данных. Пирсон. ISBN 978-0201076165.
- ^ а б Перл, Иудея (2018). Книга почему: новая наука о причине и следствии. Основные книги. ISBN 978-0465097616.
- ^ Клейнберг, Саманта (2015). Зачем: руководство по поиску и использованию причин. O'Reilly Media, Inc. ISBN 978-1491952191.
- ^ Illari, P .; Руссо, Ф. (2014). Причинность: философская теория встречается с научной практикой. ОУП Оксфорд. ISBN 978-0191639685.
- ^ Фишер, Р. (1937). Дизайн экспериментов. Оливер и Бойд.
- ^ Хилл, Б. (1955). Принципы медицинской статистики. Ланцет Лимитед.
- ^ Халперн, Дж. (2016). Фактическая причинность. MIT Press. ISBN 978-0262035026.
- ^ Pearl, J .; Glymour, M .; Джуэлл, Н. П. (2016). Причинно-следственный вывод в статистике: учебник. Джон Вили и сыновья. ISBN 978-1119186847.
- ^ а б Стоун Р. (1993). «Предположения, на которых основываются причинные выводы». Журнал Королевского статистического общества. Серия B (Методологическая). 55 (2): 455–466. Дои:10.1111 / j.2517-6161.1993.tb01915.x.
- ^ Грейнджер, С. (1980). «Тестирование причинно-следственной связи: личная точка зрения». Журнал экономической динамики и управления. 2: 329–352. Дои:10.1016 / 0165-1889 (80) 90069-X.
- ^ Грейнджер, К. В. Дж. (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Econometrica. 37 (3): 424–438. Дои:10.2307/1912791. JSTOR 1912791.
- ^ Грейнджер, Клайв. «Лекция о премии. NobelPrize.org. Nobel Media AB 2018».
- ^ Вудворд, Джеймс (2004). Создание вещей: теория причинного объяснения (Oxford Studies in the Philosophy of Science). Издательство Оксфордского университета. ISBN 978-1435619999.
- ^ Spirtes, P .; Глимур, К. (1991). «Алгоритм быстрого восстановления разреженных причинных графов». Компьютерный обзор социальных наук. 9 (1): 62–72. Дои:10.1177/089443939100900106. S2CID 38398322.
- ^ а б Го, Руочэн; Ченг, Лу; Ли, Цзюньдун; Хан, П. Ричард; Лю, Хуань (2018). «Исследование причинно-следственной связи обучения с данными: проблемы и методы». arXiv:1809.09337. Cite имеет пустой неизвестный параметр:
|1=
(помощь) - ^ Малинский, Даниил; Дэнкс, Дэвид (2018). «Алгоритмы обнаружения причин: практическое руководство». Философия Компас. 13 (1): e12470. Дои:10.1111 / phc3.12470.
- ^ Spirtes, P .; Чжан, К. (2016). «Причинное открытие и вывод: концепции и последние методологические достижения». Аппл Информ (Берл). 3: 3. Дои:10.1186 / с40535-016-0018-х. ЧВК 4841209. PMID 27195202.
- ^ Ю, Куи; Ли, Цзюён; Лю, Линь; Ричард Хан, П .; Лю, Хуан (2016). «Обзор алгоритмов обнаружения причинно-следственных связей на основе ограничений». arXiv:1611.03977 [cs.AI ].
- ^ Сун, Джи; Bollt, Erik M .; Ли, Цзюньдун; Ричард Хан, П .; Лю, Хуан (2014). «Энтропия причинно-следственной связи определяет косвенные влияния, доминирование соседей и упреждающие связи». Physica D: нелинейные явления. 267: 49–57. arXiv:1504.03769. Bibcode:2014PhyD..267 ... 49S. Дои:10.1016 / j.physd.2013.07.001.
- ^ а б c Фридман, Дэвид; Хамфрис, Пол (1999). «Существуют ли алгоритмы, обнаруживающие причинную структуру?». Синтез. 121 (1–2): 29–54. Дои:10.1023 / А: 1005277613752.
- ^ Рагху, В. К .; Ramsey, J.D .; Моррис, А .; Manatakis, D. V .; Sprites, P .; Chrysanthis, P.K .; Glymour, C .; Бенос, П. В. (2018). «Сравнение стратегий масштабируемого причинно-следственного обнаружения моделей скрытых переменных из смешанных данных». Международный журнал науки о данных и аналитики. 6 (33): 33–45. Дои:10.1007 / s41060-018-0104-3. ЧВК 6096780. PMID 30148202.
- ^ Симидзу, S (2014). «ЛИНГАМ: негауссовские методы оценки причинных структур». Бихевиорометрика. 41 (1): 65–98. Дои:10.2333 / bhmk.41.65. S2CID 49238101.
- ^ Щека, C .; Zheng, H .; Hallstrom, B.R .; Хьюз, Р. Э. (2018). «Применение алгоритма обнаружения причинно-следственной связи для анализа данных реестра артропластики». Биомед Eng Comput Biol. 9: 117959721875689. Дои:10.1177/1179597218756896. ЧВК 5826097. PMID 29511363.
- ^ Wen, X .; Rangarajan, G .; Дин, М. (2013). "Является ли причинно-следственная связь по Грейнджеру жизнеспособным методом анализа данных фМРТ?". PLOS ONE. 8 (7): e67428. Bibcode:2013PLoSO ... 867428W. Дои:10.1371 / journal.pone.0067428. ЧВК 3701552. PMID 23861763.
- ^ Эберт-Упхофф, Imme; Дэн, Йи (2017). «Причинное открытие в науках о Земле - использование синтетических данных, чтобы научиться интерпретировать результаты». Компьютеры и науки о Земле. 99: 50–60. Bibcode:2017CG ..... 99 ... 50E. Дои:10.1016 / j.cageo.2016.10.008.
- ^ McCracken, J.M .; Weigel, R. S .; Ли, Цзюньдун; Ричард Хан, П .; Лю, Хуан (2014). «Конвергентное перекрестное отображение и попарный асимметричный вывод». Phys. Ред. E. 90 (6): 062903. arXiv:1407.5696. Bibcode:2014PhRvE..90f2903M. Дои:10.1103 / PhysRevE.90.062903. PMID 25615160.
- ^ Шайнс, Р. (1997). «Введение в причинный вывод» (PDF). Причинно-следственная связь в кризисе: 185–199.
- ^ Холланд, П. В. (1986). «Статистика и причинно-следственный вывод». Журнал Американской статистической ассоциации. 81 (396): 945–960. Дои:10.1080/01621459.1986.10478354.
- ^ Imbens, G.W .; Рубин, Д. Б. (2015). Причинный вывод в статистике, социальных и биомедицинских науках. Издательство Кембриджского университета. ISBN 978-0521885881.
- ^ Morgan, S.L .; Уиншип, К. (2015). Противоречия и причинный вывод. Издательство Кембриджского университета. ISBN 978-1107065079.