Многофакторное снижение размерности - Multifactor dimensionality reduction

Многофакторное уменьшение размерности (MDR) статистический подход, также используемый в машинное обучение автоматические подходы,[1] для обнаружения и характеристики комбинаций атрибуты или независимые переменные которые взаимодействуют, чтобы влиять на зависимую переменную или переменную класса.[2][3][4][5][6][7][8] MDR был разработан специально для выявления неаддитивных взаимодействия среди дискретный переменные, влияющие на двоичный результат и считается непараметрический и безмодельная альтернатива традиционным статистическим методам, таким как логистическая регрессия.

В основе метода МДР лежит конструктивная индукция или разработка функций алгоритм, преобразующий две или более переменных или атрибутов в один атрибут.[9] Этот процесс создания нового атрибута изменяет пространство представления данных.[10] Конечная цель - создать или открыть представление, которое облегчает обнаружение нелинейный или неаддитивные взаимодействия между атрибутами, так что предсказание переменной класса улучшается по сравнению с предсказанием исходного представления данных.

Наглядный пример

Рассмотрим следующий простой пример, используя Эксклюзивный или (XOR) функция. XOR - это логический оператор который обычно используется в интеллектуальном анализе данных и машинное обучение как пример функции, которая не является линейно разделимой. В таблице ниже представлен простой набор данных, в котором связь между атрибутами (X1 и X2) и переменной класса (Y) определяется функцией XOR, такой что Y = X1 XOR X2.

Таблица 1

X1X2Y
000
011
101
110

А машинное обучение Алгоритм должен обнаружить или аппроксимировать функцию XOR, чтобы точно предсказать Y, используя информацию о X1 и X2. Альтернативной стратегией было бы сначала изменить представление данных с помощью конструктивной индукции для облегчения прогнозного моделирования. Алгоритм MDR изменит представление данных (X1 и X2) следующим образом. MDR начинается с выбора двух атрибутов. В этом простом примере выбраны X1 и X2. Каждая комбинация значений для X1 и X2 проверяется, и подсчитывается количество раз, когда Y = 1 и / или Y = 0. В этом простом примере Y = 1 встречается ноль раз, а Y = 0 встречается один раз для комбинации X1 = 0 и X2 = 0. С помощью MDR соотношение этих подсчетов вычисляется и сравнивается с фиксированным порогом. Здесь соотношение подсчетов составляет 0/1, что меньше нашего фиксированного порога 1. Поскольку 0/1 <1, мы кодируем новый атрибут (Z) как 0. Когда соотношение больше единицы, мы кодируем Z как 1. Этот процесс повторяется для всех уникальных комбинаций значений X1 и X2. Таблица 2 иллюстрирует наше новое преобразование данных.

Таблица 2

ZY
00
11
11
00

Алгоритму машинного обучения теперь нужно сделать гораздо меньше работы, чтобы найти хорошую прогностическую функцию. Фактически, в этом очень простом примере функция Y = Z имеет точность классификации 1. Приятной особенностью методов конструктивной индукции, таких как MDR, является возможность использовать любой метод интеллектуального анализа данных или машинного обучения для анализа нового представления данные. Деревья решений, нейронные сети, или наивный байесовский классификатор может использоваться в сочетании с показателями качества модели, такими как сбалансированная точность[11][12] и взаимная информация.[13]

Машинное обучение с MDR

Как показано выше, основной алгоритм конструктивной индукции в MDR очень прост. Однако его реализация для шаблонов интеллектуального анализа реальных данных может быть сложной в вычислительном отношении. Как и в случае с любым алгоритмом машинного обучения, всегда есть опасения переоснащение. То есть алгоритмы машинного обучения хороши для поиска закономерностей в полностью случайных данных. Часто бывает трудно определить, является ли заявленный паттерн важным сигналом или просто случайностью. Один из подходов - оценить возможность обобщения модели на независимые наборы данных с использованием таких методов, как перекрестная проверка.[14][15][16][17] Модели, описывающие случайные данные, обычно не обобщают. Другой подход состоит в том, чтобы сгенерировать множество случайных перестановок данных, чтобы увидеть, что обнаружит алгоритм интеллектуального анализа данных, когда ему будет предоставлена ​​возможность переобучения. Перестановочное тестирование позволяет генерировать эмпирический p-значение за результат.[18][19][20][21] Репликация в независимых данных может также предоставить доказательства для модели MDR, но может быть чувствительной к различиям в наборах данных.[22][23] Все эти подходы оказались полезными для выбора и оценки моделей MDR. Важным шагом в машинном обучении является интерпретация. С MDR использовалось несколько подходов, включая энтропийный анализ.[9][24] и анализ путей.[25][26] Были рассмотрены советы и подходы к использованию МЛУ для моделирования взаимодействия генов.[7][27]

Расширения к MDR

Были введены многочисленные расширения MDR. К ним относятся семейные методы,[28][29][30] нечеткие методы,[31] ковариантная корректировка,[32] отношения шансов,[33] оценки риска,[34] методы выживания,[35][36] надежные методы,[37] методы количественных признаков,[38][39] и многие другие.

Приложения MDR

МЛУ в основном применялся для обнаружения взаимодействий ген-ген или эпистаз в генетических исследованиях распространенных заболеваний человека, таких как мерцательная аритмия,[40][41] аутизм,[42] Рак мочевого пузыря,[43][44][45] рак молочной железы,[46] сердечно-сосудистые заболевания,[14] гипертония,[47][48][49] ожирение,[50][51] панкреатический рак,[52] рак простаты[53][54][55] и туберкулез.[56] Он также был применен к другим биомедицинским проблемам, таким как генетический анализ фармакология результаты.[57][58][59] Центральная проблема - масштабирование МЛУ до большое количество данных например, из полногеномные ассоциации исследований (GWAS).[60] Было использовано несколько подходов. Один из подходов - отфильтровать признаки перед анализом MDR.[61] Это можно сделать, используя биологические знания с помощью таких инструментов, как BioFilter.[62] Это также можно сделать с помощью вычислительных инструментов, таких как ReliefF.[63] Другой подход - использовать стохастический поиск такие алгоритмы как генетическое программирование исследовать пространство поиска комбинаций функций.[64] Еще один подход - это перебор с использованием высокопроизводительные вычисления.[65][66][67]

Реализации

Смотрите также

использованная литература

  1. ^ McKinney, Brett A .; Рейф, Дэвид М .; Ричи, Мэрилин Д .; Мур, Джейсон Х. (1 января 2006 г.). «Машинное обучение для обнаружения взаимодействий генов: обзор». Прикладная биоинформатика. 5 (2): 77–88. Дои:10.2165/00822942-200605020-00002. ISSN  1175-5636. ЧВК  3244050. PMID  16722772.
  2. ^ Ричи, Мэрилин Д .; Hahn, Lance W .; Руди, Нади; Бейли, Л. Рене; Дюпон, Уильям Д .; Parl, Fritz F .; Мур, Джейсон Х. (1 июля 2001 г.). «Снижение многофакторной размерности выявляет взаимодействия высокого порядка между генами метаболизма эстрогена при спорадическом раке молочной железы». Американский журнал генетики человека. 69 (1): 138–147. Дои:10.1086/321276. ISSN  0002-9297. ЧВК  1226028. PMID  11404819.
  3. ^ Ричи, Мэрилин Д .; Hahn, Lance W .; Мур, Джейсон Х. (1 февраля 2003 г.). «Сила многофакторного снижения размерности для обнаружения взаимодействий ген-ген при наличии ошибки генотипирования, отсутствующих данных, фенокопии и генетической гетерогенности». Генетическая эпидемиология. 24 (2): 150–157. Дои:10.1002 / gepi.10218. ISSN  1098-2272. PMID  12548676.
  4. ^ Hahn, L.W .; Ritchie, M.D .; Мур, Дж. Х. (12 февраля 2003 г.). «Программное обеспечение для многофакторного уменьшения размерности для обнаружения взаимодействий ген-ген и ген-среда». Биоинформатика. 19 (3): 376–382. Дои:10.1093 / биоинформатика / btf869. ISSN  1367-4803. PMID  12584123.
  5. ^ W., Hahn, Lance; Х., Мур, Джейсон (1 января 2004 г.). «Идеальное различение дискретных клинических конечных точек с использованием мультилокусных генотипов». В биологии Silico. 4 (2). ISSN  1386-6338.
  6. ^ Мур, Джейсон Х. (1 ноября 2004 г.). «Вычислительный анализ взаимодействия генов с использованием многофакторного уменьшения размерности». Экспертный обзор молекулярной диагностики. 4 (6): 795–803. Дои:10.1586/14737159.4.6.795. ISSN  1473-7159. PMID  15525222.
  7. ^ а б Мур, Джейсон Х .; Эндрюс, Питер К. (1 января 2015 г.). Мур, Джейсон Х .; Уильямс, Скотт М. (ред.). Эпистаз. Методы молекулярной биологии. 1253. Springer Нью-Йорк. С. 301–314. Дои:10.1007/978-1-4939-2155-3_16. ISBN  9781493921546. PMID  25403539.
  8. ^ Мур, Джейсон Х. (1 января 2010 г.). Обнаружение, характеристика и интерпретация нелинейных взаимодействий генов с использованием многофакторного уменьшения размерности. Достижения в генетике. 72. С. 101–116. Дои:10.1016 / B978-0-12-380862-2.00005-9. ISBN  9780123808622. ISSN  0065-2660. PMID  21029850.
  9. ^ а б Мур, Джейсон Х .; Гилберт, Джошуа К.; Цай, Чиа-Ти; Чан, Фу-Тянь; Холден, Тодд; Барни, Нейт; Уайт, Билл К. (21 июля 2006 г.). «Гибкая вычислительная структура для обнаружения, характеристики и интерпретации статистических моделей эпистаза в генетических исследованиях восприимчивости человека к болезням». Журнал теоретической биологии. 241 (2): 252–261. Дои:10.1016 / j.jtbi.2005.11.036. PMID  16457852.
  10. ^ Михальский, Р. (февраль 1983 г.). «Теория и методология индуктивного обучения». Искусственный интеллект. 20 (2): 111–161. Дои:10.1016/0004-3702(83)90016-4.
  11. ^ Velez, Digna R .; Уайт, Билл С .; Motsinger, Alison A .; Буш, Уильям С .; Ричи, Мэрилин Д .; Уильямс, Скотт М .; Мур, Джейсон Х. (1 мая 2007 г.). «Функция сбалансированной точности для моделирования эпистазов в несбалансированных наборах данных с использованием многофакторного уменьшения размерности». Генетическая эпидемиология. 31 (4): 306–315. Дои:10.1002 / gepi.20211. ISSN  0741-0395. PMID  17323372.
  12. ^ Намкунг, Чонхён; Ким, Кюнга; Йи, Сунгон; Чанг, Вонил; Квон, Мин-Сок; Пак, Тэсон (1 февраля 2009 г.). «Новые методы оценки для многофакторных классификаторов уменьшения размерности в анализе взаимодействия генов». Биоинформатика. 25 (3): 338–345. Дои:10.1093 / биоинформатика / btn629. ISSN  1367-4811. PMID  19164302.
  13. ^ Буш, Уильям С .; Эдвардс, Тодд Л .; Дудек, Скотт М .; McKinney, Brett A .; Ричи, Мэрилин Д. (1 января 2008 г.). «Альтернативные таблицы непредвиденных обстоятельств улучшают мощность и обнаруживают многофакторное снижение размерности». BMC Bioinformatics. 9: 238. Дои:10.1186/1471-2105-9-238. ISSN  1471-2105. ЧВК  2412877. PMID  18485205.
  14. ^ а б Коффи, Кристофер С .; Hebert, Patricia R .; Ричи, Мэрилин Д .; Krumholz, Harlan M .; Газиано, Дж. Майкл; Ридкер, Пол М .; Браун, Нэнси Дж .; Vaughan, Douglas E .; Мур, Джейсон Х. (1 января 2004 г.). «Применение условной логистической регрессии и многофакторного уменьшения размерности для обнаружения взаимодействий генов с риском инфаркта миокарда: важность проверки модели». BMC Bioinformatics. 5: 49. Дои:10.1186/1471-2105-5-49. ISSN  1471-2105. ЧВК  419697. PMID  15119966.
  15. ^ Motsinger, Alison A .; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Влияние сокращения интервалов перекрестной проверки на эффективность многофакторного снижения размерности». Генетическая эпидемиология. 30 (6): 546–555. Дои:10.1002 / gepi.20166. ISSN  1098-2272. PMID  16800004.
  16. ^ Гори, Джеффри Дж .; Суини, Холли С.; Рейф, Дэвид М .; Моцингер-Райф, Элисон А. (5 ноября 2012 г.). «Сравнение методов валидации внутренней модели для многофакторного снижения размерности в случае генетической гетерогенности». BMC Research Notes. 5: 623. Дои:10.1186/1756-0500-5-623. ISSN  1756-0500. ЧВК  3599301. PMID  23126544.
  17. ^ Уинхэм, Стейси Дж .; Слейтер, Эндрю Дж .; Моцингер-Райф, Элисон А. (22 июля 2010 г.). «Сравнение методов внутренней проверки для многофакторного снижения размерности». BMC Bioinformatics. 11: 394. Дои:10.1186/1471-2105-11-394. ISSN  1471-2105. ЧВК  2920275. PMID  20650002.
  18. ^ Паттин, Кристина А .; Уайт, Билл С .; Барни, Нейт; Гуй, Цзян; Нельсон, Хизер Х .; Келси, Карл Т .; Эндрю, Анджелина С .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2009 г.). «Вычислительно эффективный метод проверки гипотез для анализа эпистаза с использованием многофакторного уменьшения размерности». Генетическая эпидемиология. 33 (1): 87–94. Дои:10.1002 / gepi.20360. ISSN  1098-2272. ЧВК  2700860. PMID  18671250.
  19. ^ Грин, Кейси С .; Himmelstein, Daniel S .; Нельсон, Хизер Х .; Келси, Карл Т .; Уильямс, Скотт М .; Эндрю, Анджелина С .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 октября 2009 г.). Биокомпьютинг 2010. Тихоокеанский симпозиум по биокомпьютингу. Тихоокеанский симпозиум по биокомпьютингу. МИРОВАЯ НАУЧНАЯ. С. 327–336. Дои:10.1142/9789814295291_0035. ISBN  9789814299473. ЧВК  2916690. PMID  19908385.
  20. ^ Дай, Хунъин; Бхандари, Мадхусудан; Беккер, Мара; Лидер, Дж. Стивен; Гедигк, Роджер; Моцингер-Райф, Элисон А. (22 мая 2012 г.). «Глобальные тесты P-значений для моделей многофакторного снижения размерности при выборе оптимального количества целевых генов». BioData Mining. 5 (1): 3. Дои:10.1186/1756-0381-5-3. ISSN  1756-0381. ЧВК  3508622. PMID  22616673.
  21. ^ Моцингер-Райф, Элисон А. (30 декабря 2008 г.). «Влияние альтернативных стратегий тестирования перестановок на производительность многофакторного уменьшения размерности». BMC Research Notes. 1: 139. Дои:10.1186/1756-0500-1-139. ISSN  1756-0500. ЧВК  2631601. PMID  19116021.
  22. ^ Грин, Кейси С .; Penrod, Nadia M .; Уильямс, Скотт М .; Мур, Джейсон Х. (2 июня 2009 г.). «Неспособность воспроизвести генетическую ассоциацию может дать важные ключи к разгадке генетической архитектуры». PLOS One. 4 (6): e5639. Bibcode:2009PLoSO ... 4.5639G. Дои:10.1371 / journal.pone.0005639. ISSN  1932-6203. ЧВК  2685469. PMID  19503614.
  23. ^ Piette, Elizabeth R .; Мур, Джейсон Х. (19 апреля 2017 г.). Повышение воспроизводимости результатов генетической ассоциации с использованием методов повторной выборки генотипа. Приложения эволюционных вычислений. Конспект лекций по информатике. 10199. С. 96–108. Дои:10.1007/978-3-319-55849-3_7. ISBN  978-3-319-55848-6.
  24. ^ Мур, Джейсон Х .; Ху, Тин (1 января 2015 г.). Анализ эпистазов с использованием теории информации. Методы молекулярной биологии. 1253. С. 257–268. Дои:10.1007/978-1-4939-2155-3_13. ISBN  978-1-4939-2154-6. ISSN  1940-6029. PMID  25403536.
  25. ^ Ким, Нора Чанг; Эндрюс, Питер С .; Asselbergs, Folkert W .; Фрост, Х. Роберт; Уильямс, Скотт М .; Харрис, Брент Т .; Читай, Синтия; Аскленд, Кэтлин Д .; Мур, Джейсон Х. (28 июля 2012 г.). «Анализ генной онтологии парных генетических ассоциаций в двух полногеномных исследованиях спорадического БАС». BioData Mining. 5 (1): 9. Дои:10.1186/1756-0381-5-9. ISSN  1756-0381. ЧВК  3463436. PMID  22839596.
  26. ^ Ченг, Саманта; Эндрю, Анджелина С .; Эндрюс, Питер С .; Мур, Джейсон Х. (1 января 2016 г.). «Комплексный системный анализ предрасположенности к раку мочевого пузыря показывает роль декарбоксилазы в двух полногеномных ассоциативных исследованиях». BioData Mining. 9: 40. Дои:10.1186 / s13040-016-0119-z. ЧВК  5154053. PMID  27999618.
  27. ^ Гола, Дамиан; Махачи Джон, Джестина М .; ван Стин, Кристель; Кениг, Инке Р. (1 марта 2016 г.). «Дорожная карта к методам многофакторного снижения размерности». Брифинги по биоинформатике. 17 (2): 293–308. Дои:10.1093 / bib / bbv038. ISSN  1477-4054. ЧВК  4793893. PMID  26108231.
  28. ^ Martin, E. R .; Ritchie, M.D .; Hahn, L .; Kang, S .; Мур, Дж. Х. (1 февраля 2006 г.). «Новый метод определения эффектов генов в нуклеарных семьях: MDR-PDT». Генетическая эпидемиология. 30 (2): 111–123. Дои:10.1002 / gepi.20128. ISSN  0741-0395. PMID  16374833.
  29. ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лэй; Ма, Дженни З .; Mangold, Jamie E .; Чжу, Цзюнь; Элстон, Роберт С .; Ли, Мин Д. (1 октября 2008 г.). «Комбинаторный подход к обнаружению взаимодействий ген-ген и ген-окружающая среда в семейных исследованиях». Американский журнал генетики человека. 83 (4): 457–467. Дои:10.1016 / j.ajhg.2008.09.001. ISSN  1537-6605. ЧВК  2561932. PMID  18834969.
  30. ^ Каттаерт, Том; Урреа, Виктор; Naj, Adam C .; Де Лобель, Лиззи; Де Вит, Ванесса; Фу, Мао; Махачи Джон, Джестина М .; Шэнь, Хайцин; Калле, М. Луз (22 апреля 2010 г.). «FAM-MDR: гибкий семейный многофакторный метод уменьшения размерности для обнаружения эпистаза с использованием связанных лиц». PLOS One. 5 (4): e10304. Bibcode:2010PLoSO ... 510304C. Дои:10.1371 / journal.pone.0010304. ISSN  1932-6203. ЧВК  2858665. PMID  20421984.
  31. ^ Лим, Сангсоб; Пак, Тэсон (14 марта 2017 г.). «Эмпирический нечеткий многофакторный метод уменьшения размерности для обнаружения взаимодействий генов». BMC Genomics. 18 (Дополнение 2): 115. Дои:10.1186 / с12864-017-3496-х. ISSN  1471-2164. ЧВК  5374597. PMID  28361694.
  32. ^ Гуй, Цзян; Эндрю, Анджелина С .; Эндрюс, Питер; Нельсон, Хизер М .; Келси, Карл Т .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2010 г.). «Простой и эффективный с точки зрения вычислений подход к выборке для ковариативной корректировки для многофакторного анализа уменьшения размерности эпистаза». Человеческая наследственность. 70 (3): 219–225. Дои:10.1159/000319175. ISSN  1423-0062. ЧВК  2982850. PMID  20924193.
  33. ^ Чанг, Юджин; Ли, Сын Ён; Элстон, Роберт С .; Пак, Тэсон (1 января 2007 г.). «Метод многофакторного снижения размерности на основе отношения шансов для обнаружения взаимодействий генов». Биоинформатика. 23 (1): 71–76. Дои:10.1093 / биоинформатика / btl557. ISSN  1367-4811. PMID  17092990.
  34. ^ Дай, Хунъин; Чарниго, Ричард Дж .; Becker, Mara L .; Лидер, Дж. Стивен; Моцингер-Райф, Элисон А. (8 января 2013 г.). «Моделирование оценок риска множественных взаимодействий генов с использованием агрегированного многофакторного уменьшения размерности». BioData Mining. 6 (1): 1. Дои:10.1186/1756-0381-6-1. ЧВК  3560267. PMID  23294634.
  35. ^ Гуй, Цзян; Мур, Джейсон Х .; Келси, Карл Т .; Марсит, Кармен Дж .; Карагас, Маргарет Р .; Эндрю, Анджелина С. (1 января 2011 г.). «Новый метод многофакторного снижения размерности выживаемости для обнаружения взаимодействий генов с применением для прогноза рака мочевого пузыря». Генетика человека. 129 (1): 101–110. Дои:10.1007 / s00439-010-0905-5. ISSN  1432-1203. ЧВК  3255326. PMID  20981448.
  36. ^ Ли, Сынён; Сын, Донхи; Ю, Вэньбао; Парк, Тэсон (1 декабря 2016 г.). «Анализ взаимодействия генов для модели ускоренного времени отказа с использованием унифицированного метода многофакторного уменьшения размерности на основе модели». Геномика и информатика. 14 (4): 166–172. Дои:10.5808 / GI.2016.14.4.166. ISSN  1598-866X. ЧВК  5287120. PMID  28154507.
  37. ^ Гуй, Цзян; Эндрю, Анджелина С .; Эндрюс, Питер; Нельсон, Хизер М .; Келси, Карл Т .; Карагас, Маргарет Р .; Мур, Джейсон Х. (1 января 2011 г.). «Надежный многофакторный метод уменьшения размерности для обнаружения взаимодействий генов с приложением к генетическому анализу предрасположенности к раку мочевого пузыря». Анналы генетики человека. 75 (1): 20–28. Дои:10.1111 / j.1469-1809.2010.00624.x. ISSN  1469-1809. ЧВК  3057873. PMID  21091664.
  38. ^ Гуй, Цзян; Мур, Джейсон Х .; Уильямс, Скотт М .; Эндрюс, Питер; Hillege, Hans L .; ван дер Харст, Пим; Навис, Гержан; Van Gilst, Wiek H .; Ассельбергс, Фолкерт В. (1 января 2013 г.). «Простой и эффективный с вычислительной точки зрения подход к многофакторному анализу снижения размерности генно-генетических взаимодействий для количественных характеристик». PLOS One. 8 (6): e66545. Bibcode:2013PLoSO ... 866545G. Дои:10.1371 / journal.pone.0066545. ISSN  1932-6203. ЧВК  3689797. PMID  23805232.
  39. ^ Лу, Сян-Ян; Чен, Го-Бо; Ян, Лэй; Ма, Дженни З .; Чжу, Цзюнь; Элстон, Роберт С .; Ли, Мин Д. (1 июня 2007 г.). «Обобщенный комбинаторный подход к обнаружению взаимодействий между генами и генами и средой, применимый к никотиновой зависимости». Американский журнал генетики человека. 80 (6): 1125–1137. Дои:10.1086/518312. ISSN  0002-9297. ЧВК  1867100. PMID  17503330.
  40. ^ Цай, Чиа-Ти; Лай, Линь-Пинг; Линь, Цзюнн-Ли; Чан, Фу-Тянь; Хван, Джуэй-Джен; Ричи, Мэрилин Д .; Мур, Джейсон Х .; Сюй, Куан-Ли; Ценг, Чуэн-Дэн (6 апреля 2004 г.). «Полиморфизмы генов ренин-ангиотензиновой системы и фибрилляция предсердий». Тираж. 109 (13): 1640–1646. Дои:10.1161 / 01.CIR.0000124487.36586.26. ISSN  0009-7322. PMID  15023884.
  41. ^ Asselbergs, Folkert W .; Мур, Джейсон Х .; van den Berg, Maarten P .; Римм, Эрик Б .; де Бур, Рудольф А .; Dullaart, Robin P .; Навис, Гержан; ван Гильст, Вик Х. (1 января 2006 г.). «Роль полиморфизма CETP TaqIB в определении предрасположенности к фибрилляции предсердий: вложенное исследование случай-контроль». BMC Medical Genetics. 7: 39. Дои:10.1186/1471-2350-7-39. ISSN  1471-2350. ЧВК  1462991. PMID  16623947.
  42. ^ Ma, D.Q .; Whitehead, P.L .; Menold, M.M .; Martin, E.R .; Ashley-Koch, A.E .; Mei, H .; Ричи, доктор медицины; DeLong, G.R .; Абрамсон, Р. (1 сентября 2005 г.). «Идентификация значительной ассоциации и взаимодействия генов с генами субъединиц рецептора ГАМК при аутизме». Американский журнал генетики человека. 77 (3): 377–388. Дои:10.1086/433195. ISSN  0002-9297. ЧВК  1226204. PMID  16080114.
  43. ^ Эндрю, Анджелина С .; Нельсон, Хизер Х .; Келси, Карл Т .; Мур, Джейсон Х .; Meng, Alexis C .; Casella, Daniel P .; Tosteson, Tor D .; Schned, Alan R .; Карагас, Маргарет Р. (1 мая 2006 г.). «Соответствие нескольких аналитических подходов демонстрирует сложную взаимосвязь между SNP генов репарации ДНК, курением и предрасположенностью к раку мочевого пузыря». Канцерогенез. 27 (5): 1030–1037. Дои:10.1093 / carcin / bgi284. ISSN  0143-3334. PMID  16311243.
  44. ^ Эндрю, Анджелина С .; Карагас, Маргарет Р .; Нельсон, Хизер Х .; Гуаррера, Симонетта; Полидоро, Сильвия; Гамберини, Сара; Сакердот, Карлотта; Мур, Джейсон Х .; Келси, Карл Т. (1 января 2008 г.). «Полиморфизмы репарации ДНК изменяют риск рака мочевого пузыря: многофакторная аналитическая стратегия». Человеческая наследственность. 65 (2): 105–118. Дои:10.1159/000108942. ISSN  0001-5652. ЧВК  2857629. PMID  17898541.
  45. ^ Эндрю, Анджелина С .; Ху, Тинг; Гу, Цзянь; Гуй, Цзян; Е, Юаньцин; Марсит, Кармен Дж .; Келси, Карл Т .; Schned, Alan R .; Таньос, Сэм А. (1 января 2012 г.). «HSD3B и взаимодействие генов в анализе генетической предрасположенности к раку мочевого пузыря». PLOS One. 7 (12): e51301. Bibcode:2012PLoSO ... 751301A. Дои:10.1371 / journal.pone.0051301. ISSN  1932-6203. ЧВК  3526593. PMID  23284679.
  46. ^ Цао, Цзинцзин; Ло, Чэнлинь; Ян, Руи; Пэн, Руи; Ван, Кайцзюань; Ван, Пэн; Йе, Хуа; Сонг, Чуньхуа (1 декабря 2016 г.). «rs15869 в сайте связывания miRNA в BRCA2 связан с восприимчивостью к раку груди». Медицинская онкология. 33 (12): 135. Дои:10.1007 / s12032-016-0849-2. ISSN  1357-0560. PMID  27807724.
  47. ^ Уильямс, Скотт М .; Ричи, Мэрилин Д .; III, Джон А. Филлипс; Доусон, Эллиот; Принц, Мелисса; Джура, Эльвира; Уиллис, Алеция; Семеня, Амма; Summar, Marshall (1 января 2004 г.). «Мультилокусный анализ гипертонии: иерархический подход». Человеческая наследственность. 57 (1): 28–38. Дои:10.1159/000077387. ISSN  0001-5652. PMID  15133310.
  48. ^ Санада, Хиронобу; Ятабэ, Джуничи; Мидорикава, Санаэ; Хашимото, Шигеацу; Ватанабэ, Цуёси; Мур, Джейсон Х .; Ричи, Мэрилин Д .; Уильямс, Скотт М .; Пецзулло, Джон К. (1 марта 2006 г.). «Однонуклеотидные полиморфизмы для диагностики гипертонии, чувствительной к соли». Клиническая химия. 52 (3): 352–360. Дои:10.1373 / Clinchem.2005.059139. ISSN  0009-9147. PMID  16439609.
  49. ^ Мур, Джейсон Х .; Уильямс, Скотт М. (1 января 2002 г.). «Новые стратегии для выявления взаимодействий генов при гипертонии». Анналы медицины. 34 (2): 88–95. Дои:10.1080/07853890252953473. ISSN  0785-3890. PMID  12108579.
  50. ^ Де, Ришика; Verma, Shefali S .; Хольцингер, Эмили; Холл, Молли; Берт, Эмбер; Каррелл, Дэвид С .; Кросслин, Дэвид Р .; Jarvik, Gail P .; Куйваниеми, Елена (1 февраля 2017 г.). «Выявление взаимодействий ген-ген, которые тесно связаны с четырьмя количественными липидными признаками в нескольких когортах» (PDF). Генетика человека. 136 (2): 165–178. Дои:10.1007 / s00439-016-1738-7. ISSN  1432-1203. PMID  27848076.
  51. ^ Де, Ришика; Verma, Shefali S .; Дренос, Фотиос; Хольцингер, Эмили Р .; Холмс, Майкл В .; Холл, Молли А .; Кросслин, Дэвид Р .; Каррелл, Дэвид С .; Хаконарсон, Хакон (1 января 2015 г.). «Выявление взаимодействий ген-ген, которые тесно связаны с индексом массы тела, с помощью количественного многофакторного уменьшения размерности (QMDR)». BioData Mining. 8: 41. Дои:10.1186 / s13040-015-0074-0. ЧВК  4678717. PMID  26674805.
  52. ^ Дуэлл, Эрик Дж .; Bracci, Paige M .; Мур, Джейсон Х .; Бурк, Роберт Д.; Келси, Карл Т .; Холли, Элизабет А. (1 июня 2008 г.). «Обнаружение взаимодействий ген-ген и ген-среда на основе пути при раке поджелудочной железы». Эпидемиология, биомаркеры и профилактика рака. 17 (6): 1470–1479. Дои:10.1158 / 1055-9965.EPI-07-2797. ISSN  1055-9965. ЧВК  4410856. PMID  18559563.
  53. ^ Сюй, Цзяньфэн; Лоуи, Джеймс; Виклунд, Фредрик; Солнце, Джилин; Линдмарк, Фредрик; Сюй, Фан-Чи; Димитров, Латчезар; Чанг, Баоли; Тернер, Обри Р. (1 ноября 2005 г.). «Взаимодействие четырех генов в пути воспаления достоверно предсказывает риск рака простаты». Эпидемиология, биомаркеры и профилактика рака. 14 (11): 2563–2568. Дои:10.1158 / 1055-9965.EPI-05-0356. ISSN  1055-9965. PMID  16284379.
  54. ^ Лаванда, Николь А .; Роджерс, Эрика Н .; Йеоду, Сьюзан; Радд, Джеймс; Ху, Тинг; Чжан, Цзе; Brock, Guy N .; Kimbro, Kevin S .; Мур, Джейсон Х. (30 апреля 2012 г.). «Взаимодействие между вариантами последовательности, ассоциированными с апоптозом, и совместные эффекты при агрессивном раке простаты». BMC Medical Genomics. 5: 11. Дои:10.1186/1755-8794-5-11. ISSN  1755-8794. ЧВК  3355002. PMID  22546513.
  55. ^ Лаванда, Николь А .; Benford, Marnita L .; VanCleave, Tiva T .; Brock, Guy N .; Киттлс, Рик А .; Мур, Джейсон Х .; Хайн, Дэвид В .; Кидд, Ла Крейс Р. (16 ноября 2009 г.). «Исследование генов полиморфной глутатион-S-трансферазы (GST), курения табака и риска рака простаты среди мужчин африканского происхождения: исследование случай-контроль». BMC Рак. 9: 397. Дои:10.1186/1471-2407-9-397. ISSN  1471-2407. ЧВК  2783040. PMID  19917083.
  56. ^ Коллинз, Райан Л .; Ху, Тинг; Вейсе, Кристиан; Сируго, Джорджио; Уильямс, Скотт М .; Мур, Джейсон Х. (18 февраля 2013 г.). «Многофакторное снижение размерности выявляет эпистатическое взаимодействие с тремя локусами, связанное с восприимчивостью к туберкулезу легких». BioData Mining. 6 (1): 4. Дои:10.1186/1756-0381-6-4. ЧВК  3618340. PMID  23418869.
  57. ^ Wilke, Russell A .; Рейф, Дэвид М .; Мур, Джейсон Х. (1 ноября 2005 г.). «Комбинаторная фармакогенетика». Обзоры природы Drug Discovery. 4 (11): 911–918. Дои:10.1038 / nrd1874. ISSN  1474-1776. PMID  16264434.
  58. ^ Motsinger, Alison A .; Ричи, Мэрилин Д .; Шафер, Роберт В .; Роббинс, Грегори К .; Морс, Джин Д .; Лаббе, Линия; Wilkinson, Grant R .; Клиффорд, Дэвид Б.; Д'Акуила, Ричард Т. (1 ноября 2006 г.). «Мультилокусные генетические взаимодействия и ответ на схемы, содержащие эфавиренц: исследование группы клинических испытаний СПИДа у взрослых». Фармакогенетика и геномика. 16 (11): 837–845. Дои:10.1097 / 01.fpc.0000230413.97596.fa. ISSN  1744-6872. PMID  17047492.
  59. ^ Ричи, Мэрилин Д .; Моцингер, Элисон А. (1 декабря 2005 г.). «Многофакторное снижение размерности для обнаружения взаимодействий ген-ген и ген-среда в исследованиях фармакогеномики». Фармакогеномика. 6 (8): 823–834. Дои:10.2217/14622416.6.8.823. ISSN  1462-2416. PMID  16296945.
  60. ^ Мур, Джейсон Х .; Asselbergs, Folkert W .; Уильямс, Скотт М. (15 февраля 2010 г.). «Проблемы биоинформатики для полногеномных ассоциативных исследований». Биоинформатика. 26 (4): 445–455. Дои:10.1093 / биоинформатика / btp713. ISSN  1367-4811. ЧВК  2820680. PMID  20053841.
  61. ^ Сунь, Сянцин; Лу, Цин; Мукерджи, Шубхабрата; Мукхирджи, Шубхабрата; Крейн, Пол К .; Элстон, Роберт; Ричи, Мэрилин Д. (1 января 2014 г.). «Анализатор для поиска эпистаза - статистическая фильтрация против биологической». Границы генетики. 5: 106. Дои:10.3389 / fgene.2014.00106. ЧВК  4012196. PMID  24817878.
  62. ^ Пендерграсс, Сара А .; Фразе, Алекс; Уоллес, Джон; Вулф, Дэниел; Катияр, Нирджа; Мур, Кэрри; Ричи, Мэрилин Д. (30 декабря 2013 г.). «Геномный анализ с помощью biofilter 2.0: фильтрация на основе знаний, аннотации и разработка моделей». BioData Mining. 6 (1): 25. Дои:10.1186/1756-0381-6-25. ЧВК  3917600. PMID  24378202.
  63. ^ Мур, Джейсон Х. (1 января 2015 г.). Анализ эпистаза с помощью ReliefF. Методы молекулярной биологии. 1253. С. 315–325. Дои:10.1007/978-1-4939-2155-3_17. ISBN  978-1-4939-2154-6. ISSN  1940-6029. PMID  25403540.
  64. ^ Мур, Джейсон Х .; Уайт, Билл К. (1 января 2007 г.). Риоло, Рик; Соул, Теренс; Ворзель, Билл (ред.). Теория и практика генетического программирования IV. Генетические и эволюционные вычисления. Springer США. С. 11–28. Дои:10.1007/978-0-387-49650-4_2. ISBN  9780387333755.
  65. ^ Грин, Кейси С .; Sinnott-Armstrong, Nicholas A .; Himmelstein, Daniel S .; Парк, Пол Дж .; Мур, Джейсон Х .; Харрис, Брент Т. (1 марта 2010 г.). «Многофакторное снижение размерности графических процессоров позволяет тестировать эпистаз в масштабе всего генома при спорадическом БАС». Биоинформатика. 26 (5): 694–695. Дои:10.1093 / биоинформатика / btq009. ISSN  1367-4811. ЧВК  2828117. PMID  20081222.
  66. ^ Буш, Уильям С .; Дудек, Скотт М .; Ричи, Мэрилин Д. (1 сентября 2006 г.). «Параллельное многофакторное снижение размерности: инструмент для масштабного анализа ген-генных взаимодействий». Биоинформатика. 22 (17): 2173–2174. Дои:10.1093 / биоинформатика / btl347. ISSN  1367-4811. ЧВК  4939609. PMID  16809395.
  67. ^ Sinnott-Armstrong, Nicholas A .; Грин, Кейси С .; Канкаре, Фабио; Мур, Джейсон Х. (24 июля 2009 г.). «Ускорение анализа эпистазов в генетике человека с помощью потребительского графического оборудования». BMC Research Notes. 2: 149. Дои:10.1186/1756-0500-2-149. ISSN  1756-0500. ЧВК  2732631. PMID  19630950.
  68. ^ Уинхэм, Стейси Дж .; Моцингер-Райф, Элисон А. (16 августа 2011 г.). «Реализация многофакторного уменьшения размерности в пакете R». BioData Mining. 4 (1): 24. Дои:10.1186/1756-0381-4-24. ISSN  1756-0381. ЧВК  3177775. PMID  21846375.
  69. ^ Calle, M. Luz; Урреа, Виктор; Малатс, Нурия; Ван Стин, Кристель (1 сентября 2010 г.). «mbmdr: пакет R для изучения взаимодействия генов, связанных с бинарными или количественными признаками». Биоинформатика. 26 (17): 2198–2199. Дои:10.1093 / биоинформатика / btq352. ISSN  1367-4811. PMID  20595460.

дальнейшее чтение

  • Михальски, Р. С., «Распознавание образов как компьютерная индукция, управляемая знаниями», Департамент компьютерных наук, № 927, Иллинойский университет, Урбана, июнь 1978 г.