Молекулярная добыча - Molecule mining

Эта страница описывает добыча полезных ископаемых за молекулы. Поскольку молекулы могут быть представлены молекулярные графики это сильно связано с анализ графов и структурированный анализ данных. Основная проблема заключается в том, как представлять молекулы при различении экземпляров данных. Один из способов добиться этого - химическое сходство. метрики, имеющая давние традиции в области хеминформатика.

Типичные подходы к вычислению химического сходства используют химические отпечатки пальцев, но при этом теряется основная информация о топология молекулы. Анализ молекулярных графов напрямую устраняет эту проблему. Так делает обратная задача QSAR что предпочтительнее для векторных отображений.

Кодирование (Молекулая, Молекулаjя)

Методы ядра

  • Маргинализованный ядро графа[1]
  • Ядро с оптимальным назначением[2][3][4]
  • Фармакофорное ядро[5]
  • Реализация на C ++ (и R) объединение
    • ядро маргинализованного графа между помеченными графами[1]
    • расширения маргинализованного ядра[6]
    • Ядра Танимото[7]
    • ядра графов на основе древовидных шаблонов[8]
    • ядра на основе фармакофоров для трехмерной структуры молекул[5]

Максимальное количество методов Common Graph

  • MCS -HSCS[9] (Стратегия ранжирования общей подструктуры с наивысшим баллом (HSCS) для одиночной MCS)
  • Маленькая молекула Детектор подграфов (SMSD)[10]- это программная библиотека на основе Java для вычисления максимального общего подграфа (MCS) между небольшими молекулами. Это поможет нам найти сходство / расстояние между двумя молекулами. MCS также используется для скрининга соединений, подобных лекарствам, путем попадания в молекулы, имеющие общий подграф (подструктуру).[11]

Кодирование (Молекулая)

Методы молекулярного запроса

Методы на основе специальных архитектур нейронных сетей

Смотрите также

Рекомендации

  1. ^ а б Х. Кашима, К. Цуда, А. Инокучи, Маргинальные ядра между помеченными графами, 20-я Международная конференция по машинному обучению (ICML2003), 2003 г. PDF
  2. ^ Х. Фрёлих, Й. К. Вегнер, А. Целль, Ядра оптимального назначения для атрибутивных молекулярных графов, 22-я Международная конференция по машинному обучению (ICML 2005), Omnipress, Мэдисон, Висконсин, США, 2005, 225-232. PDF
  3. ^ Фрёлих Х., Вегнер Дж. К., Целль А. (2006). «Функции ядра для атрибутированных молекулярных графов - новый подход на основе подобия к прогнозированию ADME в классификации и регрессии». QSAR Comb. Наука. 25: 317–326. Дои:10.1002 / qsar.200510135.CS1 maint: несколько имен: список авторов (связь)
  4. ^ Х. Фрёлих, Й. К. Вегнер, А. Целль, Ядра назначения для химических соединений, Международная объединенная конференция по нейронным сетям 2005 (IJCNN'05), 2005, 913-918. CiteSeer
  5. ^ а б Маэ П., Ралайвола Л., Стовен В., Верт Дж. (2006). «Фармакофорное ядро ​​для виртуального скрининга с машинами опорных векторов». Модель J Chem Inf. 46: 2003–2014. arXiv:q-bio / 0603006. Дои:10.1021 / ci060138m.CS1 maint: несколько имен: список авторов (связь)
  6. ^ П. Маэ, Н. Уэда, Т. Акуцу, Ж.-Л. Перре, П. Верт, Ж.-П. (2004). «Расширения ядер маргинальных графов». Материалы 21-й конференции ICML: 552–559.CS1 maint: несколько имен: список авторов (связь)
  7. ^ Л. Ралайвола, С. Дж. Свамидасс, С. Хирото и П. Балди (2005). «Ядра графа для химической информатики». Нейронные сети. 18 (8): 1093–1110. Дои:10.1016 / j.neunet.2005.07.009. PMID  16157471.CS1 maint: несколько имен: список авторов (связь)
  8. ^ П. Маэ и Ж.-П. Верт (2009). «Графические ядра на основе древовидных структур для молекул». Машинное обучение. 75 (1): 3–35. arXiv:q-bio / 0609024. Дои:10.1007 / s10994-008-5086-2. ISSN  0885-6125.
  9. ^ Вегнер Й. К., Фрёлих Х., Миленц Х., Целль А. (2006). "Анализ данных и графиков в химическом пространстве для ADME и наборов данных о деятельности". QSAR Comb. Наука. 25: 205–220. Дои:10.1002 / qsar.200510009.CS1 maint: несколько имен: список авторов (связь)
  10. ^ Рахман С. А., Баштон М., Холлидей Г. Л., Шредер Р., Торнтон Дж. М. (2009). "Набор инструментов для обнаружения подграфов малых молекул (SMSD)". Журнал химинформатики. 1: 12. Дои:10.1186/1758-2946-1-12. ЧВК  2820491. PMID  20298518.CS1 maint: несколько имен: список авторов (связь)
  11. ^ http://www.ebi.ac.uk/thornton-srv/software/SMSD/
  12. ^ Кинг Р. Д., Сринивасан А., Дехаспе Л. (2001). «Wamr: инструмент интеллектуального анализа данных для химических данных». J. Comput.-Aid. Мол. Des. 15: 173–181. Дои:10.1023 / А: 1008171016861. PMID  11272703.CS1 maint: несколько имен: список авторов (связь)
  13. ^ Л. Дехаспе, Х. Тойвонен, Кинг, Обнаружение частых подструктур в химических соединениях, 4-я Международная конференция по открытию знаний и интеллектуальному анализу данных, AAAI Press., 1998, 30-36.
  14. ^ А. Инокучи, Т. Васио, Т. Окада, Х. Мотода, Применение метода анализа графов на основе априори для анализа данных мутагенеза, Журнал компьютерной химии, 2001;, 2, 87-92.
  15. ^ А. Инокучи, Т. Васио, К. Нисимура, Х. Мотода, Быстрый алгоритм поиска часто связанных подграфов, IBM Research, Токийская исследовательская лаборатория, 2002.
  16. ^ А. Клэр, Р. Д. Кинг, Анализ данных генома дрожжей на ленивом функциональном языке, Практические аспекты декларативных языков (PADL2003), 2003.
  17. ^ Курамочи М., Карыпис Г. (2004). «Эффективный алгоритм обнаружения частых подграфов». IEEE Transactions по разработке знаний и данных. 16 (9): 1038–1051. Дои:10.1109 / tkde.2004.33.
  18. ^ Дешпанде М., Курамочи М., Уэйл Н., Карипис Г. (2005). «Частые подходы на основе субструктуры для классификации химических соединений». IEEE Transactions по разработке знаний и данных. 17 (8): 1036–1050. Дои:10.1109 / tkde.2005.127. HDL:11299/215559.CS1 maint: несколько имен: список авторов (связь)
  19. ^ Хельма К., Крамер Т., Крамер С., де Рэдт Л. (2004). «Методы интеллектуального анализа данных и машинного обучения для идентификации субструктур, вызывающих мутагенность, и взаимосвязей между структурой и активностью несовместимых соединений». J. Chem. Инф. Comput. Наука. 44: 1402–1411. Дои:10.1021 / ci034254q.CS1 maint: несколько имен: список авторов (связь)
  20. ^ Т. Майнл, К. Боргельт, М. Р. Бертольд, Дискриминационный майнинг закрытых фрагментов и идеальные расширения в MoFa, Труды второго стартового симпозиума исследователей ИИ (STAIRS 2004), 2004.
  21. ^ Т. Майнл, К. Боргельт, М. Р. Бертольд, М. Филиппсен, Поиск фрагментов с нечеткими цепями в молекулярных базах данных, Второй международный семинар по графам, деревьям и последовательностям майнинга (МГТС2004), 2004.
  22. ^ Meinl, T .; Бертольд, М. Р. (2004). "Гибридная добыча фрагментов с MoFa и ФСГ » (PDF). Материалы конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004).
  23. ^ S. Nijssen, J. N. Kok. Частый анализ графов и его применение в молекулярных базах данных, Материалы конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004), 2004.
  24. ^ К. Хельма, Прогнозная токсикология, CRC Press, 2005.
  25. ^ М. Верляйн, Расширение и распараллеливание алгоритма анализа графов, Университет Фридриха Александра, 2006. PDF
  26. ^ К. Ян, С. Крамер, Оптимизация gSpan для наборов молекулярных данных, Труды Третьего международного семинара по графам, деревьям и последовательностям майнинга (МГТС-2005), 2005.
  27. ^ X. Ян, J. Han, gSpan: анализ шаблонов оснований на основе графиков, Материалы Международной конференции IEEE 2002 года по интеллектуальному анализу данных (ICDM 2002), IEEE Computer Society, 2002, 721-724.
  28. ^ Карват А., Рэдт Л. Д. (2006). «СМИРЕП: прогнозирование химической активности с помощью SMILES». Модель J Chem Inf. 46: 2432–2444. Дои:10.1021 / ci060159g.
  29. ^ Андо Х., Дехаспе Л., Луйтен В., Крененбрук Э., Вандекастил Х., Меервельт Л. (2006). «Обнаружение правил водородной связи в кристаллах с индуктивным логическим программированием». Мол Фарм. 3: 665–674. Дои:10.1021 / mp060034z.CS1 maint: несколько имен: список авторов (связь)
  30. ^ Маззаторта П., Тран Л., Шилтер Б., Григоров М. (2007). «Интеграция взаимосвязи структура-деятельность и систем искусственного интеллекта для улучшения предсказания in Silico мутагенности теста Эймса». J. Chem. Инф. Модель. 47: 34–38. Дои:10.1021 / ci600411v.CS1 maint: несколько имен: список авторов (связь)
  31. ^ Уэйл Н., Карипис Г. "Сравнение дескрипторных пространств для поиска и классификации химических соединений". ICDM. 2006: 678–689.
  32. ^ А. Гаго Алонсо, J.E. Медина Пагола, J.A. Карраско-Очоа и Х.Ф. Мартинес-Тринидад Майнинг Connected Subgraph Mining с сокращением числа кандидатов, Proc. ECML - ДОКД, стр. 365–376, 2008.
  33. ^ Сяохун Ван, Цзюнь Хуан, Аарон Смалтер, Джеральд Лашингтон, Применение функций ядра для точного поиска сходства в больших химических базах данных , BMC Bioinformatics Vol. 11 (Дополнение 3): S8 2010.
  34. ^ Баскин, И. И .; Палюлин В.А.; Зефиров Н.С. (1993). «[Методология поиска прямых корреляций между структурами и свойствами органических соединений с использованием вычислительных нейронных сетей]». Доклады Академии Наук СССР. 333 (2): 176–179.
  35. ^ Баскин И.И., Палюлин В.А., Зефиров Н.С. (1997). «Нейронное устройство для поиска прямых корреляций между структурами и свойствами органических соединений». J. Chem. Инф. Comput. Наука. 37 (4): 715–721. Дои:10.1021 / ci940128y.CS1 maint: несколько имен: список авторов (связь)
  36. ^ Киреев Д. Б. (1995). «ChemNet: новый метод на основе нейронной сети для отображения графов / свойств». J. Chem. Инф. Comput. Наука. 35 (2): 175–180. Дои:10.1021 / ci00024a001.
  37. ^ А. М. Биануччи; Микели, Алессио; Спердути, Алессандро; Старита, Антонина (2000). «Применение каскадных корреляционных сетей для структур в химии». Прикладной интеллект. 12 (1–2): 117–146. Дои:10.1023 / А: 1008368105614.
  38. ^ А. Микели, А. Спердути, А. Старита, А. М. Биануччи (2001). «Анализ внутренних представлений, разработанных нейронными сетями для структур, применяемых для количественных исследований взаимосвязи структура-активность бензодиазепинов». J. Chem. Инф. Comput. Наука. 41 (1): 202–218. CiteSeerX  10.1.1.137.2895. Дои:10.1021 / ci9903399. PMID  11206375.CS1 maint: несколько имен: список авторов (связь)
  39. ^ О. Иванчук (2001). «Кодирование молекулярной структуры в топологии искусственных нейронных сетей». Ежеквартальные обзоры Roumanian Chemical. 8: 197–220.
  40. ^ А. Гулон, Т. Пико, А. Дюпра, Г. Дрейфус (2007). «Прогнозирование действий без вычисления дескрипторов: графические машины для QSAR». SAR и QSAR в исследованиях окружающей среды. 18 (1–2): 141–153. Дои:10.1080/10629360601054313. PMID  17365965.CS1 maint: несколько имен: список авторов (связь)

дальнейшее чтение

  • Шёлкопф, Б., К. Цуда и Дж. П. Верт: Ядерные методы в вычислительной биологии, MIT Press, Кембридж, Массачусетс, 2004.
  • Р.О. Дуда, П.Е. Харт, Д. Аист, Классификация паттернов, Джон Уайли и сыновья, 2001. ISBN  0-471-05669-3
  • Гасфилд, Д., Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология, Издательство Кембриджского университета, 1997. ISBN  0-521-58519-8
  • Р. Тодескини, В. Консонни, Справочник молекулярных дескрипторов, Вайли-ВЧ, 2000. ISBN  3-527-29913-0

внешняя ссылка