Молекулярная добыча - Molecule mining
Эта страница описывает добыча полезных ископаемых за молекулы. Поскольку молекулы могут быть представлены молекулярные графики это сильно связано с анализ графов и структурированный анализ данных. Основная проблема заключается в том, как представлять молекулы при различении экземпляров данных. Один из способов добиться этого - химическое сходство. метрики, имеющая давние традиции в области хеминформатика.
Типичные подходы к вычислению химического сходства используют химические отпечатки пальцев, но при этом теряется основная информация о топология молекулы. Анализ молекулярных графов напрямую устраняет эту проблему. Так делает обратная задача QSAR что предпочтительнее для векторных отображений.
Кодирование (Молекулая, Молекулаjя)
Методы ядра
- Маргинализованный ядро графа[1]
- Ядро с оптимальным назначением[2][3][4]
- Фармакофорное ядро[5]
- Реализация на C ++ (и R) объединение
Максимальное количество методов Common Graph
- MCS -HSCS[9] (Стратегия ранжирования общей подструктуры с наивысшим баллом (HSCS) для одиночной MCS)
- Маленькая молекула Детектор подграфов (SMSD)[10]- это программная библиотека на основе Java для вычисления максимального общего подграфа (MCS) между небольшими молекулами. Это поможет нам найти сходство / расстояние между двумя молекулами. MCS также используется для скрининга соединений, подобных лекарствам, путем попадания в молекулы, имеющие общий подграф (подструктуру).[11]
Кодирование (Молекулая)
Методы молекулярного запроса
- Теплее[12][13]
- ГОСА[14][15]
- ПолиФАРМ[16]
- ФСГ[17][18]
- MolFea[19]
- MoFa / MoSS[20][21][22]
- Гастон[23]
- ЛАЗАР[24]
- ParMol[25] (содержит MoFa, FFSM, gSpan и Gaston)
- оптимизированный gSpan[26][27]
- СМИРЕП[28]
- DMax[29]
- SAm / AIm / RHC[30]
- AFGen[31]
- красный[32]
- G-Hash[33]
Методы на основе специальных архитектур нейронных сетей
Смотрите также
Рекомендации
- ^ а б Х. Кашима, К. Цуда, А. Инокучи, Маргинальные ядра между помеченными графами, 20-я Международная конференция по машинному обучению (ICML2003), 2003 г. PDF
- ^ Х. Фрёлих, Й. К. Вегнер, А. Целль, Ядра оптимального назначения для атрибутивных молекулярных графов, 22-я Международная конференция по машинному обучению (ICML 2005), Omnipress, Мэдисон, Висконсин, США, 2005, 225-232. PDF
- ^ Фрёлих Х., Вегнер Дж. К., Целль А. (2006). «Функции ядра для атрибутированных молекулярных графов - новый подход на основе подобия к прогнозированию ADME в классификации и регрессии». QSAR Comb. Наука. 25: 317–326. Дои:10.1002 / qsar.200510135.CS1 maint: несколько имен: список авторов (связь)
- ^ Х. Фрёлих, Й. К. Вегнер, А. Целль, Ядра назначения для химических соединений, Международная объединенная конференция по нейронным сетям 2005 (IJCNN'05), 2005, 913-918. CiteSeer
- ^ а б Маэ П., Ралайвола Л., Стовен В., Верт Дж. (2006). «Фармакофорное ядро для виртуального скрининга с машинами опорных векторов». Модель J Chem Inf. 46: 2003–2014. arXiv:q-bio / 0603006. Дои:10.1021 / ci060138m.CS1 maint: несколько имен: список авторов (связь)
- ^ П. Маэ, Н. Уэда, Т. Акуцу, Ж.-Л. Перре, П. Верт, Ж.-П. (2004). «Расширения ядер маргинальных графов». Материалы 21-й конференции ICML: 552–559.CS1 maint: несколько имен: список авторов (связь)
- ^ Л. Ралайвола, С. Дж. Свамидасс, С. Хирото и П. Балди (2005). «Ядра графа для химической информатики». Нейронные сети. 18 (8): 1093–1110. Дои:10.1016 / j.neunet.2005.07.009. PMID 16157471.CS1 maint: несколько имен: список авторов (связь)
- ^ П. Маэ и Ж.-П. Верт (2009). «Графические ядра на основе древовидных структур для молекул». Машинное обучение. 75 (1): 3–35. arXiv:q-bio / 0609024. Дои:10.1007 / s10994-008-5086-2. ISSN 0885-6125.
- ^ Вегнер Й. К., Фрёлих Х., Миленц Х., Целль А. (2006). "Анализ данных и графиков в химическом пространстве для ADME и наборов данных о деятельности". QSAR Comb. Наука. 25: 205–220. Дои:10.1002 / qsar.200510009.CS1 maint: несколько имен: список авторов (связь)
- ^ Рахман С. А., Баштон М., Холлидей Г. Л., Шредер Р., Торнтон Дж. М. (2009). "Набор инструментов для обнаружения подграфов малых молекул (SMSD)". Журнал химинформатики. 1: 12. Дои:10.1186/1758-2946-1-12. ЧВК 2820491. PMID 20298518.CS1 maint: несколько имен: список авторов (связь)
- ^ http://www.ebi.ac.uk/thornton-srv/software/SMSD/
- ^ Кинг Р. Д., Сринивасан А., Дехаспе Л. (2001). «Wamr: инструмент интеллектуального анализа данных для химических данных». J. Comput.-Aid. Мол. Des. 15: 173–181. Дои:10.1023 / А: 1008171016861. PMID 11272703.CS1 maint: несколько имен: список авторов (связь)
- ^ Л. Дехаспе, Х. Тойвонен, Кинг, Обнаружение частых подструктур в химических соединениях, 4-я Международная конференция по открытию знаний и интеллектуальному анализу данных, AAAI Press., 1998, 30-36.
- ^ А. Инокучи, Т. Васио, Т. Окада, Х. Мотода, Применение метода анализа графов на основе априори для анализа данных мутагенеза, Журнал компьютерной химии, 2001;, 2, 87-92.
- ^ А. Инокучи, Т. Васио, К. Нисимура, Х. Мотода, Быстрый алгоритм поиска часто связанных подграфов, IBM Research, Токийская исследовательская лаборатория, 2002.
- ^ А. Клэр, Р. Д. Кинг, Анализ данных генома дрожжей на ленивом функциональном языке, Практические аспекты декларативных языков (PADL2003), 2003.
- ^ Курамочи М., Карыпис Г. (2004). «Эффективный алгоритм обнаружения частых подграфов». IEEE Transactions по разработке знаний и данных. 16 (9): 1038–1051. Дои:10.1109 / tkde.2004.33.
- ^ Дешпанде М., Курамочи М., Уэйл Н., Карипис Г. (2005). «Частые подходы на основе субструктуры для классификации химических соединений». IEEE Transactions по разработке знаний и данных. 17 (8): 1036–1050. Дои:10.1109 / tkde.2005.127. HDL:11299/215559.CS1 maint: несколько имен: список авторов (связь)
- ^ Хельма К., Крамер Т., Крамер С., де Рэдт Л. (2004). «Методы интеллектуального анализа данных и машинного обучения для идентификации субструктур, вызывающих мутагенность, и взаимосвязей между структурой и активностью несовместимых соединений». J. Chem. Инф. Comput. Наука. 44: 1402–1411. Дои:10.1021 / ci034254q.CS1 maint: несколько имен: список авторов (связь)
- ^ Т. Майнл, К. Боргельт, М. Р. Бертольд, Дискриминационный майнинг закрытых фрагментов и идеальные расширения в MoFa, Труды второго стартового симпозиума исследователей ИИ (STAIRS 2004), 2004.
- ^ Т. Майнл, К. Боргельт, М. Р. Бертольд, М. Филиппсен, Поиск фрагментов с нечеткими цепями в молекулярных базах данных, Второй международный семинар по графам, деревьям и последовательностям майнинга (МГТС2004), 2004.
- ^ Meinl, T .; Бертольд, М. Р. (2004). "Гибридная добыча фрагментов с MoFa и ФСГ » (PDF). Материалы конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004).
- ^ S. Nijssen, J. N. Kok. Частый анализ графов и его применение в молекулярных базах данных, Материалы конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004), 2004.
- ^ К. Хельма, Прогнозная токсикология, CRC Press, 2005.
- ^ М. Верляйн, Расширение и распараллеливание алгоритма анализа графов, Университет Фридриха Александра, 2006. PDF
- ^ К. Ян, С. Крамер, Оптимизация gSpan для наборов молекулярных данных, Труды Третьего международного семинара по графам, деревьям и последовательностям майнинга (МГТС-2005), 2005.
- ^ X. Ян, J. Han, gSpan: анализ шаблонов оснований на основе графиков, Материалы Международной конференции IEEE 2002 года по интеллектуальному анализу данных (ICDM 2002), IEEE Computer Society, 2002, 721-724.
- ^ Карват А., Рэдт Л. Д. (2006). «СМИРЕП: прогнозирование химической активности с помощью SMILES». Модель J Chem Inf. 46: 2432–2444. Дои:10.1021 / ci060159g.
- ^ Андо Х., Дехаспе Л., Луйтен В., Крененбрук Э., Вандекастил Х., Меервельт Л. (2006). «Обнаружение правил водородной связи в кристаллах с индуктивным логическим программированием». Мол Фарм. 3: 665–674. Дои:10.1021 / mp060034z.CS1 maint: несколько имен: список авторов (связь)
- ^ Маззаторта П., Тран Л., Шилтер Б., Григоров М. (2007). «Интеграция взаимосвязи структура-деятельность и систем искусственного интеллекта для улучшения предсказания in Silico мутагенности теста Эймса». J. Chem. Инф. Модель. 47: 34–38. Дои:10.1021 / ci600411v.CS1 maint: несколько имен: список авторов (связь)
- ^ Уэйл Н., Карипис Г. "Сравнение дескрипторных пространств для поиска и классификации химических соединений". ICDM. 2006: 678–689.
- ^ А. Гаго Алонсо, J.E. Медина Пагола, J.A. Карраско-Очоа и Х.Ф. Мартинес-Тринидад Майнинг Connected Subgraph Mining с сокращением числа кандидатов, Proc. ECML - ДОКД, стр. 365–376, 2008.
- ^ Сяохун Ван, Цзюнь Хуан, Аарон Смалтер, Джеральд Лашингтон, Применение функций ядра для точного поиска сходства в больших химических базах данных , BMC Bioinformatics Vol. 11 (Дополнение 3): S8 2010.
- ^ Баскин, И. И .; Палюлин В.А.; Зефиров Н.С. (1993). «[Методология поиска прямых корреляций между структурами и свойствами органических соединений с использованием вычислительных нейронных сетей]». Доклады Академии Наук СССР. 333 (2): 176–179.
- ^ Баскин И.И., Палюлин В.А., Зефиров Н.С. (1997). «Нейронное устройство для поиска прямых корреляций между структурами и свойствами органических соединений». J. Chem. Инф. Comput. Наука. 37 (4): 715–721. Дои:10.1021 / ci940128y.CS1 maint: несколько имен: список авторов (связь)
- ^ Киреев Д. Б. (1995). «ChemNet: новый метод на основе нейронной сети для отображения графов / свойств». J. Chem. Инф. Comput. Наука. 35 (2): 175–180. Дои:10.1021 / ci00024a001.
- ^ А. М. Биануччи; Микели, Алессио; Спердути, Алессандро; Старита, Антонина (2000). «Применение каскадных корреляционных сетей для структур в химии». Прикладной интеллект. 12 (1–2): 117–146. Дои:10.1023 / А: 1008368105614.
- ^ А. Микели, А. Спердути, А. Старита, А. М. Биануччи (2001). «Анализ внутренних представлений, разработанных нейронными сетями для структур, применяемых для количественных исследований взаимосвязи структура-активность бензодиазепинов». J. Chem. Инф. Comput. Наука. 41 (1): 202–218. CiteSeerX 10.1.1.137.2895. Дои:10.1021 / ci9903399. PMID 11206375.CS1 maint: несколько имен: список авторов (связь)
- ^ О. Иванчук (2001). «Кодирование молекулярной структуры в топологии искусственных нейронных сетей». Ежеквартальные обзоры Roumanian Chemical. 8: 197–220.
- ^ А. Гулон, Т. Пико, А. Дюпра, Г. Дрейфус (2007). «Прогнозирование действий без вычисления дескрипторов: графические машины для QSAR». SAR и QSAR в исследованиях окружающей среды. 18 (1–2): 141–153. Дои:10.1080/10629360601054313. PMID 17365965.CS1 maint: несколько имен: список авторов (связь)
дальнейшее чтение
- Шёлкопф, Б., К. Цуда и Дж. П. Верт: Ядерные методы в вычислительной биологии, MIT Press, Кембридж, Массачусетс, 2004.
- Р.О. Дуда, П.Е. Харт, Д. Аист, Классификация паттернов, Джон Уайли и сыновья, 2001. ISBN 0-471-05669-3
- Гасфилд, Д., Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология, Издательство Кембриджского университета, 1997. ISBN 0-521-58519-8
- Р. Тодескини, В. Консонни, Справочник молекулярных дескрипторов, Вайли-ВЧ, 2000. ISBN 3-527-29913-0
внешняя ссылка
- Детектор подграфов малых молекул (SMSD) - это программная библиотека на основе Java для вычисления максимального общего подграфа (MCS) между небольшими молекулами.
- 5-й Международный семинар по горному делу и обучению с помощью графиков, 2007 г.
- Обзор за 2006 год
- Molecule mining (базовые химические экспертные системы)
- ParMol и документация магистерской диссертации - Java - Открытый исходный код - Распределенный майнинг - Библиотека алгоритмов тестирования
- TU München - Kramer group
- Молекулярный майнинг (передовые химические экспертные системы)
- Ассистент химии DMax - коммерческое программное обеспечение
- AFGen - Программное обеспечение для генерации дескрипторов на основе фрагментов