Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Эта страница описывает добычу для молекул . Поскольку молекулы могут быть представлены молекулярными графами, это сильно связано с интеллектуальным анализом графов и структурированных данных . Основная проблема заключается в том, как представлять молекулы при различении экземпляров данных. Один из способов сделать это - метрики химического сходства , которые имеют давнюю традицию в области хеминформатики .

Типичные подходы к вычислению химического сходства используют химические отпечатки пальцев, но при этом теряется основная информация о топологии молекулы . Анализ молекулярных графов напрямую позволяет избежать этой проблемы. То же самое и с обратной задачей QSAR, которая предпочтительнее для векторных отображений.

Кодирование (Molecule i , Molecule j i ) [ править ]

Методы ядра [ править ]

  • Ядро маргинализованного графа [1]
  • Ядро с оптимальным назначением [2] [3] [4]
  • Ядро фармакофоров [5]
  • С ++ (и R) осуществление сочетания
    • ядро маргинализованного графа между помеченными графами [1]
    • расширения маргинализованного ядра [6]
    • Ядра Танимото [7]
    • ядра графов, основанные на древовидных шаблонах [8]
    • ядра на основе фармакофоров для трехмерной структуры молекул [5]

Максимальное количество методов Common Graph [ править ]

  • MCS -HSCS [9] (стратегия ранжирования общей подструктуры с наивысшим баллом (HSCS) для одиночной MCS)
  • Детектор подграфов малых молекул (SMSD) [10] - это программная библиотека на основе Java для вычисления максимального общего подграфа (MCS) между небольшими молекулами. Это поможет нам найти сходство / расстояние между двумя молекулами. MCS также используется для скрининга соединений, подобных лекарствам, путем попадания в молекулы, которые имеют общий подграф (подструктуру). [11]

Кодирование (Molecule i ) [ править ]

Методы молекулярных запросов [ править ]

  • Теплее [12] [13]
  • ГОСА [14] [15]
  • ПолифАРМ [16]
  • ФСГ [17] [18]
  • MolFea [19]
  • MoFa / MoSS [20] [21] [22]
  • Гастон [23]
  • ЛАЗАР [24]
  • ParMol [25] (содержит MoFa, FFSM, gSpan и Gaston)
  • оптимизированный gSpan [26] [27]
  • СМИРЕП [28]
  • DMax [29]
  • SAm / AIm / RHC [30]
  • AFGen [31]
  • gRed [32]
  • G-Hash [33]

Методы, основанные на специальных архитектурах нейронных сетей [ править ]

  • БПЗ [34] [35]
  • ChemNet [36]
  • CCS [37] [38]
  • Молнет [39]
  • Графические машины [40]

См. Также [ править ]

  • Молекулярный язык запросов
  • Химическая теория графов
  • QSAR
  • ADME
  • Коэффициент распределения

Ссылки [ править ]

  1. ^ a b Х. Кашима, К. Цуда, А. Инокучи, Маргинальные ядра между помеченными графами, 20-я Международная конференция по машинному обучению (ICML2003), 2003 г. PDF
  2. ^ Х. Фрёлих, Дж. К. Вегнер, А. Зелл, Оптимальные ядра распределения для атрибутивных молекулярных графов , 22-я Международная конференция по машинному обучению (ICML 2005), Omnipress, Мэдисон, Висконсин, США, 2005 , 225-232. PDF
  3. ^ Fröhlich H., Вегнер JK, Zell A. (2006). «Функции ядра для атрибутированных молекулярных графов - новый подход на основе подобия к прогнозированию ADME в классификации и регрессии». QSAR Comb. Sci . 25 : 317–326. DOI : 10.1002 / qsar.200510135 .CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ H. Fröhlich, JK Wegner, A. Zell, Ядра назначения для химических соединений , Международная объединенная конференция по нейронным сетям 2005 (IJCNN'05), 2005 , 913-918. CiteSeer
  5. ^ a b Маэ П., Ралайвола Л., Стовен В., Верт Дж. (2006). «Фармакофорное ядро ​​для виртуального скрининга с машинами опорных векторов». Модель J Chem Inf . 46 : 2003–2014. arXiv : q-bio / 0603006 . DOI : 10.1021 / ci060138m .CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ П. Маэ, Н. Уэда, Т. Акуцу, Ж.-Л. Перре, П. Верт, Ж.-П. (2004). «Расширения ядер маргинальных графов». Труды 21-го ICML : 552–559.CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Л. Ралайвола, С.Дж. Свамидасс, С. Хирото и П. Балди (2005). «Ядра графа для химической информатики». Нейронные сети . 18 (8): 1093–1110. DOI : 10.1016 / j.neunet.2005.07.009 . PMID 16157471 . CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ П. Маэ и Ж.-П. Верт (2009). «Графические ядра на основе древовидных структур для молекул». Машинное обучение . 75 (1): 3–35. arXiv : q-bio / 0609024 . DOI : 10.1007 / s10994-008-5086-2 . ISSN 0885-6125 . 
  9. ^ Вегнер JK, Fröhlich H., Mielenz H., Zell A. (2006). «Анализ данных и графиков в химическом пространстве для ADME и наборов данных о деятельности». QSAR Comb. Sci . 25 : 205–220. DOI : 10.1002 / qsar.200510009 .CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Рахман С. А., Bashton М., Holliday Л., Шрейдер Р., Thornton JM (2009). "Набор инструментов для обнаружения подграфов малых молекул (SMSD)" . Журнал химинформатики . 1 : 12. DOI : 10,1186 / 1758-2946-1-12 . PMC 2820491 . PMID 20298518 .  CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ http://www.ebi.ac.uk/thornton-srv/software/SMSD/
  12. ^ King RD, Сринивазан А., Dehaspe Л. (2001). «Wamr: инструмент интеллектуального анализа данных для химических данных». J. Comput.-Aid. Мол. Des . 15 : 173–181. DOI : 10,1023 / A: 1008171016861 . PMID 11272703 . CS1 maint: несколько имен: список авторов ( ссылка )
  13. ^ Л. Дехаспе, Х. Тойвонен, Кинг, Обнаружение частых подструктур в химических соединениях , 4-я Международная конференция по открытию знаний и интеллектуальному анализу данных, AAAI Press., 1998, 30-36.
  14. ^ А. Инокучи, Т. Васио, Т. Окада, Х. Мотода, Применение метода анализа графов на основе априори для анализа данных мутагенеза , Журнал компьютерной химии , 2001 ;, 2, 87-92.
  15. ^ А. Инокучи, Т. Васио, К. Нисимура, Х. Мотода, Быстрый алгоритм для добычи часто соединенных подграфов , IBM Research, Tokyo Research Laboratory, 2002 .
  16. ^ А. Клэр, Р. Д. Кинг,Анализ данных генома дрожжей на ленивом функциональном языке , Практические аспекты декларативных языков (PADL2003), 2003 .
  17. ^ Kuramochi М., Karypis Г. (2004). «Эффективный алгоритм обнаружения частых подграфов». IEEE Transactions по разработке знаний и данных . 16 (9): 1038–1051. DOI : 10,1109 / tkde.2004.33 .
  18. ^ Дешпанд М., Kuramochi М., Wale Н., Karypis Г. (2005). «Частые основанные на субструктуре подходы к классификации химических соединений». IEEE Transactions по разработке знаний и данных . 17 (8): 1036–1050. DOI : 10,1109 / tkde.2005.127 . ЛВП : 11299/215559 .CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Helma С., Крамер Т., Крамер С., де Raedt Л. (2004). «Методы интеллектуального анализа данных и машинного обучения для идентификации субструктур, вызывающих мутагенность, и взаимосвязей между структурой и активностью несовместимых соединений». J. Chem. Инф. Comput. Sci . 44 : 1402–1411. DOI : 10.1021 / ci034254q .CS1 maint: несколько имен: список авторов ( ссылка )
  20. ^ Т. Майнл, К. Боргельт, М.Р. Бертольд, Дискриминационный анализ закрытых фрагментов и идеальные расширения в MoFa , Труды Второго симпозиума исследователей ИИ (STAIRS 2004), 2004 .
  21. ^ Т. Майнл, К. Боргельт, М.Р. Бертольд, М. Филиппсен, Добыча фрагментов с нечеткими цепями в молекулярных базах данных , Второй международный семинар по интеллектуальным графам, деревьям и последовательностям (MGTS2004), 2004 .
  22. ^ Meinl, T .; Бертольд, MR (2004). «Гибридный фрагментарный майнинг с использованием MoFa и FSG» (PDF) . Материалы конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004) .
  23. ^ С. Nijssen, JN Kok. Частое Graph Mining и ее применение в молекулярные базы данных , Труды IEEE конференции 2004 года по системам, Человек и кибернетики (SMC2004), 2004 .
  24. ^ С. Helma, Predictive токсикологии, CRC Press, 2005 .
  25. ^ М. Верляйн, Расширение и распараллеливание алгоритма интеллектуального анализа графов, Университет Фридриха Александра, 2006 . PDF
  26. ^ К. Ян, С. Крамер, Оптимизация gSpan для наборов молекулярных данных , Труды Третьего международного семинара по графам, деревьям и последовательностям добычи полезных ископаемых (МГТС-2005), 2005 .
  27. ^ X. Ян, Дж. Хан, gSpan: Анализ шаблонов подструктур на основе графов , Труды Международной конференции IEEE 2002 года по интеллектуальному анализу данных (ICDM 2002), IEEE Computer Society , 2002 , 721-724.
  28. ^ Karwath А., Raedt LD (2006). «СМИРЕП: прогнозирование химической активности с помощью SMILES». Модель J Chem Inf . 46 : 2432–2444. DOI : 10.1021 / ci060159g .
  29. ^ Ando H., Dehaspe Л., Люйтен В., Craenenbroeck Е., Vandecasteele H., Meervelt L. (2006). «Обнаружение правил водородной связи в кристаллах с индуктивным логическим программированием». Mol Pharm . 3 : 665–674. DOI : 10.1021 / mp060034z .CS1 maint: несколько имен: список авторов ( ссылка )
  30. ^ Mazzatorta П., Tran Л., Schilter Б., Григоров М. (2007). "Интеграция взаимосвязи структура-деятельность и систем искусственного интеллекта для улучшения предсказания in Silico мутагенности теста Эймса". J. Chem. Инф. Модель . 47 : 34–38. DOI : 10.1021 / ci600411v .CS1 maint: несколько имен: список авторов ( ссылка )
  31. ^ Уэйл Н., Карипис Г. "Сравнение дескрипторных пространств для поиска и классификации химических соединений". ICDM . 2006 : 678–689.
  32. ^ А. Гаго Алонсо, Дж. Э. Медина Пагола, Дж. А. Карраско-Очоа и Дж. Ф. Мартинес-Тринидад Mining Connected Subgraph Mining сокращение числа кандидатов , Proc. из ECML - PKDD , С. 365-376,. 2008 .
  33. ^ Сяохун Ван, Цзюнь Хуан, Аарон Смалтер, Джеральд Лашингтон, Применение функций ядра для точного поиска сходства в больших химических базах данных , BMC Bioinformatics Vol. 11 (Дополнение 3): S8 2010 .
  34. ^ Баскин, II; В.А. Палюлин; Н.С. Зефиров (1993). «[Методология поиска прямых корреляций между структурами и свойствами органических соединений с использованием вычислительных нейронных сетей]». Доклады Академии Наук СССР . 333 (2): 176–179.
  35. И.И. Баскин, В.А. Палюлин, Н.С. Зефиров (1997). «Нейронное устройство для поиска прямых корреляций между структурами и свойствами органических соединений». J. Chem. Инф. Comput. Sci . 37 (4): 715–721. DOI : 10.1021 / ci940128y .CS1 maint: несколько имен: список авторов ( ссылка )
  36. ^ ДБ Киреев (1995). «ChemNet: новый метод на основе нейронной сети для отображения графов / свойств». J. Chem. Инф. Comput. Sci . 35 (2): 175–180. DOI : 10.1021 / ci00024a001 .
  37. ^ AM Биануччи; Микели, Алессио; Спердути, Алессандро; Старита, Антонина (2000). «Применение каскадных корреляционных сетей для структур в химии». Прикладной интеллект . 12 (1–2): 117–146. DOI : 10,1023 / A: 1008368105614 .
  38. ^ А. Микели, А. Sperduti, А. Starita, А. М. Bianucci (2001). «Анализ внутренних представлений, разработанных нейронными сетями для структур, применяемых для количественных исследований взаимосвязи структура-активность бензодиазепинов». J. Chem. Инф. Comput. Sci . 41 (1): 202–218. CiteSeerX 10.1.1.137.2895 . DOI : 10.1021 / ci9903399 . PMID 11206375 .  CS1 maint: несколько имен: список авторов ( ссылка )
  39. ^ О. Ivanciuc (2001). «Кодирование молекулярной структуры в топологии искусственных нейронных сетей». Ежеквартальные обзоры румынской химической промышленности . 8 : 197–220.
  40. ^ А. Goulon, Т. Пико, А. Duprat, Г. Дрейфус (2007). «Прогнозирование действий без вычисления дескрипторов: графические машины для QSAR». SAR и QSAR в исследованиях окружающей среды . 18 (1–2): 141–153. DOI : 10.1080 / 10629360601054313 . PMID 17365965 . CS1 maint: несколько имен: список авторов ( ссылка )

Дальнейшее чтение [ править ]

  • Шёлкопф, Б., К. Цуда и Дж. П. Верт: ядерные методы в вычислительной биологии , MIT Press, Кембридж, Массачусетс, 2004 .
  • Р. О. Дуда, П. Е. Харт, Д. Г. Аист, Классификация образцов , John Wiley & Sons, 2001 . ISBN 0-471-05669-3 
  • Гусфилд Д. Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология , Cambridge University Press, 1997 . ISBN 0-521-58519-8 
  • Р. Тодескини, В. Консонни, Справочник по молекулярным дескрипторам , Wiley-VCH, 2000 . ISBN 3-527-29913-0 

Внешние ссылки [ править ]

  • Детектор подграфов малых молекул (SMSD) - это программная библиотека на основе Java для вычисления максимального общего подграфа (MCS) между небольшими молекулами.
  • 5-й Международный семинар по горному делу и обучению с помощью графиков, 2007 г.
  • Обзор за 2006 год
  • Молекулярный майнинг (базовые химические экспертные системы)
  • ParMol и документация по магистерской диссертации - Java - Открытый исходный код - Распределенный майнинг - Библиотека алгоритмов тестирования
  • TU München - Kramer group
  • Молекулярный майнинг (передовые химические экспертные системы)
  • DMax Chemistry Assistant - коммерческое программное обеспечение
  • AFGen - Программное обеспечение для генерации дескрипторов на основе фрагментов