Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В области вычислительной химии и молекулярного моделирования , скоринг функция являются математическими функциями , используемых для прогнозирования приблизительно связывания сродства между двумя молекулами после того, как они были пристыкованы . Чаще всего одна из молекул представляет собой небольшое органическое соединение, такое как лекарство, а вторая - биологическая мишень лекарства, такая как рецептор белка . [1] Оценочные функции также были разработаны для прогнозирования силы межмолекулярных взаимодействий между двумя белками [2]или между белком и ДНК . [3]

Утилита [ править ]

Функции скоринга широко используются в разработке лекарств и других приложениях молекулярного моделирования . К ним относятся: [4]

  • Виртуальный скрининг из небольших молекул баз данных кандидата лигандов для идентификации новых малых молекулкоторые связываются с белкоммишеньюпредставляющего интереси поэтому являются полезными отправными точками для открытия новых лекарств [5]
  • Дизайн de novo (дизайн «с нуля») новых малых молекул, которые связываются с белком-мишенью [6]
  • Провести оптимизацию проверочных обращений для оптимизации их близости и селективности [7]

Потенциально более надежной, но гораздо более требовательной к вычислениям альтернативой подсчетным функциям являются вычисления возмущений свободной энергии . [8]

Предпосылки [ править ]

Оценочные функции обычно параметризуются (или обучаются) по набору данных, состоящему из экспериментально определенных аффинностей связывания между молекулярными видами, аналогичными видам, которые нужно предсказать.

Для используемых в настоящее время методов, направленных на прогнозирование сродства лигандов к белкам, сначала необходимо знать или прогнозировать следующее:

  • Третичная структура белка - расположение атомов белка в трехмерном пространстве. Белковые структуры могут быть определены экспериментальными методами, такими как рентгеновская кристаллография или методы ЯМР в фазе раствора, или предсказаны путем моделирования гомологии .
  • Активная конформация лиганда - трехмерная форма лиганда, связанного с белком.
  • Режим связывания - ориентация двух партнеров связывания относительно друг друга в комплексе

Приведенная выше информация дает трехмерную структуру комплекса. На основе этой структуры функция оценки может затем оценить силу ассоциации между двумя молекулами в комплексе с использованием одного из методов, описанных ниже. Наконец, сама функция подсчета баллов может использоваться, чтобы помочь предсказать как режим связывания, так и активную конформацию малой молекулы в комплексе, или, в качестве альтернативы, в ходе стыковки можно использовать более простую и более быструю в вычислительном отношении функцию.

Классы [ править ]

Существует четыре основных класса функций подсчета очков: [9] [10] [11]

  • Сродство силового поля оценивается путем суммирования силы межмолекулярных ван-дер-ваальсовых взаимодействий и электростатических взаимодействий между всеми атомами двух молекул в комплексе с использованием силового поля . Также часто включаются внутримолекулярные энергии (также называемые энергией деформации ) двух партнеров по связыванию. Наконец , так как связывание обычно происходит в присутствии воды, в десольватации энергии лиганда и белка иногда принимать во внимание , используя неявные сольватации методы , такие как GBSA или PBSA . [12]
  • Эмпирический - основан на подсчете количества различных типов взаимодействий между двумя партнерами по связыванию. [6] Подсчет может быть основан на количестве атомов лиганда и рецептора, находящихся в контакте друг с другом, или путем расчета изменения доступной для растворителя площади поверхности (ΔSASA) в комплексе по сравнению с лигандом и белком, не входящим в комплекс. Коэффициенты оценочной функции обычно подбираются с использованием нескольких методов линейной регрессии . Эти условия взаимодействия функции могут включать, например:
    • гидрофобно- гидрофобные контакты (благоприятные),
    • гидрофобно- гидрофильные контакты (неблагоприятные) (учитывает неудовлетворенные водородные связи, которые являются важным энтальпийным вкладом в связывание. [13] Одна потерянная водородная связь может составлять 1-2 порядка величины сродства связывания. [14] ),
    • количество водородных связей (благоприятный вклад в сродство, особенно если он защищен от растворителя, если растворитель не оказывает никакого влияния),
    • количество вращающихся связей, иммобилизованных при образовании комплекса (неблагоприятный вклад конформационной энтропии ).
  • На основе знаний - на основе статистических наблюдений за межмолекулярными тесными контактами в больших трехмерных базах данных (таких как Cambridge Structural Database или Protein Data Bank ), которые используются для получения статистических « потенциалов средней силы ». Этот метод основан на предположении, что тесные межмолекулярные взаимодействия между определенными типами атомов или функциональных групп, которые происходят чаще, чем можно было бы ожидать, исходя из случайного распределения, вероятно, будут энергетически выгодными и, следовательно, будут способствовать сродству связывания. [15]
  • Машинное обучение - в отличие от этих классических функций оценки, функции оценки машинного обучения характеризуются тем, что не предполагают заранее заданную функциональную форму для взаимосвязи между аффинностью связывания и структурными особенностями, описывающими комплекс белок-лиганд. [16] Таким образом, функциональная форма выводится непосредственно из данных. Было обнаружено, что функции оценки машинного обучения превосходят классические функции оценки при прогнозировании аффинности связывания различных комплексов белок-лиганд. [17] [18] Это также относится к комплексам, специфичным для мишени, [19] [20], хотя преимущество зависит от мишени и в основном зависит от объема соответствующих доступных данных. [11][21] При надлежащей осторожности функции оценки машинного обучения имеют тенденцию сильно превосходить классические функции оценки в связанной задаче виртуального скрининга на основе структуры. [22] [23] [24] [25] [26] [27] [28] [29] Кроме того, если доступны данные, относящиеся к цели, этот разрыв в производительности увеличивается. [30] Эти обзоры предоставляют более широкий обзор машины - обучение функциям оценки для разработки лекарств на основе структуры. [11] [31] [32] [33] Выбор ложных целей для данной цели - один из наиболее важных факторов для обучения и тестирования любой функции подсчета очков. [34]

Первые три типа, силовое поле, эмпирический и основанный на знаниях, обычно называют классическими оценочными функциями и характеризуются тем, что их вклад в связывание линейно комбинируется. Из-за этого ограничения классические функции оценки не могут использовать большие объемы обучающих данных. [35]

Уточнение [ править ]

Поскольку различные оценочные функции являются относительно коллинеарными, консенсусные оценочные функции не могут значительно повысить точность. [36] Это утверждение несколько противоречило преобладающему мнению в этой области, поскольку предыдущие исследования предполагали, что консенсусная оценка полезна. [37]

Идеальная оценочная функция может предсказать свободную энергию связывания между лигандом и его мишенью. Но в действительности и вычислительные методы, и вычислительные ресурсы ограничивают эту цель. Поэтому чаще всего выбирают методы, минимизирующие количество ложноположительных и ложноотрицательных лигандов. В тех случаях, когда доступен экспериментальный обучающий набор данных констант и структур связывания, был разработан простой метод для уточнения оценочной функции, используемой в молекулярном стыковке. [38]

Ссылки [ править ]

  1. Jain AN (октябрь 2006 г.). «Оценочные функции для стыковки белок-лиганд». Современная наука о белках и пептидах . 7 (5): 407–20. DOI : 10.2174 / 138920306778559395 . PMID  17073693 .
  2. ^ Lensink MF, Мендес R, Wodak SJ (декабрь 2007). «Докинг и оценка белковых комплексов: CAPRI, 3-е издание». Белки . 69 (4): 704–18. DOI : 10.1002 / prot.21804 . PMID 17918726 . S2CID 25383642 .  
  3. ^ Robertson TA, Varani G (февраль 2007). «Всеатомная, зависящая от расстояния функция подсчета очков для предсказания взаимодействий белок-ДНК по структуре». Белки . 66 (2): 359–74. DOI : 10.1002 / prot.21162 . PMID 17078093 . S2CID 24437518 .  
  4. ^ Rajamani R, Хорошо AC (май 2007). «Ранжирование позиций в поиске и оптимизации потенциальных клиентов на основе структуры: современные тенденции в развитии скоринговых функций». Текущее мнение в области открытия и разработки лекарств . 10 (3): 308–15. PMID 17554857 . 
  5. ^ Зайферт MH, Kraus J, Kramer B (май 2007). «Виртуальный высокопроизводительный скрининг молекулярных баз данных». Текущее мнение в области открытия и разработки лекарств . 10 (3): 298–307. PMID 17554856 . 
  6. ^ a b Böhm HJ (июль 1998 г.). «Прогнозирование констант связывания белковых лигандов: быстрый метод определения приоритета совпадений, полученных с помощью программ de novo design или поиска в трехмерных базах данных». Журнал компьютерного молекулярного дизайна . 12 (4): 309–23. Bibcode : 1998JCAMD..12..309B . DOI : 10,1023 / A: 1007999920146 . PMID 9777490 . S2CID 7474036 .  
  7. ^ Жозеф-McCarthy D, Бабур JC, Feyfant E, Thompson DC, Humblet C (май 2007). «Оптимизация свинца с помощью высокопроизводительного молекулярного стыковки». Текущее мнение в области открытия и разработки лекарств . 10 (3): 264–74. PMID 17554852 . 
  8. ^ Foloppe N Хаббард R (2006). «К прогнозируемому дизайну лигандов с помощью вычислительных методов, основанных на свободной энергии?». Современная лекарственная химия . 13 (29): 3583–608. DOI : 10.2174 / 092986706779026165 . PMID 17168725 . 
  9. ^ ДВГУ Л. А., Льюис Р., Хорошее AC, Bodkin M, Essex JW (2007). «Глава 9: Функции подсчета очков: от свободной энергии связывания к обогащению в виртуальном просмотре» . В Dhoti H, Leach AR (ред.). Открытие лекарств на основе структуры . Дордрехт: Спрингер. С. 223–246. ISBN 978-1-4020-4407-6.
  10. ^ Sotriffer C, H Matter (2011). «Глава 7.3: Классы функций подсчета очков» . В Sotriffer C (ред.). Виртуальный просмотр: принципы, проблемы и практические рекомендации . 48 . ISBN компании John Wiley & Sons, Inc. 978-3-527-63334-0.
  11. ^ a b c Ain QU, Александрова A, Roessler FD, Ballester PJ (2015-11-01). «Функции машинного обучения для улучшения предсказания сродства привязки на основе структуры и виртуального скрининга» . Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . 5 (6): 405–424. DOI : 10.1002 / wcms.1225 . PMC 4832270 . PMID 27110292 .  
  12. ^ Genheden S, Райд U (май 2015). «Методы MM / PBSA и MM / GBSA для оценки аффинности связывания лиганда» . Мнение эксперта об открытии лекарств . 10 (5): 449–61. DOI : 10.1517 / 17460441.2015.1032936 . PMC 4487606 . PMID 25835573 .  
  13. ^ Schneider N, Lange G, Hindle S, R Klein, Rarey M (январь 2013). «Последовательное описание водородной связи и энергии дегидратации в комплексах белок-лиганд: методы, лежащие в основе оценочной функции HYDE». Журнал компьютерного молекулярного дизайна . 27 (1): 15–29. Bibcode : 2013JCAMD..27 ... 15S . DOI : 10.1007 / s10822-012-9626-2 . PMID 23269578 . S2CID 1545277 .  
  14. ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (ноябрь 2003 г.). «Требования к специфическому связыванию фрагментов низкоаффинного ингибитора с SH2-доменом (pp60) Src идентичны требованиям для высокоаффинного связывания полноразмерных ингибиторов». Журнал медицинской химии . 46 (24): 5184–95. DOI : 10.1021 / jm020970s . PMID 14613321 . 
  15. ^ Muegge I (октябрь 2006). «Новый взгляд на систему оценки PMF». Журнал медицинской химии . 49 (20): 5895–902. DOI : 10.1021 / jm050038s . PMID 17004705 . 
  16. ^ Ballester PJ, Митчелл JB (май 2010). «Подход машинного обучения к предсказанию сродства связывания белок-лиганд с приложениями для молекулярного стыковки» . Биоинформатика . 26 (9): 1169–75. DOI : 10.1093 / биоинформатики / btq112 . PMC 3524828 . PMID 20236947 .  
  17. Перейти ↑ Li H, Leung KS, Wong MH, Ballester PJ (февраль 2015 г.). «Улучшение AutoDock Vina с помощью случайного леса: возрастающая точность предсказания привязки за счет эффективного использования больших наборов данных». Молекулярная информатика . 34 (2–3): 115–26. DOI : 10.1002 / minf.201400132 . PMID 27490034 . S2CID 3444365 .  
  18. ^ Ashtawy HM, Махапатра NR (2015-04-01). «Сравнительная оценка точности прогнозирования обычных и машинных функций оценки для прогнозирования сродства связывания белок-лиганд» . Транзакции IEEE / ACM по вычислительной биологии и биоинформатике . 12 (2): 335–47. DOI : 10.1109 / TCBB.2014.2351824 . PMID 26357221 . 
  19. ^ Чжань В., Ли Д., Че Дж., Чжан Л., Ян Б., Ху И, Лю Т., Дун Х (март 2014 г.). «Объединение оценок стыковки, профилей взаимодействия и молекулярных дескрипторов для повышения точности молекулярного стыковки: к открытию новых ингибиторов Akt1». Европейский журнал медицинской химии . 75 : 11–20. DOI : 10.1016 / j.ejmech.2014.01.019 . PMID 24508830 . 
  20. ^ Kinnings SL, Лю N, Tonge PJ, Джексон RM, Се L, Bourne PE (февраль 2011). «Основанный на машинном обучении метод для улучшения функций подсчета очков и его применение для перепрофилирования лекарств» . Журнал химической информации и моделирования . 51 (2): 408–19. DOI : 10.1021 / ci100369f . PMC 3076728 . PMID 21291174 .  
  21. ^ Li H, Зи KH, Lu G, Ballester PJ (2020-02-05). «Функции машинного обучения для оптимизации содержания лекарств на основе структуры» . Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . 10 (5). DOI : 10.1002 / wcms.1465 .
  22. ^ Li L, Wang B, Meroueh SO (сентябрь 2011). «Поддержка векторной регрессии комплексов рецептор-лиганд для ранжирования и виртуального скрининга химических библиотек» . Журнал химической информации и моделирования . 51 (9): 2132–8. DOI : 10.1021 / ci200078f . PMC 3209528 . PMID 21728360 .  
  23. ^ Durrant JD, Фридман А.Я., Роджерс К., McCammon JA (июль 2013). «Сравнение нейросетевых функций скоринга и современного состояния: приложения с общим скринингом библиотек» . Журнал химической информации и моделирования . 53 (7): 1726–35. DOI : 10.1021 / ci400042y . PMC 3735370 . PMID 23734946 .  
  24. Перейти ↑ Ding B, Wang J, Li N, Wang W (январь 2013 г.). «Характеристика связывания малых молекул. I. Точная идентификация сильных ингибиторов при виртуальном скрининге» . Журнал химической информации и моделирования . 53 (1): 114–22. DOI : 10.1021 / ci300508m . PMC 3584174 . PMID 23259763 .  
  25. ^ Wójcikowski M, Ballester PJ, Siedlecki P (апрель 2017). «Выполнение функций оценки машинного обучения в структурированном виртуальном скрининге» . Научные отчеты . 7 : 46710. Bibcode : 2017NatSR ... 746710W . DOI : 10.1038 / srep46710 . PMC 5404222 . PMID 28440302 .  
  26. ^ Рагоз М, Hochuli Дж, Idrobo Е, Sunseri Дж, Koes и ДР (апрель 2017 г.). «Оценка белков-лигандов с помощью сверточных нейронных сетей» . Журнал химической информации и моделирования . 57 (4): 942–957. arXiv : 1612.02751 . DOI : 10.1021 / acs.jcim.6b00740 . PMC 5479431 . PMID 28368587 .  
  27. Li H, Peng J, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (март 2018). «Влияние структуры белка и сходства последовательностей на точность функций машинного обучения для прогнозирования сродства связывания» . Биомолекулы . 8 (1): 12. DOI : 10,3390 / biom8010012 . PMC 5871981 . PMID 29538331 .  
  28. ^ Imrie F, Bradley AR, Deane CM (февраль 2021). «Создание соответствующих свойств молекул-приманок с использованием глубокого обучения». Биоинформатика (btab080). DOI : 10.1093 / биоинформатики / btab080 . PMID 33532838 . 
  29. ^ Adeshina YO, Deeds EJ, Karanicolas J (август 2020). «Классификация машинного обучения может уменьшить количество ложных срабатываний при структурированном виртуальном скрининге» . Труды Национальной академии наук Соединенных Штатов Америки . 117 (31): 18477–18488. DOI : 10.1073 / pnas.2000585117 . PMC 7414157 . PMID 32669436 .  
  30. Xiong GL, Ye WL, Shen C, Lu AP, Hou TJ, Cao DS (июнь 2020 г.). «Повышение эффективности виртуального скрининга на основе структуры путем обучения на основе компонентов функции подсчета баллов». Брифинги по биоинформатике (bbaa094). DOI : 10.1093 / нагрудник / bbaa094 . PMID 32496540 . 
  31. Шен Ц, Дин Дж, Ван З, Цао Д, Дин Х, Хоу Т. (2019-06-27). «От машинного обучения к глубокому обучению: достижения в оценочных функциях для стыковки белок-лиганд». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . 10 . DOI : 10.1002 / wcms.1429 . S2CID 198336898 . 
  32. ^ Ян X, Ван Y, Бирн R, Шнайдер G, Ян S (2019-07-11). «Концепции искусственного интеллекта для компьютерного обнаружения лекарств» . Химические обзоры . 119 (18): 10520–10594. DOI : 10.1021 / acs.chemrev.8b00728 . PMID 31294972 . 
  33. ^ Li H, Зи KH, Lu G, Ballester PJ (2020-04-22). «Функции машинного обучения для виртуального скрининга на основе структуры». Междисциплинарные обзоры Wiley: вычислительная молекулярная наука . 11 . DOI : 10.1002 / wcms.1478 . S2CID 219089637 . 
  34. Ballester PJ (декабрь 2019 г.). «Выбор функций оценки машинного обучения для структурного виртуального скрининга». Открытие наркотиков сегодня. Технологии . 32–33: 81–87. DOI : 10.1016 / j.ddtec.2020.09.001 . PMID 33386098 . 
  35. Li H, Peng J, Sidorov P, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (март 2019). «Классические скоринговые функции для стыковки не могут использовать большие объемы структурных данных и данных взаимодействия». Биоинформатика . Оксфорд, Англия. 35 (20): 3989–3995. DOI : 10.1093 / биоинформатики / btz183 . PMID 30873528 . 
  36. ^ Englebienne P, Moitessier N (июнь 2009). «Стыковка лигандов в гибкие и сольватированные макромолекулы. 4. Являются ли популярные функции подсчета точными для этого класса белков?». Журнал химической информации и моделирования . 49 (6): 1568–80. DOI : 10.1021 / ci8004308 . PMID 19445499 . 
  37. ^ ОДА А, Цутид К, Такакур Т, Yamaotsu Н, Хиро S (2006). «Сравнение консенсусных стратегий оценки для оценки вычислительных моделей комплексов белок-лиганд». Журнал химической информации и моделирования . 46 (1): 380–91. DOI : 10.1021 / ci050283k . PMID 16426072 . 
  38. ^ Хеллгрен M, Carlsson J, Остберг LJ, Стааб CA, Persson B, Хоог JO (сентябрь 2010). «Обогащение лигандов молекулярными докингами и последующая характеристика алкогольдегидрогеназы 3 человека». Клеточные и молекулярные науки о жизни . 67 (17): 3005–15. DOI : 10.1007 / s00018-010-0370-2 . PMID 20405162 . S2CID 2391130 .