QSAR


Поиск количественных соотношений структура-свойство — процедура построения моделей, позволяющих по структурам химических соединений предсказывать их разнообразные свойства. За моделями, позволяющими прогнозировать количественные характеристики биологической активности, исторически закрепилось англоязычное название Quantitative Structure-Activity Relationship (QSAR). Аббревиатура QSAR часто трактуется расширенно для обозначения любых моделей структура-свойство. За моделями, позволяющими прогнозировать физические и физикохимические свойства органических соединений, закрепилось англоязычное название Quantitative Structure-Property Relationship (QSPR). При качественном описании соотношений между структурами химических соединений и их биологической активностью употребляют англоязычный термин Structure-Activity Relationship (SAR).

Поиск количественных соотношений структура-свойство основан на применении методов математической статистики и машинного обучения для построения моделей, позволяющих по описанию структур химических соединений предсказывать их свойства (физические, химические, биологическую активность). При прогнозировании свойств на качественном уровне (например, будет ли данное химическое соединение обладать данным видом биологической активности) говорят о решении классификационной задачи, тогда как при прогнозировании числовых значений свойств говорят о решении регрессионной задачи. Описание структур химических соединений для этих целей может быть векторным либо невекторным (графовым).

При векторном описании химической структуре ставится в соответствие вектор молекулярных дескрипторов, каждый из которых представляет собой инвариант молекулярного графа.

Молекулярные дескрипторы наиболее полно описаны в монографии[12], которую можно считать энциклопедией молекулярных дескрипторов, а также в учебном пособии[13].

Для решения регрессионных задач при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:

Для решения двухклассовых (бинарных) либо многоклассовых классификационных задач при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения: