Область применимости (AD) модели QSAR - это физико-химическое, структурное или биологическое пространство, знания или информация, на основе которых был разработан обучающий набор модели и для которого он применим для прогнозирования новых соединений.
Цель AD - установить, выполняются ли предположения модели и для каких химикатов модель может быть надежно применима. В общем, это скорее для интерполяции , чем для экстраполяции . До сих пор не существует единого общепринятого алгоритма для определения AD: подробный обзор можно найти в Отчете и рекомендациях ECVAM Workshop 52. [1] Существует довольно систематический подход к определению областей интерполяции. [2]Этот процесс включает в себя удаление выбросов и метод распределения плотности вероятности с использованием выборки, взвешенной по ядру. Другой широко используемый подход для структурной AD регрессионных моделей QSAR основан на рычаге, рассчитанном из диагональных значений матрицы шляпы моделирующих молекулярных дескрипторов. [3] [4] [5] Недавнее тщательное сравнительное исследование нескольких алгоритмов AD показало, что стандартное отклонение прогнозов модели является наиболее надежным подходом. [6] Чтобы исследовать AD обучающего набора химических веществ, можно непосредственно проанализировать свойства многомерного дескрипторного пространства обучающих соединений или, более косвенно, с помощью показателей расстояния (или сходства). При использовании метрик расстояния следует соблюдать осторожность, чтобы использовать ортогональное и значимое векторное пространство. Это может быть достигнуто с помощью различных средств выбора характеристик и последовательного анализа главных компонентов .
Заметки
- ^ Нецева Т, Уорт А, Альденберг Т, Бениньи Р, Кронин М, Граматика П, Яворска Дж, Кан С, Клопман Г, Марчант С, Мятт Г, Николова-Желязкова Н, Патлевич Г, Перкинс Р, Робертс Д, Шульц Т. , Стэнтон Д., ван де Сандт Дж., Тонг В., Вейт Дж., Янг С.: Текущее состояние методов определения области применимости (количественных) взаимосвязей между структурой и активностью. Альтернативная лаборатория Anim 2005, 33: 1-19
- ^ Jaworska J, Николова-Jeliazkova N, Aldenberg T: Оценка области применимости QSAR проекцией пространства дескрипторов обучающей выборки: обзор. Альтернативная лаборатория Anim 2005, 33 (5): 445-459
- Перейти ↑ Atkinson AC, Plots, Transformations and Regression, Clarendon Press, Oxford, 1985, p.282
- ^ Тропша А., Граматика П., Гомбар В.К., Важность серьезности: проверка абсолютно необходима для успешного применения и интерпретации моделей QSPR. QSAR Comb.Sci. 2003, 22: 69-77
- ^ Граматика П. Принципы валидации моделей QSAR: внутренние и внешние QSAR Comb.Sci. 2007, 26 (5): 694-701.
- ^ Тетко И.В., Сушко И., Пандей А.К., Чжу Х., Тропша А., Папа Э, Оберг Т., Тодешини Р., Фурчес Д., Варнек А. Критическая оценка моделей токсичности окружающей среды QSAR против Tetrahymena pyriformis: сосредоточение внимания на области применимости и переобучении выбор переменных. Модель J Chem Inf. 2008 сентябрь; 48 (9): 1733-46.