dcGO - это обширная база данных онтологий для белковых доменов. [1] В качестве ресурса онтологии dcGO объединяет открытые биомедицинские онтологии из различных контекстов, от функциональной информации, такой как генная онтология, до других сведений о ферментах и путях, от информации о фенотипах основных модельных организмов до информации о человеческих заболеваниях и лекарствах. В качестве ресурса белкового домена dcGO включает аннотации как для отдельных доменов, так и для супрадоменов (т.е. комбинации двух или более последовательных доменов).
Содержание | |
---|---|
Описание | База данных dcGO - это комплексный предметно-ориентированный ресурс по онтологии для белковых доменов. |
Типы данных захвачены | Белковые домены, онтологии |
Контакт | |
Исследовательский центр | Бристольский университет |
Первичное цитирование | PMID 23161684 |
Доступ | |
Веб-сайт | Сайт dcGO |
Скачать URL | dcGO СКАЧАТЬ |
Инструменты | |
Интернет | PSnet , sTOL , dcGOR , dcGO Predictor , dcGO Enrichment |
Концепции
В основе dcGO лежат две ключевые концепции. Первая концепция - пометить белковые домены с помощью онтологии, например, с помощью Gene Ontology. Вот почему это называется dcGO, доменно-ориентированной генной онтологией. Вторая концепция заключается в использовании меченных онтологией белковых доменов, например, для предсказания функции белков. Проще говоря, первая концепция касается создания ресурса dcGO, а вторая концепция - того, как использовать ресурс dcGO.
Сроки
- В 2010 году алгоритм, лежащий в основе dcGO, был первоначально опубликован как усовершенствование базы данных SUPERFAMILY . [2]
- В 2011 году dcGO Predictor занял 10-е место в конкурсе CAFA 2011 года в применении к генной онтологии . [3] [4] Этот предиктор - это только предметно-ориентированный метод без машинного обучения.
- В 2012 году база данных была официально выпущена, опубликована в выпуске NAR database.
- В 2013 году веб-сервер был улучшен для поддержки многих анализов с использованием ресурса dcGO.
- В начале 2014 года был представлен «dcGO Predictor» для прогнозирования функций и фенотипа, заняв 4-е место в прогнозировании фенотипа CAFA.
- В конце 2014 года был разработан пакет R с открытым исходным кодом dcGOR, который помогает анализировать онтологии и аннотации белковых доменов.
Веб сервер
В последнее время dcGO используется для построения сети доменов с функциональной точки зрения для кросс-онтологических сравнений [5] и для объединения с деревом видов жизни (sTOL) для обеспечения филогенетического контекста для функционирования и фенотипа. [6]
Программное обеспечение
Программное обеспечение с открытым исходным кодом dcGOR разработано с использованием языка программирования R для анализа предметно-ориентированных онтологий и аннотаций. [7] Поддерживаемые анализы включают:
- легкий доступ к широкому спектру онтологий и их предметно-ориентированным аннотациям;
- возможность создавать индивидуальные онтологии и аннотации;
- анализ и визуализация обогащения на основе предметной области;
- построение доменной (семантической) сети по аннотациям онтологий;
- анализ значимости для оценки контактной (статистической значимости) сети с использованием алгоритма случайного блуждания ;
- высокопроизводительные параллельные вычисления.
Функциональные возможности, находящиеся в стадии активной разработки:
- алгоритм и реализации для создания предметно-ориентированных аннотаций онтологий;
- предсказание онтологических терминов для архитектуры доменов входных белков;
- реконструкция наследственных дискретных символов с использованием максимального правдоподобия / экономии.
Смотрите также
Рекомендации
- ^ Fang, H .; Гоф, Дж. (2012). «DcGO: База данных онтологий, ориентированных на предметную область, по функциям, фенотипам, заболеваниям и многому другому» . Исследования нуклеиновых кислот . 41 (выпуск базы данных): D536 – D544. DOI : 10.1093 / NAR / gks1080 . PMC 3531119 . PMID 23161684 .
- ^ Де Лима Мораис, DA; Fang, H .; Rackham, OJL; Wilson, D .; Pethica, R .; Chothia, C .; Гоф, Дж. (2010). «SUPERFAMILY 1.75, включая доменно-ориентированный метод онтологии генов» . Исследования нуклеиновых кислот . 39 (выпуск базы данных): D427 – D434. DOI : 10.1093 / NAR / gkq1130 . PMC 3013712 . PMID 21062816 .
- ^ Fang, H .; Гоф, Дж. (2013). «Домен-ориентированное решение функциональной геномики с помощью dcGO Predictor» . BMC Bioinformatics . 14 Приложение 3: S9. DOI : 10.1186 / 1471-2105-14-S3-S9 . PMC 3584936 . PMID 23514627 .
- ^ Radivojac, P .; Кларк, WT; Орон, TR; Schnoes, AM; Wittkop, T .; Соколов, А .; Graim, K .; Funk, C .; Verspoor, K .; Бен-Гур, А .; Pandey, G .; Юнес, JM; Talwalkar, AS; Репо, С .; Соуза, ML; Piovesan, D .; Casadio, R .; Wang, Z .; Cheng, J .; Fang, H .; Gough, J .; Koskinen, P .; Törönen, P .; Nokso-Koivisto, J .; Holm, L .; Cozzetto, D .; Бьюкен, DWA; Bryson, K .; Джонс, ДТ; и другие. (2013). «Масштабная оценка предсказания вычислительной функции белка» . Природные методы . 10 (3): 221–227. DOI : 10.1038 / nmeth.2340 . PMC 3584181 . PMID 23353650 .
- ^ Клык, H; Гоф, Дж (2013). «Матрица болезнь-лекарственное средство-фенотип, выведенная путем хождения по функциональной доменной сети». Молекулярные биосистемы . 9 (7): 1686–96. DOI : 10.1039 / c3mb25495j . PMID 23462907 .
- ^ Fang, H .; Оутс, Мэн; Петика, РБ; Гринвуд, JM; Сардар, AJ; Rackham, OJL; Донохью, PCJ; Stamatakis, A .; Де Лима Мораис, DA; Гоф, Дж. (2013). «Ежедневно обновляемое дерево (секвенированной) жизни как справочник для исследования генома» . Научные отчеты . 3 : 2015. Bibcode : 2013NatSR ... 3E2015F . DOI : 10.1038 / srep02015 . PMC 6504836 . PMID 23778980 .
- ^ Фанг, H (2014). «DcGOR: пакет R для анализа онтологий и аннотаций белковых доменов» . Вычислительная биология PLoS . 10 (10): e1003929. Bibcode : 2014PLSCB..10E3929F . DOI : 10.1371 / journal.pcbi.1003929 . PMC 4214615 . PMID 25356683 .
Внешние ссылки
- СУПЕРСЕМЬЯ
- SCOP