Содержание | |
---|---|
Описание | Ресурс с контролируемым словарным запасом для описания функций генов и генных продуктов |
Доступ | |
Веб-сайт | генеонтология |
Джин Онтология ( ГО ) является одним из основной биоинформатики инициативы унифицировать представление гена и ген продукта атрибутов во всех видах . [1] Более конкретно, проект направлен на: 1) поддержание и развитие своего контролируемого словаря генов и атрибутов генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставлять инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. [2] [3]GO является частью более крупной классификации, Open Biomedical Ontology , и является одним из первых кандидатов в члены OBO Foundry . [4]
В то время как номенклатура генов фокусируется на генах и генных продуктах, онтология генов фокусируется на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки, чтобы сделать данные (не только генов и их продуктов, но и курируемых атрибутов) машиночитаемыми и сделать это унифицированным для всех видов способом (тогда как соглашения о номенклатуре генов варьируются в зависимости от биологического таксона ).
Термины и онтология [ править ]
С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, и отношений между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательской группы. Это затрудняет обмен данными и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генного продукта . Онтология охватывает три области:
- клеточный компонент , части клетки или ее внеклеточное окружение;
- молекулярная функция , элементарная активность генного продукта на молекулярном уровне, такая как связывание или катализ ;
- биологический процесс , операции или наборы молекулярных событий с определенным началом и концом, относящиеся к функционированию интегрированных живых единиц: клеток, тканей , органов и организмов .
Каждый термин GO в онтологии имеет имя термина, которое может быть словом или цепочкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированными источниками; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как точно эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как направленный ациклический граф , и каждый термин имеет определенные отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариотам и эукариотам ,одноклеточные и одноклеточные организмы .
GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO. [5] Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например, [6] ). Предлагаемые изменения проверяются редакторами онтологий и при необходимости вносятся в них.
Онтология GO и файлы аннотаций находятся в свободном доступе на веб-сайте GO [7] в различных форматах или могут быть доступны онлайн с помощью браузера GO AmiGO . Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.
Пример термина [ править ]
- id: GO: 0000016
- название: активность лактазы
- онтология: молекулярная функция
- def: «Катализ реакции: лактоза + H2O = D-глюкоза + D-галактоза». [EC: 3.2.1.108]
- синоним: «активность лактазы-флоризингидролазы» ШИРОКО [EC: 3.2.1.108]
- синоним: «активность лактозогидролазы» ТОЧНО [EC: 3.2.1.108]
- xref: EC: 3.2.1.108
- xref: MetaCyc: LACTASE-RXN
- xref: Reactome: 20536
- is_a: GO: 0004553! гидролазная активность, гидролизующие О-гликозильные соединения
Источник данных: [8]
Аннотация [ править ]
Аннотации генома включают в себя практику сбора данных о продукте гена, а в аннотациях GO для этого используются термины из GO. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO. [9] В дополнение к идентификатору генного продукта и соответствующему термину GO, аннотации GO содержат по крайней мере следующие данные: ссылку, используемую для создания аннотации (например, журнальная статья); Доказательства код , обозначающий тип доказательства , на которых базируется аннотаций; Дата и автор аннотации
В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых свидетельств, а также дополнительная информация, такая как условия, при которых наблюдается функция.
Код свидетельства происходит из контролируемого словаря кодов, онтологии кода свидетельства, охватывающего как ручные, так и автоматизированные методы аннотации. [10] Например, отслеживаемое заявление автора (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные для этой аннотации содержат ссылку на эту статью; Вывод на основе подобия последовательностей (ISS) означает, что куратор-человек просмотрел результат поиска сходства последовательностей и подтвердил его биологическое значение. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций.(МЭА). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений. [11] [12] Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым, менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Для поддержки разработки аннотаций Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.
Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генных онтологий. [13] [14]
Пример аннотации [ править ]
- Генный продукт: актин, альфа-сердечная мышца 1, UniProtKB: P68032
- GO термин: сокращение сердца; GO: 0060047 (биологический процесс)
- Код доказательства: выведен из мутантного фенотипа (IMP)
- Ссылка: PMID 17611253
- Назначен: UniProtKB, 6 июня 2008 г.
Источник данных: [15]
Инструменты [ править ]
Существует большое количество инструментов [16], доступных как онлайн, так и для загрузки, которые используют данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit .
AmiGO [17] [9] - это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST , [18] инструменты, позволяющие анализировать большие наборы данных, [19] [20] и интерфейс для прямого запроса базы данных GO. [21]
AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или можно загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например, [22] ). Это бесплатное программное обеспечение с открытым исходным кодом и доступно как часть распространения программного обеспечения go-dev. [23]
OBO-Edit [24] - это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Gene Ontology Consortium. Он реализован на Java и использует графо-ориентированный подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждений, который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя OBO-Edit был разработан для биомедицинских онтологий, его можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания. [23]
Консорциум [ править ]
Консорциум генных онтологий - это набор биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. [12] Это включает ряд баз данных модельных организмов и многовидовых баз данных белков , группы разработки программного обеспечения и специальную редакцию.
История [ править ]
Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). [25] Многие другие базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие основные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект. [7]По состоянию на июль 2019 года GO содержит 44 945 терминов; есть 6 408 283 аннотаций к 4 467 различным биологическим организмам. [7] Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в арсенале биоинформатики . Их цели имеют три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.
Также начинает появляться несколько анализов генной онтологии с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, онтологический анализ биологических онтологий см. [26]
См. Также [ править ]
- Blast2GO [27]
- База данных сравнительной токсикогеномики
- Дэвид биоинформатика
- Интерфером
- Национальный центр биомедицинской онтологии
Ссылки [ править ]
- ^ Ген Онтология консорциума (январь 2008). «Проект генной онтологии в 2008 году» . Исследования нуклеиновых кислот . 36 (выпуск базы данных): D440–4. DOI : 10.1093 / NAR / gkm883 . PMC 2238979 . PMID 17984083 .
- ^ Дессимоз, Кристоф ; Шкунца, Нивес, ред. (2017). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . DOI : 10.1007 / 978-1-4939-3743-1 . ISBN 9781493937431. ISSN 1064-3745 . S2CID 3708801 .
- ^ Годе, Паскаль; Шкунца, Нивес; Ху, Джеймс С .; Дессимоз, Кристоф (2017). «Букварь по онтологии генов». Справочник по генной онтологии . Методы молекулярной биологии. 1446 . С. 25–37. DOI : 10.1007 / 978-1-4939-3743-1_3 . ISBN 978-1-4939-3741-7. ISSN 1064-3745 . PMC 6377150 . PMID 27812933 .
- ^ Смит Б., Эшбернер М., Росс С., Бард Дж., Баг В., Цеустерс В., Голдберг Л.Дж., Эйлбек К., Ирландия А., Мунгалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансон С.А., Шойерманн Р.Х., Шах Н. , Whetzel PL, Lewis S (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных» . Природа Биотехнологии . 25 (11): 1251–5. DOI : 10.1038 / nbt1346 . PMC 2814061 . PMID 17989687 .
- ^ Ловеринг, Рут С. (2017). «Как научное сообщество способствует генной онтологии?». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . Спрингер (Нью-Йорк). С. 85–93. DOI : 10.1007 / 978-1-4939-3743-1_7 . ISBN 978-1-4939-3741-7. ISSN 1064-3745 . PMID 27812937 .
- Перейти ↑ Diehl AD, Lee JA, Scheuermann RH, Blake JA (апрель 2007 г.). «Разработка онтологий для биологических систем: иммунология» . Биоинформатика . 23 (7): 913–5. DOI : 10.1093 / биоинформатики / btm029 . PMID 17267433 .
- ^ a b c «Ресурсы по онтологии генов» . Консорциум генных онтологий.
- ^ Sjcarbon, Джин Онтология Consortium Wiki (2013-07-10). «AmiGO_2_Manual: term_Page» (HTML) .
- ^ a b AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
- ^ «Онтология кода свидетельств» . Онтология кода свидетельств.
- ^ du Plessis L, Skunca N, Dessimoz C (ноябрь 2011 г.). «Что, где, как и почему онтологии генов - учебник для биоинформатиков» . Брифинги по биоинформатике . 12 (6): 723–35. DOI : 10.1093 / нагрудник / bbr002 . PMC 3220872 . PMID 21330331 .
- ^ a b «Консорциум GO» . Проверено 16 марта 2009 .
- ^ Pinoli P, Chicco D, Masseroli M (июнь 2013). «Вычислительные алгоритмы для прогнозирования аннотации генной онтологии» . BMC Bioinformatics . 16 (6): S4. DOI : 10.1186 / 1471-2105-16-S6-S4 . PMC 4416163 . PMID 25916950 .
- ^ Козцетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы передачи аннотаций из последовательности». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . Спрингер (Нью-Йорк). С. 55–67. DOI : 10.1007 / 978-1-4939-3743-1_5 . ISBN 978-1-4939-3741-7. ISSN 1064-3745 . PMID 27812935 .
- ^ Консорциум GO (2009-03-16). «AmiGO: P68032 Ассоциации» .
- ^ Москуэра JL, Санчес-Пла A (июль 2008). «SerbGO: в поисках лучшего инструмента GO» . Исследования нуклеиновых кислот . 36 (выпуск веб-сервера): W368–71. DOI : 10.1093 / NAR / gkn256 . PMC 2447766 . PMID 18480123 .
- ^ Carbon S, Ирландия A, Mungall CJ, Shu S, Маршалл B, Льюис S (январь 2009). AmiGO Hub; Рабочая группа по веб-присутствию. «AmiGO: онлайн-доступ к онтологии и аннотационным данным» . Биоинформатика . 25 (2): 288–9. DOI : 10.1093 / биоинформатики / btn615 . PMC 2639003 . PMID 19033274 .
- ^ "Инструмент AmiGO BLAST" . Архивировано из оригинала на 2011-08-20 . Проверено 13 марта 2009 .
- ^ Инструмент расширения терминов AmiGO. Архивировано 7 апреля 2008 г. в Wayback Machine ; находит важные общие термины GO в наборе аннотаций
- ^ Amigo Тоньше архивации 2011-09-29 в Wayback Machine ; отображает подробные аннотации до терминов высокого уровня
- ^ GOOSE , GO Online SQL Environment; позволяет выполнять прямой SQL-запрос к базе данных GO
- ^ Онтология Consortium завод (2009-03-16). «Консорциум онтологий растений» . Проверено 16 марта 2009 .
- ^ a b «Онтология генов загружается на SourceForge» . Проверено 16 марта 2009 .
- ^ День Рихтер J, Харрис М., Гендель М., Льюис S (август 2007). «ОБО-Edit - редактор онтологий для биологов» . Биоинформатика . 23 (16): 2198–200. DOI : 10.1093 / биоинформатика / btm112 . PMID 17545183 .
- ^ Ashburner M, Болл CA, Blake JA , Ботстайн D, Butler H, Cherry JM, Дэвис П., Долинский K, Дуайт SS, Eppig JT, Харрис М., Хилл DP, Issel-Тарвер L, Kasarskis A, Льюис S, Matese JC , Ричардсон Дж. Э., Рингуолд М., Рубин Г. М., Шерлок Дж. (Май 2000 г.). «Генная онтология: инструмент для объединения биологии. Консорциум генных онтологий» . Генетика природы . 25 (1): 25–9. DOI : 10.1038 / 75556 . PMC 3037419 . PMID 10802651 .
- ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий» . Границы генетики . 3 : 269. DOI : 10,3389 / fgene.2012.00269 . PMC 3509948 . PMID 23226158 .
- ^ Гетц S, Гарсиа-Гомес JM, Terol Дж, Уильямс ТД, Нагарадж SH, Nueda МДж, Роблес М, Talon М, Dopazo Дж, Конес А (июнь 2008 г.). «Функциональные аннотации и интеллектуальный анализ данных с высокой пропускной способностью с помощью пакета Blast2GO» . Исследования нуклеиновых кислот . 36 (10): 3420–35. DOI : 10.1093 / NAR / gkn176 . PMC 2425479 . PMID 18445632 .
Внешние ссылки [ править ]
Викиданные имеют свойство:
|
- AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
- Консорциум Gene Ontology - официальный сайт
- PlantRegMap - аннотация GO для 165 видов растений и анализ обогащения GO
- SimCT - веб-инструмент для отображения взаимосвязей между биологическими объектами, аннотированными онтологией, в виде дерева кластеризации.
- SerbGO - инструмент GO для сравнения возможностей различных программ, чтобы показать их общие черты и различия, а также определить, какие инструменты, если таковые имеются, имеют определенные пользовательские возможности для анализа GO.
- Онтология генов, ориентированная на домен - база данных онтологий, ориентированных на предметную область, по функциям, фенотипам, заболеваниям и многому другому.