Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Джин Онтология ( ГО ) является одним из основной биоинформатики инициативы унифицировать представление гена и ген продукта атрибутов во всех видах . [1] Более конкретно, проект направлен на: 1) поддержание и развитие своего контролируемого словаря генов и атрибутов генных продуктов; 2) аннотировать гены и генные продукты, а также ассимилировать и распространять аннотационные данные; и 3) предоставлять инструменты для легкого доступа ко всем аспектам данных, предоставляемых проектом, и для обеспечения функциональной интерпретации экспериментальных данных с использованием GO, например, посредством анализа обогащения. [2] [3]GO является частью более крупной классификации, Open Biomedical Ontology , и является одним из первых кандидатов в члены OBO Foundry . [4]

В то время как номенклатура генов фокусируется на генах и генных продуктах, онтология генов фокусируется на функциях генов и генных продуктах. GO также расширяет возможности, используя язык разметки, чтобы сделать данные (не только генов и их продуктов, но и курируемых атрибутов) машиночитаемыми и сделать это унифицированным для всех видов способом (тогда как соглашения о номенклатуре генов варьируются в зависимости от биологического таксона ).

Термины и онтология [ править ]

С практической точки зрения онтология - это представление того, о чем мы знаем. «Онтологии» состоят из представлений вещей, которые можно обнаружить или непосредственно наблюдать, и отношений между этими вещами. В биологии и смежных областях не существует универсальной стандартной терминологии, и использование терминов может быть специфическим для вида, области исследования или даже конкретной исследовательской группы. Это затрудняет обмен данными и обмен данными. Проект Gene Ontology предоставляет онтологию определенных терминов, представляющих свойства генного продукта . Онтология охватывает три области:

Каждый термин GO в онтологии имеет имя термина, которое может быть словом или цепочкой слов; уникальный буквенно-цифровой идентификатор; определение с цитированными источниками; и онтология, указывающая домен, к которому он принадлежит. У терминов также могут быть синонимы, которые классифицируются как точно эквивалентные названию термина, более широкие, узкие или связанные; ссылки на эквивалентные концепции в других базах данных; и комментарии по значению или использованию термина. Онтология GO структурирована как направленный ациклический граф , и каждый термин имеет определенные отношения с одним или несколькими другими терминами в том же домене, а иногда и с другими доменами. Словарь GO разработан так, чтобы не зависеть от вида, и включает термины, применимые к прокариотам и эукариотам ,одноклеточные и одноклеточные организмы .

GO не статичен, и дополнения, исправления и изменения предлагаются и запрашиваются членами исследовательских сообществ и сообществ аннотаций, а также теми, кто непосредственно участвует в проекте GO. [5] Например, аннотатор может запросить конкретный термин для представления метаболического пути, или часть онтологии может быть изменена с помощью экспертов сообщества (например, [6] ). Предлагаемые изменения проверяются редакторами онтологий и при необходимости вносятся в них.

Онтология GO и файлы аннотаций находятся в свободном доступе на веб-сайте GO [7] в различных форматах или могут быть доступны онлайн с помощью браузера GO AmiGO . Проект Gene Ontology также предоставляет загружаемые сопоставления своих терминов с другими системами классификации.

Пример термина [ править ]

id: GO: 0000016
название: активность лактазы
онтология: молекулярная функция
def: «Катализ реакции: лактоза + H2O = D-глюкоза + D-галактоза». [EC: 3.2.1.108]
синоним: «активность лактазы-флоризингидролазы» ШИРОКО [EC: 3.2.1.108]
синоним: «активность лактозогидролазы» ТОЧНО [EC: 3.2.1.108]
xref: EC: 3.2.1.108
xref: MetaCyc: LACTASE-RXN
xref: Reactome: 20536
is_a: GO: 0004553! гидролазная активность, гидролизующие О-гликозильные соединения

Источник данных: [8]

Аннотация [ править ]

Аннотации генома включают в себя практику сбора данных о продукте гена, а в аннотациях GO для этого используются термины из GO. Аннотации от кураторов GO интегрированы и распространяются на веб-сайте GO, где их можно скачать напрямую или просмотреть в Интернете с помощью AmiGO. [9] В дополнение к идентификатору генного продукта и соответствующему термину GO, аннотации GO содержат по крайней мере следующие данные: ссылку, используемую для создания аннотации (например, журнальная статья); Доказательства код , обозначающий тип доказательства , на которых базируется аннотаций; Дата и автор аннотации


В аннотацию GO также может быть включена вспомогательная информация, в зависимости от термина GO и используемых свидетельств, а также дополнительная информация, такая как условия, при которых наблюдается функция.

Код свидетельства происходит из контролируемого словаря кодов, онтологии кода свидетельства, охватывающего как ручные, так и автоматизированные методы аннотации. [10] Например, отслеживаемое заявление автора (TAS) означает, что куратор прочитал опубликованную научную статью, и метаданные для этой аннотации содержат ссылку на эту статью; Вывод на основе подобия последовательностей (ISS) означает, что куратор-человек просмотрел результат поиска сходства последовательностей и подтвердил его биологическое значение. Аннотации из автоматизированных процессов (например, переназначение аннотаций, созданных с использованием другого словаря аннотаций) получают код, полученный из электронных аннотаций.(МЭА). В 2010 году более 98% всех аннотаций GO были выведены с помощью вычислений, а не кураторами, но по состоянию на 2 июля 2019 года только около 30% всех аннотаций GO были выведены с помощью вычислений. [11] [12] Поскольку эти аннотации не проверяются человеком, Консорциум GO считает их несколько менее надежными, и они обычно относятся к более высокоуровневым, менее подробным условиям. Полные наборы аннотационных данных можно загрузить с веб-сайта GO. Для поддержки разработки аннотаций Консорциум GO проводит семинары и наставляет новые группы кураторов и разработчиков.

Многие алгоритмы машинного обучения были разработаны и реализованы для прогнозирования аннотаций генных онтологий. [13] [14]

Пример аннотации [ править ]

Генный продукт: актин, альфа-сердечная мышца 1, UniProtKB: P68032
GO термин: сокращение сердца; GO: 0060047 (биологический процесс)
Код доказательства: выведен из мутантного фенотипа (IMP)
Ссылка: PMID  17611253
Назначен: UniProtKB, 6 июня 2008 г.

Источник данных: [15]

Инструменты [ править ]

Существует большое количество инструментов [16], доступных как онлайн, так и для загрузки, которые используют данные, предоставленные проектом GO. Подавляющее большинство из них поступает от третьих лиц; Консорциум GO разрабатывает и поддерживает два инструмента: AmiGO и OBO-Edit .

AmiGO [17] [9] - это веб-приложение, которое позволяет пользователям запрашивать, просматривать и визуализировать онтологии и данные аннотаций генных продуктов. Он также имеет инструмент BLAST , [18] инструменты, позволяющие анализировать большие наборы данных, [19] [20] и интерфейс для прямого запроса базы данных GO. [21]

AmiGO можно использовать онлайн на веб-сайте GO для доступа к данным, предоставленным Консорциумом GO, или можно загрузить и установить для локального использования в любой базе данных, использующей схему базы данных GO (например, [22] ). Это бесплатное программное обеспечение с открытым исходным кодом и доступно как часть распространения программного обеспечения go-dev. [23]

OBO-Edit [24] - это независимый от платформы редактор онтологий с открытым исходным кодом, разработанный и поддерживаемый Gene Ontology Consortium. Он реализован на Java и использует графо-ориентированный подход для отображения и редактирования онтологий. OBO-Edit включает в себя комплексный интерфейс поиска и фильтрации с возможностью отображать подмножества терминов, чтобы сделать их визуально различимыми; пользовательский интерфейс также можно настроить в соответствии с предпочтениями пользователя. OBO-Edit также имеет модуль рассуждений, который может выводить ссылки, которые не были явно указаны, на основе существующих отношений и их свойств. Хотя OBO-Edit был разработан для биомедицинских онтологий, его можно использовать для просмотра, поиска и редактирования любой онтологии. Он доступен для бесплатного скачивания. [23]

Консорциум [ править ]

Консорциум генных онтологий - это набор биологических баз данных и исследовательских групп, активно участвующих в проекте генной онтологии. [12] Это включает ряд баз данных модельных организмов и многовидовых баз данных белков , группы разработки программного обеспечения и специальную редакцию.

История [ править ]

Онтология генов была первоначально создана в 1998 году консорциумом исследователей, изучающих геномы трех модельных организмов : Drosophila melanogaster (плодовая муха), Mus musculus (мышь) и Saccharomyces cerevisiae (пивные или пекарские дрожжи). [25] Многие другие базы данных модельных организмов присоединились к Консорциуму генных онтологий, предоставляя не только аннотационные данные, но также внося свой вклад в разработку онтологий и инструментов для просмотра и применения данных. Многие основные базы данных по растениям, животным и микроорганизмам вносят свой вклад в этот проект. [7]По состоянию на июль 2019 года GO содержит 44 945 терминов; есть 6 408 283 аннотаций к 4 467 различным биологическим организмам. [7] Существует значительный объем литературы по разработке и использованию GO, и он стал стандартным инструментом в арсенале биоинформатики . Их цели имеют три аспекта: построение генной онтологии, присвоение онтологии генам / генным продуктам и разработка программного обеспечения и баз данных для первых двух объектов.

Также начинает появляться несколько анализов генной онтологии с использованием формальных, независимых от предметной области свойств классов (метасвойств). Например, онтологический анализ биологических онтологий см. [26]

См. Также [ править ]

  • Blast2GO [27]
  • База данных сравнительной токсикогеномики
  • Дэвид биоинформатика
  • Интерфером
  • Национальный центр биомедицинской онтологии

Ссылки [ править ]

  1. ^ Ген Онтология консорциума (январь 2008). «Проект генной онтологии в 2008 году» . Исследования нуклеиновых кислот . 36 (выпуск базы данных): D440–4. DOI : 10.1093 / NAR / gkm883 . PMC 2238979 . PMID 17984083 .  
  2. ^ Дессимоз, Кристоф ; Шкунца, Нивес, ред. (2017). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . DOI : 10.1007 / 978-1-4939-3743-1 . ISBN 9781493937431. ISSN  1064-3745 . S2CID  3708801 .
  3. ^ Годе, Паскаль; Шкунца, Нивес; Ху, Джеймс С .; Дессимоз, Кристоф (2017). «Букварь по онтологии генов». Справочник по генной онтологии . Методы молекулярной биологии. 1446 . С. 25–37. DOI : 10.1007 / 978-1-4939-3743-1_3 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMC  6377150 . PMID  27812933 .
  4. ^ Смит Б., Эшбернер М., Росс С., Бард Дж., Баг В., Цеустерс В., Голдберг Л.Дж., Эйлбек К., Ирландия А., Мунгалл С.Дж., Леонтис Н., Рокка-Серра П., Руттенберг А., Сансон С.А., Шойерманн Р.Х., Шах Н. , Whetzel PL, Lewis S (ноябрь 2007 г.). «The OBO Foundry: скоординированная эволюция онтологий для поддержки интеграции биомедицинских данных» . Природа Биотехнологии . 25 (11): 1251–5. DOI : 10.1038 / nbt1346 . PMC 2814061 . PMID 17989687 .  
  5. ^ Ловеринг, Рут С. (2017). «Как научное сообщество способствует генной онтологии?». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . Спрингер (Нью-Йорк). С. 85–93. DOI : 10.1007 / 978-1-4939-3743-1_7 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMID  27812937 .
  6. Перейти ↑ Diehl AD, Lee JA, Scheuermann RH, Blake JA (апрель 2007 г.). «Разработка онтологий для биологических систем: иммунология» . Биоинформатика . 23 (7): 913–5. DOI : 10.1093 / биоинформатики / btm029 . PMID 17267433 . 
  7. ^ a b c «Ресурсы по онтологии генов» . Консорциум генных онтологий.
  8. ^ Sjcarbon, Джин Онтология Consortium Wiki (2013-07-10). «AmiGO_2_Manual: term_Page» (HTML) .
  9. ^ a b AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
  10. ^ «Онтология кода свидетельств» . Онтология кода свидетельств.
  11. ^ du Plessis L, Skunca N, Dessimoz C (ноябрь 2011 г.). «Что, где, как и почему онтологии генов - учебник для биоинформатиков» . Брифинги по биоинформатике . 12 (6): 723–35. DOI : 10.1093 / нагрудник / bbr002 . PMC 3220872 . PMID 21330331 .  
  12. ^ a b «Консорциум GO» . Проверено 16 марта 2009 .
  13. ^ Pinoli P, Chicco D, Masseroli M (июнь 2013). «Вычислительные алгоритмы для прогнозирования аннотации генной онтологии» . BMC Bioinformatics . 16 (6): S4. DOI : 10.1186 / 1471-2105-16-S6-S4 . PMC 4416163 . PMID 25916950 .  
  14. ^ Козцетто, Доменико; Джонс, Дэвид Т. (2017). «Вычислительные методы передачи аннотаций из последовательности». In Dessimoz, C; Skunca, N (ред.). Справочник по генной онтологии . Методы молекулярной биологии. 1446 . Спрингер (Нью-Йорк). С. 55–67. DOI : 10.1007 / 978-1-4939-3743-1_5 . ISBN 978-1-4939-3741-7. ISSN  1064-3745 . PMID  27812935 .
  15. ^ Консорциум GO (2009-03-16). «AmiGO: P68032 Ассоциации» .
  16. ^ Москуэра JL, Санчес-Пла A (июль 2008). «SerbGO: в поисках лучшего инструмента GO» . Исследования нуклеиновых кислот . 36 (выпуск веб-сервера): W368–71. DOI : 10.1093 / NAR / gkn256 . PMC 2447766 . PMID 18480123 .  
  17. ^ Carbon S, Ирландия A, Mungall CJ, Shu S, Маршалл B, Льюис S (январь 2009). AmiGO Hub; Рабочая группа по веб-присутствию. «AmiGO: онлайн-доступ к онтологии и аннотационным данным» . Биоинформатика . 25 (2): 288–9. DOI : 10.1093 / биоинформатики / btn615 . PMC 2639003 . PMID 19033274 .  
  18. ^ "Инструмент AmiGO BLAST" . Архивировано из оригинала на 2011-08-20 . Проверено 13 марта 2009 .
  19. ^ Инструмент расширения терминов AmiGO. Архивировано 7 апреля 2008 г. в Wayback Machine ; находит важные общие термины GO в наборе аннотаций
  20. ^ Amigo Тоньше архивации 2011-09-29 в Wayback Machine ; отображает подробные аннотации до терминов высокого уровня
  21. ^ GOOSE , GO Online SQL Environment; позволяет выполнять прямой SQL-запрос к базе данных GO
  22. ^ Онтология Consortium завод (2009-03-16). «Консорциум онтологий растений» . Проверено 16 марта 2009 .
  23. ^ a b «Онтология генов загружается на SourceForge» . Проверено 16 марта 2009 .
  24. ^ День Рихтер J, Харрис М., Гендель М., Льюис S (август 2007). «ОБО-Edit - редактор онтологий для биологов» . Биоинформатика . 23 (16): 2198–200. DOI : 10.1093 / биоинформатика / btm112 . PMID 17545183 . 
  25. ^ Ashburner M, Болл CA, Blake JA , Ботстайн D, Butler H, Cherry JM, Дэвис П., Долинский K, Дуайт SS, Eppig JT, Харрис М., Хилл DP, Issel-Тарвер L, Kasarskis A, Льюис S, Matese JC , Ричардсон Дж. Э., Рингуолд М., Рубин Г. М., Шерлок Дж. (Май 2000 г.). «Генная онтология: инструмент для объединения биологии. Консорциум генных онтологий» . Генетика природы . 25 (1): 25–9. DOI : 10.1038 / 75556 . PMC 3037419 . PMID 10802651 .  
  26. ^ Деб, Б. (2012). «Онтологический анализ некоторых биологических онтологий» . Границы генетики . 3 : 269. DOI : 10,3389 / fgene.2012.00269 . PMC 3509948 . PMID 23226158 .  
  27. ^ Гетц S, Гарсиа-Гомес JM, Terol Дж, Уильямс ТД, Нагарадж SH, Nueda МДж, Роблес М, Talon М, Dopazo Дж, Конес А (июнь 2008 г.). «Функциональные аннотации и интеллектуальный анализ данных с высокой пропускной способностью с помощью пакета Blast2GO» . Исследования нуклеиновых кислот . 36 (10): 3420–35. DOI : 10.1093 / NAR / gkn176 . PMC 2425479 . PMID 18445632 .  

Внешние ссылки [ править ]

  • AmiGO - текущий официальный веб-набор инструментов для поиска и просмотра базы данных Gene Ontology
  • Консорциум Gene Ontology - официальный сайт
  • PlantRegMap - аннотация GO для 165 видов растений и анализ обогащения GO
  • SimCT - веб-инструмент для отображения взаимосвязей между биологическими объектами, аннотированными онтологией, в виде дерева кластеризации.
  • SerbGO - инструмент GO для сравнения возможностей различных программ, чтобы показать их общие черты и различия, а также определить, какие инструменты, если таковые имеются, имеют определенные пользовательские возможности для анализа GO.
  • Онтология генов, ориентированная на домен - база данных онтологий, ориентированных на предметную область, по функциям, фенотипам, заболеваниям и многому другому.