Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Логотип проекта Базы данных универсальных модельных организмов

Проект Generic Model Organism Database ( GMOD ) предоставляет сообществам биологических исследователей набор программных компонентов с открытым исходным кодом для визуализации, аннотирования, управления и хранения биологических данных. Проект GMOD финансируется Национальным институтом здравоохранения США , Национальным научным фондом и Службой сельскохозяйственных исследований Министерства сельского хозяйства США .

История [ править ]

Проект GMOD был начат в начале 2000-х годов как сотрудничество между несколькими базами данных модельных организмов (MOD), которые разделяли потребность в создании аналогичных программных инструментов для обработки данных из проектов секвенирования. MOD или базы данных по конкретным организмам описывают геном и другую информацию о важных экспериментальных организмах в науках о жизни и фиксируют большие объемы данных и информации, генерируемые современной биологией . Вместо того , чтобы каждая группа проектирования свое собственное программное обеспечение, четыре основных MODs-- FlyBase , Saccharomyces Геном базы данных , Mouse Геном базы данных , и WormBase- работали вместе для создания приложений, которые обеспечивают функциональность, необходимую для всех модов, например, программное обеспечение, помогающее управлять данными в моде, а также помогать пользователям получать доступ к данным и запрашивать их.

Проект GMOD направлен на обеспечение взаимодействия программных компонентов. С этой целью многие инструменты используют общий формат файла ввода / вывода или запускаются из базы данных схемы Chado.

Схема базы данных Chado [ править ]

Схема Чадо [1] направлена ​​на охват многих классов данных, часто используемых современными биологами, от генетических данных до филогенетических деревьев, публикаций, организмов, данных микрочипов, идентификаторов и экспрессии РНК / белков. Чадо широко использует контролируемые словари для ввода всех сущностей в базе данных; например: гены, транскрипты, экзоны, мобильные элементы и т. д. хранятся в таблице функций с типом, предоставленным Sequence Ontology . Когда новый тип добавляется в онтологию последовательности, таблица функций не требует модификации, только обновление данных в базе данных. То же самое можно сказать и о данных анализа, которые также можно хранить в Chado.

Существующие основные модули Чадо:

  • последовательность - для последовательностей / функций
  • cv - для контролируемых словарей / онтологий
  • общие - в настоящее время просто dbxrefs
  • организм - таксономические данные
  • pub - публикации и ссылки
  • companalysis - дополняет модуль последовательности данными вычислительного анализа
  • map - карты непоследовательности
  • генетико-генетические и фенотипические данные
  • выражение - экспрессия гена
  • естественное разнообразие - данные о населении

Программное обеспечение [ править ]

Полный список компонентов программного обеспечения GMOD находится на странице компонентов GMOD. Эти компоненты включают:

Участвующие базы данных [ править ]

Следующие ниже базы данных организмов вносят свой вклад и / или принимают компоненты GMOD для баз данных модельных организмов.

Связанные проекты [ править ]

  • Bioperl , BioJava , Biopython , BioRuby и др.
  • Ансамбль
  • Генная онтология
  • DAS
  • Единая схема геномики
  • Ламантин: ручной инструмент аннотации
  • Biocurator.org
  • Открытые биомедицинские онтологии
  • Проект онтологии последовательности

См. Также [ править ]

  • Биологическая база данных
  • Геномный проект
  • Геномика
  • Геном
  • Genome Compiler - универсальная программная платформа для проектирования и визуализации ДНК, управления данными и совместной работы.

Ссылки [ править ]

  1. ^ Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример из практики Чадо: модульная схема на основе онтологии для представления биологической информации, связанной с геномом» . Биоинформатика . 23 (13): i337 – i346. DOI : 10.1093 / биоинформатики / btm189 . PMID  17646315 .
  2. ^ Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельного организма» . Genome Res . 12 (10): 1599–610. DOI : 10.1101 / gr.403602 . PMC 187535 . PMID 12368253 .  
  3. ^ Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.» . Исследования нуклеиновых кислот . 44 (W1): W3 – W10. DOI : 10.1093 / NAR / gkw343 . PMC 4987906 . PMID 27137889 .  
  4. ^ Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). "BeetleBase: база данных модельных организмов Tribolium castaneum" . Nucleic Acids Res . 35 (Выпуск базы данных): D476–9. DOI : 10.1093 / NAR / gkl776 . PMC 1669707 . PMID 17090595 .  
  5. ^ Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum" . Nucleic Acids Res . 34 (Выпуск базы данных): D423–7. DOI : 10.1093 / NAR / gkj090 . PMC 1347453 . PMID 16381903 .  
  6. ^ Арнаис О; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными» . Nucleic Acids Res . 35 (выпуск базы данных): D439–44. DOI : 10.1093 / NAR / gkl777 . PMC 1669747 . PMID 17142227 .  
  7. ^ Colbourne JK; Singan VR; Гилберт Д.Г. (2005). «wFleaBase: база данных генома дафний» . BMC Bioinformatics . 6 : 45. DOI : 10,1186 / 1471-2105-6-45 . PMC 555599 . PMID 15752432 .  

Внешние ссылки [ править ]

  • Сайт GMOD