Проект Generic Model Organism Database ( GMOD ) предоставляет сообществам биологических исследователей набор программных компонентов с открытым исходным кодом для визуализации, аннотирования, управления и хранения биологических данных. Проект GMOD финансируется Национальным институтом здравоохранения США , Национальным научным фондом и Службой сельскохозяйственных исследований Министерства сельского хозяйства США .
История [ править ]
Проект GMOD был начат в начале 2000-х годов как сотрудничество между несколькими базами данных модельных организмов (MOD), которые разделяли потребность в создании аналогичных программных инструментов для обработки данных из проектов секвенирования. MOD или базы данных по конкретным организмам описывают геном и другую информацию о важных экспериментальных организмах в науках о жизни и фиксируют большие объемы данных и информации, генерируемые современной биологией . Вместо того , чтобы каждая группа проектирования свое собственное программное обеспечение, четыре основных MODs-- FlyBase , Saccharomyces Геном базы данных , Mouse Геном базы данных , и WormBase- работали вместе для создания приложений, которые обеспечивают функциональность, необходимую для всех модов, например, программное обеспечение, помогающее управлять данными в моде, а также помогать пользователям получать доступ к данным и запрашивать их.
Проект GMOD направлен на обеспечение взаимодействия программных компонентов. С этой целью многие инструменты используют общий формат файла ввода / вывода или запускаются из базы данных схемы Chado.
Схема базы данных Chado [ править ]
Схема Чадо [1] направлена на охват многих классов данных, часто используемых современными биологами, от генетических данных до филогенетических деревьев, публикаций, организмов, данных микрочипов, идентификаторов и экспрессии РНК / белков. Чадо широко использует контролируемые словари для ввода всех сущностей в базе данных; например: гены, транскрипты, экзоны, мобильные элементы и т. д. хранятся в таблице функций с типом, предоставленным Sequence Ontology . Когда новый тип добавляется в онтологию последовательности, таблица функций не требует модификации, только обновление данных в базе данных. То же самое можно сказать и о данных анализа, которые также можно хранить в Chado.
Существующие основные модули Чадо:
- последовательность - для последовательностей / функций
- cv - для контролируемых словарей / онтологий
- общие - в настоящее время просто dbxrefs
- организм - таксономические данные
- pub - публикации и ссылки
- companalysis - дополняет модуль последовательности данными вычислительного анализа
- map - карты непоследовательности
- генетико-генетические и фенотипические данные
- выражение - экспрессия гена
- естественное разнообразие - данные о населении
Программное обеспечение [ править ]
Полный список компонентов программного обеспечения GMOD находится на странице компонентов GMOD. Эти компоненты включают:
|
Участвующие базы данных [ править ]
Следующие ниже базы данных организмов вносят свой вклад и / или принимают компоненты GMOD для баз данных модельных организмов.
АНИСИД | АнтоноспораДБ | Арабидопсис |
Beebase | BeetleBase [4] | База данных генома крупного рогатого скота (BGD) |
BioHealthBase | Просмотрщик QTL Bovine | База данных генов EST крупного рогатого скота |
CGD | CGL | ChromDB |
Проект аннотации хромосомы 7 | CSHLmpd | База данных геномных вариантов |
DictyBase [5] | ДРОСПЕГ | EcoCyc |
FlyBase | Сравнительная геномика грибов | Обозреватель теломер грибков |
Браузер Gallus Genome | GeneDB | GrainGenes |
Gramene | HapMap | Человек 2q33 |
База данных сегментарного дублирования генома человека | IVDB | МАГИ |
Базы данных по морским биологическим лабораторным организмам | Информатика генома мыши | База данных сегментарного дублирования, отличная от человека |
OMAP | OryGenesDB | Oryza Хромосома 8 |
Инструменты пути | ParameciumDB [6] | АрахисКарта |
РастенияDB | PlasmoDB | PomBase |
PseudoCAP | PossumBase | PUMAdb |
База данных генома крысы | База данных генома Saccharomyces | SGD Lite |
SmedDB | Сеть Sol Genomics | Soybase |
База данных Soybean Gbrowse | T1DBase | Информационный ресурс по арабидопсису |
TGD | Институт генома | Институт геномных исследований |
Браузер генома риса TIGR | ToxoDB | TriAnnot BAC Viewer |
VectorBase | wFleaBase [7] | WormBase |
XanthusBase | Xenbase |
Связанные проекты [ править ]
- Bioperl , BioJava , Biopython , BioRuby и др.
- Ансамбль
- Генная онтология
- DAS
- Единая схема геномики
- Ламантин: ручной инструмент аннотации
- Biocurator.org
- Открытые биомедицинские онтологии
- Проект онтологии последовательности
См. Также [ править ]
- Биологическая база данных
- Геномный проект
- Геномика
- Геном
- Genome Compiler - универсальная программная платформа для проектирования и визуализации ДНК, управления данными и совместной работы.
Ссылки [ править ]
- ^ Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример из практики Чадо: модульная схема на основе онтологии для представления биологической информации, связанной с геномом» . Биоинформатика . 23 (13): i337 – i346. DOI : 10.1093 / биоинформатики / btm189 . PMID 17646315 .
- ^ Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельного организма» . Genome Res . 12 (10): 1599–610. DOI : 10.1101 / gr.403602 . PMC 187535 . PMID 12368253 .
- ^ Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.» . Исследования нуклеиновых кислот . 44 (W1): W3 – W10. DOI : 10.1093 / NAR / gkw343 . PMC 4987906 . PMID 27137889 .
- ^ Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). "BeetleBase: база данных модельных организмов Tribolium castaneum" . Nucleic Acids Res . 35 (Выпуск базы данных): D476–9. DOI : 10.1093 / NAR / gkl776 . PMC 1669707 . PMID 17090595 .
- ^ Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum" . Nucleic Acids Res . 34 (Выпуск базы данных): D423–7. DOI : 10.1093 / NAR / gkj090 . PMC 1347453 . PMID 16381903 .
- ^ Арнаис О; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными» . Nucleic Acids Res . 35 (выпуск базы данных): D439–44. DOI : 10.1093 / NAR / gkl777 . PMC 1669747 . PMID 17142227 .
- ^ Colbourne JK; Singan VR; Гилберт Д.Г. (2005). «wFleaBase: база данных генома дафний» . BMC Bioinformatics . 6 : 45. DOI : 10,1186 / 1471-2105-6-45 . PMC 555599 . PMID 15752432 .
Внешние ссылки [ править ]
- Сайт GMOD