База данных универсальных модельных организмов

Логотип проекта Базы данных универсальных модельных организмов

Проект Generic Model Organism Database ( GMOD ) предоставляет сообществам биологических исследователей набор программных компонентов с открытым исходным кодом для визуализации, аннотирования, управления и хранения биологических данных. Проект GMOD финансируется Национальным институтом здравоохранения США , Национальным научным фондом и Службой сельскохозяйственных исследований Министерства сельского хозяйства США .

История [ править ]

Проект GMOD был начат в начале 2000-х годов как сотрудничество между несколькими базами данных модельных организмов (MOD), которые разделяли потребность в создании аналогичных программных инструментов для обработки данных из проектов секвенирования. MOD или базы данных по конкретным организмам описывают геном и другую информацию о важных экспериментальных организмах в науках о жизни и фиксируют большие объемы данных и информации, генерируемые современной биологией . Вместо того , чтобы каждая группа проектирования свое собственное программное обеспечение, четыре основных MODs-- FlyBase , Saccharomyces Геном базы данных , Mouse Геном базы данных , и WormBase- работали вместе для создания приложений, которые обеспечивают функциональность, необходимую для всех модов, например, программное обеспечение, помогающее управлять данными в моде, а также помогать пользователям получать доступ к данным и запрашивать их.

Проект GMOD направлен на обеспечение взаимодействия программных компонентов. С этой целью многие инструменты используют общий формат файла ввода / вывода или запускаются из базы данных схемы Chado.

Схема базы данных Chado [ править ]

Схема Чадо ^[1] направлена на охват многих классов данных, часто используемых современными биологами, от генетических данных до филогенетических деревьев, публикаций, организмов, данных микрочипов, идентификаторов и экспрессии РНК / белков. Чадо широко использует контролируемые словари для ввода всех сущностей в базе данных; например: гены, транскрипты, экзоны, мобильные элементы и т. д. хранятся в таблице функций с типом, предоставленным Sequence Ontology . Когда новый тип добавляется в онтологию последовательности, таблица функций не требует модификации, только обновление данных в базе данных. То же самое можно сказать и о данных анализа, которые также можно хранить в Chado.

Существующие основные модули Чадо:

последовательность - для последовательностей / функций
cv - для контролируемых словарей / онтологий
общие - в настоящее время просто dbxrefs
организм - таксономические данные
pub - публикации и ссылки
companalysis - дополняет модуль последовательности данными вычислительного анализа
map - карты непоследовательности
генетико-генетические и фенотипические данные
выражение - экспрессия гена
естественное разнообразие - данные о населении

Программное обеспечение [ править ]

Полный список компонентов программного обеспечения GMOD находится на странице компонентов GMOD. Эти компоненты включают:

GMOD Core (база данных и инструменты Chado)
- Чадо: схема Чадо и инструменты для ее установки.
- XORT: инструмент для загрузки и выгрузки chado-xml
- GMODTools: извлекает данные из базы данных Chado в общие форматы групповых геномов (GFF, Fasta и т. Д.)
Сайт MOD
- Tripal: веб-интерфейс на основе Drupal .
Редактирование и визуализация генома
- Apollo: приложение Java для просмотра и редактирования аннотаций генома
- GBrowse: приложение CGI для отображения аннотаций генома ^[2]
- JBrowse: приложение JavaScript для отображения аннотаций генома
- Pathway Tools : браузер генома со сравнительным режимом
Сравнительная геномика
- GBrowse_syn: программа просмотра synteny на основе GBrowse
- CMap: приложение CGI для отображения сравнительных карт
Литературное руководство
- Textpresso: система интеллектуального анализа текста для научной литературы
Инструменты запросов к базе данных
- BioMart : система управления данными, ориентированная на запросы
- InterMine : система хранилища данных с открытым исходным кодом
Биологические пути
- Pathway Tools: инструменты для получения информации о метаболических путях и анализа данных функциональной геномики с высокой пропускной способностью.
Регулирующие сети
- Инструменты пути: поддерживает определение регуляторных взаимодействий и просмотр регуляторных сетей.
Анализ
- Галактика ^[3]
- ИЗГОТОВИТЕЛЬ

Участвующие базы данных [ править ]

Следующие ниже базы данных организмов вносят свой вклад и / или принимают компоненты GMOD для баз данных модельных организмов.

АНИСИД	АнтоноспораДБ	Арабидопсис
Beebase	BeetleBase ^[4]	База данных генома крупного рогатого скота (BGD)
BioHealthBase	Просмотрщик QTL Bovine	База данных генов EST крупного рогатого скота
CGD	CGL	ChromDB
Проект аннотации хромосомы 7	CSHLmpd	База данных геномных вариантов
DictyBase ^[5]	ДРОСПЕГ	EcoCyc
FlyBase	Сравнительная геномика грибов	Обозреватель теломер грибков
Браузер Gallus Genome	GeneDB	GrainGenes
Gramene	HapMap	Человек 2q33
База данных сегментарного дублирования генома человека	IVDB	МАГИ
Базы данных по морским биологическим лабораторным организмам	Информатика генома мыши	База данных сегментарного дублирования, отличная от человека
OMAP	OryGenesDB	Oryza Хромосома 8
Инструменты пути	ParameciumDB ^[6]	АрахисКарта
РастенияDB	PlasmoDB	PomBase
PseudoCAP	PossumBase	PUMAdb
База данных генома крысы	База данных генома Saccharomyces	SGD Lite
SmedDB	Сеть Sol Genomics	Soybase
База данных Soybean Gbrowse	T1DBase	Информационный ресурс по арабидопсису
TGD	Институт генома	Институт геномных исследований
Браузер генома риса TIGR	ToxoDB	TriAnnot BAC Viewer
VectorBase	wFleaBase ^[7]	WormBase
XanthusBase	Xenbase

Связанные проекты [ править ]

Bioperl , BioJava , Biopython , BioRuby и др.
Ансамбль
Генная онтология
DAS
Единая схема геномики
Ламантин: ручной инструмент аннотации
Biocurator.org
Открытые биомедицинские онтологии
Проект онтологии последовательности

См. Также [ править ]

Биологическая база данных
Геномный проект
Геномика
Геном
Genome Compiler - универсальная программная платформа для проектирования и визуализации ДНК, управления данными и совместной работы.

Ссылки [ править ]

^ Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример из практики Чадо: модульная схема на основе онтологии для представления биологической информации, связанной с геномом» . Биоинформатика . 23 (13): i337 – i346. DOI : 10.1093 / биоинформатики / btm189 . PMID 17646315 .
^ Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельного организма» . Genome Res . 12 (10): 1599–610. DOI : 10.1101 / gr.403602 . PMC 187535 . PMID 12368253 .
^ Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.» . Исследования нуклеиновых кислот . 44 (W1): W3 – W10. DOI : 10.1093 / NAR / gkw343 . PMC 4987906 . PMID 27137889 .
^ Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). "BeetleBase: база данных модельных организмов Tribolium castaneum" . Nucleic Acids Res . 35 (Выпуск базы данных): D476–9. DOI : 10.1093 / NAR / gkl776 . PMC 1669707 . PMID 17090595 .
^ Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum" . Nucleic Acids Res . 34 (Выпуск базы данных): D423–7. DOI : 10.1093 / NAR / gkj090 . PMC 1347453 . PMID 16381903 .
^ Арнаис О; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными» . Nucleic Acids Res . 35 (выпуск базы данных): D439–44. DOI : 10.1093 / NAR / gkl777 . PMC 1669747 . PMID 17142227 .
^ Colbourne JK; Singan VR; Гилберт Д.Г. (2005). «wFleaBase: база данных генома дафний» . BMC Bioinformatics . 6 : 45. DOI : 10,1186 / 1471-2105-6-45 . PMC 555599 . PMID 15752432 .

Внешние ссылки [ править ]

Сайт GMOD

[1] Кристофер Дж. Мунгалл; Дэвид Б. Эммерт; Консорциум FlyBase (2007). «Пример из практики Чадо: модульная схема на основе онтологии для представления биологической информации, связанной с геномом» . Биоинформатика . 23 (13): i337 – i346. DOI : 10.1093 / биоинформатики / btm189 . PMID 17646315 .

[2] Stein LD; Mungall C; Шу С; Caudy M; Mangone M; День А; Никерсон Э; Stajich JE; Харрис TW; Арва А; Льюис С. (2002). «Универсальный браузер генома: строительный блок для базы данных системы модельного организма» . Genome Res . 12 (10): 1599–610. DOI : 10.1101 / gr.403602 . PMC 187535 . PMID 12368253 .

[3] Afgan, E .; Baker, D .; ван ден Бик, М .; Бланкенберг, Д .; Bouvier, D .; Čech, M .; Чилтон, Дж .; Clements, D .; Coraor, N .; Эберхард, С .; Grüning, B .; Guerler, A .; Hillman-Jackson, J .; Von Kuster, G .; Rasche, E .; Soranzo, N .; Турага, Н .; Taylor, J .; Некрутенко, А .; Гокс, Дж. (8 июля 2016 г.). «Платформа Galaxy для доступных, воспроизводимых и совместных биомедицинских анализов: обновление 2016 г.» . Исследования нуклеиновых кислот . 44 (W1): W3 – W10. DOI : 10.1093 / NAR / gkw343 . PMC 4987906 . PMID 27137889 .

[4] Ван Л; Ван С; Li Y; Paradesi MS; Браун SJ. (2007). "BeetleBase: база данных модельных организмов Tribolium castaneum" . Nucleic Acids Res . 35 (Выпуск базы данных): D476–9. DOI : 10.1093 / NAR / gkl776 . PMC 1669707 . PMID 17090595 .

[5] Чисхолм Р.Л .; Gaudet P; Просто ЭМ; Pilcher KE; Фей П; Торговец SN; Kibbe WA. (2006). "dictyBase, база данных модельных организмов Dictyostelium discoideum" . Nucleic Acids Res . 34 (Выпуск базы данных): D423–7. DOI : 10.1093 / NAR / gkj090 . PMC 1347453 . PMID 16381903 .

[6] Арнаис О; Каин С; Коэн Дж; Сперлинг Л. (2007). «ParameciumDB: ресурс сообщества, объединяющий последовательность генома Paramecium tetraurelia с генетическими данными» . Nucleic Acids Res . 35 (выпуск базы данных): D439–44. DOI : 10.1093 / NAR / gkl777 . PMC 1669747 . PMID 17142227 .

[7] Colbourne JK; Singan VR; Гилберт Д.Г. (2005). «wFleaBase: база данных генома дафний» . BMC Bioinformatics . 6 : 45. DOI : 10,1186 / 1471-2105-6-45 . PMC 555599 . PMID 15752432 .

[1]