Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Биологические базы данных - это хранилища биологической информации. [1] Журнал Nucleic Acids Research регулярно публикует специальные выпуски по биологическим базам данных и содержит список таких баз данных. В выпуске 2018 года список из около 180 таких баз и обновлений ранее описанных баз. [2]

Мета-базы данных [ править ]

Мета-базы данных - это базы данных баз данных, которые собирают данные о данных для генерации новых данных. Они способны объединять информацию из разных источников и делать ее доступной в новой и более удобной форме или с акцентом на конкретное заболевание или организм. [База метаданных - это модель базы данных для управления метаданными, глобального запроса независимой базы данных и распределенной базы данных. обработка данных. Слово «база метаданных» является дополнением к словарю]. Первоначально метаданные были обычным термином, относящимся просто к данным о данных, таких как теги, ключевые слова и заголовки разметки.


Базы данных модельных организмов [ править ]

Базы данных модельных организмов предоставляют подробные биологические данные для интенсивного изучения.

Базы данных нуклеиновых кислот [ править ]

Базы данных ДНК [ править ]

Первичные базы данных
Международная база данных нуклеотидных последовательностей (INSD) состоит из следующих баз данных.

DDBJ (Япония), GenBank (США) и European Nucleotide Archive (Европа) являются хранилищами данных нуклеотидных последовательностей всех организмов . Все три принимают представления нуклеотидных последовательностей, а затем ежедневно обмениваются новыми и обновленными данными для достижения оптимальной синхронизации между ними. Эти три базы данных являются первичными, поскольку содержат исходные данные о последовательностях. Они сотрудничают с Sequence Read Archive (SRA), который архивирует необработанные считывания с высокопроизводительных инструментов секвенирования.

Вторичные базы данных

  • База данных 23andMe
  • HapMap
  • OMIM (Online Mendelian Inheritance in Man): наследственные заболевания
  • RefSeq
  • Проект «1000 геномов» : запущен в январе 2008 года. Были проанализированы и опубликованы геномы более тысячи анонимных участников из ряда различных этнических групп.
  • База данных EggNOG: иерархический, функционально и филогенетически аннотированный ресурс по ортологии, основанный на 5090 организмах и 2502 вирусах. Он обеспечивает множественные выравнивания последовательностей и деревья максимального правдоподобия, а также широкую функциональную аннотацию. [4] [5]

Базы данных экспрессии генов (в основном данные микрочипов) [ править ]

Базы данных генома

Эти базы данных собирают последовательности генома , аннотируют и анализируют их и предоставляют открытый доступ. Некоторые добавляют кураторство экспериментальной литературы для улучшения вычисляемых аннотаций. Эти базы данных могут содержать геномы многих видов или один модельный геном организма .

  • ArrayExpress: [6] архив данных функциональной геномики; хранит данные высокопроизводительных экспериментов по функциональной геномике из EMBL
  • Биоинформатический комбайн
  • Ensembl : обеспечивает автоматические базы данных аннотаций для геномов человека, мыши, других позвоночных и эукариот
  • Ensembl Genomes : предоставляет данные в масштабе генома для бактерий, простейших, грибов, растений и беспозвоночных многоклеточных животных через унифицированный набор интерактивных и программных интерфейсов (с использованием программной платформы Ensembl)
  • FlyBase : геном модельного организма Drosophila melanogaster
  • База данных генных болезней
  • Омнибус экспрессии генов (GEO [7] ): общедоступный репозиторий функциональных геномных данных Национального института рака США (NCI), который поддерживает данные на основе массивов и последовательностей. Предоставляются инструменты для запроса и загрузки профилей экспрессии генов.
  • Атлас белков человека (HPA [8] ): общедоступная база данных с профилями экспрессии генов, кодирующих человеческий белок, как на уровне мРНК, так и на уровне белка в тканях, клетках, субклеточных компартментах и ​​раковых опухолях.
  • Информационная система по бобовым (LIS): геномная база данных для семейства бобовых [9]
  • Проект «Персональный геном» : человеческие геномы 100 000 добровольцев со всего мира
  • RGD ( База данных генома крыс ): данные генома и фенотипа Rattus norvegicus
  • База данных генома Saccharomyces : [10] геном модельного дрожжевого организма.
  • SNPedia
  • База данных SoyBase [11] (SoyBase): генетика и геномная база данных сои Министерства сельского хозяйства США (Soybean )
  • Браузер генома малярии UCSC : геном видов, вызывающих малярию ( Plasmodium falciparum и другие)
  • Wormbase : геном модельного организма Caenorhabditis elegans и WormBase ParaSite для паразитических видов
  • Xenbase : геном модельного организма Xenopus tropicalis и Xenopus laevis
  • Информационная сеть по рыбкам данио : геном этой модельной рыбы

Базы данных фенотипов [ править ]

  • PHI-base : база данных взаимодействия патоген-хозяин. Он связывает информацию о генах с фенотипической информацией от микробных патогенов на их хозяевах. Информация подбирается вручную из рецензируемой литературы.
  • База данных генома крыс RGD : данные о геноме и фенотипе Rattus norvegicus
  • База данных PomBase : собранные вручную фенотипические данные дрожжей Schizosaccharomyces pombe

Базы данных РНК [ править ]

  • miRBase : база данных микроРНК
  • Rfam : база данных семейств РНК

Базы данных аминокислот / белков [ править ]

Базы данных последовательностей белков [ править ]

  • DisProt : база данных экспериментальных доказательств расстройства в белках ( Indiana University School Медицины , Университет Темпл , Университет Падуи )
  • InterPro : классифицирует белки по семействам и прогнозирует наличие доменов и сайтов
  • MobiDB : аннотация базы данных по внутренним нарушениям белков ( Падуанский университет )
  • neXtProt : ресурс знаний, ориентированный на человеческий белок
  • Pfam : база данных выравниваний и HMM семейств белков ( Институт Сэнгера )
  • ОТПЕЧАТКИ : сборник белковых отпечатков пальцев от ( Манчестерского университета )
  • ПРОФИЛЬ : база данных семейств и доменов белков
  • Информационный ресурс о белках ( Медицинский центр Джорджтаунского университета [GUMC])
  • SUPERFAMILY : библиотека HMM, представляющих суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
  • Swiss-Prot : база знаний о белках ( Швейцарский институт биоинформатики )
  • NCBI : последовательность белков и база знаний (Национальный центр биотехнологической информации)

Базы данных структуры белков [ править ]

  • Банк данных белков (PDB), содержащий:
    • Банк данных по белкам в Европе (PDBe) [12]
    • ProteinDatabank в Японии (PDBj) [13]
    • Исследовательское сотрудничество в области структурной биоинформатики (RCSB) [14]
  • Структурная классификация белков (SCOP)
  • CATH  : База данных классификации структуры белков

Для получения дополнительных баз данных структуры белков см. Также База данных структуры белков .

Базы данных моделей белков [ править ]

  • ModBase : база данных сравнительных моделей структуры белков ( Sali Lab, UCSF )
  • Матрица сходства белков ( SIMAP ): база данных сходства белков, вычисленная с помощью FASTA
  • Swiss-model : сервер и репозиторий для моделей структуры белков
  • AAindex : база данных аминокислотных индексов, матриц аминокислотных мутаций и потенциалов парных контактов

Белковые и другие молекулярные взаимодействия [ править ]

  • BioGRID : общий репозиторий для наборов данных взаимодействия ( Исследовательский институт Самуэля Луненфельда )
  • База данных РНК-связывающих белков
  • База данных взаимодействующих белков ( Калифорнийский университет )
  • IntAct : [15] [16] база данных с открытым исходным кодом для молекулярных взаимодействий ( EMBL-EBI )

Базы данных экспрессии белков [ править ]

  • Атлас белков человека : нацелен на отображение всех белков человека в клетках, тканях и органах.

Базы данных путей передачи сигналов [ править ]

  • База данных взаимодействия NCI-Nature Pathway
  • Netpath : курируемый ресурс путей передачи сигналов у людей
  • Reactome : навигационная карта биологических путей человека, начиная от метаболических процессов и кончая гормональными сигналами ( Институт онкологических исследований Онтарио , Европейский институт биоинформатики , Медицинский центр Нью-Йоркского университета в Лангоне , лаборатория Колд-Спринг-Харбор )
  • WikiPathways

Базы данных о метаболических путях и функциях белков [ править ]

  • Коллекция баз данных BioCyc : включает EcoCyc и MetaCyc
  • BRENDA : комплексная информационная система по ферментам, включая FRENDA, AMENDA, DRENDA и KENDA.
  • HMDB : содержит подробную информацию о низкомолекулярных метаболитах, обнаруженных в организме человека.
  • База данных KEGG PATHWAY ( Университет Киото )
  • База данных MANET ( Университет Иллинойса )
  • Reactome : навигационная карта биологических путей человека, начиная от метаболических процессов и кончая гормональными сигналами ( Институт онкологических исследований Онтарио , Европейский институт биоинформатики , Медицинский центр Нью-Йоркского университета в Лангоне , лаборатория Колд-Спринг-Харбор )
  • САБИО-РК : база данных биохимических реакций и их кинетических свойств
  • WikiPathways

Дополнительные базы данных [ править ]

Экзосомные базы данных [ править ]

  • ExoCarta
  • Атлас внеклеточной РНК: хранилище профилей малых РНК-seq и qPCR exRNA из биожидкостей человека и мыши

Базы данных математических моделей [ править ]

  • База данных биомоделей : опубликованные математические модели, описывающие биологические процессы

Таксономические базы данных [ править ]

  • BacDive : бактериальная база метаданных, которая предоставляет связанную с штаммами информацию о бактериальном и архейном биоразнообразии, включая информацию о таксономии
  • EzTaxon-e : база данных для идентификации прокариот на основе последовательностей гена рибосомной РНК 16S

Радиологические базы данных [ править ]

  • Архив изображений рака (TCIA)
  • Информационный центр инструментов и ресурсов для нейровизуализации и информатики

Базы данных по устойчивости к противомикробным препаратам [ править ]

  • AMRFinderPlus
  • База данных антимикробных препаратов (AMDD)
  • ARDB
  • ARGminer
  • BacMet
  • База данных бета-лактамаз (BLAD)
  • База данных бета-лактамаз (BLDB)
  • CBMAR
  • Полная база данных по устойчивости к антибиотикам
  • EARS-Net
  • ФЕРМА
  • ИНТЕГРАЛ
  • ЛАКЕД
  • МЕГАРЫ
  • MUBII-TB-DB
  • База данных горчицы
  • MvirDB
  • PathoPhenoDB
  • База данных PATRIC
  • RAC: Хранилище кассет устойчивости к антибиотикам
  • ResFinder
  • TBDReaMDB
  • u-CARE
  • VFDB

Базы данных в стиле вики [ править ]

  • Джин Вики
  • WikiProfessional

Специализированные базы данных [ править ]

  • Штрих-код Life Data Systems : база данных штрих-кодов ДНК
  • Атлас генома рака (TCGA): предоставляет данные из сотен образцов рака, полученных с использованием высокопроизводительных методов, таких как профилирование экспрессии генов, профилирование вариаций числа копий, генотипирование SNP, профилирование метилирования ДНК по всему геному, профилирование микроРНК и секвенирование экзонов минимум 1200 генов
  • Целлозавр : ресурс знаний о клеточных линиях
  • CTD ( база данных сравнительной токсикогеномики ): описывает химические взаимодействия генов и болезней.
  • DiProDB : база данных для сбора и анализа термодинамических, структурных и других свойств динуклеотидов
  • Атлас служебных и справочных транскриптов (Атлас HRT) [17] веб-инструмент для поиска специфичных для клеток-кандидатов референсных генов / транскриптов, подходящих для нормализации эксперимента qPCR. HRT Atlas также описывает полный список генов и транскриптов домашнего хозяйства человека и мыши.
  • Дриада : хранилище данных, лежащих в основе научных публикаций в фундаментальных и прикладных биологических науках.
  • Эдинбургский Атлас Мышей
  • База данных эукариотических промоторов EPD
  • FINDbase (база данных частоты наследственных заболеваний)
  • GigaDB : хранилище крупномасштабных наборов данных, лежащих в основе научных публикаций в области биологических и биомедицинских исследований
  • HGNC (Комитет по номенклатуре генов HUGO): ресурс для утвержденной номенклатуры генов человека
  • Международный консорциум эпигенома человека : [18] объединяет эпигеномные справочные данные из хорошо известных национальных проектов, таких как Канадский CEEHRC, [19] European Blueprint, [20] Европейский архив генома-феномена (EGA [21] ), US ENCODE и дорожная карта NIH. , Немецкий DEEP, [22] японский CREST, [23] корейский KNIH, сингапурский GIS и китайский EpiHK [24]
  • MethBase : база данных данных о метилировании ДНК, визуализированная в браузере генома UCSC.
  • Minimotif Miner : база данных коротких смежных функциональных пептидных мотивов
  • Онкогеномные базы данных : сборник баз данных, служащих для исследований рака.
  • PubMed : ссылки и рефераты по наукам о жизни и биомедицине
  • Интегрированная база данных по млекопитающим RIKEN
  • TDR Targets : база данных хемогеномики, посвященная открытию лекарств от тропических болезней
  • TRANSFAC : база данных о факторах транскрипции эукариот, их сайтах связывания генома и профилях связывания ДНК
  • JASPAR : база данных вручную созданных неизбыточных профилей связывания факторов транскрипции.
  • MetOSite : база данных о сайтах сульфоксидации метионина и его функциональной роли в белках [25]
  • Проект затрат и использования здравоохранения (HCUP) - это крупнейший сборник данных о больничном лечении в Соединенных Штатах. Он включает сотни миллионов записей в стационарных, амбулаторных и неотложных случаях.

Ссылки [ править ]

  1. ^ Wren JD, Bateman A (октябрь 2008). «Базы данных, данные могилы и пыль на ветру» . Биоинформатика . 24 (19): 2127–8. DOI : 10.1093 / биоинформатики / btn464 . PMID  18819940 .
  2. ^ "Том 46, выпуск D1 | Исследование нуклеиновых кислот | Oxford Academic" . Acade.oup.com . Проверено 4 сентября 2018 .
  3. ^ Замок, А; Резерфорд, К; Харрис, Массачусетс; Hayles, J; Оливер SG; Bähler, J; Вуд, V (13 октября 2018 г.). «PomBase 2018: управляемая пользователем повторная реализация базы данных о делящихся дрожжах обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации» . Исследования нуклеиновых кислот . 47 (D1): D821 – D827. DOI : 10.1093 / NAR / gky961 . PMC 6324063 . PMID 30321395 .  
  4. ^ Пауэлл, Шон; Форслунд, Кристоффер; Шкларчик, Дамиан; Трачана, Каллиопи; Рот, Александр; Уэрта-Сепас, Хайме; Габальдон, Тони; Раттей, Томас; Криви, Крис; Кун, Майкл; Дженсен, Ларс Дж. (01.12.2013). «eggNOG v4.0: вывод вложенной ортологии для 3686 организмов» . Исследования нуклеиновых кислот . 42 (D1): D231 – D239. DOI : 10.1093 / NAR / gkt1253 . ISSN 0305-1048 . PMC 3964997 . PMID 24297252 .   
  5. ^ Уэрта-Сепас, Хайме; Шкларчик, Дамиан; Хеллер, Давиде; Эрнандес-Плаза, Ана; Форслунд, София К; Повар, Хелен; Mende, Daniel R; Летунич, Ивица; Раттей, Томас; Дженсен, Ларс Дж; фон Меринг, Кристиан (2018-11-12). «eggNOG 5.0: иерархический, функционально и филогенетически аннотированный ортологический ресурс на основе 5090 организмов и 2502 вирусов» . Исследования нуклеиновых кислот . 47 (D1): D309 – D314. DOI : 10.1093 / NAR / gky1085 . ISSN 0305-1048 . PMC 6324079 . PMID 30418610 .   
  6. ^ ArrayExpress
  7. ^ ГЕО
  8. ^ "Атлас человеческого белка" . www.proteinatlas.org . Проверено 27 мая 2019 .
  9. ^ Dash S, Кэмпбелл JD, Кэннон EK, Клири AM, Хуанг W, Kalberer SR, Karingula V, Rice AG, Singh J, Umale PE, Weeks NT, Wilkey AP, Farmer AD, Cannon SB (январь 2016). «Информационная система по бобовым (LegumeInfo.org): ключевой компонент набора объединенных ресурсов данных для семейства бобовых» . Исследования нуклеиновых кислот . 44 (D1): D1181-8. DOI : 10.1093 / NAR / gkv1159 . PMC 4702835 . PMID 26546515 .  
  10. ^ "База данных генома Saccharomyces | SGD" . www.yeastgenome.org . Проверено 4 сентября 2018 .
  11. ^ Грант, Дэвид; Нельсон, Рекс Т .; Кэннон, Стивен Б.; Шумейкер, Рэнди С. (2010). «SoyBase, база данных по генетике и геномике сои USDA-ARS» . Исследования нуклеиновых кислот . 38 (Дополнение 1) (Выпуск базы данных): D843 – D846. DOI : 10.1093 / NAR / gkp798 . PMC 2808871 . PMID 20008513 .  
  12. ^ Mir S, Alhroub Y, Anyango S, Armstrong DR, Berrisford JM, Clark AR, Conroy MJ, Dana JM, Deshpande M, Gupta D, Gutmanas A, Haslam P, Mak L, Mukhopadhyay A, Nadzirin N, Paysan-Lafosse T. , Sehnal D, Sen S, Smart OS, Varadi M, Kleywegt GJ, Velankar S (январь 2018 г.). «PDBe: к многоразовой инфраструктуре доставки данных в банке данных белков в Европе» . Исследования нуклеиновых кислот . 46 (D1): D486 – D492. DOI : 10.1093 / NAR / gkx1070 . PMC 5753225 . PMID 29126160 .  
  13. ^ Киндзо А.Р., Беккер ГДж, Сузуки Н, Цутия У, Т Кавабата, Ikegawa Y, Накамура Н (январь 2017 г.). «Protein Data Bank Japan (PDBj): обновленные пользовательские интерфейсы, структура описания ресурсов, инструменты анализа для больших структур» . Исследования нуклеиновых кислот . 45 (D1): D282 – D288. DOI : 10.1093 / NAR / gkw962 . PMC 5210648 . PMID 27789697 .  
  14. ^ Роза PW, Прлич А, Altunkaya А, Би С, Брэдли А.Р., Кристи СН, и др. (Январь 2017 г.). «Банк данных белка RCSB: интегральный взгляд на белок, ген и трехмерную структурную информацию» . Исследования нуклеиновых кислот . 45 (D1): D271 – D281. DOI : 10.1093 / NAR / gkw1000 . PMC 5210513 . PMID 27794042 .  
  15. ^ Hermjakob H., Монтекки-Палацци, Л., Льюингтон, К., Мудали, С., Kerrien, С., сад, С., Vingron, М., Roechert, Б., Roepstorff, P., Valencia, А., Маргалит, Х., Армстронг, Дж., Байрох, А., Чезарени, Г., Шерман, Д., и Апвейлер, Р. (2004). IntAct: база данных молекулярных взаимодействий с открытым исходным кодом. Исследование нуклеиновых кислот, 32 (выпуск базы данных), D452 – D455. https://doi.org/10.1093/nar/gkh052
  16. ^ Kerrien, С., Аранда, Б., Breuza, Л., мост, А., Broackes-Картер, Ф. Чен, К., Duesbury, М., Dumousseau, М., Feuermann, М., Hinz, U., Jandrasits, C., Jimenez, RC, Khadake, J., Mahadevan, U., Masson, P., Pedruzzi, I., Pfeiffenberger, E., Porras, P., Raghunath, A., Roechert, B .,… Hermjakob, H. (2012). База данных по взаимодействию молекул IntAct в 2012 году. Исследование нуклеиновых кислот, 40 (выпуск базы данных), D841 – D846. https://doi.org/10.1093/nar/gkr1088
  17. ^ Hounkpe, Bidossessi Wilfried; Чену, Франсин; де-Лима, Франсьель; Де-Паула, Эрих Винисиус (14.07.2020). «База данных HRT Atlas v1.0: переопределение генов домашнего хозяйства человека и мыши и возможных эталонных транскриптов путем анализа массивных наборов данных RNA-seq» . Исследование нуклеиновых кислот : gkaa609. DOI : 10.1093 / NAR / gkaa609 . ISSN 0305-1048 . PMID 32663312 .  
  18. ^ (IHEC) портал данных
  19. ^ CEEHRC
  20. ^ Чертеж
  21. ^ EGA
  22. ^ ГЛУБОКО
  23. ^ КРЕСТ
  24. ^ «Совместное использование эпигеномов в глобальном масштабе» . Методы природы . 15 (3): 151. 2018. DOI : 10.1038 / nmeth.4630 . ISSN 1548-7105 . 
  25. ^ Вальверде, Эктор; Cantón, Francisco R .; Аледо, Хуан Карлос (2019). «Метосайт: комплексный ресурс по изучению сульфоксидации остатков метионина» . Биоинформатика . 35 (22): 4849–4850. DOI : 10.1093 / биоинформатики / btz462 . PMC 6853639 . PMID 31197322 .  

Внешние ссылки [ править ]

  • Коллекция баз данных молекулярной биологии по исследованиям нуклеиновых кислот - более 1600 баз данных