Из Википедии, бесплатной энциклопедии
  (Перенаправлено из биологических баз )
Перейти к навигации Перейти к поиску
Домашняя страница биологической базы данных STRING, которая описывает функциональные связи между белками. [1]

Биологические базы данных - это библиотеки информации о биологических науках, собранной в результате научных экспериментов, опубликованной литературы, технологий высокопроизводительных экспериментов и компьютерного анализа. [ необходима цитата ] Они содержат информацию из областей исследований, включая геномику , протеомику , метаболомику , экспрессию генов микрочипов и филогенетику . [2] Информация, содержащаяся в биологических базах данных, включает функцию генов, структуру, локализацию (как клеточную, так и хромосомную), клинические эффекты мутаций, а также сходство биологических последовательностей и структур.

Биологические базы данных можно в целом разделить на базы данных последовательностей, структур и функциональных возможностей. Последовательности нуклеиновых кислот и белков хранятся в базах данных последовательностей, а в базах данных структур хранятся решенные структуры РНК и белков. Функциональные базы данных предоставляют информацию о физиологической роли генных продуктов, например об активности ферментов, мутантных фенотипах или биологических путях. Базы данных модельных организмов - это функциональные базы данных, которые предоставляют данные по конкретным видам. Базы данных являются важными инструментами в деле оказания помощи ученых проанализировать и объяснить множество биологических явлений от структуры биомолекул и их взаимодействие, на весь метаболизм организмов и для понимания эволюции из видов. Эти знания помогают облегчить борьбу с болезнями, помогают в разработке лекарств , предсказании определенных генетических заболеваний и обнаружении основных взаимосвязей между видами в истории жизни .

Биологические знания распределены по множеству различных общих и специализированных баз данных. Иногда это затрудняет обеспечение согласованности информации. Интегративная биоинформатика - одна из областей, пытающихся решить эту проблему путем предоставления унифицированного доступа. Одно из решений состоит в том, как биологические базы данных перекрестно ссылаются на другие базы данных с инвентарными номерами, чтобы связать связанные с ними знания вместе.

Концепции реляционных баз данных в информатике и концепции поиска информации в электронных библиотеках важны для понимания биологических баз данных. Проектирование, разработка и долгосрочное управление биологической базой данных - это основная область биоинформатики . [3] Содержимое данных включает последовательности генов, текстовые описания, атрибуты и классификации онтологий , цитаты и табличные данные. Они часто описываются как полуструктурированные данные и могут быть представлены в виде таблиц, записей с разделителями ключами и XML-структур.

Проблема с базой данных исследований нуклеиновых кислот [ править ]

Важным ресурсом для поиска биологических баз данных является специальный ежегодный выпуск журнала Nucleic Acids Research (NAR). Выпуск базы данных NAR находится в свободном доступе и классифицирует многие общедоступные онлайн-базы данных, связанные с биологией и биоинформатикой . В сопутствующей базе данных, называемой «Коллекция баз данных онлайн-молекулярной биологии», содержится 1380 онлайн-баз данных. [4] Существуют и другие коллекции баз данных, такие как MetaBase и Коллекция ссылок на биоинформатику. [5] [6]

Доступ [ редактировать ]

Большинство биологических баз данных доступно через веб-сайты, которые систематизируют данные таким образом, чтобы пользователи могли просматривать их в Интернете. Кроме того, базовые данные обычно доступны для загрузки в различных форматах. Биологические данные бывают разных форматов. Эти форматы включают текст, данные о последовательностях, структуру белка и ссылки. Каждый из них можно найти в определенных источниках, например:

  • Текстовые форматы предоставляются PubMed и OMIM .
  • Данные о последовательностях предоставлены GenBank с точки зрения ДНК и UniProt с точки зрения белка.
  • Белковые структуры предоставлены PDB , SCOP и CATH .

Базы данных по конкретным видам [ править ]

Базы данных по конкретным видам доступны для некоторых видов, в основном тех, которые часто используются в исследованиях ( модельные организмы ). Например, EcoCyc - это база данных E. coli . Другие популярные базы данных модельных организмов включают информацию о геноме мыши для лабораторных мышей , Mus musculus , базу данных генома крыс для Rattus , ZFIN для Danio Rerio (рыбок данио), PomBase [7] для делящихся дрожжей Schizosaccharomyces pombe , FlyBase для Drosophila , WormBaseдля нематод Caenorhabditis elegans и Caenorhabditis briggsae и Xenbase для лягушек Xenopus tropicalis и Xenopus laevis .

См. Также [ править ]

  • Биобанк
  • Биологические данные
  • Химическая база данных
  • База данных домена смерти
  • Европейский институт биоинформатики
  • База данных генных болезней
  • Интегративная биоинформатика
  • Список биологических баз данных
  • Базы данных модельных организмов
  • NCBI
  • PubMed (база данных биомедицинской литературы)

Ссылки [ править ]

  1. ^ Szklarczyk D; Franceschini A; Kuhn M; и другие. (Январь 2011 г.). «База данных STRING в 2011 году: сети функционального взаимодействия белков, глобально интегрированные и оцененные» . Nucleic Acids Res . 39 (выпуск базы данных): D561–8. DOI : 10.1093 / NAR / gkq973 . PMC  3013807 . PMID  21045058 .
  2. ^ Альтман РБ (март 2004 г.). «Создание успешных биологических баз данных» . Краткий. Биоинформатика . 5 (1): 4–5. DOI : 10.1093 / bib / 5.1.4 . PMID 15153301 . 
  3. Bourne P (август 2005 г.). «Будет ли биологическая база данных отличаться от биологического журнала?» . PLOS Comput. Биол . 1 (3): 179–81. Bibcode : 2005PLSCB ... 1 ... 3 . DOI : 10.1371 / journal.pcbi.0010034 . PMC 1193993 . PMID 16158097 .  
  4. ^ Гальперин М.Ю. Фернандес-Суарес XM (январь 2012 г.). «Выпуск базы данных исследований нуклеиновых кислот 2012 года и онлайн-сборник базы данных по молекулярной биологии» . Nucleic Acids Res . 40 (выпуск базы данных): D1–8. DOI : 10.1093 / NAR / gkr1196 . PMC 3245068 . PMID 22144685 .  
  5. ^ Bolser DM; Chibon PY; Palopoli N; и другие. (Январь 2012 г.). «MetaBase - wiki-база биологических баз данных» . Nucleic Acids Res . 40 (выпуск базы данных): D1250–4. DOI : 10.1093 / NAR / gkr1099 . PMC 3245051 . PMID 22139927 .  
  6. ^ Brazas MD; Yim DS; Yamada JT; Ouellette BF (июль 2011 г.). «Обновление Каталога ссылок по биоинформатике 2011 г .: больше ресурсов, инструментов, баз данных и функций для расширения возможностей сообщества биоинформатиков» . Nucleic Acids Res . 39 (выпуск веб-сервера): W3–7. DOI : 10.1093 / NAR / gkr514 . PMC 3125814 . PMID 21715385 .  
  7. ^ Замок, А; Резерфорд, К; Харрис, Массачусетс; Hayles, J; Оливер SG; Bähler, J; Вуд, V (13 октября 2018 г.). «PomBase 2018: управляемая пользователем повторная реализация базы данных о делящихся дрожжах обеспечивает быстрый и интуитивно понятный доступ к разнообразной, взаимосвязанной информации» . Исследования нуклеиновых кислот . 47 (D1): D821 – D827. DOI : 10.1093 / NAR / gky961 . PMC 6324063 . PMID 30321395 .  

Внешние ссылки [ править ]

  • Интерактивный список биологических баз данных , классифицированный по категориям, из Nucleic Acids Research , 2010
  • DBD: База данных биологических баз данных
  • Биошаринг (база биологических баз данных)