Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Национальный центр биотехнологической информации ( NCBI ) [1] [2] является частью Национальной библиотеки США медицины (NLM), филиал Национального института здоровья (NIH). Он одобрен и финансируется правительством США . NCBI находится в Бетесде, штат Мэриленд, и был основан в 1988 году в соответствии с законодательством, спонсируемым сенатором Клодом Пеппером .

NCBI содержит ряд баз данных, относящихся к биотехнологии и биомедицине, и является важным ресурсом для инструментов и услуг в области биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных по биомедицинской литературе. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . NCBI был направлен Дэвид Липмана , [2] один из первоначальных авторов BLAST программы выравнивания последовательностей [3] и широко уважаемая фигура в биоинформатики. Он также руководил внутренней исследовательской программой, в которую входили группы под руководством Стивена Альтшула (еще один соавтор BLAST ), Дэвида Ландсмана, Юджина Кунина , Джона Уилбура, Терезы Пржитицкой и Чжийонг Лу. Дэвид Липман ушел со своего поста в мае 2017 года. [4]

GenBank [ править ]

NCBI отвечал за предоставление доступа к базе данных последовательностей ДНК GenBank с 1992 года. [5] GenBank координирует работу с отдельными лабораториями и другими базами данных последовательностей, такими как Европейская лаборатория молекулярной биологии (EMBL) и Банк данных ДНК Японии (DDBJ). [5]

С 1992 года NCBI расширился, чтобы предоставить другие базы данных в дополнение к GenBank. NCBI предоставляет ген , онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (трехмерные структуры белков), dbSNP (база данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии , а также координаты с Национальным институтом рака для обеспечения проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификационный номер таксономии) каждому виду организмов. [6]

NCBI имеет программные инструменты, которые доступны через интернет-браузеры или по FTP. Например, BLAST - это программа поиска сходства последовательностей. BLAST может выполнять сравнение последовательностей с базой данных ДНК GenBank менее чем за 15 секунд.

Книжная полка NCBI [ править ]

Книжная полка NCBI [7] представляет собой собрание свободно доступных, загружаемых он-лайн версий избранных биомедицинских книг. Книжная полка охватывает широкий круг тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг являются онлайн-версиями ранее опубликованных книг, а другие, например, « Перерыв на кофе» , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к репозиторию Entrez PubMed рецензируемых публикаций.рефераты в содержимом этой книжной полки предоставляют устоявшиеся взгляды на развивающиеся области исследования и контекст, в котором можно организовать множество разрозненных отдельных частей опубликованных исследований. [ необходима цитата ]

Базовый инструмент поиска местного выравнивания (BLAST) [ править ]

BLAST - это алгоритм, используемый для вычисления сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. [8]BLAST - это мощный инструмент для поиска последовательностей, похожих на последовательность запроса, в одном и том же организме или в разных организмах. Он ищет последовательность запросов в базах данных и на серверах NCBI и отправляет результаты обратно в браузер пользователя в выбранном формате. Последовательности ввода в BLAST в основном имеют формат FASTA или Genbank, в то время как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML - это формат вывода по умолчанию для веб-страницы NCBI. Результаты для NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющих соответствующие данные для оценки, а также сопоставления для интересующей последовательности и совпадений, полученных с аналогичными оценками BLAST для них [9 ]

Entrez [ править ]

Система поиска Entrez Global Query между базами данных используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, структуры белков, PubMed, таксономия, полные геномы, OMIM и некоторые другие. [10] Entrez - это система индексации и поиска, содержащая данные из различных источников для биомедицинских исследований. NCBI распространила первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank., белковые последовательности из SWISS-PROT, переведенные GenBank, PIR, PRF, PDB, а также соответствующие отрывки и цитаты из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и систему поиска, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. [11]

Джин [ править ]

Ген был внедрен в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных гомологии. Каждой записи гена присваивается уникальный GeneID, за которым можно следить в циклах пересмотра. Генные записи для известных или предсказанных генов устанавливаются здесь и разграничены позиции карты или нуклеотидных последовательностей. Gene имеет несколько преимуществ по сравнению со своим предшественником, LocusLink, включая лучшую интеграцию с другими базами данных в NCBI, более широкий таксономический охват и расширенные возможности для запроса и поиска, предоставляемые системой Entrez. [12]

Белок [ править ]

База данных белков поддерживает текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB / SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML, и связаны с другими ресурсами NCBI. Protein предоставляет пользователям релевантные данные, такие как гены, последовательности ДНК / РНК, биологические пути, данные об экспрессии и вариациях, а также литературу. Он также предоставляет заранее определенные наборы подобных и идентичных белков для каждой последовательности, вычисленные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI. База данных консервативных доменов ( CDD) белка содержит профили последовательностей, которые характеризуют высококонсервативные домены в белковых последовательностях. Он также содержит записи из внешних ресурсов, таких как SMART и Pfam . В белке есть еще одна база данных, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, которые сгруппированы в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. [13]

База данных Pubchem [ править ]

База данных PubChem NCBI является общедоступным ресурсом для молекул и их активности в отношении биологических тестов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . [14]

См. Также [ править ]

  • Банк данных ДНК Японии (DDBJ)
  • Европейский институт биоинформатики (EBI)

Ссылки [ править ]

  1. ^ «Проект генома человека» . Нью-Йорк Таймс .
  2. ^ a b «Исследовательский институт размещает данные о генах в Интернете» . Нью-Йорк Таймс . 26 июня 1997 г.
  3. ^ «Смысл от последовательностей: Стивен Ф. Альтшул на улучшении BLAST» . 2000. Архивировано из оригинала на 2007-10-07.
  4. ^ "Национальная медицинская библиотека объявляет об уходе директора NCBI доктора Дэвида Липмана" . www.nlm.nih.gov . Проверено 6 мая 2017 .
  5. ^ a b Мизрахи, Илен (22 августа 2007 г.). GenBank: База данных нуклеотидных последовательностей . Национальный центр биотехнологической информации (США) - через www.ncbi.nlm.nih.gov.
  6. ^ «Главная - Таксономия - NCBI» . www.ncbi.nlm.nih.gov .
  7. ^ США (2019-05-06). «Главная - Книги - NCBI» . Ncbi.nlm.nih.gov . Проверено 12 июня 2019 .
  8. ^ Altschul Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. DOI : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 . 
  9. Мэдден Т. (2002). Справочник NCBI, 2-е издание, глава 16, Инструмент анализа последовательности BLAST
  10. ^ Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследование нуклеиновых кислот 41 (выпуск базы данных): D8 – D20.
  11. ^ Ostell J. (2002). Справочник NCBI, 2-е издание, глава 15, Система поиска и поиска Entrez
  12. ^ Maglott Д. Прюитт К. & Tatusova Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: справочник генов
  13. Перейти ↑ Sayers E. (2013). Справочник NCBI, 2-е издание, NCBI Protein Resources
  14. Перейти ↑ Wang Y. & Bryant S H. (2014). Справочник NCBI, 2-е издание, База данных NCBI PubChem BioAssay

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Национальная медицинская библиотека
  • Национальные институты здоровья