Из Википедии, бесплатной энциклопедии
  (Перенаправлено из NCBI )
Перейти к навигации Перейти к поиску

Национальный центр биотехнологической информации ( NCBI ) [1] [2] является частью Национальной библиотеки США медицины (NLM), филиал Национального института здоровья (NIH). Он одобрен и финансируется правительством США . NCBI расположен в Бетесде, штат Мэриленд, и был основан в 1988 году в соответствии с законодательством, спонсируемым сенатором Клодом Пеппером .

NCBI содержит ряд баз данных, относящихся к биотехнологии и биомедицине, и является важным источником инструментов и услуг в области биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных по биомедицинской литературе. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . NCBI был направлен Дэвид Липмана , [2] один из первоначальных авторов BLAST программы выравнивания последовательностей [3] и широко уважаемая фигура в биоинформатики. Он также руководил очной исследовательской программой, в которую входили группы под руководством Стивена Альтшула (еще один соавтор BLAST ), Дэвида Ландсмана, Юджина Кунина , Джона Уилбура, Терезы Пржитицка и Чжийонг Лу. Дэвид Липман ушел со своего поста в мае 2017 года. [4]

GenBank [ править ]

NCBI отвечал за предоставление базы данных последовательностей ДНК GenBank с 1992 года. [5] GenBank координирует работу с отдельными лабораториями и другими базами данных последовательностей, такими как Европейская лаборатория молекулярной биологии (EMBL) и Банк данных ДНК Японии (DDBJ). [5]

С 1992 года NCBI расширился, чтобы предоставить другие базы данных в дополнение к GenBank. NCBI предоставляет ген , онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (трехмерные структуры белков), dbSNP (база данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии , а также координаты с Национальным институтом рака для обеспечения проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификационный номер таксономии) каждому виду организмов. [6]

NCBI имеет программные инструменты, которые доступны через интернет-браузеры или по FTP. Например, BLAST - это программа поиска сходства последовательностей. BLAST может сравнивать последовательности с базой данных ДНК GenBank менее чем за 15 секунд.

Книжная полка NCBI [ править ]

Книжная полка NCBI [7] представляет собой собрание свободно доступных загружаемых онлайн-версий избранных биомедицинских книг. Книжная полка охватывает широкий круг тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг являются онлайн-версиями ранее опубликованных книг, а другие, например, « Перерыв на кофе» , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к репозиторию Entrez PubMed рецензируемых публикаций.рефераты в содержании этой книжной полки предоставляют устоявшиеся взгляды на развивающиеся области исследования и контекст, в котором могут быть организованы многие разрозненные отдельные части опубликованных исследований. [ необходима цитата ]

Базовый инструмент поиска местного выравнивания (BLAST) [ править ]

BLAST - это алгоритм, используемый для вычисления сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. [8]BLAST - это мощный инструмент для поиска последовательностей, похожих на последовательность запроса, в одном и том же организме или в разных организмах. Он ищет последовательность запросов в базах данных и на серверах NCBI и отправляет результаты обратно в браузер пользователя в выбранном формате. Последовательности ввода в BLAST в основном имеют формат FASTA или Genbank, тогда как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML - это формат вывода по умолчанию для веб-страницы NCBI. Результаты NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющими соответствующие данные для оценки, наряду с выравниванием для интересующей последовательности и совпадениями, полученными с аналогичными оценками BLAST для них [9 ]

Entrez [ править ]

Система поиска Entrez Global Query между базами данных используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, структуры белков, PubMed, таксономия, полные геномы, OMIM и некоторые другие. [10] Entrez - это система индексации и поиска, содержащая данные из различных источников для биомедицинских исследований. NCBI распространила первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank., белковые последовательности из SWISS-PROT, переведенные GenBank, PIR, PRF, PDB, а также соответствующие выдержки и цитаты из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и поисковую систему, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. [11]

Джин [ править ]

Ген был внедрен в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных гомологии. Каждой записи гена присваивается уникальный GeneID, за которым можно следить в циклах пересмотра. Здесь устанавливаются генные записи для известных или предсказанных генов, которые разграничены положениями на карте или нуклеотидными последовательностями. Gene имеет несколько преимуществ по сравнению со своим предшественником, LocusLink, включая лучшую интеграцию с другими базами данных в NCBI, более широкий таксономический охват и расширенные возможности для запроса и поиска, предоставляемые системой Entrez. [12]

Белок [ править ]

База данных белков поддерживает текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB / SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML, и связаны с другими ресурсами NCBI. Protein предоставляет пользователям релевантные данные, такие как гены, последовательности ДНК / РНК, биологические пути, данные по экспрессии и вариациям, а также литературу. Он также предоставляет заранее определенные наборы похожих и идентичных белков для каждой последовательности, вычисленные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI. База данных консервативных доменов ( CDD) белка содержит профили последовательностей, которые характеризуют высококонсервативные домены в белковых последовательностях. Он также содержит записи из внешних ресурсов, таких как SMART и Pfam . В белке есть еще одна база данных, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, которые сгруппированы в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. [13]

База данных Pubchem [ править ]

База данных PubChem NCBI - это общедоступный ресурс, посвященный молекулам и их активности в отношении биологических тестов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . [14]

См. Также [ править ]

  • Банк данных ДНК Японии (DDBJ)
  • Европейский институт биоинформатики (EBI)

Ссылки [ править ]

  1. ^ "Проект генома человека" . Нью-Йорк Таймс .
  2. ^ a b «Исследовательский институт размещает данные о генах в Интернете» . Нью-Йорк Таймс . 26 июня 1997 г.
  3. ^ «Смысл от последовательностей: Стивен Ф. Альтшул на улучшении BLAST» . 2000. Архивировано из оригинала на 2007-10-07.
  4. ^ "Национальная медицинская библиотека объявляет об уходе директора NCBI доктора Дэвида Липмана" . www.nlm.nih.gov . Проверено 6 мая 2017 .
  5. ^ a b Мизрахи, Илен (22 августа 2007 г.). GenBank: База данных нуклеотидных последовательностей . Национальный центр биотехнологической информации (США) - через www.ncbi.nlm.nih.gov.
  6. ^ «Главная - Таксономия - NCBI» . www.ncbi.nlm.nih.gov .
  7. ^ США (2019-05-06). «Главная - Книги - NCBI» . Ncbi.nlm.nih.gov . Проверено 12 июня 2019 .
  8. ^ Altschul Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. DOI : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 . 
  9. Мэдден Т. (2002). Справочник NCBI, 2-е издание, глава 16, Инструмент анализа последовательности BLAST
  10. ^ Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследование нуклеиновых кислот 41 (выпуск базы данных): D8 – D20.
  11. ^ Ostell J. (2002). Справочник NCBI, 2-е издание, глава 15, Система поиска и поиска Entrez
  12. ^ Maglott Д. Прюитт К. & Tatusova Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: справочник генов
  13. Перейти ↑ Sayers E. (2013). Справочник NCBI, 2-е издание, NCBI Protein Resources
  14. Перейти ↑ Wang Y. & Bryant S H. (2014). Справочник NCBI, 2-е издание, База данных NCBI PubChem BioAssay

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Национальная медицинская библиотека
  • Национальные институты здоровья