Национальный центр биотехнологической информации

Национальный центр биотехнологической информации

Сокращение	NCBI
Основан	1988 ; 33 года назад ( 1988 )
Штаб-квартира	Бетесда, Мэриленд , США
Координаты	38 ° 59′45 ″ с.ш., 77 ° 05′56 ″ з.д. / 38.9959 ° N 77.0989 ° W / 38.9959; -77,0989 Координаты : 38.9959 ° N 77.0989 ° W38 ° 59′45 ″ с.ш., 77 ° 05′56 ″ з.д. / / 38.9959; -77,0989
Интернет сайт	www .ncbi .nlm .nih .gov

Национальный центр биотехнологической информации ( NCBI ) ^[1]^[2] является частью Национальной библиотеки США медицины (NLM), филиал Национального института здоровья (NIH). Он одобрен и финансируется правительством США . NCBI находится в Бетесде, штат Мэриленд, и был основан в 1988 году в соответствии с законодательством, спонсируемым сенатором Клодом Пеппером .

NCBI содержит ряд баз данных, относящихся к биотехнологии и биомедицине, и является важным ресурсом для инструментов и услуг в области биоинформатики. Основные базы данных включают GenBank для последовательностей ДНК и PubMed , библиографическую базу данных по биомедицинской литературе. Другие базы данных включают базу данных NCBI Epigenomics . Все эти базы данных доступны в Интернете через поисковую систему Entrez . NCBI был направлен Дэвид Липмана , ^[2] один из первоначальных авторов BLAST программы выравнивания последовательностей ^[3] и широко уважаемая фигура в биоинформатики. Он также руководил внутренней исследовательской программой, в которую входили группы под руководством Стивена Альтшула (еще один соавтор BLAST ), Дэвида Ландсмана, Юджина Кунина , Джона Уилбура, Терезы Пржитицкой и Чжийонг Лу. Дэвид Липман ушел со своего поста в мае 2017 года. ^[4]

GenBank [ править ]

NCBI отвечал за предоставление доступа к базе данных последовательностей ДНК GenBank с 1992 года. ^[5] GenBank координирует работу с отдельными лабораториями и другими базами данных последовательностей, такими как Европейская лаборатория молекулярной биологии (EMBL) и Банк данных ДНК Японии (DDBJ). ^[5]

С 1992 года NCBI расширился, чтобы предоставить другие базы данных в дополнение к GenBank. NCBI предоставляет ген , онлайн-менделевское наследование у человека , базу данных молекулярного моделирования (трехмерные структуры белков), dbSNP (база данных однонуклеотидных полиморфизмов ), коллекцию эталонных последовательностей, карту генома человека и браузер таксономии , а также координаты с Национальным институтом рака для обеспечения проекта анатомии генома рака. NCBI присваивает уникальный идентификатор (идентификационный номер таксономии) каждому виду организмов. ^[6]

NCBI имеет программные инструменты, которые доступны через интернет-браузеры или по FTP. Например, BLAST - это программа поиска сходства последовательностей. BLAST может выполнять сравнение последовательностей с базой данных ДНК GenBank менее чем за 15 секунд.

Книжная полка NCBI [ править ]

Книжная полка NCBI ^[7] представляет собой собрание свободно доступных, загружаемых он-лайн версий избранных биомедицинских книг. Книжная полка охватывает широкий круг тем, включая молекулярную биологию , биохимию , клеточную биологию , генетику , микробиологию , болезненные состояния с молекулярной и клеточной точки зрения, методы исследования и вирусологию . Некоторые из книг являются онлайн-версиями ранее опубликованных книг, а другие, например, « Перерыв на кофе» , написаны и отредактированы сотрудниками NCBI. Книжная полка является дополнением к репозиторию Entrez PubMed рецензируемых публикаций.рефераты в содержимом этой книжной полки предоставляют устоявшиеся взгляды на развивающиеся области исследования и контекст, в котором можно организовать множество разрозненных отдельных частей опубликованных исследований. ^{[ необходима цитата ]}

Базовый инструмент поиска местного выравнивания (BLAST) [ править ]

BLAST - это алгоритм, используемый для вычисления сходства последовательностей между биологическими последовательностями, такими как нуклеотидные последовательности ДНК и аминокислотные последовательности белков. ^[8]BLAST - это мощный инструмент для поиска последовательностей, похожих на последовательность запроса, в одном и том же организме или в разных организмах. Он ищет последовательность запросов в базах данных и на серверах NCBI и отправляет результаты обратно в браузер пользователя в выбранном формате. Последовательности ввода в BLAST в основном имеют формат FASTA или Genbank, в то время как выходные данные могут быть доставлены в различных форматах, таких как HTML, форматирование XML и простой текст. HTML - это формат вывода по умолчанию для веб-страницы NCBI. Результаты для NCBI-BLAST представлены в графическом формате со всеми найденными совпадениями, таблицей с идентификаторами последовательностей для совпадений, имеющих соответствующие данные для оценки, а также сопоставления для интересующей последовательности и совпадений, полученных с аналогичными оценками BLAST для них ^{[9 ]}

Entrez [ править ]

Система поиска Entrez Global Query между базами данных используется в NCBI для всех основных баз данных, таких как нуклеотидные и белковые последовательности, структуры белков, PubMed, таксономия, полные геномы, OMIM и некоторые другие. ^[10] Entrez - это система индексации и поиска, содержащая данные из различных источников для биомедицинских исследований. NCBI распространила первую версию Entrez в 1991 году, состоящую из нуклеотидных последовательностей из PDB и GenBank., белковые последовательности из SWISS-PROT, переведенные GenBank, PIR, PRF, PDB, а также соответствующие отрывки и цитаты из PubMed. Entrez специально разработан для интеграции данных из нескольких различных источников, баз данных и форматов в единую информационную модель и систему поиска, которая может эффективно извлекать соответствующие ссылки, последовательности и структуры. ^[11]

Джин [ править ]

Ген был внедрен в NCBI для характеристики и организации информации о генах. Он служит основным узлом в связке геномной карты, экспрессии, последовательности, функции белка, структуры и данных гомологии. Каждой записи гена присваивается уникальный GeneID, за которым можно следить в циклах пересмотра. Генные записи для известных или предсказанных генов устанавливаются здесь и разграничены позиции карты или нуклеотидных последовательностей. Gene имеет несколько преимуществ по сравнению со своим предшественником, LocusLink, включая лучшую интеграцию с другими базами данных в NCBI, более широкий таксономический охват и расширенные возможности для запроса и поиска, предоставляемые системой Entrez. ^[12]

Белок [ править ]

База данных белков поддерживает текстовые записи для отдельных последовательностей белков, полученные из множества различных ресурсов, таких как проект NCBI Reference Sequence (RefSeq), GenBank, PDB и UniProtKB / SWISS-Prot. Записи о белках представлены в различных форматах, включая FASTA и XML, и связаны с другими ресурсами NCBI. Protein предоставляет пользователям релевантные данные, такие как гены, последовательности ДНК / РНК, биологические пути, данные об экспрессии и вариациях, а также литературу. Он также предоставляет заранее определенные наборы подобных и идентичных белков для каждой последовательности, вычисленные с помощью BLAST. База данных структур NCBI содержит наборы трехмерных координат для экспериментально определенных структур в PDB, которые импортируются NCBI. База данных консервативных доменов ( CDD) белка содержит профили последовательностей, которые характеризуют высококонсервативные домены в белковых последовательностях. Он также содержит записи из внешних ресурсов, таких как SMART и Pfam . В белке есть еще одна база данных, известная как база данных белковых кластеров, которая содержит наборы последовательностей белков, которые сгруппированы в соответствии с максимальным выравниванием между отдельными последовательностями, рассчитанным с помощью BLAST. ^[13]

База данных Pubchem [ править ]

База данных PubChem NCBI является общедоступным ресурсом для молекул и их активности в отношении биологических тестов. PubChem доступен для поиска и доступен через информационно-поисковую систему Entrez . ^[14]

См. Также [ править ]

Банк данных ДНК Японии (DDBJ)
Европейский институт биоинформатики (EBI)

Ссылки [ править ]

^ «Проект генома человека» . Нью-Йорк Таймс .
^ a b «Исследовательский институт размещает данные о генах в Интернете» . Нью-Йорк Таймс . 26 июня 1997 г.
^ «Смысл от последовательностей: Стивен Ф. Альтшул на улучшении BLAST» . 2000. Архивировано из оригинала на 2007-10-07.
^ "Национальная медицинская библиотека объявляет об уходе директора NCBI доктора Дэвида Липмана" . www.nlm.nih.gov . Проверено 6 мая 2017 .
^ a b Мизрахи, Илен (22 августа 2007 г.). GenBank: База данных нуклеотидных последовательностей . Национальный центр биотехнологической информации (США) - через www.ncbi.nlm.nih.gov.
^ «Главная - Таксономия - NCBI» . www.ncbi.nlm.nih.gov .
^ США (2019-05-06). «Главная - Книги - NCBI» . Ncbi.nlm.nih.gov . Проверено 12 июня 2019 .
^ Altschul Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. DOI : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 .
↑ Мэдден Т. (2002). Справочник NCBI, 2-е издание, глава 16, Инструмент анализа последовательности BLAST
^ Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследование нуклеиновых кислот 41 (выпуск базы данных): D8 – D20.
^ Ostell J. (2002). Справочник NCBI, 2-е издание, глава 15, Система поиска и поиска Entrez
^ Maglott Д. Прюитт К. & Tatusova Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: справочник генов
Перейти ↑ Sayers E. (2013). Справочник NCBI, 2-е издание, NCBI Protein Resources
Перейти ↑ Wang Y. & Bryant S H. (2014). Справочник NCBI, 2-е издание, База данных NCBI PubChem BioAssay

Внешние ссылки [ править ]

Викиданные имеют свойство:

Идентификатор таксономии NCBI (P685) (см. Использование )

Официальный веб-сайт
Национальная медицинская библиотека
Национальные институты здоровья

[Genome.NYT-1] «Проект генома человека» . Нью-Йорк Таймс .

[LipmanDirNCBI.NYT-2] «Исследовательский институт размещает данные о генах в Интернете» . Нью-Йорк Таймс . 26 июня 1997 г.

[SciWatch-3] «Смысл от последовательностей: Стивен Ф. Альтшул на улучшении BLAST» . 2000. Архивировано из оригинала на 2007-10-07.

[4] "Национальная медицинская библиотека объявляет об уходе директора NCBI доктора Дэвида Липмана" . www.nlm.nih.gov . Проверено 6 мая 2017 .

[auto-5] Мизрахи, Илен (22 августа 2007 г.). GenBank: База данных нуклеотидных последовательностей . Национальный центр биотехнологической информации (США) - через www.ncbi.nlm.nih.gov.

[6] «Главная - Таксономия - NCBI» . www.ncbi.nlm.nih.gov .

[7] США (2019-05-06). «Главная - Книги - NCBI» . Ncbi.nlm.nih.gov . Проверено 12 июня 2019 .

[8] Altschul Стивен; Гиш Уоррен; Миллер Уэбб; Майерс Юджин; Липман Дэвид (1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–410. DOI : 10.1016 / s0022-2836 (05) 80360-2 . PMID 2231712 .

[9] Мэдден Т. (2002). Справочник NCBI, 2-е издание, глава 16, Инструмент анализа последовательности BLAST

[10] Координаторы ресурсов NCBI (2012). «Ресурсы базы данных Национального центра биотехнологической информации». Исследование нуклеиновых кислот 41 (выпуск базы данных): D8 – D20.

[11] Ostell J. (2002). Справочник NCBI, 2-е издание, глава 15, Система поиска и поиска Entrez

[12] Maglott Д. Прюитт К. & Tatusova Т. (2005). Справочник NCBI, 2-е издание, глава 19, Ген: справочник генов

[13] Перейти ↑ Sayers E. (2013). Справочник NCBI, 2-е издание, NCBI Protein Resources

[14] Перейти ↑ Wang Y. & Bryant S H. (2014). Справочник NCBI, 2-е издание, База данных NCBI PubChem BioAssay

[1]

vтеБиоинформатика
Базы данных	Базы данных последовательностей: GenBank , Европейский архив нуклеотидов и Банк данных ДНК Японии Вторичные базы данных: UniProt , база данных последовательностей белков, объединяющая Swiss-Prot , TrEMBL и Protein Information Resource Другие базы данных: Protein Data Bank , Ensembl и InterPro Специализированные геномные базы данных: BOLD , База данных генома Saccharomyces , FlyBase , VectorBase , WormBase , База данных генома крыс , PHI-база , информационный ресурс Arabidopsis и информационная сеть по рыбкам данио
Программного обеспечения	ВЗРЫВ Галстук-бабочка Clustal EMBOSS HMMER МЫШЦЫ SAMtools Набор SOAP TopHat
Другой	Сервер: ExPASy Онтология: онтология генов Розалинд (образовательная платформа)
Учреждения	Broad Institute Китайский национальный генетический банк (CNGB) Отдел вычислительной биологии (CBD) Microsoft Research - Центр вычислительной и системной биологии Университета Тренто (COSBI) Центр баз данных для наук о жизни (DBCLS) Банк данных ДНК Японии (DDBJ) Европейский институт биоинформатики (EMBL-EBI) Европейская лаборатория молекулярной биологии (EMBL) Институт Флэтайрон Институт Дж. Крейга Вентера (JCVI) Институт молекулярной клеточной биологии и генетики Макса Планка (MPI-CBG) Национальный центр биотехнологической информации США (NCBI) Японский институт генетики Нидерландский центр биоинформатики (NBIC) Филиппинский геномный центр (PGC) Scripps Research Швейцарский институт биоинформатики (SIB) Институт Wellcome Sanger Институт Уайтхеда
Организации	Африканское общество биоинформатики и вычислительной биологии (ASBCB) Ресурсы по биоинформатике Австралии (EMBL-AR) Европейская сеть молекулярной биологии (EMBnet) Международное сотрудничество с базами данных нуклеотидных последовательностей (INSDC) Международное общество биодокументации (ISB) Международное общество вычислительной биологии (ISCB) Студенческий совет (ISCB-SC) Институт геномики и интегративной биологии (CSIR-IGIB) Японское общество биоинформатики (JSBi)
Встречи	Базель вычислительной биологии конференции ([BC ² ]) Европейская конференция по вычислительной биологии (ECCB) Интеллектуальные системы для молекулярной биологии (ISMB) Международная конференция по биоинформатике (InCoB) Конференция ISCB Africa ASBCB по биоинформатике Тихоокеанский симпозиум по биокомпьютингу (PSB) Исследования в области вычислительной молекулярной биологии (РЕКОМБ)
Форматы файлов	Формат CRAM Формат FASTA Формат FASTQ Формат NeXML Формат Nexus Формат Pileup Формат SAM Стокгольмский формат Формат VCF
похожие темы	Вычислительная биология Список биобанков Список биологических баз данных Молекулярная филогенетика Последовательность действий База данных последовательностей Выравнивание последовательности
Категория Commons