Содержание | |
---|---|
Описание | |
Контакт | |
Основное цитирование | PMID 30357364 |
Доступ | |
Формат данных | ммCIF , PDB |
Интернет сайт |
Белок банка данных ( PDB ) [1] является базой данных для трехмерных структурных данных больших биологических молекул, таких как белки и нуклеиновые кислоты . Данные, обычно получаемые с помощью рентгеновской кристаллографии , ЯМР-спектроскопии или, что все чаще, криоэлектронной микроскопии и представляемые биологами и биохимиками со всего мира, находятся в свободном доступе в Интернете через веб-сайты входящих в него организаций (PDBe, [2] PDBj, [3] RCSB, [4] и BMRB [5]). PDB контролируется организацией под названием Worldwide Protein Data Bank , wwPDB.
PDB является ключевым в областях структурной биологии , таких как структурная геномика . Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставлять свои структурные данные в PDB. Многие другие базы данных используют белковые структуры, депонированные в PDB. Например, SCOP и CATH классифицируют структуры белков, а PDBsum предоставляет графический обзор записей PDB с использованием информации из других источников, таких как онтология генов . [6] [7]
История [ править ]
Две силы сошлись, чтобы инициировать PDB: небольшой, но растущий набор наборов данных о структуре белка, определенных с помощью дифракции рентгеновских лучей; и недавно доступный (1968) дисплей молекулярной графики, Brookhaven RAster Display (BRAD), для визуализации этих белковых структур в 3-D. В 1969 году при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории Эдгар Мейер ( Техасский университет A&M ) начал писать программное обеспечение для хранения файлов с атомными координатами в общем формате, чтобы сделать их доступными для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получать удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. [8] ПОИСК сыграл важную роль в создании сетей, тем самым положив начало функциональному началу PDB.
Банк данных по белкам был объявлен в октябре 1971 года в журнале Nature New Biology [9] как совместное предприятие Кембриджского центра структурных данных , Великобритания, и Брукхейвенской национальной лаборатории, США.
После смерти Гамильтона в 1973 году Том Кецтл взял на себя руководство PDB в течение следующих 20 лет. В январе 1994 года руководителем PDB был назначен Джоэл Суссман из Израильского института науки Вейцмана . В октябре 1998 года [10] PDB был передан Исследовательскому сотрудничеству по структурной биоинформатике (RCSB); [11] передача была завершена в июне 1999 года. Новым директором стала Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - суперкомпьютерный центр Сан-Диего в Калифорнийском университете в Сан-Диего ). [12]В 2003 году, с образованием wwPDB, PDB стала международной организацией. Членами-учредителями являются PDBe (Европа), [2] RCSB (США) и PDBj (Япония). [3] BMRB [5] присоединился в 2006 году каждый из четырех членов wwPDB может выступать в качестве осаждения, обработки данных и центров распространения данных PDB. Под обработкой данных понимается тот факт, что персонал wwPDB просматривает и аннотирует каждую поданную заявку. [13] Затем данные автоматически проверяются на достоверность (исходный код [14] этого программного обеспечения для проверки был предоставлен общественности бесплатно).
Содержание [ править ]
База данных PDB обновляется еженедельно ( UTC +0 среда) вместе со списком активов. [16] По состоянию на 1 апреля 2020 [Обновить]года в PDB входили:
Экспериментальный метод | Белки | Нуклеиновые кислоты | Комплексы белок / нуклеиновая кислота | Другой | Общий |
---|---|---|---|---|---|
дифракция рентгеновских лучей | 135170 | 2097 | 6945 | 4 | 144216 |
ЯМР | 11337 | 1325 | 264 | 8 | 12934 |
Электронная микроскопия | 3475 | 35 год | 1136 | 0 | 4646 |
Гибридный | 155 | 5 | 3 | 1 | 164 |
Другой | 286 | 4 | 6 | 13 | 309 |
Общий: | 150423 | 3466 | 8354 | 26 | 162269 |
- 134 146 структур в PDB имеют файл структурных факторов .
- 10 289 структур имеют файл ограничения ЯМР.
- 4814 структур в PDB имеют файл химических сдвигов .
- 4718 структур в PDB имеют файл карты 3DEM, размещенный в банке данных EM
Большинство структур определяется с помощью дифракции рентгеновских лучей, но около 10% структур определяется с помощью ЯМР белков . При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивается расстояние между парами атомов белка. Окончательную конформацию белка получают с помощью ЯМР путем решения задачи дистанционной геометрии . После 2013 года все большее количество белков определяется с помощью криоэлектронной микроскопии . При щелчке по числам в связанной внешней таблице отображаются примеры структур, определенных этим методом.
Для структур PDB, определенных с помощью дифракции рентгеновских лучей, которые имеют файл структурных факторов, можно просмотреть их карту электронной плотности. Данные таких структур хранятся на «сервере электронной плотности». [17] [18]
Исторически количество структур в PDB росло примерно экспоненциально: 100 зарегистрированных структур в 1982 г., 1000 структур в 1993 г., 10 000 в 1999 г. и 100 000 в 2014 г. [19] [20]
Формат файла [ править ]
Формат файла, изначально используемый PDB, назывался форматом файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в действие формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF . MmCIF стал стандартным форматом для архива PDB в 2014 году. [21] В 2019 году wwPDB объявил, что депонирование для кристаллографические методы принимаются только в формате mmCIF. [22]
XML версия PDB, называется PDBML, был описан в 2005 году [23] Файлы структуры могут быть загружены в любой из этих трех форматов, хотя все большее число структур не соответствовать формату наследия PDB. Отдельные файлы легко загружаются в графические пакеты по URL-адресам в Интернете :
- Для файлов формата PDB используйте, например,
http://www.pdb.org/pdb/files/4hhb.pdb.gz
илиhttp://pdbe.org/download/4hhb
- Для файлов PDBML (XML) используйте, например,
http://www.pdb.org/pdb/files/4hhb.xml.gz
илиhttp://pdbe.org/pdbml/4hhb
" 4hhb
" - это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, свой PDB ID. (Это не уникальный идентификатор для биомолекул, потому что несколько структур для одной и той же молекулы - в разных средах или конформациях - могут содержаться в PDB с разными идентификаторами PDB.)
Просмотр данных [ редактировать ]
Файлы структуры можно просматривать с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом , включая Jmol , Pymol , VMD и Rasmol . Другие несвободные условно-бесплатные программы включают ICM-Browser, [24] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [25] StarBiochem [26] (интерактивная программа просмотра молекул на основе Java со встроенным поиском в банке данных белков), Sirius , и VisProt3DS [27] (инструмент для визуализации белков в трехмерном стереоскопическом представлении в анаглите и других режимах) и Discovery Studio. Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул и плагинов для веб-браузеров.
См. Также [ править ]
- Кристаллографическая база данных
- Белковая структура
- Прогноз структуры белка
- База данных структуры белков
- PDBREPORT перечисляет все аномалии (также ошибки) в структурах PDB
- PDBsum - извлекает данные из других баз данных о структурах PDB.
- Proteopedia - совместная трехмерная энциклопедия белков и других молекул.
Ссылки [ править ]
- ^ wwPDB, Консорциум (2019). «Банк данных белков: единый глобальный архив данных о трехмерной структуре макромолекул» . Nucleic Acids Res . 47 (D1): 520–528. DOI : 10.1093 / NAR / gky949 . PMC 6324056 . PMID 30357364 .
- ^ a b "PDBe home <Узел <EMBL-EBI" . pdbe.org .
- ^ a b "Банк данных по белкам Японии - PDB Japan - PDBj" . pdbj.org .
- ^ Банк, RCSB Protein Data. «RCSB PDB: Домашняя страница» . rcsb.org .
- ^ a b «Банк биологического магнитного резонанса» . bmrb.wisc.edu .
- Перейти ↑ Berman, HM (январь 2008 г.). «Банк данных о белках: историческая перспектива» (PDF) . Acta Crystallographica Раздел A . A64 (1): 88–95. DOI : 10.1107 / S0108767307035623 . PMID 18156675 .
- ^ Ласковски RA, Hutchinson EG, Мичи Д., Уоллес AC, Джонс М.Л., Thornton JM (декабрь 1997). «PDBsum: веб-база данных сводок и анализов всех структур PDB». Trends Biochem. Sci . 22 (12): 488–90. DOI : 10.1016 / S0968-0004 (97) 01140-7 . PMID 9433130 .
- Перейти ↑ Meyer EF (1997). «Первые годы Белкового банка данных» . Белковая наука . Издательство Кембриджского университета. 6 (7): 1591–1597. DOI : 10.1002 / pro.5560060724 . PMC 2143743 . PMID 9232661 .
- ^ "Банк данных белков". Природа Новая Биология . 1971. DOI : 10.1038 / newbio233223b0 .
- ^ Берман НМ, ВЕСТБРУК Дж, Фен Z, G Гиллилэнд, Бхат Т.Н., Weissig Н, Shindyalov И.Н., Борн ПЭ (январь 2000). «Банк данных о белках» . Nucleic Acids Res . 28 (1): 235–242. DOI : 10.1093 / NAR / 28.1.235 . PMC 102472 . PMID 10592235 .
- ^ "Сотрудничество по исследованию структурной биоинформатики" . RCSB.org . Сотрудничество в области структурной биоинформатики. Архивировано из оригинала на 2007-02-05.
- ^ "Архив новостей RCSB PDB" . Банк данных белков RCSB.
- ^ Карри E, Фрейтас A, O'Riáin S (2010). «Роль курирования данных на основе сообщества для предприятий» . В Д. Вуде (ред.). Связывание корпоративных данных . Бостон: Springer США. С. 25–47. ISBN 978-1-441-97664-2.
- ^ "Пакет проверки PDB" . sw-tools.pdb.org .
- ^ Берли С.К., Берман Х.М., Бхикадия С., Би С, Чен Л., Костанцо Л.Д. и др. (консорциум wwPDB) (январь 2019 г.). «Банк данных белков: единый глобальный архив данных о трехмерной структуре макромолекул» . Исследования нуклеиновых кислот . 47 (D1): D520 – D528. DOI : 10.1093 / NAR / gky949 . PMC 6324056 . PMID 30357364 .
- ^ "Распад текущих активов PDB" . RCSB.
- ^ "Сервер электронной плотности Упсалы" . Уппсальский университет . Проверено 6 апреля 2013 .
- ^ Kleywegt ГДж, Харрис М. Р., Цзоу JY, Тейлор ТК, Wählby А, Джонс Т.А. (декабрь 2004). "Уппсальский сервер электронной плотности" . Acta Crystallogr D . 60 (Pt 12 Pt 1): 2240–2249. DOI : 10.1107 / S0907444904013253 . PMID 15572777 .
- ^ Анон (2014). «Точные данные: для Protein Data Bank было непросто сохранить актуальность для 100 000 структур» . Природа . 509 (7500): 260. DOI : 10.1038 / 509260a . PMID 24834514 .
- ^ «Отчет о росте содержания» . RCSB PDB. Архивировано из оригинала на 2007-04-28 . Проверено 6 апреля 2013 .
- ^ «wwPDB: форматы файлов и PDB» . wwpdb.org . Проверено 1 апреля 2020 года .
- ^ wwPDB.org. «wwPDB: Новости 2019» . wwpdb.org .
- ^ ВЕСТБРУК Дж, Ито Н, Н Накамура, Henrick К, Бермана НМ (апрель 2005 г.). «PDBML: представление архивных данных структуры макромолекул в XML» (PDF) . Биоинформатика . 21 (7): 988–992. DOI : 10.1093 / биоинформатики / bti082 . PMID 15509603 .
- ^ "ICM-браузер" . ООО "Молсофт" . Проверено 6 апреля 2013 .
- ^ "Швейцарский PDB Viewer" . Швейцарский институт биоинформатики . Проверено 6 апреля 2013 .
- ^ «ЗВЕЗДА: Биохимия - Дом» . web.mit.edu .
- ^ "VisProt3DS" . Молекулярный Systems Ltd . Проверено 6 апреля 2013 .
Внешние ссылки [ править ]
Викиданные имеют свойство:
|
- Всемирный банк данных о белках ( wwPDB ) - родительский сайт для региональных хостов (ниже)
- RCSB Protein Data Bank (США)
- PDBe (Европа)
- PDBj (Япония)
- BMRB, Банк данных биологического магнитного резонанса (США)
- wwPDB Documentation - документация по форматам файлов PDB и PDBML.
- Взгляд на структуры - введение RCSB в кристаллографию
- Домашняя страница PDBsum - извлекает данные о структурах PDB из других баз данных.
- База данных нуклеиновых кислот, NDB - зеркало PDB, специально для поиска нуклеиновых кислот.
- Вводное руководство по PDB, спонсируемое PDB
- PDBe: Краткий обзор EBI Train OnLine