Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Белок банка данных ( PDB ) [1] является базой данных для трехмерных структурных данных больших биологических молекул, таких как белки и нуклеиновые кислоты . Данные, обычно получаемые с помощью рентгеновской кристаллографии , ЯМР-спектроскопии или, что все чаще, криоэлектронной микроскопии и представляемые биологами и биохимиками со всего мира, находятся в свободном доступе в Интернете через веб-сайты входящих в него организаций (PDBe, [2] PDBj, [3] RCSB, [4] и BMRB [5]). PDB контролируется организацией под названием Worldwide Protein Data Bank , wwPDB.

PDB является ключевым в областях структурной биологии , таких как структурная геномика . Большинство крупных научных журналов и некоторые финансирующие агентства теперь требуют от ученых предоставлять свои структурные данные в PDB. Многие другие базы данных используют белковые структуры, депонированные в PDB. Например, SCOP и CATH классифицируют структуры белков, а PDBsum предоставляет графический обзор записей PDB с использованием информации из других источников, таких как онтология генов . [6] [7]

История [ править ]

Две силы сошлись, чтобы инициировать PDB: небольшой, но растущий набор наборов данных о структуре белка, определенных с помощью дифракции рентгеновских лучей; и недавно доступный (1968) дисплей молекулярной графики, Brookhaven RAster Display (BRAD), для визуализации этих белковых структур в 3-D. В 1969 году при спонсорской поддержке Уолтера Гамильтона из Брукхейвенской национальной лаборатории Эдгар Мейер ( Техасский университет A&M ) начал писать программное обеспечение для хранения файлов с атомными координатами в общем формате, чтобы сделать их доступными для геометрической и графической оценки. К 1971 году одна из программ Мейера, SEARCH, позволила исследователям получать удаленный доступ к информации из базы данных для изучения белковых структур в автономном режиме. [8] ПОИСК сыграл важную роль в создании сетей, тем самым положив начало функциональному началу PDB.

Банк данных по белкам был объявлен в октябре 1971 года в журнале Nature New Biology [9] как совместное предприятие Кембриджского центра структурных данных , Великобритания, и Брукхейвенской национальной лаборатории, США.

После смерти Гамильтона в 1973 году Том Кецтл взял на себя руководство PDB в течение следующих 20 лет. В январе 1994 года руководителем PDB был назначен Джоэл Суссман из Израильского института науки Вейцмана . В октябре 1998 года [10] PDB был передан Исследовательскому сотрудничеству по структурной биоинформатике (RCSB); [11] передача была завершена в июне 1999 года. Новым директором стала Хелен М. Берман из Университета Рутгерса (одно из управляющих учреждений RCSB, другое - суперкомпьютерный центр Сан-Диего в Калифорнийском университете в Сан-Диего ). [12]В 2003 году, с образованием wwPDB, PDB стала международной организацией. Членами-учредителями являются PDBe (Европа), [2] RCSB (США) и PDBj (Япония). [3] BMRB [5] присоединился в 2006 году каждый из четырех членов wwPDB может выступать в качестве осаждения, обработки данных и центров распространения данных PDB. Под обработкой данных понимается тот факт, что персонал wwPDB просматривает и аннотирует каждую поданную заявку. [13] Затем данные автоматически проверяются на достоверность (исходный код [14] этого программного обеспечения для проверки был предоставлен общественности бесплатно).

Содержание [ править ]

Примеры белковых структур из PDB (созданных с помощью UCSF Chimera)
Скорость определения структуры белка по методам и годам. [15]

База данных PDB обновляется еженедельно ( UTC +0 среда) вместе со списком активов. [16] По состоянию на 1 апреля 2020 года в PDB входили:

134 146 структур в PDB имеют файл структурных факторов .
10 289 структур имеют файл ограничения ЯМР.
4814 структур в PDB имеют файл химических сдвигов .
4718 структур в PDB имеют файл карты 3DEM, размещенный в банке данных EM

Большинство структур определяется с помощью дифракции рентгеновских лучей, но около 10% структур определяется с помощью ЯМР белков . При использовании дифракции рентгеновских лучей получают приближения координат атомов белка, тогда как с помощью ЯМР оценивается расстояние между парами атомов белка. Окончательную конформацию белка получают с помощью ЯМР путем решения задачи дистанционной геометрии . После 2013 года все большее количество белков определяется с помощью криоэлектронной микроскопии . При щелчке по числам в связанной внешней таблице отображаются примеры структур, определенных этим методом.

Для структур PDB, определенных с помощью дифракции рентгеновских лучей, которые имеют файл структурных факторов, можно просмотреть их карту электронной плотности. Данные таких структур хранятся на «сервере электронной плотности». [17] [18]

Исторически количество структур в PDB росло примерно экспоненциально: 100 зарегистрированных структур в 1982 г., 1000 структур в 1993 г., 10 000 в 1999 г. и 100 000 в 2014 г. [19] [20]

Формат файла [ править ]

Формат файла, изначально используемый PDB, назывался форматом файла PDB. Исходный формат был ограничен шириной компьютерных перфокарт до 80 символов в строке. Примерно в 1996 году был введен в действие формат «файла макромолекулярной кристаллографической информации», mmCIF, который является расширением формата CIF . MmCIF стал стандартным форматом для архива PDB в 2014 году. [21] В 2019 году wwPDB объявил, что депонирование для кристаллографические методы принимаются только в формате mmCIF. [22]

XML версия PDB, называется PDBML, был описан в 2005 году [23] Файлы структуры могут быть загружены в любой из этих трех форматов, хотя все большее число структур не соответствовать формату наследия PDB. Отдельные файлы легко загружаются в графические пакеты по URL-адресам в Интернете :

  • Для файлов формата PDB используйте, например, http://www.pdb.org/pdb/files/4hhb.pdb.gzилиhttp://pdbe.org/download/4hhb
  • Для файлов PDBML (XML) используйте, например, http://www.pdb.org/pdb/files/4hhb.xml.gzилиhttp://pdbe.org/pdbml/4hhb

" 4hhb" - это идентификатор PDB. Каждая структура, опубликованная в PDB, получает четырехзначный буквенно-цифровой идентификатор, свой PDB ID. (Это не уникальный идентификатор для биомолекул, потому что несколько структур для одной и той же молекулы - в разных средах или конформациях - могут содержаться в PDB с разными идентификаторами PDB.)

Просмотр данных [ редактировать ]

Файлы структуры можно просматривать с помощью одной из нескольких бесплатных компьютерных программ с открытым исходным кодом , включая Jmol , Pymol , VMD и Rasmol . Другие несвободные условно-бесплатные программы включают ICM-Browser, [24] MDL Chime , UCSF Chimera , Swiss-PDB Viewer, [25] StarBiochem [26] (интерактивная программа просмотра молекул на основе Java со встроенным поиском в банке данных белков), Sirius , и VisProt3DS [27] (инструмент для визуализации белков в трехмерном стереоскопическом представлении в анаглите и других режимах) и Discovery Studio. Веб-сайт RCSB PDB содержит обширный список как бесплатных, так и коммерческих программ визуализации молекул и плагинов для веб-браузеров.

См. Также [ править ]

  • Кристаллографическая база данных
  • Белковая структура
  • Прогноз структуры белка
  • База данных структуры белков
  • PDBREPORT перечисляет все аномалии (также ошибки) в структурах PDB
  • PDBsum - извлекает данные из других баз данных о структурах PDB.
  • Proteopedia - совместная трехмерная энциклопедия белков и других молекул.

Ссылки [ править ]

  1. ^ wwPDB, Консорциум (2019). «Банк данных белков: единый глобальный архив данных о трехмерной структуре макромолекул» . Nucleic Acids Res . 47 (D1): 520–528. DOI : 10.1093 / NAR / gky949 . PMC 6324056 . PMID 30357364 .  
  2. ^ a b "PDBe home <Узел <EMBL-EBI" . pdbe.org .
  3. ^ a b "Банк данных по белкам Японии - PDB Japan - PDBj" . pdbj.org .
  4. ^ Банк, RCSB Protein Data. «RCSB PDB: Домашняя страница» . rcsb.org .
  5. ^ a b «Банк биологического магнитного резонанса» . bmrb.wisc.edu .
  6. Перейти ↑ Berman, HM (январь 2008 г.). «Банк данных о белках: историческая перспектива» (PDF) . Acta Crystallographica Раздел A . A64 (1): 88–95. DOI : 10.1107 / S0108767307035623 . PMID 18156675 .  
  7. ^ Ласковски RA, Hutchinson EG, Мичи Д., Уоллес AC, Джонс М.Л., Thornton JM (декабрь 1997). «PDBsum: веб-база данных сводок и анализов всех структур PDB». Trends Biochem. Sci . 22 (12): 488–90. DOI : 10.1016 / S0968-0004 (97) 01140-7 . PMID 9433130 . 
  8. Перейти ↑ Meyer EF (1997). «Первые годы Белкового банка данных» . Белковая наука . Издательство Кембриджского университета. 6 (7): 1591–1597. DOI : 10.1002 / pro.5560060724 . PMC 2143743 . PMID 9232661 .  
  9. ^ "Банк данных белков". Природа Новая Биология . 1971. DOI : 10.1038 / newbio233223b0 .
  10. ^ Берман НМ, ВЕСТБРУК Дж, Фен Z, G Гиллилэнд, Бхат Т.Н., Weissig Н, Shindyalov И.Н., Борн ПЭ (январь 2000). «Банк данных о белках» . Nucleic Acids Res . 28 (1): 235–242. DOI : 10.1093 / NAR / 28.1.235 . PMC 102472 . PMID 10592235 .  
  11. ^ "Сотрудничество по исследованию структурной биоинформатики" . RCSB.org . Сотрудничество в области структурной биоинформатики. Архивировано из оригинала на 2007-02-05.
  12. ^ "Архив новостей RCSB PDB" . Банк данных белков RCSB.
  13. ^ Карри E, Фрейтас A, O'Riáin S (2010). «Роль курирования данных на основе сообщества для предприятий» . В Д. Вуде (ред.). Связывание корпоративных данных . Бостон: Springer США. С. 25–47. ISBN 978-1-441-97664-2.
  14. ^ "Пакет проверки PDB" . sw-tools.pdb.org .
  15. ^ Берли С.К., Берман Х.М., Бхикадия С., Би С, Чен Л., Костанцо Л.Д. и др. (консорциум wwPDB) (январь 2019 г.). «Банк данных белков: единый глобальный архив данных о трехмерной структуре макромолекул» . Исследования нуклеиновых кислот . 47 (D1): D520 – D528. DOI : 10.1093 / NAR / gky949 . PMC 6324056 . PMID 30357364 .  
  16. ^ "Распад текущих активов PDB" . RCSB.
  17. ^ "Сервер электронной плотности Упсалы" . Уппсальский университет . Проверено 6 апреля 2013 .
  18. ^ Kleywegt ГДж, Харрис М. Р., Цзоу JY, Тейлор ТК, Wählby А, Джонс Т.А. (декабрь 2004). "Уппсальский сервер электронной плотности" . Acta Crystallogr D . 60 (Pt 12 Pt 1): 2240–2249. DOI : 10.1107 / S0907444904013253 . PMID 15572777 . 
  19. ^ Анон (2014). «Точные данные: для Protein Data Bank было непросто сохранить актуальность для 100 000 структур» . Природа . 509 (7500): 260. DOI : 10.1038 / 509260a . PMID 24834514 . 
  20. ^ «Отчет о росте содержания» . RCSB PDB. Архивировано из оригинала на 2007-04-28 . Проверено 6 апреля 2013 .
  21. ^ «wwPDB: форматы файлов и PDB» . wwpdb.org . Проверено 1 апреля 2020 года .
  22. ^ wwPDB.org. «wwPDB: Новости 2019» . wwpdb.org .
  23. ^ ВЕСТБРУК Дж, Ито Н, Н Накамура, Henrick К, Бермана НМ (апрель 2005 г.). «PDBML: представление архивных данных структуры макромолекул в XML» (PDF) . Биоинформатика . 21 (7): 988–992. DOI : 10.1093 / биоинформатики / bti082 . PMID 15509603 .  
  24. ^ "ICM-браузер" . ООО "Молсофт" . Проверено 6 апреля 2013 .
  25. ^ "Швейцарский PDB Viewer" . Швейцарский институт биоинформатики . Проверено 6 апреля 2013 .
  26. ^ «ЗВЕЗДА: Биохимия - Дом» . web.mit.edu .
  27. ^ "VisProt3DS" . Молекулярный Systems Ltd . Проверено 6 апреля 2013 .

Внешние ссылки [ править ]

  • Всемирный банк данных о белках ( wwPDB ) - родительский сайт для региональных хостов (ниже)
    • RCSB Protein Data Bank (США)
    • PDBe (Европа)
    • PDBj (Япония)
    • BMRB, Банк данных биологического магнитного резонанса (США)
  • wwPDB Documentation - документация по форматам файлов PDB и PDBML.
  • Взгляд на структуры - введение RCSB в кристаллографию
  • Домашняя страница PDBsum - извлекает данные о структурах PDB из других баз данных.
  • База данных нуклеиновых кислот, NDB - зеркало PDB, специально для поиска нуклеиновых кислот.
  • Вводное руководство по PDB, спонсируемое PDB
  • PDBe: Краткий обзор EBI Train OnLine