Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Protein Data Bank (PDB) Формат файла представляет собой текстовый формат файла описания трехмерных структур молекул , проведенных в Protein Data Bank . Соответственно, формат pdb обеспечивает описание и аннотацию структур белков и нуклеиновых кислот, включая координаты атомов, назначения вторичных структур, а также связи между атомами. Кроме того, сохраняются экспериментальные метаданные. Формат PDB - это устаревший формат файла для банка данных белков, который теперь хранит данные о биологических макромолекулах в новом формате файлов mmCIF .

История [ править ]

Формат файла PDB был изобретен в 1976 году как читаемый человеком файл, который позволил исследователям обмениваться координатами белков через систему баз данных. Его формат с фиксированной шириной столбцов ограничен 80 столбцами, что было основано на ширине компьютерных перфокарт, которые ранее использовались для обмена координатами. [1] За прошедшие годы формат файла претерпел множество изменений и пересмотров. По состоянию на 13 июля 2011 г. последняя редакция - 3.30. [2]

Пример [ править ]

Типичный файл PDB, описывающий белок, состоит из сотен или тысяч строк, подобных приведенному ниже (взятому из файла, описывающего структуру синтетического коллагеноподобного пептида ):

ВНЕКЛЕТОЧНЫЙ МАТРИКС ЗАГОЛОВКИ 22-ЯНВ-98 1A3IНАЗВАНИЕ РЕНТГЕНОВСКОЕ КРИСТАЛЛОГРАФИЧЕСКОЕ ОПРЕДЕЛЕНИЕ КОЛЛАГЕНПОДОБНОГОТИТУЛ 2 ПЕПТИД С ПОВТОРЯЮЩЕЙСЯ ПОСЛЕДОВАТЕЛЬНОСТЬЮ (PRO-PRO-GLY)...EXPDTA ДИФРАКЦИЯ РЕНТГЕНОВСКОГО ИЗЛУЧЕНИЯАВТОР РЗКРАМЕР, Л. ВИТАЛЬЯНО, Ж. БЕЛЛА, Р. БЕРИЗИО, Л. МАЗЗАРЕЛЛА,АВТОР 2 Б.БРОДСКИЙ, А.ЗАГАРИ, ГМБЕРМАН...ЗАМЕЧАНИЕ 350 БИОМОЛЕКУЛА: 1ЗАМЕЧАНИЕ 350 ПРИМЕНЯЙТЕ СЛЕДУЮЩИЕ К ЦЕПЯМ: A, B, CЗАМЕЧАНИЕ 350 BIOMT1 1 1.000000 0.000000 0.000000 0.00000ЗАМЕЧАНИЕ 350 BIOMT2 1 0,000000 1,000000 0,000000 0,00000...SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLYSEQRES 1 B 6 PRO PRO GLY PRO PRO GLYSEQRES 1 C 6 PRO PRO GLY PRO PRO GLY...АТОМ 1 Н ПРО А 1 8,316 21,206 21,530 1,00 17,44 НATOM 2 CA PRO A 1 7,608 20,729 20,336 1,00 17,44 СATOM 3 C PRO A 1 8,487 20,707 19,092 1,00 17,44 CАТОМ 4 О ПРО А 1 9,466 21,457 19,005 1,00 17,44 ОATOM 5 CB PRO A 1 6,460 21,723 20,211 1,00 22,26 С...HETATM 130 C ACY 401 3,682 22,541 11,236 1,00 21,19 CHETATM 131 O ACY 401 2,807 23,097 10,553 1,00 21,19 OHETATM 132 OXT ACY 401 4,306 23,101 12,291 1,00 21,19 O...
Записи HEADER, TITLE и AUTHOR
предоставить информацию об исследователях, которые определили структуру; доступно множество других типов записей для предоставления других типов информации.
ЗАМЕЧАНИЕ записи
могут содержать аннотации произвольной формы, но они также содержат стандартизованную информацию; например, в REMARK 350 BIOMTзаписях описывается, как вычислить координаты экспериментально наблюдаемого мультимера из координат явно заданных координат одного повторяющегося элемента.
SEQRES записи
приведите последовательности трех пептидных цепей (названных A, B и C), которые в этом примере очень короткие, но обычно охватывают несколько строк.
Записи ATOM
описывают координаты атомов, входящих в состав белка. Например, первая строка ATOM выше описывает атом альфа-N первого остатка пептидной цепи A, который является остатком пролина; первые три числа с плавающей запятой - это координаты x, y и z в единицах Ангстремов . [3] Следующие три столбца - это заполняемость, температурный коэффициент и название элемента соответственно.
Записи HETATM
описывают координаты гетероатомов, то есть тех атомов, которые не входят в состав молекулы белка.

Программное обеспечение для молекулярной визуализации, способное отображать файлы PDB [ править ]

См. Также [ править ]

  • Формат химического файла
  • ScientificPython - предоставляет интерфейс для Python
  • Программное обеспечение для моделирования молекулярной механики

Ссылки [ править ]

  1. ^ Берман, Хелен М. "Банк данных белка: историческая перспектива". Acta Crystallographica Section A 64.1 (2007): 88-95.
  2. ^ "Формат ввода атомарных координат Версия 3.3" . wwPDB. Июль 2011 г.
  3. ^ "Формат wwPDB версии 3.3: Координатный раздел" . Архивировано из оригинала на 2012-02-28 . Проверено 23 марта 2012 .

Внешние ссылки [ править ]

  • Руководство по формату PDB Это текущая версия (3.3) спецификации формата PDB.
  • PDBML Более новый альтернативный формат файлов на основе XML для молекулярных координат.
  • Банк данных белков RCSB
  • Банк данных о белках в Европе
  • База данных молекулярного моделирования (MMDB) от NCBI
  • Проект восстановления wwPDB от wwPDB
  • MakeMultimer Онлайн-инструмент для расширения записей BIOMT в файлах pdb
  • Приложение Molecules для iPad / iPhone для отображения файлов PDB
  • Библиотека макромолекул Python (mmLib) - библиотека Python, способная читать и записывать форматы файлов PDB.