Это хорошая статья. Для получения дополнительной информации нажмите здесь.
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Структурное выравнивание тиоредоксинов человека и мухи Drosophila melanogaster . Белки показаны в виде лент, белок человека - красным, а белок мух - желтым. Генерируется из PDB 3TRX и 1XWC .

Структурное выравнивание пытается установить гомологию между двумя или более полимерными структурами на основе их формы и трехмерной конформации . Этот процесс обычно применяется к третичным структурам белков, но также может использоваться для больших молекул РНК . В отличие от простой структурной суперпозиции, где известны по крайней мере некоторые эквивалентные остатки двух структур, структурное выравнивание не требует априорного знания эквивалентных положений. Структурное выравнивание - ценный инструмент для сравнения белков с низким сходством последовательностей, где эволюционные отношения между белками не могут быть легко обнаружены стандартными методами.методы выравнивания последовательностей . Структурное выравнивание, следовательно, может использоваться для обозначения эволюционных отношений между белками, которые имеют очень мало общей последовательности. Однако следует проявлять осторожность при использовании результатов в качестве доказательства общей эволюционной родословной из-за возможных смешивающих эффектов конвергентной эволюции, посредством которой несколько неродственных аминокислотных последовательностей сходятся в общей третичной структуре .

Структурные выравнивания могут сравнивать две последовательности или несколько последовательностей . Поскольку эти выравнивания основываются на информации о трехмерных конформациях всех запрашиваемых последовательностей, этот метод можно использовать только для последовательностей, для которых эти структуры известны. Обычно их находят с помощью рентгеновской кристаллографии или ЯМР-спектроскопии . Можно выполнить структурное выравнивание структур, созданных методами прогнозирования структуры . Действительно, оценка таких прогнозов часто требует структурного согласования между моделью и реально известной структурой для оценки качества модели. [1] Структурное выравнивание особенно полезно при анализе данных структурной геномики ипротеомики , и их можно использовать в качестве точек сравнения для оценки выравниваний, произведенных методами биоинформатики, основанными исключительно на последовательностях . [2] [3] [4]

Результатами структурного выравнивания являются суперпозиция наборов атомных координат и минимальное среднеквадратичное отклонение ( RMSD ) между структурами. RMSD двух выровненных структур указывает на их расхождение друг с другом. Структурное выравнивание может быть затруднено существованием нескольких белковых доменов внутри одной или нескольких входных структур, поскольку изменения относительной ориентации доменов между двумя выравниваемыми структурами могут искусственно раздувать RMSD.

Данные, полученные в результате структурного выравнивания [ править ]

Минимальная информация, полученная при успешном структурном выравнивании, представляет собой набор остатков, которые считаются эквивалентными между структурами. Этот набор эквивалентностей затем обычно используется для наложения трехмерных координат для каждой входной структуры. (Обратите внимание, что один входной элемент может быть зафиксирован в качестве эталона, и поэтому его наложенные координаты не изменяются.) Подобранные структуры могут использоваться для расчета взаимных значений RMSD, а также других более сложных мер структурного сходства, таких как проверка глобального расстояния (GDT, [5] метрика, используемая в CASP ). Структурное выравнивание также подразумевает соответствующее одномерное выравнивание последовательности. из которых идентичность последовательностей или процент остатков, которые идентичны между входными структурами, могут быть рассчитаны как мера того, насколько тесно связаны две последовательности.

Типы сравнений [ править ]

Поскольку белковые структуры состоят из аминокислот , боковые цепи которых связаны общим белковым каркасом, ряд различных возможных подмножеств атомов, составляющих макромолекулу белка, можно использовать для получения структурного выравнивания и вычисления соответствующих значений RMSD. При выравнивании структур с очень разными последовательностями атомы боковой цепи обычно не учитываются, поскольку их идентичность различается между многими выровненными остатками. По этой причине в методах структурного выравнивания обычно используются по умолчанию только атомы основной цепи, включенные в пептидную связь . Для простоты и эффективности часто рассматриваются только положения альфа-углерода , поскольку пептидная связь имеет минимальный вариантплоское строение. Только когда выравниваемые структуры очень похожи или даже идентичны, имеет смысл выравнивать положения атомов боковой цепи, и в этом случае RMSD отражает не только конформацию остова белка, но также ротамерные состояния боковых цепей. Другие критерии сравнения, которые снижают шум и подтверждают положительные совпадения, включают назначение вторичной структуры , нативные карты контактов или картины взаимодействия остатков, меры упаковки боковых цепей и меры удержания водородных связей . [6]

Структурная суперпозиция [ править ]

Самое простое возможное сравнение белковых структур не пытается выровнять входные структуры и требует предварительно рассчитанного выравнивания в качестве входных данных, чтобы определить, какие из остатков в последовательности должны учитываться при вычислении RMSD. Структурная суперпозиция обычно используется для сравнения нескольких конформаций одного и того же белка (в этом случае выравнивание не требуется, поскольку последовательности одинаковы) и для оценки качества выравниваний, произведенных с использованием только информации о последовательностях между двумя или более последовательностями, структура которых известна. . Этот метод традиционно использует простой алгоритм подбора наименьших квадратов, в котором оптимальные повороты и перемещения находятся путем минимизации суммы квадратов расстояний между всеми структурами в суперпозиции. [7]В последнее время методы максимального правдоподобия и байесовские методы значительно повысили точность расчетных матриц вращения, сдвигов и ковариаций для суперпозиции. [8] [9]

Алгоритмы, основанные на многомерных поворотах и ​​модифицированных кватернионах , были разработаны для определения топологических отношений между белковыми структурами без необходимости предварительно определенного выравнивания. Такие алгоритмы успешно идентифицировали канонические складки, такие как четырехспиральный пучок . [10] Метод SuperPose достаточно расширяем, чтобы исправлять относительные повороты доменов и другие структурные ошибки. [11]

Оценка сходства [ править ]

Часто целью поиска структурной суперпозиции является не столько сама суперпозиция, сколько оценка сходства двух структур или уверенность в отдаленном совмещении. [1] [2] [3] Тонкое, но важное отличие от максимальной структурной суперпозиции - это преобразование выравнивания в значимую оценку сходства. [12] [13] Большинство методов выдают своего рода «оценку», указывающую качество наложения. [5] [14] [15] [12] [13] Однако то, что на самом деле нужно, - это не просто оценочный «Z-балл» или оценочныйE-значение для случайного наблюдения наблюдаемой суперпозиции, но вместо этого желательно, чтобы оценочное E-значение было тесно коррелировано с истинным E-значением. Важно отметить, что даже если оценочное значение E метода в среднем является точно правильным , если ему не хватает низкого стандартного отклонения в процессе генерации оценочного значения, то ранжирование относительных сходств белка запроса к набору сравнения редко согласуется с «истинный» порядок. [12] [13]

Различные методы накладывают разное количество остатков, потому что они используют разные гарантии качества и разные определения «перекрытия»; некоторые включают только остатки, удовлетворяющие множеству локальных и глобальных критериев суперпозиции, а другие являются более жадными, гибкими и беспорядочными. Большее количество наложенных атомов может означать большее сходство, но это не всегда может давать лучшее E-значение, количественно определяющее маловероятность суперпозиции, и, следовательно, не так полезно для оценки сходства, особенно в удаленных гомологах. [1] [2] [3] [4]

Алгоритмическая сложность [ править ]

Оптимальное решение [ править ]

Было показано, что оптимальное " навешивание " белковой последовательности на известную структуру и получение оптимального множественного выравнивания последовательностей является NP-полным . [16] [17] Однако это не означает, что проблема структурного выравнивания является NP-полной. Строго говоря, оптимальное решение проблемы выравнивания структуры белка известно только для определенных мер сходства структуры белка, таких как меры, используемые в экспериментах по предсказанию структуры белка, GDT_TS [5] и MaxSub. [14] Эти меры могут быть строго оптимизированы с помощью алгоритма, способного максимизировать количество атомов в двух белках, которые могут быть наложены друг на друга при заранее заданном отрезке расстояния. [15] К сожалению, алгоритм оптимального решения непрактичен, поскольку время его работы зависит не только от длины, но и от внутренней геометрии входных белков.

Примерное решение [ править ]

Были разработаны приближенные полиномиальные алгоритмы структурного выравнивания, которые производят семейство «оптимальных» решений в пределах параметра приближения для данной функции оценки. [15] [18] Хотя эти алгоритмы теоретически классифицируют проблему приблизительного выравнивания структуры белка как «решаемую», они по-прежнему слишком дороги в вычислительном отношении для крупномасштабного анализа структуры белка. Как следствие, практических алгоритмов, которые сходятся к глобальным решениям выравнивания, учитывая функцию подсчета очков, не существует. Поэтому большинство алгоритмов являются эвристическими, но были разработаны алгоритмы, которые гарантируют сходимость по крайней мере к локальным максимизаторам функций подсчета и являются практичными. [19]

Представление структур [ править ]

Белковые структуры должны быть представлены в некотором координатно-независимом пространстве, чтобы сделать их сопоставимыми. Обычно это достигается путем построения матрицы от последовательности к последовательности или серии матриц, которые включают сравнительные показатели: а не абсолютные расстояния относительно фиксированного координатного пространства. Интуитивно понятное представление - это матрица расстояний , которая представляет собой двумерную матрицу, содержащую все попарные расстояния между некоторым подмножеством атомов в каждой структуре (например, альфа-атомами углерода ). Размерность матрицы увеличивается по мере увеличения количества одновременно выравниваемых структур. Уменьшение белка до грубого показателя, такого как вторичная структураэлементы (SSE) или структурные фрагменты также могут производить разумное выравнивание, несмотря на потерю информации из-за отбрасывания расстояний, поскольку также отбрасывается шум . [20] Выбор представления для облегчения вычислений имеет решающее значение для разработки эффективного механизма выравнивания.

Методы [ править ]

Методы структурного выравнивания использовались при сравнении отдельных структур или наборов структур, а также при создании баз данных сравнения «все ко всем», которые измеряют расхождение между каждой парой структур, присутствующей в банке данных белков (PDB). Такие базы данных используются для классификации белков по их складке .

ДАЛИ [ править ]

Иллюстрация векторов атом-атом, вычисленных в SSAP. Из этих векторов можно построить серию векторных различий, например, между (FA) в протеине 1 и (SI) в протеине 2. Две последовательности нанесены на два измерения матрицы, чтобы сформировать матрицу различий между двумя белками. Динамическое программирование применяется ко всем возможным матрицам разностей для построения серии оптимальных путей локального выравнивания, которые затем суммируются, чтобы сформировать итоговую матрицу, на которой выполняется второй раунд динамического программирования.

Распространенным и популярным методом структурного выравнивания является DALI или метод ALIgnment матрицы расстояний, который разбивает входные структуры на гексапептидные фрагменты и вычисляет матрицу расстояний, оценивая образцы контактов между последовательными фрагментами. [21] Вторичные структурные особенности, в которых участвуют смежные по порядку вычеты, появляются на главной диагонали матрицы.; другие диагонали в матрице отражают пространственные контакты между остатками, которые не находятся рядом друг с другом в последовательности. Когда эти диагонали параллельны главной диагонали, элементы, которые они представляют, параллельны; когда они перпендикулярны, их черты антипараллельны. Это представление требует большого объема памяти, поскольку элементы квадратной матрицы симметричны (и, следовательно, избыточны) относительно главной диагонали.

Когда матрицы расстояний двух белков имеют одинаковые или похожие особенности в примерно одинаковых положениях, можно сказать, что они имеют похожие складки с петлями одинаковой длины, соединяющими их элементы вторичной структуры. Фактический процесс выравнивания DALI требует поиска сходства после построения матриц расстояний двух белков; это обычно выполняется с помощью серии перекрывающихся подматриц размером 6x6. Затем совпадения подматриц повторно собираются в окончательное выравнивание с помощью стандартного алгоритма максимизации очков - в исходной версии DALI использовался метод Монте-Карло.моделирование, чтобы максимизировать показатель структурного сходства, который является функцией расстояний между предполагаемыми соответствующими атомами. В частности, более удаленные атомы в пределах соответствующих элементов экспоненциально уменьшаются, чтобы уменьшить влияние шума, вносимого подвижностью петель, скручиванием спирали и другими незначительными структурными изменениями. [20] Поскольку DALI полагается на матрицу расстояний от всех до всех, он может учитывать возможность того, что структурно выровненные объекты могут появляться в разных порядках в двух сравниваемых последовательностях.

Метод DALI также использовался для создания базы данных, известной как FSSP (складывающаяся классификация, основанная на выравнивании структуры и структуры белков или семейств структурно подобных белков), в которой все известные белковые структуры выровнены друг с другом для определения их структурных соседей и складная классификация. Существует база данных с возможностью поиска на основе DALI, а также загружаемая программа и поиск в Интернете на основе автономной версии, известной как DaliLite.

Комбинаторное расширение [ править ]

Метод комбинаторного расширения (CE) похож на DALI в том, что он также разбивает каждую структуру в наборе запросов на серию фрагментов, которые затем пытается повторно собрать в полное выравнивание. Серия попарных комбинаций фрагментов, называемых парами выровненных фрагментов или AFP, используется для определения матрицы сходства, с помощью которой генерируется оптимальный путь для идентификации окончательного совмещения. Только те AFP, которые соответствуют заданным критериям локального сходства, включаются в матрицу как средство уменьшения необходимого пространства поиска и, таким образом, повышения эффективности. [22]Возможен ряд показателей сходства; Первоначальное определение метода CE включало только структурные суперпозиции и расстояния между остатками, но с тех пор было расширено за счет включения местных экологических свойств, таких как вторичная структура, воздействие растворителя, образцы водородных связей и двугранные углы . [22]

Путь выравнивания рассчитывается как оптимальный путь через матрицу сходства путем линейного продвижения по последовательностям и расширения выравнивания со следующей возможной парой AFP с высоким баллом. Первоначальная пара AFP, которая является ядром выравнивания, может находиться в любой точке матрицы последовательностей. Затем расширения переходят к следующему AFP, который соответствует заданным критериям расстояния, ограничивая выравнивание небольшими размерами зазора. Размер каждого AFP и максимальный размер зазора являются обязательными входными параметрами, но обычно устанавливаются на эмпирически определенные значения 8 и 30 соответственно. [22] Подобно DALI и SSAP, CE использовался для создания универсальной базы данных классификации на основе известных белковых структур в PDB.

RCSB PDB недавно выпустила обновленную версию CE, мамонт и Fatcat как часть RCSB PDB белка Сравнение инструментов . Он предоставляет новую разновидность CE, которая может обнаруживать кольцевые перестановки в белковых структурах. [23]

Мамонт [ править ]

МАМОНТ [12]подходит к проблеме выравнивания с другой цели, чем почти все другие методы. Вместо того, чтобы пытаться найти выравнивание, которое максимально перекрывает наибольшее количество остатков, он ищет подмножество структурного выравнивания, которое с наименьшей вероятностью произойдет случайно. Для этого он отмечает локальное выравнивание мотива флажками, чтобы указать, какие остатки одновременно удовлетворяют более строгим критериям: 1) перекрытие локальных структур 2) регулярная вторичная структура 3) 3D-суперпозиция 4) такой же порядок в первичной последовательности. Он преобразует статистику количества остатков с совпадениями с высокой степенью достоверности и размера белка, чтобы случайно вычислить значение ожидания для результата. Он отлично справляется с сопоставлением удаленных гомологов, особенно структур, созданных с помощью предсказания структуры ab initio, с семействами структур, такими как SCOP,потому что он подчеркивает извлечение статистически надежного суб-выравнивания, а не достижение максимального выравнивания последовательностей или максимальной трехмерной суперпозиции.[2] [3]

Для каждого перекрывающегося окна из 7 последовательных остатков он вычисляет набор единичных векторов направления смещения между соседними остатками C-альфа. Локальные мотивы «все против всех» сравниваются на основе оценки URMS. Эти значения становятся записями оценки парного выравнивания для динамического программирования, которое производит начальное попарное выравнивание остатков. На втором этапе используется модифицированный алгоритм MaxSub: одна 7-местная выровненная пара в каждом белке используется для ориентации двух полноразмерных белковых структур, чтобы максимально наложить их только на эти 7 C-альфа, затем в этой ориентации он сканирует любые дополнительные выровненные пары. близкие в 3D. Он переориентирует структуры, чтобы наложить этот расширенный набор, и выполняет итерацию до тех пор, пока не перестанут совпадать пары в 3D. Этот процесс перезапускается для каждых 7 окон остатков в выравнивании семян.На выходе получается максимальное количество атомов, найденное в любом из этих начальных затравок. Эта статистика преобразуется в откалиброванное значение E для сходства белков.

Mammoth не пытается повторить первоначальное выравнивание или расширить подмножество высокого качества. Поэтому отображаемое начальное выравнивание нельзя справедливо сравнивать с выравниванием DALI или TM, поскольку оно было сформировано просто как эвристика для сокращения пространства поиска. (Его можно использовать, если нужно выравнивание, основанное исключительно на локальном сходстве структуры и мотива, независимо от атомного выравнивания твердого тела на больших расстояниях.) Из-за той же экономичности он более чем в десять раз быстрее, чем DALI, CE и TM-align. [24] Он часто используется в сочетании с этими более медленными инструментами для предварительного просмотра больших баз данных с целью извлечения только лучших структур, связанных с E-значением, для более исчерпывающего наложения или дорогостоящих вычислений. [25] [26]

Он оказался особенно успешным при анализе структур-ловушек на основе предсказания структуры ab initio. [1] [2] [3] Эти приманки печально известны тем, что получают правильную структуру мотивов локальных фрагментов и формируют некоторые ядра правильной трехмерной третичной структуры, но неверно получают полную третичную структуру. В этом сумеречном режиме удаленной гомологии е-значения Мамонта для оценки предсказания структуры белка CASP [1] оказались значительно более коррелированными с человеческим рейтингом, чем SSAP или DALI. [12]Способность мамонтов извлекать многокритериальные частичные перекрытия с белками известной структуры и ранжировать их с соответствующими значениями E, в сочетании с его скоростью, облегчает сканирование огромного количества моделей ложных целей по базе данных PDB для определения наиболее вероятных правильных ложных целей на основе их удаленная гомология с известными белками. [2]

SSAP [ править ]

Метод SSAP (программа последовательного выравнивания структуры) использует двойное динамическое программирование для создания структурного выравнивания на основе векторов атом-атом в пространстве структуры. Вместо альфа-атомов углерода, обычно используемых при структурном выравнивании, SSAP конструирует свои векторы из бета-атомов углерода.для всех остатков, кроме глицина, метод, который, таким образом, учитывает ротамерное состояние каждого остатка, а также его расположение вдоль основной цепи. SSAP работает, сначала конструируя серию векторов расстояний между остатками между каждым остатком и его ближайшими несмежными соседями на каждом белке. Затем строится серия матриц, содержащих разности векторов между соседями для каждой пары остатков, для которых были построены векторы. Динамическое программирование, применяемое к каждой результирующей матрице, определяет ряд оптимальных локальных выравниваний, которые затем суммируются в «итоговую» матрицу, к которой динамическое программирование применяется снова для определения общего структурного выравнивания.

Первоначально SSAP производил только попарные выравнивания, но с тех пор был расширен и на множественные выравнивания. [27] Он был применен универсально для создания иерархической схемы классификации складок, известной как CATH (класс, архитектура, топология, гомология), [28] которая использовалась для создания базы данных классификации структуры белков CATH. .

Последние события [ править ]

Улучшения в методах структурного выравнивания составляют активную область исследований, и часто предлагаются новые или модифицированные методы, которые, как утверждается, предлагают преимущества по сравнению с более старыми и более широко распространенными методами. В недавнем примере TM-align используется новый метод взвешивания своей матрицы расстояний, к которому затем применяется стандартное динамическое программирование . [29] [13] Взвешивание предлагается для ускорения сходимости динамического программирования и корректировки эффектов, возникающих из-за длин выравнивания. В сравнительном исследовании сообщалось, что TM-align улучшает как скорость, так и точность по сравнению с DALI и CE. [29]

Другими многообещающими методами структурного выравнивания являются методы локального структурного выравнивания. Они обеспечивают сравнение предварительно выбранных частей белков (например, сайтов связывания, определяемых пользователем структурных мотивов) [30] [31] [32] с сайтами связывания или базами данных структур целых белков. Серверы MultiBind и MAPPIS [32] [33] позволяют идентифицировать общие пространственные структуры физико-химических свойств, таких как донор Н-связи, акцептор, алифатические, ароматические или гидрофобные, в наборе предоставленных пользователем сайтов связывания белков, определяемых взаимодействиями с небольшими молекулами. (MultiBind) или в наборе предоставляемых пользователем межбелковых интерфейсов (MAPPIS). Другие обеспечивают сравнение полных белковых структур [34]против ряда структур, представленных пользователем, или против большой базы данных структур белков в разумные сроки ( ProBiS [35] ). В отличие от подходов глобального выравнивания, подходы локального структурного выравнивания подходят для обнаружения локально консервативных паттернов функциональных групп, которые часто появляются в сайтах связывания и имеют значительное участие в связывании лиганда. [33] В качестве примера сравнивается G-Losa, [36] инструмент для выравнивания локальной структуры, с TM-align, методом на основе глобального выравнивания структуры. В то время как G-Losa предсказывает положения лекарственно-подобных лигандов в одноцепочечных белковых мишенях более точно, чем TM-align, общая вероятность успеха TM-align лучше. [37]

Однако по мере того, как улучшения алгоритмов и производительность компьютеров устранили чисто технические недостатки старых подходов, стало ясно, что не существует единого универсального критерия для «оптимального» структурного согласования. TM-align, например, особенно надежен при количественной оценке сравнений между наборами белков с большими различиями в длинах последовательностей, но он только косвенно фиксирует водородные связи или сохранение порядка вторичной структуры, что может быть лучшим показателем для выравнивания эволюционно связанных белков. Таким образом, недавние разработки были сосредоточены на оптимизации определенных атрибутов, таких как скорость, количественная оценка, корреляция с альтернативными золотыми стандартами или допустимость несовершенства структурных данных или структурных моделей ab initio. Альтернативная методология, которая набирает популярность, заключается в использованииконсенсус различных методов для установления структурного сходства белков. [38]

Структурное выравнивание РНК [ править ]

Методы структурного выравнивания традиционно применялись исключительно к белкам как первичным биологическим макромолекулам, которые принимают характерные трехмерные структуры. Однако большие молекулы РНК также образуют характерные третичные структуры , которые опосредуются в первую очередь водородными связями, образованными между парами оснований, а также стэкингом оснований . Функционально похожие некодирующие молекулы РНК могут быть особенно трудными для извлечения из данных геномики, потому что структура более консервативна, чем последовательность в РНК, а также в белках [40], а более ограниченный алфавит РНК снижаетинформационное содержание любого данного нуклеотида в любой данной позиции.

Однако из-за растущего интереса к структурам РНК и из-за роста числа экспериментально определенных структур 3D РНК, в последнее время было разработано мало методов подобия структур РНК. Одним из таких методов является, например, SETTER [41], который разлагает каждую структуру РНК на более мелкие части, называемые общими вторичными структурными единицами (GSSU). GSSU впоследствии выравниваются, и эти частичные выравнивания объединяются в окончательное выравнивание структуры РНК и оцениваются. Метод реализован на веб-сервере SETTER . [42]

Недавний метод попарного структурного выравнивания последовательностей РНК с низкой идентичностью был опубликован и реализован в программе FOLDALIGN . [43] Тем не менее, этот метод не совсем аналогичен методам структурного выравнивания белков, поскольку он с помощью вычислений предсказывает структуры входных последовательностей РНК, а не требует экспериментально определенных структур в качестве входных данных. Хотя вычислительное предсказание процесса сворачивания белка на сегодняшний день не было особенно успешным, структуры РНК без псевдоязычных узлов часто могут быть разумно предсказаны с использованием методов оценки на основе свободной энергии, которые учитывают спаривание и укладку оснований. [44]

Программное обеспечение [ править ]

Выбор программного инструмента для структурного выравнивания может быть сложной задачей из-за большого разнообразия доступных пакетов, которые значительно различаются по методологии и надежности. Частичное решение этой проблемы было представлено в [38] и стало общедоступным через веб-сервер ProCKSI. Более полный список доступного в настоящее время и свободно распространяемого программного обеспечения для структурного выравнивания можно найти в программном обеспечении для структурного выравнивания .

Свойства некоторых серверов структурного выравнивания и пакетов программного обеспечения обобщены и протестированы на примерах в Structural Alignment Tools в Proteopedia.Org .

См. Также [ править ]

  • Множественное выравнивание последовательностей
  • Список программного обеспечения для выравнивания последовательностей
  • Выравнивание последовательности
  • Структурная классификация белков
  • SuperPose
  • Белковое суперсемейство

Ссылки [ править ]

  1. ^ a b c d e Крыштафович А, Монастырский Б, Фиделис К. (2016). «Статистика CASP11 и система оценки центра прогнозов» . Белки . 84 : (Дополнение 1): 15-19. DOI : 10.1002 / prot.25005 .CS1 maint: использует параметр авторов ( ссылка )
  2. ^ Б с д е е Lars Мальмзотрут Майкл Riffle, Чарли ЕСТ Штраус, Дилан Чивиана, Триша N Дэвиса, Ричард Bonneau, Дэвид Бейкер (2007). «Назначения надсемейства для протеома дрожжей посредством интеграции предсказания структуры с генной онтологией» . PLoS Biol . 5 (4): e76соответствующий автор1, 2. doi : 10.1371 / journal.pbio.0050076 .CS1 maint: использует параметр авторов ( ссылка )
  3. ^ а б в г Дэ Дэвид Э. Ким, Дилан Чивиан и Дэвид Бейкер (2004). «Прогнозирование и анализ структуры белка с помощью сервера Robetta» . Исследования нуклеиновых кислот . 32 (проблема с веб-сервером): W526 – W531. DOI : 10.1093 / NAR / gkh468 . PMID 15215442 . CS1 maint: использует параметр авторов ( ссылка )
  4. ^ a b Чжан Y, Сколник J (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Proc Natl Acad Sci USA . 102 (4): 1029–34. DOI : 10.1073 / pnas.0407152101 . PMC 545829 . PMID 15653774 .  
  5. ^ а б в Земля А. (2003). «LGA - метод поиска трехмерных сходств в структурах белков» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. DOI : 10.1093 / NAR / gkg571 . PMC 168977 . PMID 12824330 .  
  6. ^ Godzik A (1996). «Структурное выравнивание двух белков: есть ли единственный ответ?» . Белковая наука . 5 (7): 1325–38. DOI : 10.1002 / pro.5560050711 . PMC 2143456 . PMID 8819165 .  
  7. ^ Мартин ACR (1982). «Быстрое сравнение белковых структур». Acta Crystallogr . 38 (6): 871–873. DOI : 10.1107 / S0567739482001806 .
  8. ^ Теобальд DL, Вуттка DS (2006). «Эмпирические байесовские иерархические модели для регуляризации оценки максимального правдоподобия в матричной гауссовской задаче Прокруста» . Труды Национальной академии наук . 103 (49): 18521–18527. DOI : 10.1073 / pnas.0508445103 . PMC 1664551 . PMID 17130458 .  
  9. ^ Теобальд DL, Вуттка DS (2006). «THESEUS: Максимальное правдоподобие наложения и анализ макромолекулярных структур» . Биоинформатика . 22 (17): 2171–2172. DOI : 10.1093 / биоинформатики / btl332 . PMC 2584349 . PMID 16777907 .  
  10. ^ Дидерикс К. (1995). «Структурное наложение белков с неизвестным выравниванием и обнаружение топологического сходства с использованием алгоритма шестимерного поиска» . Белки . 23 (2): 187–95. DOI : 10.1002 / prot.340230208 . PMID 8592700 . 
  11. ^ Маити R, Ван Domselaar GH, Чжан H, Wishart DS (2004). «SuperPose: простой сервер для сложной структурной суперпозиции» . Nucleic Acids Res . 32 (выпуск веб-сервера): W590–4. DOI : 10.1093 / NAR / gkh477 . PMC 441615 . PMID 15215457 .  
  12. ^ a b c d e Ортис, штат Арканзас; Штраус CE; Ольмеа О. (2002). «МАМОНТ (сопоставление молекулярных моделей, полученных из теории): автоматизированный метод сравнения моделей» . Белковая наука . 11 (11): 2606–2621. DOI : 10.1110 / ps.0215902 . PMID 12381844 . 
  13. ^ а б в г Чжан Ю., Сколник Дж. (2004). «Функция скоринга для автоматической оценки качества шаблона структуры белка». Белки . 57 (4): 702–710. DOI : 10.1002 / prot.20264 . PMID 15476259 . 
  14. ^ a b Siew N, Elofsson A, Rychlewsk L, Fischer D (2000). «MaxSub: автоматизированная мера для оценки качества предсказания структуры белка» . Биоинформатика . 16 (9): 776–85. DOI : 10.1093 / биоинформатики / 16.9.776 . PMID 11108700 . 
  15. ^ а б в Полексич А (2009). «Алгоритмы оптимального выравнивания структуры белков» . Биоинформатика . 25 (21): 2751–2756. DOI : 10.1093 / биоинформатики / btp530 . PMID 19734152 . 
  16. ^ Lathrop RH. (1994). «Проблема потоковой передачи белка с предпочтениями взаимодействия аминокислотных последовательностей является NP-полной». Protein Eng . 7 (9): 1059–68. CiteSeerX 10.1.1.367.9081 . DOI : 10,1093 / белок / 7.9.1059 . PMID 7831276 .  
  17. Перейти ↑ Wang L, Jiang T (1994). «О сложности множественного выравнивания последовательностей». Журнал вычислительной биологии . 1 (4): 337–48. CiteSeerX 10.1.1.408.894 . DOI : 10,1089 / cmb.1994.1.337 . PMID 8790475 .  
  18. ^ Колодный R, Linial N (2004). «Приблизительное структурное выравнивание белка за полиномиальное время» . PNAS . 101 (33): 12201–12206. DOI : 10.1073 / pnas.0404383101 . PMC 514457 . PMID 15304646 .  
  19. ^ Мартинес L, Andreani, R, Мартинес, JM. (2007). «Конвергентные алгоритмы структурного выравнивания белков» . BMC Bioinformatics . 8 : 306. DOI : 10,1186 / 1471-2105-8-306 . PMC 1995224 . PMID 17714583 .  CS1 maint: несколько имен: список авторов ( ссылка )
  20. ^ a b Установите DM. (2004). Биоинформатика: анализ последовательности и генома 2-е изд. Лабораторный пресс Колд-Спринг-Харбор: Колд-Спринг-Харбор, Нью-Йорк, ISBN 0879697121 
  21. Перейти ↑ Holm L, Sander C (1996). «Картографирование белковой вселенной». Наука . 273 (5275): 595–603. DOI : 10.1126 / science.273.5275.595 . PMID 8662544 . 
  22. ^ a b c Шиндялов И.Н.; Bourne PE (1998). «Выравнивание структуры белка путем возрастающего комбинаторного расширения (CE) оптимального пути» . Белковая инженерия . 11 (9): 739–747. DOI : 10,1093 / белок / 11.9.739 . PMID 9796821 . 
  23. ^ Прлич A, S Bliven, Роза PW, Блюм WF, Бизон C, Godzik A, Bourne PE (2010). «Предварительно рассчитанные выравнивания структуры белков на сайте RCSB PDB» . Биоинформатика . 26 (23): 2983–2985. DOI : 10.1093 / биоинформатики / btq572 . PMC 3003546 . PMID 20937596 .  
  24. Pin-Hao Chi, Bin Pang, Дмитрий Коркин, Chi-Ren Shyu (2009). «Эффективная SCOP-кратная классификация и извлечение с использованием сопоставления белковых субструктур на основе индексов» . Биоинформатика . 25 (19): 2559–2565. DOI : 10.1093 / биоинформатики / btp474 .CS1 maint: использует параметр авторов ( ссылка )
  25. Сара Чик, Юань Ци, Шри Кришна, Лиза Н. Кинч и Ник В. Гришин (2004). «SCOPmap: автоматическое отнесение белковых структур к эволюционным суперсемействам» . BMC Bioinformatics . 5 (197). DOI : 10.1186 / 1471-2105-5-197 . PMID 15598351 . CS1 maint: использует параметр авторов ( ссылка )
  26. ^ Кай Ван, Рам Самудрала. «FSSA: новый метод определения функциональных сигнатур по структурным согласованиям» . Биоинформатика . 21 (13): 2969–2977. DOI : 10.1093 / биоинформатики / bti471 .CS1 maint: использует параметр авторов ( ссылка )
  27. ^ Тейлора WR, Flores Т.П., Orengo CA (1994). «Множественное выравнивание структуры белка» . Protein Sci . 3 (10): 1858–70. DOI : 10.1002 / pro.5560031025 . PMC 2142613 . PMID 7849601 .  
  28. ^ Orengo CA, Мичи Д., Джонс S, Джонс DT, Swindells MB, Thornton JM (1997). «CATH: иерархическая классификация структур домена белка». Структура . 5 (8): 1093–1108. DOI : 10.1016 / S0969-2126 (97) 00260-8 . PMID 9309224 . 
  29. ^ a b Чжан Y, Сколник J (2005). «TM-align: алгоритм выравнивания структуры белка на основе TM-score» . Исследования нуклеиновых кислот . 33 (7): 2302–2309. DOI : 10.1093 / NAR / gki524 . PMC 1084323 . PMID 15849316 .  
  30. ^ Стефано Ангаран; Мэри Эллен Бок ; Клаудио Гарутти; Concettina Guerra1 (2009). «MolLoc: веб-инструмент для локального структурного выравнивания молекулярных поверхностей» . Исследования нуклеиновых кислот . 37 (выпуск веб-сервера): W565–70. DOI : 10.1093 / NAR / gkp405 . PMC 2703929 . PMID 19465382 .  
  31. ^ Gaëlle Debret; Арно Мартель; Филипп Куниасс (2009). "РАСМОТ-3D ПРО: поисковый веб-сервер по 3D-мотивам" . Исследования нуклеиновых кислот . 37 (выпуск веб-сервера): W459–64. DOI : 10.1093 / NAR / gkp304 . PMC 2703991 . PMID 19417073 .  
  32. ^ a b Александра Шульман-Пелег; Максим Шацкий; Рут Нусинов; Хаим Дж. Вольфсон (2008). «MultiBind и MAPPIS: веб-серверы для множественного выравнивания сайтов связывания белков 3D и их взаимодействия» . Исследования нуклеиновых кислот . 36 (выпуск веб-сервера): W260–4. DOI : 10.1093 / NAR / gkn185 . PMC 2447750 . PMID 18467424 .  
  33. ^ a b Александра Шульман-Пелег; Максим Шацкий; Рут Нусинов; Хаим Дж. Вольфсон (2007). «Пространственная химическая консервация взаимодействий горячих точек в белково-белковых комплексах» . BMC Biology . 5 (43): 43. DOI : 10.1186 / 1741-7007-5-43 . PMC 2231411 . PMID 17925020 .  
  34. ^ Габриэле Аузиелло; Пьер Федерико Герардини; Паоло Маркатили; Анна Трамонтано; Allegra Via; Мануэла Хельмер-Читтерих (2008). «FunClust: веб-сервер для идентификации структурных мотивов в наборе негомологичных белковых структур» . BMC Biology . 9 : S2. DOI : 10.1186 / 1471-2105-9-S2-S2 . PMC 2323665 . PMID 18387204 .  
  35. ^ Janez Konc; Душанка Янежич (2010). «Алгоритм ProBiS для обнаружения структурно подобных сайтов связывания белков путем локального структурного выравнивания» . Биоинформатика . 26 (9): 1160–1168. DOI : 10.1093 / биоинформатики / btq100 . PMC 2859123 . PMID 20305268 .  
  36. ^ Хуэй Сун Ли; Вонпил Им (2012). «Идентификация шаблонов лигандов с использованием локального выравнивания структуры для разработки лекарств на основе структуры» . Журнал химической информации и моделирования . 52 (10): 2784–2795. DOI : 10.1021 / ci300178e . PMC 3478504 . PMID 22978550 .  
  37. ^ Хуэй Сун Ли; Вонпил Им (2013). «Обнаружение сайта связывания лиганда путем локального выравнивания структуры и его комплементарности производительности» . Журнал химической информации и моделирования . 53 (9): 2462–2470. DOI : 10.1021 / ci4003602 . PMC 3821077 . PMID 23957286 .  
  38. ^ a b Бартел Д., Херст Дж. Д., Блажевич Дж., Берк Е. К. и Красногор Н. (2007). «ProCKSI: система поддержки принятия решений для сравнения белков (структур), знаний, сходства и информации» . BMC Bioinformatics . 8 : 416. DOI : 10,1186 / 1471-2105-8-416 . PMC 2222653 . PMID 17963510 .  CS1 maint: несколько имен: список авторов ( ссылка )
  39. ^ Сиппл, М .; Видерштейн, М. (2012). «Обнаружение пространственных корреляций в белковых структурах и молекулярных комплексах» . Структура . 20 (4): 718–728. DOI : 10.1016 / j.str.2012.01.024 . PMC 3320710 . PMID 22483118 .  
  40. ^ Torarinsson Е, Sawera М, Havgaard JH, фредгольмовы М, Городкин J (2006). «Тысячи соответствующих участков генома человека и мыши, не совпадающих по первичной последовательности, содержат общую структуру РНК» . Genome Res . 16 (7): 885–9. DOI : 10.1101 / gr.5226606 . PMC 1484455 . PMID 16751343 .  
  41. ^ Hoksza D, Svozil D (2012). «Эффективное сравнение парных структур РНК методом SETTER» (PDF) . Биоинформатика . 28 (14): 1858–1864. DOI : 10.1093 / биоинформатики / bts301 . PMID 22611129 .  
  42. ^ Чех P, Svozil D, Hoksza D (2012). «SETTER: веб-сервер для сравнения структуры РНК» . Исследования нуклеиновых кислот . 40 (W1): W42 – W48. DOI : 10.1093 / NAR / gks560 . PMC 3394248 . PMID 22693209 .  
  43. ^ Havgaard JH, Lyngso РБ, Stormo Г.Д., Городкин J (2005). «Попарное локальное структурное выравнивание последовательностей РНК со сходством последовательностей менее 40%» . Биоинформатика . 21 (9): 1815–24. DOI : 10.1093 / биоинформатики / bti279 . PMID 15657094 . 
  44. ^ Mathews DH, DH Turner (2006). «Прогнозирование вторичной структуры РНК путем минимизации свободной энергии». Curr Opin Struct Biol . 16 (3): 270–8. DOI : 10.1016 / j.sbi.2006.05.010 . PMID 16713706 . 

Дальнейшее чтение [ править ]

  • Борн П.Е., Шиндялов И.Н. (2003): Сравнение и согласование структур . В: Bourne, PE, Weissig, H. (Eds): Structural Bioinformatics . Хобокен, штат Нью-Джерси: Wiley-Liss. ISBN 0-471-20200-2 
  • Юань X, Быстрофф С. (2004) "Непоследовательные структурные выравнивания выявляют не зависящие от топологии структуры упаковки ядра в белках", Биоинформатика . 5 нояб.2004 г.
  • Юнг Дж, Ли Би (2000). «Выравнивание структуры белка с использованием профилей окружающей среды» . Protein Eng . 13 (8): 535–543. DOI : 10,1093 / белок / 13.8.535 .
  • Йе Й, Годзик А (2005). «Выравнивание множественных гибких структур с использованием графов частичного порядка» . Биоинформатика . 21 (10): 2362–2369. DOI : 10.1093 / биоинформатики / bti353 . PMID  15746292 .
  • Сиппл М, Видерштейн М (2008). «Примечание о сложных проблемах выравнивания конструкций» . Биоинформатика . 24 (3): 426–427. DOI : 10.1093 / биоинформатики / btm622 . PMID  18174182 .