Гомологическое моделирование

Модель гомологии белка DHRS7B, созданная с помощью швейцарской модели и визуализированная с помощью PyMOL.

Гомологическое моделирование , также известное как сравнительное моделирование белка, относится к построению модели с атомным разрешением « целевого » белка из его аминокислотной последовательности и экспериментальной трехмерной структуры родственного гомологичного белка (« матрицы »). Гомологическое моделирование основывается на идентификации одной или нескольких известных белковых структур, которые могут напоминать структуру запрашиваемой последовательности, и на производстве выравнивания.который отображает остатки в запрашиваемой последовательности с остатками в матричной последовательности, было показано, что белковые структуры более консервативны, чем белковые последовательности среди гомологов, но последовательности, у которых идентичность последовательностей ниже 20%, могут иметь очень различную структуру. ^[1]

Эволюционно родственные белки имеют сходные последовательности, а встречающиеся в природе гомологичные белки имеют аналогичную структуру белка. Было показано, что трехмерная структура белка эволюционно более консервативна, чем можно было бы ожидать на основе одной только консервации последовательности. ^[2]

Выравнивание последовательностей и структура шаблона затем используются для создания структурной модели мишени. Поскольку белковые структуры более консервативны, чем последовательности ДНК, обнаруживаемые уровни сходства последовательностей обычно подразумевают значительное структурное сходство. ^[3]

Качество модели гомологии зависит от качества выравнивания последовательностей и структуры матрицы. Подход может быть усложнен наличием зазоров выравнивания (обычно называемых инделками), которые указывают на структурную область, присутствующую в мишени, но не в шаблоне, а также из-за зазоров в структуре в шаблоне, которые возникают из-за плохого разрешения в экспериментальной процедуре (обычно X -лучевая кристаллография ), использованная для решения структуры. Качество модели снижается с уменьшением идентичности последовательностей ; типичная модель имеет среднеквадратичное отклонение ~ 1-2 Å между согласованными атомами C ^α при 70% идентичности последовательностей, но только 2–4 Å.согласие при 25% идентичности последовательностей. Однако ошибки значительно выше в областях петель, где аминокислотные последовательности белков-мишеней и белков-матриц могут полностью отличаться.

Области модели, которые были построены без шаблона, обычно с помощью моделирования с помощью цикла , обычно намного менее точны, чем остальная часть модели. Ошибки в упаковке и положении боковой цепи также увеличиваются с уменьшением идентичности, и вариации в этих конфигурациях упаковки были предложены как основная причина низкого качества модели при низкой идентичности. ^[4] Взятые вместе, эти различные ошибки положения атомов являются значительными и препятствуют использованию моделей гомологии для целей, требующих данных с атомарным разрешением, таких как дизайн лекарств и предсказания межбелковых взаимодействий ; даже четвертичная структурабелка может быть трудно предсказать на основе моделей гомологии его субъединицы (ей). Тем не менее, модели гомологии могут быть полезны для получения качественных выводов о биохимии запрашиваемой последовательности, особенно при формулировании гипотез о том, почему определенные остатки сохраняются, что, в свою очередь, может привести к экспериментам для проверки этих гипотез. Например, пространственное расположение консервативных остатков может указывать на то, является ли конкретный остаток консервативным для стабилизации фолдинга, для участия в связывании некоторой небольшой молекулы или для содействия ассоциации с другим белком или нуклеиновой кислотой.

Гомологическое моделирование может создавать высококачественные структурные модели, когда мишень и шаблон тесно связаны, что вдохновило на формирование консорциума структурной геномики, посвященного производству репрезентативных экспериментальных структур для всех классов белковых складок. ^[5] Основные неточности в моделировании гомологии, которые ухудшаются с более низкой идентичностью последовательностей , происходят из-за ошибок в начальном выравнивании последовательностей и из-за неправильного выбора матрицы. ^[6] Как и другие методы предсказания структуры, текущая практика моделирования гомологии оценивается в проводящемся раз в два года крупномасштабном эксперименте, известном как Критическая оценка методов предсказания структуры белка, или CASP .

Мотив [ править ]

Метод моделирования гомологии основан на наблюдении, что третичная структура белка более консервативна, чем аминокислотная последовательность . ^[3] Таким образом, даже белки, которые заметно разошлись по последовательности, но все же имеют обнаруживаемое сходство, также будут иметь общие структурные свойства, в частности общую складку. Поскольку получение экспериментальных структур с помощью таких методов, как рентгеновская кристаллография и ЯМР белков, для каждого интересующего белка сложно и требует много времени , моделирование гомологии может предоставить полезные структурные модели для генерации гипотез о функции белка и направления дальнейшей экспериментальной работы.

Есть исключения из общего правила, согласно которому белки, обладающие значительной идентичностью последовательностей, будут иметь общую складку. Например, разумно подобранный набор мутаций менее 50% белка может привести к тому, что белок примет совершенно иную форму. ^[7]^[8] Однако такая масштабная структурная перестройка вряд ли произойдет в процессе эволюции , особенно с учетом того, что белок обычно находится под ограничением, заключающимся в том, что он должен сворачиваться.правильно и выполнять свою функцию в клетке. Следовательно, грубо сложенная структура белка (его «топология») консервативна дольше, чем его аминокислотная последовательность, и намного длиннее, чем соответствующая последовательность ДНК; Другими словами, два белка могут иметь схожую складку, даже если их эволюционные отношения настолько далеки, что их нельзя надежно различить. Для сравнения, функция белка консервативна намного меньше, чем последовательность белка, поскольку требуется относительно небольшое количество изменений в аминокислотной последовательности, чтобы взять на себя родственную функцию.

Этапы изготовления модели [ править ]

Процедуру моделирования гомологии можно разбить на четыре последовательных этапа: выбор шаблона, согласование целевого шаблона, построение модели и оценка модели. ^[3] Первые два шага часто по существу выполняются вместе, так как наиболее распространенные методы идентификации шаблонов основаны на получении выравниваний последовательностей; однако эти согласования могут быть недостаточного качества, потому что методы поиска в базе данных ставят скорость выше качества согласования. Эти процессы могут выполняться итеративно для повышения качества окончательной модели, хотя оценки качества, не зависящие от истинной целевой структуры, все еще находятся в стадии разработки.

Оптимизация скорости и точности этих шагов для использования в крупномасштабном автоматизированном прогнозировании структуры является ключевым компонентом инициатив в области структурной геномики, отчасти потому, что результирующий объем данных будет слишком большим для обработки вручную, а отчасти потому, что цель структурной геномики требует предоставления модели разумного качества для исследователей, которые сами не являются экспертами по предсказанию структуры. ^[3]

Выбор шаблона и выравнивание последовательностей [ править ]

Важнейшим первым шагом в моделировании гомологии является определение наилучшей структуры шаблона, если она действительно доступна. Простейший метод идентификации шаблона основан на последовательном попарном выравнивании последовательностей с помощью таких методов поиска в базе данных, как FASTA и BLAST . Более чувствительные методы, основанные на множественном выравнивании последовательностей, из которых PSI-BLAST является наиболее распространенным примером, итеративно обновляют свою зависящую от положения матрицу оценки для последовательной идентификации более отдаленно связанных гомологов. Было показано, что это семейство методов позволяет создавать большее количество потенциальных шаблонов и определять лучшие шаблоны для последовательностей, которые имеют только отдаленные отношения к любой решаемой структуре.Белок резьба , ^[9] , также известная как кратное признание или выравнивание 3D-1D, также может быть использована в качестве метода поиска для определения шаблонов , которые будут использоваться в традиционных методах моделирования гомологии. ^[3] Недавние эксперименты с CASP показывают, что некоторые методы потоковой передачи белков, такие как RaptorX, действительно более чувствительны, чем методы, основанные исключительно на последовательностях (профилях), когда для прогнозируемых белков доступны только отдаленно связанные матрицы. При выполнении поиска BLAST надежным первым подходом является выявление совпадений с достаточно низким E-значение, которые считаются достаточно близкими в эволюции, чтобы сделать надежную модель гомологии. Другие факторы могут нарушить баланс в крайних случаях; например, шаблон может иметь функцию, аналогичную функции последовательности запроса, или он может принадлежать гомологичному оперону . Однако шаблон с плохим значением E, как правило, не следует выбирать, даже если он является единственным доступным, поскольку он вполне может иметь неправильную структуру, что приведет к созданию ошибочной модели. Лучшим подходом является отправка первичной последовательности на серверы распознавания сверток ^[9] или, что еще лучше, мета-серверы консенсуса, которые улучшают индивидуальные серверы распознавания сверток, выявляя сходства (консенсус) среди независимых предсказаний.

Часто с помощью этих подходов идентифицируются несколько шаблонных структур-кандидатов. Хотя некоторые методы могут генерировать гибридные модели с большей точностью из нескольких шаблонов ^[9]^[10], большинство методов полагаются на один шаблон. Поэтому выбор лучшего шаблона из числа кандидатов является ключевым шагом и может значительно повлиять на окончательную точность структуры. Этот выбор определяется несколькими факторами, такими как схожесть последовательностей запроса и шаблона, их функций, а также вторичных структур прогнозируемого запроса и наблюдаемого шаблона . Пожалуй, самое главное, покрытиевыровненных регионов: часть структуры последовательности запроса, которую можно предсказать на основе шаблона, и достоверность полученной модели. Таким образом, иногда для одной последовательности запроса создается несколько моделей гомологии, причем наиболее вероятный кандидат выбирается только на последнем этапе.

Можно использовать выравнивание последовательностей, сгенерированное методом поиска в базе данных, в качестве основы для последующего создания модели; однако были исследованы и более сложные подходы. Одно предложение генерирует совокупность стохастически определенных парных выравниваний между целевой последовательностью и одиночным идентифицированным шаблоном как средство исследования «пространства выравнивания» в областях последовательности с низким локальным сходством. ^[11] выравнивания «профиль-профиль», которые сначала создают профиль последовательности мишени и систематически сравнивают его с профилями последовательностей решенных структур; Считается, что крупнозернистость, присущая конструкции профиля, снижает шум, вносимый дрейфом последовательности в несущественных областях последовательности.^[12]

Генерация модели [ править ]

Учитывая шаблон и выравнивание, содержащаяся в нем информация должна использоваться для создания трехмерной структурной модели мишени, представленной в виде набора декартовых координат для каждого атома в белке. Были предложены три основных класса методов генерации моделей. ^[13]^[14]

Сборка фрагментов [ править ]

Первоначальный метод моделирования гомологии основывался на сборке полной модели из консервативных структурных фрагментов, идентифицированных в тесно связанных решенных структурах. Например, модельное исследование сериновых протеаз у млекопитающих выявило резкое различие между «коровыми» структурными областями, консервативными во всех экспериментальных структурах этого класса, и вариабельными областями, обычно расположенными в петлях, где локализовано большинство различий в последовательностях. Таким образом, неразрешенные белки можно смоделировать, сначала сконструировав консервативное ядро, а затем заменив вариабельные области других белков в наборе решенных структур. ^[15]Текущие реализации этого метода различаются в основном тем, как они работают с несохраняемыми регионами или без шаблона. ^[16] Вариабельные области часто создаются с помощью библиотек фрагментов .

Соответствие сегментов [ править ]

Метод сопоставления сегментов разделяет цель на серию коротких сегментов, каждый из которых сопоставляется со своим собственным шаблоном, подобранным из банка данных белков . Таким образом, выравнивание последовательностей выполняется по сегментам, а не по всему белку. Выбор шаблона для каждого сегмента основан на сходстве последовательностей, сравнении альфа- координат углерода и предсказанных стерических конфликтах, возникающих из-за ван-дер-ваальсовых радиусов расходящихся атомов между мишенью и шаблоном. ^[17]

Удовлетворение пространственных ограничений [ править ]

Наиболее распространенный в настоящее время метод моделирования гомологии основан на расчетах, необходимых для построения трехмерной структуры на основе данных, полученных с помощью ЯМР-спектроскопии . Одно или несколько согласований мишени и шаблона используются для построения набора геометрических критериев, которые затем преобразуются в функции плотности вероятности для каждого ограничения. Ограничения, применяемые к основным внутренним координатам белка - расстояниям между остовами белка и двугранным углам - служат основой для процедуры глобальной оптимизации , которая первоначально использовала минимизацию энергии конъюгированного градиента для итеративного уточнения положений всех тяжелых атомов в белке. ^[18]

Этот метод был значительно расширен, чтобы его можно было применять специально для моделирования петель, что может быть чрезвычайно сложно из-за высокой гибкости петель в белках в водном растворе. ^[19] В более позднем расширении модель пространственного ограничения применяется к картам электронной плотности, полученным из исследований криоэлектронной микроскопии , которые предоставляют информацию с низким разрешением, которая сама по себе обычно недостаточна для создания структурных моделей с атомным разрешением. ^[20] Чтобы решить проблему неточностей в начальном выравнивании последовательности мишень-матрица, также была введена итерационная процедура для уточнения выравнивания на основе начального структурного соответствия. ^[21]Наиболее часто используемым программным обеспечением для моделирования на основе пространственных ограничений является MODELLER, и для надежных моделей, созданных с его помощью, создана база данных ModBase . ^[22]

Моделирование петель [ править ]

Области целевой последовательности, которые не выровнены по шаблону, моделируются с помощью моделирования цикла ; они наиболее подвержены серьезным ошибкам моделирования и возникают с большей частотой, когда мишень и матрица имеют низкую идентичность последовательностей. Координаты несовпадающих участков, определенные программами моделирования цикла, обычно намного менее точны, чем координаты, полученные простым копированием координат известной структуры, особенно если цикл длиннее 10 остатков. Первые два двугранных угла боковой цепи (χ ₁ и χ ₂ ) обычно можно оценить в пределах 30 ° для точной структуры основной цепи; однако более поздние двугранные углы, обнаруженные в более длинных боковых цепях, таких как лизин и аргининобщеизвестно, что их трудно предсказать. Более того, небольшие ошибки в χ ₁ (и, в меньшей степени, в χ ₂ ) могут вызывать относительно большие ошибки в позициях атомов на конце боковой цепи; такие атомы часто имеют функциональное значение, особенно когда они расположены рядом с активным центром .

Оценка модели [ править ]

Оценка моделей гомологии без ссылки на истинную целевую структуру обычно выполняется двумя методами: статистическими потенциалами или физическими расчетами энергии. Оба метода производят оценку энергии (или аналог энергии) для модели или моделей, которые оцениваются; независимые критерии необходимы для определения приемлемых пороговых значений. Ни один из двух методов не коррелирует исключительно хорошо с истинной структурной точностью, особенно для типов белков, недостаточно представленных в PDB , таких как мембранные белки .

Статистические потенциалы представляют собой эмпирические методы, основанные на наблюдаемых частотах контакта остатков с остатками среди белков известной структуры в PDB. Они присваивают оценку вероятности или энергии каждому возможному парному взаимодействию между аминокислотами и объединяют эти оценки парного взаимодействия в единую оценку для всей модели. Некоторые такие методы могут также производить оценку остатка за остатком, которая идентифицирует плохо оцениваемые области в модели, хотя модель может иметь разумную оценку в целом. ^[23] Эти методы подчеркивают гидрофобное ядро и открытые для растворителя полярные аминокислоты, часто присутствующие в глобулярных белках.. Примеры популярных статистических потенциалов включают Prosa и DOPE . Статистические потенциалы более эффективны с точки зрения вычислений, чем расчеты энергии. ^[23]

Физические расчеты энергии направлены на определение межатомных взаимодействий, которые физически ответственны за стабильность белка в растворе, особенно ван-дер-ваальсовых и электростатических взаимодействий. Эти расчеты выполняются с использованием силового поля молекулярной механики ; белки обычно слишком велики даже для полуэмпирических расчетов, основанных на квантовой механике . Использование этих методов основано на гипотезе энергетического ландшафта сворачивания белка, которая предсказывает, что нативное состояние белка также является его энергетическим минимумом. В таких методах обычно используется неявная сольватация., который обеспечивает непрерывное приближение ванны растворителя для одной молекулы белка без необходимости явного представления отдельных молекул растворителя. Силовое поле, специально созданное для оценки модели, известно как эффективное силовое поле (EFF) и основано на атомных параметрах из CHARMM . ^[24]

Очень обширный отчет о валидации модели можно получить с помощью программного обеспечения «What Check» Radboud Universiteit Nijmegen, которое является одним из вариантов программного пакета Radboud Universiteit Nijmegen «Что, если» ; он производит многостраничный документ с подробным анализом почти 200 научных и административных аспектов модели. «What Check» доступен как бесплатный сервер ; его также можно использовать для проверки экспериментально определенных структур макромолекул.

Один из более новых методов оценки моделей основан на методах машинного обучения , таких как нейронные сети , которые можно обучить непосредственно оценивать структуру или формировать консенсус между несколькими статистическими и энергетическими методами. Результаты с использованием опорных векторов регрессии присяжной более традиционных методов оценок превосходят общую статистическую, основанная энергию и машина методы обучения. ^[25]

Структурные методы сравнения [ править ]

Оценка точности моделей гомологии проста, если известна экспериментальная структура. Наиболее распространенный метод сравнения двух белковых структур использует метрику среднеквадратичного отклонения (RMSD) для измерения среднего расстояния между соответствующими атомами в двух структурах после их наложения. Однако RMSD недооценивает точность моделей, в которых ядро, по сути, правильно смоделировано, но некоторые области гибких петель неточны. ^[26] Метод, представленный для эксперимента по оценке моделирования CASP , известен как тест глобального расстояния.(GDT) и измеряет общее количество атомов, расстояние которых от модели до экспериментальной структуры находится под определенным ограничением расстояния. ^[26] Оба метода могут использоваться для любого подмножества атомов в структуре, но часто применяются только к альфа- атомам углерода или основной цепи белка, чтобы минимизировать шум, создаваемый плохо смоделированными ротамерными состояниями боковой цепи , которые большинство методов моделирования не оптимизированы. предсказывать. ^[27]

Сравнительный анализ [ править ]

Было предпринято несколько крупномасштабных сравнительных исследований для оценки относительного качества различных текущих методов моделирования гомологии. CASP - это эксперимент по прогнозированию для всего сообщества, который проводится каждые два года в летние месяцы и требует от групп прогнозирования представить структурные модели для ряда последовательностей, структуры которых недавно были решены экспериментально, но еще не опубликованы. Его партнер CAFASP работает параллельно с CASP, но оценивает только модели, созданные с помощью полностью автоматизированных серверов. Постоянно выполняемые эксперименты без прогнозирования «сезонов» в основном сосредоточены на тестировании общедоступных веб-серверов. LiveBench и EVAработать непрерывно, чтобы оценить производительность участвующих серверов в прогнозировании неизбежно высвобождаемых структур из PDB. CASP и CAFASP служат в основном для оценки состояния дел в области моделирования, в то время как непрерывные оценки стремятся оценить качество модели, которое может быть получено пользователем, не являющимся экспертом, с использованием общедоступных инструментов.

Точность [ править ]

Точность структур, полученных при моделировании гомологии, сильно зависит от идентичности последовательности между мишенью и шаблоном. Выше 50% идентичности последовательности, модель , как правило, является надежным, лишь с незначительными ошибками в боковой цепи упаковке и ротамерном состоянии, и общее СКО между смоделирована и экспериментальной структурой падением около 1 Å . Эта ошибка сопоставима с типичным разрешением структуры, решенной методом ЯМР. В диапазоне идентичности 30–50% ошибки могут быть более серьезными и часто образуют петли. При идентичности менее 30% возникают серьезные ошибки, иногда приводящие к неверному предсказанию основной кратности. ^[13]Эту область с низкой идентичностью часто называют «сумеречной зоной», в которой моделирование гомологии чрезвычайно затруднительно и для которой оно, возможно, менее подходит, чем методы распознавания складок . ^[28]

При высокой идентичности последовательностей основной источник ошибок в моделировании гомологии проистекает из выбора шаблона или шаблонов, на которых основана модель, в то время как более низкие идентичности демонстрируют серьезные ошибки в выравнивании последовательностей, которые препятствуют производству высококачественных моделей. ^[6] Было высказано предположение, что основным препятствием для создания качественной модели является несоответствие в выравнивании последовательностей, поскольку «оптимальное» структурное выравнивание между двумя белками известной структуры может быть использовано в качестве входных данных для текущих методов моделирования для получения достаточно точного воспроизведения оригинала. экспериментальная структура. ^[29]

Были предприняты попытки повысить точность моделей гомологии, построенных с помощью существующих методов, подвергнув их моделированию молекулярной динамики в попытке улучшить их среднеквадратичное отклонение в соответствии с экспериментальной структурой. Однако параметризации текущего силового поля могут быть недостаточно точными для этой задачи, поскольку модели гомологии, используемые в качестве исходных структур для молекулярной динамики, имеют тенденцию создавать несколько худшие структуры. ^[30] Небольшие улучшения наблюдались в случаях, когда во время моделирования использовались значительные ограничения. ^[31]

Источники ошибок [ править ]

Двумя наиболее распространенными и крупномасштабными источниками ошибок в моделировании гомологии являются плохой выбор матрицы и неточности при выравнивании последовательности мишень-матрица. ^[6]^[32] Контроль этих двух факторов с помощью структурного выравнивания или выравнивания последовательностей, произведенного на основе сравнения двух решенных структур, резко снижает ошибки в окончательных моделях; эти согласования по «золотому стандарту» можно использовать в качестве исходных данных для текущих методов моделирования для получения достаточно точных копий исходной экспериментальной структуры. ^[29]Результаты последнего эксперимента CASP показывают, что методы «консенсуса», собирающие результаты множественного распознавания и множественного поиска совмещения, увеличивают вероятность идентификации правильного шаблона; аналогично, использование нескольких шаблонов на этапе построения модели может быть хуже, чем использование одного правильного шаблона, но лучше, чем использование одного неоптимального. ^[32] Ошибки выравнивания могут быть минимизированы за счет использования множественного выравнивания, даже если используется только один шаблон, и за счет итеративного уточнения локальных областей с низким сходством. ^[3]^[11] Меньшим источником ошибок модели являются ошибки в структуре шаблона. PDBREPORTВ базе данных перечислены несколько миллионов, в основном очень маленьких, но иногда значительных ошибок в экспериментальных (шаблонных) структурах, которые были помещены в PDB .

Серьезные локальные ошибки могут возникать в моделях гомологии, где инсерционная или делеционная мутация или разрыв в решенной структуре приводят к образованию области целевой последовательности, для которой нет соответствующей матрицы. Эту проблему можно свести к минимуму, используя несколько шаблонов, но метод усложняется различными локальными структурами шаблонов вокруг промежутка и вероятностью того, что отсутствующая область в одной экспериментальной структуре также отсутствует в других структурах того же семейства белков. . Отсутствующие области чаще всего встречаются в петляхгде высокая локальная гибкость увеличивает сложность разрешения области методами определения структуры. Хотя некоторые рекомендации предоставляются даже с одним шаблоном путем позиционирования концов отсутствующей области, чем длиннее зазор, тем сложнее моделировать. В некоторых случаях петли, содержащие до 9 остатков, могут быть смоделированы с умеренной точностью, если локальное выравнивание является правильным. ^[3] Большие области часто моделируются индивидуально с использованием методов ab initio предсказания структуры , хотя этот подход имел лишь единичный успех. ^[33]

В ротамерном состоянии боковых цепей и их внутреннее расположение упаковки также создает трудности в моделировании гомологии, даже в мишени , для которых основы структура является относительно легко предсказать. Частично это связано с тем, что многие боковые цепи в кристаллических структурах не находятся в своем «оптимальном» ротамерном состоянии из-за энергетических факторов в гидрофобном ядре и в упаковке отдельных молекул в кристалле белка. ^[34] Один из методов решения этой проблемы требует поиска в ротамерной библиотеке для определения локально низкоэнергетических комбинаций состояний упаковки. ^[35]Было высказано предположение, что основная причина того, что моделирование гомологии настолько затруднительно, когда идентичность последовательности мишень-матрица составляет менее 30%, заключается в том, что такие белки имеют в целом сходные складки, но широко расходящиеся структуры упаковки боковых цепей. ^[4]

Утилита [ править ]

Использование структурных моделей включает предсказание белок-белкового взаимодействия , стыковку белок-белок , молекулярную стыковку и функциональную аннотацию генов, идентифицированных в геноме организма . ^[36] Даже модели гомологии низкой точности могут быть полезны для этих целей, потому что их неточности, как правило, находятся в петлях на поверхности белка, которые обычно более вариабельны даже между близкородственными белками. Функциональные области белка, особенно его активный сайт , имеют тенденцию быть более консервативными и, таким образом, более точно моделируются. ^[13]

Гомологические модели также могут быть использованы для выявления тонких различий между родственными белками, которые не все структурно решены. Например, этот метод был использован для идентификации сайтов связывания катионов на Na ⁺ / K ⁺АТФазе и для выдвижения гипотез о сродстве связывания различных АТФаз. ^[37] Используемые в сочетании с моделированием молекулярной динамики , модели гомологии могут также генерировать гипотезы о кинетике и динамике белка, как в исследованиях ионной селективности калиевого канала. ^[38] Крупномасштабное автоматизированное моделирование всех идентифицированных белковых кодирующих областей в геноме. была предпринята попытка для дрожжей Saccharomyces cerevisiae , в результате чего было создано около 1000 качественных моделей для белков, структуры которых еще не были определены на момент исследования, и выявлены новые взаимосвязи между 236 дрожжевыми белками и другими ранее решенными структурами. ^[39]

См. Также [ править ]

Прогноз структуры белка
Программное обеспечение для предсказания структуры белка
Протеиновая нить
Молекулярная замена

Ссылки [ править ]

^ Chothia, C; Леск, AM (1986). «Связь между расхождением последовательности и структуры в белках» . EMBO J . 5 (4): 823–6. DOI : 10.1002 / j.1460-2075.1986.tb04288.x . PMC 1166865 . PMID 3709526 .
^ Качановский, S; Зеленкевич, П (2010). «Почему похожие белковые последовательности кодируют похожие трехмерные структуры?» (PDF) . Счета теоретической химии . 125 (3–6): 643–50. DOI : 10.1007 / s00214-009-0656-3 . S2CID 95593331 .
^ Б с д е е г Marti-Реном, MA; Стюарт, AC; Fiser, A; Санчес, Р. Мело, Ф; Сали, А. (2000). «Сравнительное моделирование белковой структуры генов и геномов» . Annu Rev Biophys Biomol Struct . 29 : 291–325. DOI : 10.1146 / annurev.biophys.29.1.291 . PMID 10940251 . S2CID 11498685 .
^ a b Chung SY, Subbiah S. (1996). Структурное объяснение сумеречной зоны гомологии белковой последовательности. Структура 4: 1123–27.
^ Уильямсон AR (2000). «Создание консорциума структурной геномики». Nat Struct Biol . 7 (S1 (11s)): 953. DOI : 10.1038 / 80726 . PMID 11103997 . S2CID 35185565 .
^ a b c Венцловас C, Маргелевичюс M (2005). «Сравнительное моделирование в CASP6 с использованием консенсусного подхода к выбору шаблона, выравниванию последовательности-структуры и оценке структуры». Белки . 61 (S7): 99–105. DOI : 10.1002 / prot.20725 . PMID 16187350 . S2CID 45345271 .
^ Далал, S; Баласубраманян, S; Реган, Л. (1997). «Трансмутация альфа-спиралей и бета-листов» . Сложите Des . 2 (5): R71–9. DOI : 10.1016 / s1359-0278 (97) 00036-9 . PMID 9377709 .
^ Далал, S; Баласубраманян, S; Реган, Л. (1997). «Белковая алхимия: превращение бета-листа в альфа-спираль». Nat Struct Biol . 4 (7): 548–52. DOI : 10.1038 / nsb0797-548 . PMID 9228947 . S2CID 5608132 .
^ a b c Пэн, Цзянь; Дзинбо Сюй (2011). «RaptorX: использование структурной информации для выравнивания белков путем статистического вывода» . Белки . 79 : 161–71. DOI : 10.1002 / prot.23175 . PMC 3226909 . PMID 21987485 .
^ Пэн, Цзянь; Дзинбо Сюй (апрель 2011 г.). «Множественный шаблонный подход к потоковой передаче белков» . Белки . 79 (6): 1930–1939. DOI : 10.1002 / prot.23016 . PMC 3092796 . PMID 21465564 .
^ a b Muckstein, U; Хофакер, Иллинойс; Стадлер, П.Ф. (2002). «Стохастические попарные выравнивания» . Биоинформатика . 18 (Дополнение 2): S153–60. DOI : 10.1093 / биоинформатика / 18.suppl_2.S153 . PMID 12385998 .
^ Рыхлевский, L; Чжан, Б; Годзик, А. (1998). «Прогнозы складки и функции белков Mycoplasma genitalium» . Сложите Des . 3 (4): 229–38. DOI : 10.1016 / S1359-0278 (98) 00034-0 . PMID 9710568 .
^ a b c Бейкер, D; Сали, А (2001). «Прогнозирование структуры белков и структурная геномика». Наука . 294 (5540): 93–96. Bibcode : 2001Sci ... 294 ... 93B . DOI : 10.1126 / science.1065659 . PMID 11588250 . S2CID 7193705 .
Перейти ↑ Zhang Y (2008). «Прогресс и проблемы в предсказании структуры белка» . Curr Opin Struct Biol . 18 (3): 342–348. DOI : 10.1016 / j.sbi.2008.02.004 . PMC 2680823 . PMID 18436442 .
^ Грир, Дж. (1981). «Сравнительное построение моделей сериновых протеаз млекопитающих». Журнал молекулярной биологии . 153 (4): 1027–42. DOI : 10.1016 / 0022-2836 (81) 90465-4 . PMID 7045378 .
^ Wallner, B; Элофссон, А (2005). «Не все равны: эталон различных программ моделирования гомологии» . Белковая наука . 14 (5): 1315–1327. DOI : 10.1110 / ps.041253405 . PMC 2253266 . PMID 15840834 .
^ Левитт, М. (1992). «Точное моделирование конформации белка путем автоматического сопоставления сегментов». J Mol Biol . 226 (2): 507–33. DOI : 10.1016 / 0022-2836 (92) 90964-L . PMID 1640463 .
^ Сали, А; Blundell, TL. (1993). «Сравнительное моделирование белков путем удовлетворения пространственных ограничений». J Mol Biol . 234 (3): 779–815. DOI : 10.1006 / jmbi.1993.1626 . PMID 8254673 .
^ Fiser, A; Сали, А. (2003). «ModLoop: автоматическое моделирование петель в белковых структурах» . Биоинформатика . 19 (18): 2500–1. DOI : 10.1093 / биоинформатики / btg362 . PMID 14668246 .
^ Топф, М; Бейкер, М.Л .; Марти-Реном, Массачусетс; Чиу, Вт; Сали, А. (2006). «Уточнение белковых структур с помощью итеративного сравнительного моделирования и подгонки плотности CryoEM». J Mol Biol . 357 (5): 1655–68. DOI : 10.1016 / j.jmb.2006.01.062 . PMID 16490207 .
^ Джон, B; Сали, А. (2003). «Сравнительное моделирование структуры белков путем итеративного выравнивания, построения модели и оценки модели» . Nucleic Acids Res . 31 (14): 3982–92. DOI : 10.1093 / NAR / gkg460 . PMC 165975 . PMID 12853614 .
^ Урсула Пипер, Нарайанан Ишвар, Ханнес Braberg, MS Madhusudhan, Фред Дэвис, Эшли С. Стюарт, Nebojsa Миркович, Андреа Росся, Марк А. Marti-Рен, Андраш Fiser, Бен Уэбб, Даниэль Гринблатты, Конрад Huang, Тот Ferrin, Андрей Сали. MODBASE, база данных аннотированных моделей сравнительной структуры белков и связанные ресурсы. Nucleic Acids Res 32, D217-D222, 2004.
^ а б Сиппл, MJ. (1993). «Распознавание ошибок в трехмерных структурах белков». Белки . 17 (4): 355–62. DOI : 10.1002 / prot.340170404 . PMID 8108378 . S2CID 47269654 .
^ Lazaridis, T .; Карплюс, М. (1999a). «Отличие нативного от неправильно свернутых моделей белка с энергетической функцией, включая неявную сольватацию». J. Mol. Биол . 288 (3): 477–487. CiteSeerX 10.1.1.17.33 . DOI : 10.1006 / jmbi.1999.2685 . PMID 10329155 .
^ Eramian, D; Шен, М; Девос, Д; Мело, Ф; Сали, А; Марти-Реном, Массачусетс. (2006). «Составной балл для прогнозирования ошибок в моделях структуры белка» . Белковая наука . 15 (7): 1653–1666. DOI : 10.1110 / ps.062095806 . PMC 2242555 . PMID 16751606 .
^ а б Земла, А. (2003). «LGA - метод поиска трехмерных сходств в структурах белков» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. DOI : 10.1093 / NAR / gkg571 . PMC 168977 . PMID 12824330 .
^ Смонтируйте DM. (2004). Биоинформатика: анализ последовательности и генома 2-е изд. Лабораторная пресса Колд-Спринг-Харбор: Колд-Спринг-Харбор, Нью-Йорк.
^ Блейк, JD; Коэн, ИП. (2001). «Попарное выравнивание последовательностей ниже сумеречной зоны». J Mol Biol . 307 (2): 721–35. DOI : 10.1006 / jmbi.2001.4495 . PMID 11254392 .
^ а б Чжан, У; Сколник, Дж. (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Proc. Natl. Акад. Sci. США . 102 (4): 1029–34. Bibcode : 2005PNAS..102.1029Z . DOI : 10.1073 / pnas.0407152101 . PMC 545829 . PMID 15653774 .
^ Koehl, P; Левитт, М. (1999). «Лучшее будущее для предсказания структуры белка». Nat Struct Biol . 6 (2): 108–11. DOI : 10,1038 / 5794 . PMID 10048917 . S2CID 3162636 .
^ Flohil, JA; Vriend, G; Берендсен, HJ. (2002). «Завершение и уточнение трехмерных моделей гомологии с ограниченной молекулярной динамикой: применение к целям 47, 58 и 111 в соревновании моделирования CASP и апостериорном анализе». Белки . 48 (4): 593–604. DOI : 10.1002 / prot.10105 . PMID 12211026 . S2CID 11280977 .
^ a b Гинальски, К. (2006). «Сравнительное моделирование для предсказания структуры белков». Curr Opin Struct Biol . 16 (2): 172–7. DOI : 10.1016 / j.sbi.2006.02.003 . PMID 16510277 .
^ Kryshtafovych А, Venclovas С, Фиделис К, Moult J. (2005). Прогресс за первое десятилетие экспериментов CASP. Белки 61 (S7): 225–36.
^ Васкес, М. (1996). «Моделирование конформации боковой цепи». Curr Opin Struct Biol . 6 (2): 217–21. DOI : 10.1016 / S0959-440X (96) 80077-7 . PMID 8728654 .
^ Уилсон, C; Грегори, Л. М.; Агард, Д.А. (1993). «Моделирование конформации боковой цепи для гомологичных белков с помощью поиска ротамеров на основе энергии». J Mol Biol . 229 (4): 996–1006. DOI : 10.1006 / jmbi.1993.1100 . PMID 8445659 .
^ Гопал, S; Шредер, М; Pieper, U; Sczyrba, A; Айтекин-Курбан, Г; Бекиранов, С; Fajardo, JE; Eswar, N; Санчес, Р. и другие. (2001). «Аннотации на основе гомологии дают 1 042 новых гена-кандидата в геноме Drosophila melanogaster». Нат Жене . 27 (3): 337–40. DOI : 10.1038 / 85922 . PMID 11242120 . S2CID 2144435 .
^ Огава, H; Тоошима, К. (2002). «Гомологическое моделирование сайтов связывания катионов Na + K + -АТФазы» . Proc Natl Acad Sci USA . 99 (25): 15977–15982. Bibcode : 2002PNAS ... 9915977O . DOI : 10.1073 / pnas.202622299 . PMC 138550 . PMID 12461183 .
^ Капенер, CE; Шривастава, IH; Ранатунга, км; Форрест, Л. Р.; Смит, Г.Р .; Сансом, MSP (2000). "Моделирование гомологии и моделирование молекулярной динамики внутреннего выпрямительного калиевого канала" . Biophys J . 78 (6): 2929–2942. Bibcode : 2000BpJ .... 78.2929C . DOI : 10.1016 / S0006-3495 (00) 76833-0 . PMC 1300878 . PMID 10827973 .
^ Санчес, R; Сали, А. (1998). «Крупномасштабное моделирование белковой структуры генома Saccharomyces cerevisiae» . Proc Natl Acad Sci USA . 95 (23): 13597–13602. Bibcode : 1998PNAS ... 9513597S . DOI : 10.1073 / pnas.95.23.13597 . PMC 24864 . PMID 9811845 .

[LeskChothia-1] Chothia, C; Леск, AM (1986). «Связь между расхождением последовательности и структуры в белках» . EMBO J . 5 (4): 823–6. DOI : 10.1002 / j.1460-2075.1986.tb04288.x . PMC 1166865 . PMID 3709526 .

[kora-2] Качановский, S; Зеленкевич, П (2010). «Почему похожие белковые последовательности кодируют похожие трехмерные структуры?» (PDF) . Счета теоретической химии . 125 (3–6): 643–50. DOI : 10.1007 / s00214-009-0656-3 . S2CID 95593331 .

[Marti-3] Б с д е е г Marti-Реном, MA; Стюарт, AC; Fiser, A; Санчес, Р. Мело, Ф; Сали, А. (2000). «Сравнительное моделирование белковой структуры генов и геномов» . Annu Rev Biophys Biomol Struct . 29 : 291–325. DOI : 10.1146 / annurev.biophys.29.1.291 . PMID 10940251 . S2CID 11498685 .

[Chung-4] Chung SY, Subbiah S. (1996). Структурное объяснение сумеречной зоны гомологии белковой последовательности. Структура 4: 1123–27.

[Williamson-5] Уильямсон AR (2000). «Создание консорциума структурной геномики». Nat Struct Biol . 7 (S1 (11s)): 953. DOI : 10.1038 / 80726 . PMID 11103997 . S2CID 35185565 .

[Venclovas-6] Венцловас C, Маргелевичюс M (2005). «Сравнительное моделирование в CASP6 с использованием консенсусного подхода к выбору шаблона, выравниванию последовательности-структуры и оценке структуры». Белки . 61 (S7): 99–105. DOI : 10.1002 / prot.20725 . PMID 16187350 . S2CID 45345271 .

[Dalal1-7] Далал, S; Баласубраманян, S; Реган, Л. (1997). «Трансмутация альфа-спиралей и бета-листов» . Сложите Des . 2 (5): R71–9. DOI : 10.1016 / s1359-0278 (97) 00036-9 . PMID 9377709 .

[Dalal2-8] Далал, S; Баласубраманян, S; Реган, Л. (1997). «Белковая алхимия: превращение бета-листа в альфа-спираль». Nat Struct Biol . 4 (7): 548–52. DOI : 10.1038 / nsb0797-548 . PMID 9228947 . S2CID 5608132 .

[RaptorX-9] Пэн, Цзянь; Дзинбо Сюй (2011). «RaptorX: использование структурной информации для выравнивания белков путем статистического вывода» . Белки . 79 : 161–71. DOI : 10.1002 / prot.23175 . PMC 3226909 . PMID 21987485 .

[PengMultiTemplate-10] Пэн, Цзянь; Дзинбо Сюй (апрель 2011 г.). «Множественный шаблонный подход к потоковой передаче белков» . Белки . 79 (6): 1930–1939. DOI : 10.1002 / prot.23016 . PMC 3092796 . PMID 21465564 .

[Muckstein-11] Muckstein, U; Хофакер, Иллинойс; Стадлер, П.Ф. (2002). «Стохастические попарные выравнивания» . Биоинформатика . 18 (Дополнение 2): S153–60. DOI : 10.1093 / биоинформатика / 18.suppl_2.S153 . PMID 12385998 .

[Rychlewski-12] Рыхлевский, L; Чжан, Б; Годзик, А. (1998). «Прогнозы складки и функции белков Mycoplasma genitalium» . Сложите Des . 3 (4): 229–38. DOI : 10.1016 / S1359-0278 (98) 00034-0 . PMID 9710568 .

[Baker-13] Бейкер, D; Сали, А (2001). «Прогнозирование структуры белков и структурная геномика». Наука . 294 (5540): 93–96. Bibcode : 2001Sci ... 294 ... 93B . DOI : 10.1126 / science.1065659 . PMID 11588250 . S2CID 7193705 .

[zhang2008-14] Перейти ↑ Zhang Y (2008). «Прогресс и проблемы в предсказании структуры белка» . Curr Opin Struct Biol . 18 (3): 342–348. DOI : 10.1016 / j.sbi.2008.02.004 . PMC 2680823 . PMID 18436442 .

[Greer-15] Грир, Дж. (1981). «Сравнительное построение моделей сериновых протеаз млекопитающих». Журнал молекулярной биологии . 153 (4): 1027–42. DOI : 10.1016 / 0022-2836 (81) 90465-4 . PMID 7045378 .

[Wallner-16] Wallner, B; Элофссон, А (2005). «Не все равны: эталон различных программ моделирования гомологии» . Белковая наука . 14 (5): 1315–1327. DOI : 10.1110 / ps.041253405 . PMC 2253266 . PMID 15840834 .

[Levitt-17] Левитт, М. (1992). «Точное моделирование конформации белка путем автоматического сопоставления сегментов». J Mol Biol . 226 (2): 507–33. DOI : 10.1016 / 0022-2836 (92) 90964-L . PMID 1640463 .

[Sali-18] Сали, А; Blundell, TL. (1993). «Сравнительное моделирование белков путем удовлетворения пространственных ограничений». J Mol Biol . 234 (3): 779–815. DOI : 10.1006 / jmbi.1993.1626 . PMID 8254673 .

[Fiser-19] Fiser, A; Сали, А. (2003). «ModLoop: автоматическое моделирование петель в белковых структурах» . Биоинформатика . 19 (18): 2500–1. DOI : 10.1093 / биоинформатики / btg362 . PMID 14668246 .

[Topf-20] Топф, М; Бейкер, М.Л .; Марти-Реном, Массачусетс; Чиу, Вт; Сали, А. (2006). «Уточнение белковых структур с помощью итеративного сравнительного моделирования и подгонки плотности CryoEM». J Mol Biol . 357 (5): 1655–68. DOI : 10.1016 / j.jmb.2006.01.062 . PMID 16490207 .

[John-21] Джон, B; Сали, А. (2003). «Сравнительное моделирование структуры белков путем итеративного выравнивания, построения модели и оценки модели» . Nucleic Acids Res . 31 (14): 3982–92. DOI : 10.1093 / NAR / gkg460 . PMC 165975 . PMID 12853614 .

[Pieper-22] Урсула Пипер, Нарайанан Ишвар, Ханнес Braberg, MS Madhusudhan, Фред Дэвис, Эшли С. Стюарт, Nebojsa Миркович, Андреа Росся, Марк А. Marti-Рен, Андраш Fiser, Бен Уэбб, Даниэль Гринблатты, Конрад Huang, Тот Ferrin, Андрей Сали. MODBASE, база данных аннотированных моделей сравнительной структуры белков и связанные ресурсы. Nucleic Acids Res 32, D217-D222, 2004.

[Sippl-23] а б Сиппл, MJ. (1993). «Распознавание ошибок в трехмерных структурах белков». Белки . 17 (4): 355–62. DOI : 10.1002 / prot.340170404 . PMID 8108378 . S2CID 47269654 .

[Lazaridis-24] Lazaridis, T .; Карплюс, М. (1999a). «Отличие нативного от неправильно свернутых моделей белка с энергетической функцией, включая неявную сольватацию». J. Mol. Биол . 288 (3): 477–487. CiteSeerX 10.1.1.17.33 . DOI : 10.1006 / jmbi.1999.2685 . PMID 10329155 .

[Eramian-25] Eramian, D; Шен, М; Девос, Д; Мело, Ф; Сали, А; Марти-Реном, Массачусетс. (2006). «Составной балл для прогнозирования ошибок в моделях структуры белка» . Белковая наука . 15 (7): 1653–1666. DOI : 10.1110 / ps.062095806 . PMC 2242555 . PMID 16751606 .

[Zemla-26] а б Земла, А. (2003). «LGA - метод поиска трехмерных сходств в структурах белков» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. DOI : 10.1093 / NAR / gkg571 . PMC 168977 . PMID 12824330 .

[Mount-27] Смонтируйте DM. (2004). Биоинформатика: анализ последовательности и генома 2-е изд. Лабораторная пресса Колд-Спринг-Харбор: Колд-Спринг-Харбор, Нью-Йорк.

[Blake-28] Блейк, JD; Коэн, ИП. (2001). «Попарное выравнивание последовательностей ниже сумеречной зоны». J Mol Biol . 307 (2): 721–35. DOI : 10.1006 / jmbi.2001.4495 . PMID 11254392 .

[Zhang-29] а б Чжан, У; Сколник, Дж. (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Proc. Natl. Акад. Sci. США . 102 (4): 1029–34. Bibcode : 2005PNAS..102.1029Z . DOI : 10.1073 / pnas.0407152101 . PMC 545829 . PMID 15653774 .

[Koehl-30] Koehl, P; Левитт, М. (1999). «Лучшее будущее для предсказания структуры белка». Nat Struct Biol . 6 (2): 108–11. DOI : 10,1038 / 5794 . PMID 10048917 . S2CID 3162636 .

[Flohil-31] Flohil, JA; Vriend, G; Берендсен, HJ. (2002). «Завершение и уточнение трехмерных моделей гомологии с ограниченной молекулярной динамикой: применение к целям 47, 58 и 111 в соревновании моделирования CASP и апостериорном анализе». Белки . 48 (4): 593–604. DOI : 10.1002 / prot.10105 . PMID 12211026 . S2CID 11280977 .

[Ginalski-32] Гинальски, К. (2006). «Сравнительное моделирование для предсказания структуры белков». Curr Opin Struct Biol . 16 (2): 172–7. DOI : 10.1016 / j.sbi.2006.02.003 . PMID 16510277 .

[Kryshtafovych-33] Kryshtafovych А, Venclovas С, Фиделис К, Moult J. (2005). Прогресс за первое десятилетие экспериментов CASP. Белки 61 (S7): 225–36.

[Vasquez-34] Васкес, М. (1996). «Моделирование конформации боковой цепи». Curr Opin Struct Biol . 6 (2): 217–21. DOI : 10.1016 / S0959-440X (96) 80077-7 . PMID 8728654 .

[Wilson-35] Уилсон, C; Грегори, Л. М.; Агард, Д.А. (1993). «Моделирование конформации боковой цепи для гомологичных белков с помощью поиска ротамеров на основе энергии». J Mol Biol . 229 (4): 996–1006. DOI : 10.1006 / jmbi.1993.1100 . PMID 8445659 .

[Gopal-36] Гопал, S; Шредер, М; Pieper, U; Sczyrba, A; Айтекин-Курбан, Г; Бекиранов, С; Fajardo, JE; Eswar, N; Санчес, Р. и другие. (2001). «Аннотации на основе гомологии дают 1 042 новых гена-кандидата в геноме Drosophila melanogaster». Нат Жене . 27 (3): 337–40. DOI : 10.1038 / 85922 . PMID 11242120 . S2CID 2144435 .

[Ogawa-37] Огава, H; Тоошима, К. (2002). «Гомологическое моделирование сайтов связывания катионов Na + K + -АТФазы» . Proc Natl Acad Sci USA . 99 (25): 15977–15982. Bibcode : 2002PNAS ... 9915977O . DOI : 10.1073 / pnas.202622299 . PMC 138550 . PMID 12461183 .

[Capener-38] Капенер, CE; Шривастава, IH; Ранатунга, км; Форрест, Л. Р.; Смит, Г.Р .; Сансом, MSP (2000). "Моделирование гомологии и моделирование молекулярной динамики внутреннего выпрямительного калиевого канала" . Biophys J . 78 (6): 2929–2942. Bibcode : 2000BpJ .... 78.2929C . DOI : 10.1016 / S0006-3495 (00) 76833-0 . PMC 1300878 . PMID 10827973 .

[Sanchez-39] Санчес, R; Сали, А. (1998). «Крупномасштабное моделирование белковой структуры генома Saccharomyces cerevisiae» . Proc Natl Acad Sci USA . 95 (23): 13597–13602. Bibcode : 1998PNAS ... 9513597S . DOI : 10.1073 / pnas.95.23.13597 . PMC 24864 . PMID 9811845 .

[1]