Статистический анализ сочетания или SCA - это метод, используемый в биоинформатике для измерения ковариации между парами аминокислот при выравнивании множественных последовательностей белков (MSA). Более конкретно, он количественно определяет, насколько распределение аминокислот в некотором положении i изменяется при нарушении распределения аминокислот в другом положении j . Полученная в результате статистическая энергия связи указывает на степень эволюционной зависимости между остатками, при этом более высокая энергия связи соответствует повышенной зависимости. [1]
Определение статистической энергии связи
Статистическая энергия связи измеряет, как нарушение распределения аминокислот в одном сайте в MSA влияет на распределение аминокислот в другом сайте. Например, рассмотрим множественное выравнивание последовательностей с сайтами (или столбцами) от a до z , где каждый сайт имеет некоторое распределение аминокислот. В положении i 60% последовательностей содержат валин, а остальные 40% последовательностей содержат лейцин , в положении j распределение составляет 40% изолейцина , 40% гистидина и 20% метионина , k имеет среднее распределение (20 аминокислотных остатков). кислоты присутствуют примерно с той же частотой, что и во всех белках), а в I содержится 80% гистидина и 20% валина. Поскольку в положениях i , j и l распределение аминокислот отличается от среднего распределения, наблюдаемого во всех белках, говорят, что они обладают некоторой степенью консервативности .
В статистическом анализе связи сохранение (ΔG stat ) на каждом участке ( i ) определяется как:. [2]
Здесь P i x описывает вероятность нахождения аминокислоты x в позиции i и определяется функцией в биномиальной форме следующим образом:
где N равно 100, n x - процент последовательностей с остатком x (например, метионин) в положении i , а p x соответствует приблизительному распределению аминокислоты x во всех положениях среди всех секвенированных белков. Суммирование проводится по всем 20 аминокислотам. После вычисления ΔG i stat, принимается сохранение для положения i в суб-выравнивании, полученном после нарушения распределения аминокислот в j (ΔG i | δj stat ). Статистическая энергия связи, обозначаемая ΔΔG i, j stat , представляет собой просто разницу между этими двумя значениями. Это:
Статистическая энергия связи часто систематически рассчитывается между фиксированным возмущенным положением и всеми другими положениями в MSA. Продолжая пример MSA с начала раздела, рассмотрим возмущение в позиции j, где распределение амино изменяется с 40% I, 40% H, 20% M до 100% I. Если при последующем подвыравнивании это изменяет распределение в i от 60% V, 40% L до 90% V, 10% L, но не меняет распределение в позиции l , тогда будет некоторое количество статистической энергии связи между i и j, но не будет между l и j .
Приложения
Ранганатан и Локлесс первоначально разработали SCA для изучения термодинамического (энергетического) связывания пар остатков в белках. [3] Используя семейство доменов PDZ , они смогли идентифицировать небольшую сеть остатков, которые были энергетически связаны с остатком сайта связывания. Сеть состоит из остатков, пространственно близких к сайту связывания в третичной складке, называемых контактными парами, и более удаленных остатков, которые участвуют в более дальних энергетических взаимодействиях. Более поздние применения SCA группой Ranganathan к семействам GPCR , сериновых протеаз и гемоглобина также показали энергетическое сцепление в разреженных сетях остатков, которые взаимодействуют в аллостерической коммуникации . [4]
Статистический анализ сцепления также использовался в качестве основы для компьютерного дизайна белков. В 2005 году Socolich et al. [5] использовали SCA для домена WW для создания искусственных белков с термодинамической стабильностью и структурой, подобной естественным доменам WW. Тот факт, что 12 из 43 сконструированных белков с тем же профилем SCA, что и естественные WW-домены, правильно свернутые, предоставил веские доказательства того, что для определения укладки белка требуется мало информации - только информация о сцеплении. Эта поддержка гипотезы SCA была сделана более убедительной, учитывая, что а) успешно свернутые белки имели только 36% -ную идентичность последовательности с естественными складками WW, и б) ни один из искусственных белков, созданных без информации связывания, не был правильно свернут. Сопутствующее исследование показало, что искусственные домены WW были функционально подобны естественным доменам WW по аффинности и специфичности связывания лиганда . [6]
При прогнозировании структуры белка de novo было показано, что в сочетании с простой метрикой расстояния остаток-остаток оценка на основе SCA может довольно точно отличать складки нативного белка от нативного. [7]
Смотрите также
Внешние ссылки
- Что такое домен WW?
- Лекция Ранганатана по статистическому анализу связи (включая аудио)
- Сворачивание белков - на шаг ближе? - Краткое изложение дизайна искусственных, но функциональных WW-доменов на основе SCA в лаборатории Ranganathan.
Рекомендации
- ^ «Дополнительный материал для 'Эволюционно консервативные сети остатков опосредуют аллостерическую связь в белках. ' » .
- ^ Деккер; Фодор, А; Олдрич, RW; Йеллен, Дж; и другие. (2004). «Основанный на возмущении метод для вычисления явной вероятности эволюционной ковариации при множественном выравнивании последовательностей» . Биоинформатика . 20 (10): 1565–1572. DOI : 10.1093 / биоинформатики / bth128 . PMID 14962924 .
- ^ Lockless SW, Ранаганатан Р. (1999). «Эволюционно консервативные пути энергетической связи в белковых семьях». Наука . 286 (5438): 295–299. DOI : 10.1126 / science.286.5438.295 . PMID 10514373 .
- ^ Суэль; Lockless, SW; Уолл, Массачусетс; Ранганатан, Р. и другие. (2003). «Эволюционно консервативные сети остатков опосредуют аллостерическую связь в белках». Структурная биология природы . 10 (1): 59–69. DOI : 10.1038 / nsb881 . PMID 12483203 . S2CID 67749580 .
- ^ Соколич; Lockless, SW; Русь, WP; Ли, Н; Gardner, KH; Ранганатан, Р. и другие. (2005). «Эволюционная информация для определения складки белка». Природа . 437 (7058): 512–518. Bibcode : 2005Natur.437..512S . DOI : 10,1038 / природа03991 . PMID 16177782 . S2CID 4363255 .
- ^ Русь; Лоури, DM; Мишра, П; Яффе, МБ; Ранганатан, Р. и другие. (2005). «Естественно-подобная функция в искусственных WW-доменах». Природа . 437 (7058): 579–583. Bibcode : 2005Natur.437..579R . DOI : 10,1038 / природа03990 . PMID 16177795 . S2CID 4424336 .
- ^ Бартлетт GJ, Тейлор WR (2008). «Использование оценок, полученных в результате статистического анализа сцепления, для различения правильных и неправильных складок при прогнозировании структуры белка de novo» . Белки . 71 (1): 950–959. DOI : 10.1002 / prot.21779 . PMID 18004776 . S2CID 33836866 . Архивировано из оригинала на 2012-12-17.