Суперсемейство белков


Белковое суперсемейство — это самая большая группа ( клада ) белков, для которых можно сделать вывод об общем происхождении (см. Гомология ). Обычно это общее происхождение выводится из структурного выравнивания [1] и механистического сходства, даже если сходство последовательностей не очевидно. [2] Затем можно вывести гомологию последовательностей , даже если она не очевидна (из-за низкого сходства последовательностей). Суперсемейства обычно содержат несколько белковых семейств , которые демонстрируют сходство последовательностей внутри каждого семейства. Термин белковый клан обычно используется для обозначения протеаз и гликозилгидролаз.надсемейства, основанные на системах классификации MEROPS и CAZy . [2] [3]

Суперсемейства белков идентифицируют с помощью ряда методов. Близкородственные члены могут быть идентифицированы методами, отличными от тех, которые необходимы для группировки наиболее эволюционно расходящихся членов.

Исторически сходство различных аминокислотных последовательностей было наиболее распространенным методом определения гомологии . [5] Сходство последовательностей считается хорошим предиктором родства, поскольку сходные последовательности, скорее всего, являются результатом дупликации генов и дивергентной эволюции , а не результатом конвергентной эволюции . Аминокислотная последовательность обычно более консервативна, чем последовательность ДНК (из-за вырожденного генетического кода ), поэтому это более чувствительный метод обнаружения. Поскольку некоторые аминокислоты имеют сходные свойства (например, заряд, гидрофобность, размер), консервативные мутации , которые их заменяют, часто оказываются нейтральными.функционировать. Наиболее консервативные области последовательности белка часто соответствуют функционально важным областям, таким как каталитические сайты и сайты связывания, поскольку эти области менее устойчивы к изменениям последовательности.

Использование сходства последовательностей для вывода о гомологии имеет несколько ограничений. Не существует минимального уровня сходства последовательностей, гарантирующего создание идентичных структур. В течение длительных периодов эволюции родственные белки могут не проявлять обнаруживаемого сходства последовательностей друг с другом. Последовательности со многими вставками и делециями также иногда могут быть трудными для выравнивания и, таким образом, идентификации гомологичных участков последовательности. Например , в клане протеаз PA ни один остаток не сохраняется в суперсемействе, даже в каталитической триаде .. И наоборот, отдельные семейства, составляющие суперсемейство, определяются на основе их выравнивания последовательностей, например, семейство протеаз C04 в клане PA.

Тем не менее, сходство последовательностей является наиболее часто используемой формой доказательства для вывода о родстве, поскольку количество известных последовательностей значительно превышает количество известных третичных структур . [6] В отсутствие структурной информации сходство последовательностей ограничивает пределы, в которых белки могут быть отнесены к суперсемейству. [6]

Структура гораздо более эволюционно консервативна, чем последовательность, так что белки с очень похожими структурами могут иметь совершенно разные последовательности. [7] В очень длительных эволюционных масштабах очень немногие остатки демонстрируют обнаруживаемую консервативность аминокислотной последовательности, однако вторичные структурные элементы и третичные структурные мотивы высоко консервативны. Некоторая динамика белка [8] и конформационные изменения структуры белка также могут сохраняться, как это видно в надсемействе серпинов . [9]Следовательно, третичная структура белка может быть использована для обнаружения гомологии между белками, даже если в их последовательностях не осталось никаких признаков родства. Программы структурного выравнивания , такие как DALI , используют трехмерную структуру интересующего белка для поиска белков с похожими складками. [10] Однако в редких случаях родственные белки могут стать структурно несходными [11] , и родство может быть установлено только другими методами. [12] [13] [14]


Вверху: вторичная структурная консервация 80 членов клана протеаз PA (суперсемейство). H указывает на α-спираль , E указывает на β-лист , L указывает на петлю. Ниже показано сохранение последовательности для того же выравнивания. Стрелками указаны остатки каталитической триады . Выровнено на основе структуры DALI
Выравнивание последовательности гистоновых белков млекопитающих . Сходство последовательностей подразумевает, что они развились путем дупликации генов . Остатки, которые сохраняются во всех последовательностях, выделены серым цветом. Под белковыми последовательностями находится ключ, обозначающий: [4]
  • * сохраненная последовательность ,
  •  : консервативные мутации ,
  • . полуконсервативные мутации и
  • ␣ неконсервативные мутации .
Структурная гомология в суперсемействе PA (клан PA). Двойной β-бочонок, характеризующий надсемейство, выделен красным. Показаны репрезентативные структуры из нескольких семейств внутри суперсемейства PA. Обратите внимание, что некоторые белки имеют частично измененную структуру. Химотрипсин (1gg6), протеаза вируса травления табака (1lvm), калицивирин (1wqs), протеаза вируса Западного Нила (1fp7), эксфолиатиновый токсин (1exf), протеаза HtrA (1l1j), активатор плазминогена змеиного яда (1bqy), протеаза хлоропластов (4fln ) и протеаза вируса артериита лошадей (1 мбм).