Белковое суперсемейство


Суперсемейство белков — это крупнейшая группа ( клада ) белков , для которых можно сделать вывод об общем происхождении (см. гомологию ). Обычно это общее происхождение выводится из структурного выравнивания [1] и механистического сходства, даже если сходство последовательностей не очевидно. [2] Затем можно определить гомологию последовательностей , даже если она не очевидна (из-за низкого сходства последовательностей). Суперсемейства обычно содержат несколько семейств белков , которые демонстрируют сходство последовательностей внутри каждого семейства. Термин «белковый клан» обычно используется для обозначения протеаз и гликозилгидролаз.суперсемейства на основе систем классификации MEROPS и CAZy . [2] [3]

Суперсемейства белков идентифицируют с помощью ряда методов. Близкородственные члены могут быть идентифицированы методами, отличными от тех, которые необходимы для группировки наиболее эволюционно расходящихся членов.

Исторически сходство различных аминокислотных последовательностей было наиболее распространенным методом определения гомологии . [5] Сходство последовательностей считается хорошим показателем родства, поскольку сходные последовательности, скорее всего, являются результатом дупликации генов и дивергентной эволюции , а не результатом конвергентной эволюции . Аминокислотная последовательность обычно более консервативна, чем последовательность ДНК (из-за вырожденного генетического кода ), поэтому является более чувствительным методом обнаружения. Поскольку некоторые аминокислоты имеют схожие свойства (например, заряд, гидрофобность, размер), консервативные мутации , заменяющие их, часто оказываются нейтральными.функционировать. Наиболее консервативные области последовательности белка часто соответствуют функционально важным областям, таким как каталитические сайты и сайты связывания, поскольку эти области менее толерантны к изменениям последовательности.

Использование сходства последовательностей для вывода о гомологии имеет несколько ограничений. Не существует минимального уровня сходства последовательностей, гарантирующего создание идентичных структур. В течение длительных периодов эволюции родственные белки могут не проявлять заметного сходства последовательностей друг с другом. Последовательности с множеством вставок и делеций иногда бывает трудно выровнять и поэтому идентифицировать области гомологичных последовательностей. Например, в клане протеаз PA ни один остаток не консервативен в суперсемействе, даже в каталитической триаде .. И наоборот, отдельные семейства, составляющие суперсемейство, определяются на основе выравнивания их последовательностей, например, семейство протеаз C04 в клане PA.

Тем не менее, сходство последовательностей является наиболее часто используемой формой доказательства родства, поскольку количество известных последовательностей значительно превышает количество известных третичных структур . [6] В отсутствие структурной информации сходство последовательностей ограничивает пределы того, какие белки можно отнести к суперсемейству. [6]

Структура гораздо более консервативна в эволюционном отношении, чем последовательность, так что белки с очень похожей структурой могут иметь совершенно разные последовательности. [7] В течение очень длительного периода эволюции очень немногие остатки демонстрируют обнаруживаемую консервативность аминокислотной последовательности, однако вторичные структурные элементы и третичные структурные мотивы высококонсервативны. Некоторая динамика белков [8] и конформационные изменения структуры белков также могут сохраняться, как это видно в суперсемействе серпинов . [9]Следовательно, третичную структуру белка можно использовать для обнаружения гомологии между белками, даже если в их последовательностях не остается никаких доказательств родства. Программы структурного выравнивания , такие как DALI , используют трехмерную структуру интересующего белка для поиска белков с похожими складками. [10] Однако в редких случаях родственные белки могут оказаться структурно несходными [11] , и о родстве можно судить только другими методами. [12] [13] [14]


Вверху: вторичная структурная консервативность 80 членов клана протеаз PA (суперсемейства). H обозначает α-спираль , E обозначает β-лист , L обозначает петлю. Ниже показано сохранение последовательности для того же выравнивания. Стрелки указывают остатки каталитической триады . Выровнено на основе структуры DALI.