Семейство белков — это группа эволюционно родственных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1:1. Термин «семейство белков» не следует путать с семейством , поскольку он используется в таксономии.
Белки в одном семействе происходят от общего предка и обычно имеют сходные трехмерные структуры , функции и значительное сходство последовательностей . [ править ] Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), так как это самый строгий показатель гомологии и, следовательно, самый четкий показатель общего происхождения. [ нужна цитата ] Существует достаточно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей .методы. Очень маловероятно, что белки, не имеющие общего предка, продемонстрируют статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов белковых семейств . Семейства иногда группируются в более крупные клады , называемые суперсемействами , на основании структурного и механистического сходства, даже если не наблюдается идентифицируемой гомологии последовательностей.
В настоящее время определено более 60 000 белковых семейств [1] , хотя неоднозначность в определении «белкового семейства» приводит к тому, что разные исследователи приводят к очень разным цифрам.
Как и многие биологические термины, использование семейства белков в некоторой степени зависит от контекста; это может указывать на большие группы белков с минимально возможным уровнем обнаруживаемого сходства последовательностей, или на очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или на любую промежуточную группу. Чтобы различать эти ситуации, термин « суперсемейство белков » часто используется для отдаленно родственных белков, чье родство можно обнаружить не по сходству последовательностей, а только по общим структурным особенностям. [2] [3] [4] Другие термины, такие как класс белков, группа, клан и подсемейство, были придуманы на протяжении многих лет, но все они имеют аналогичную двусмысленность в использовании. Обычное использование состоит в том, что суперсемейства' (структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, надсемейство, такое как клан PA протеаз, имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. точное определение вряд ли будет согласовано, и читатель должен понять, как именно эти термины используются в конкретном контексте.
Концепция семейства белков возникла в то время, когда было известно очень мало белковых структур или последовательностей; в то время структурно понимались преимущественно небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром с . С того времени было обнаружено, что многие белки состоят из нескольких независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. Это привело в последние годы к сосредоточению внимания на семействах белковых доменов. Идентификации и каталогизации таких доменов посвящен ряд онлайн-ресурсов.
Области каждого белка имеют различные функциональные ограничения (особенности, критические для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. Интерфейс связывания белок-белок, тем не менее, может состоять из большой поверхности с ограничениями по гидрофобности или полярности аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ).). Эти блоки чаще всего называют мотивами, хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов.
Согласно существующему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательности. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще способен выполнять свою функцию, дуплицированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации). Определенные семейства генов/белков, особенно у эукариот, подвергаются экстремальным расширениям и сокращениям в ходе эволюции, иногда в сочетании с дупликациями всего генома . Это расширение и сокращение белковых семейств является одной из характерных особенностей эволюции генома , но его важность и последствия в настоящее время неясны.
По мере увеличения общего количества секвенированных белков и расширения интереса к анализу протеома продолжаются попытки организовать белки в семейства и описать их составные домены и мотивы. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства и суперсемейства белков в качестве основы для разработки основанной на последовательности/структуре стратегии крупномасштабного функционального назначения ферментов с неизвестной функцией. [5] Алгоритмические средства создания белковых семейств в больших масштабах основаны на понятии сходства. В большинстве случаев единственное сходство с доступом к — это сходство последовательностей.
Многие биологические базы данных записывают примеры белковых семейств и позволяют пользователям определить, принадлежат ли недавно идентифицированные белки к известному семейству. Вот несколько примеров:
Точно так же существует множество алгоритмов поиска в базе данных, например: