Семейство белков

Семейство циклофилинов человека , представленное структурами изомеразных доменов некоторых его членов.

Семейство белков — это группа эволюционно родственных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1:1. Термин «семейство белков» не следует путать с семейством , поскольку он используется в таксономии.

Белки в одном семействе происходят от общего предка и обычно имеют сходные трехмерные структуры , функции и значительное сходство последовательностей . ^{[ править ]} Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), так как это самый строгий показатель гомологии и, следовательно, самый четкий показатель общего происхождения. ^{[ нужна цитата ]} Существует достаточно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей .методы. Очень маловероятно, что белки, не имеющие общего предка, продемонстрируют статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации ^членов^{белковых}^{семейств} . Семейства иногда группируются в более крупные клады , называемые суперсемействами , на основании структурного и механистического сходства, даже если не наблюдается идентифицируемой гомологии последовательностей.

В настоящее время определено более 60 000 белковых семейств ^[1] , хотя неоднозначность в определении «белкового семейства» приводит к тому, что разные исследователи приводят к очень разным цифрам.

Терминология и использование

Как и многие биологические термины, использование семейства белков в некоторой степени зависит от контекста; это может указывать на большие группы белков с минимально возможным уровнем обнаруживаемого сходства последовательностей, или на очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или на любую промежуточную группу. Чтобы различать эти ситуации, термин « суперсемейство белков » часто используется для отдаленно родственных белков, чье родство можно обнаружить не по сходству последовательностей, а только по общим структурным особенностям. ^[2]^[3]^[4] Другие термины, такие как класс белков, группа, клан и подсемейство, были придуманы на протяжении многих лет, но все они имеют аналогичную двусмысленность в использовании. Обычное использование состоит в том, что суперсемейства' (структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, надсемейство, такое как клан PA протеаз, имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. точное определение вряд ли будет согласовано, и читатель должен понять, как именно эти термины используются в конкретном контексте.

Выше консервативная последовательность 250 членов протеаз клана PA ( суперсемейство ). Ниже показано сохранение последовательности 70 членов семейства протеаз C04: Стрелки указывают на остатки каталитической триады , выровненные на основе структуры с помощью DALI .

Белковые домены и мотивы

Концепция семейства белков возникла в то время, когда было известно очень мало белковых структур или последовательностей; в то время структурно понимались преимущественно небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром с . С того времени было обнаружено, что многие белки состоят из нескольких независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. Это привело в последние годы к сосредоточению внимания на семействах белковых доменов. Идентификации и каталогизации таких доменов посвящен ряд онлайн-ресурсов.

Области каждого белка имеют различные функциональные ограничения (особенности, критические для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. Интерфейс связывания белок-белок, тем не менее, может состоять из большой поверхности с ограничениями по гидрофобности или полярности аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ).). Эти блоки чаще всего называют мотивами, хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов.

Эволюция белковых семейств

Согласно существующему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательности. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще способен выполнять свою функцию, дуплицированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации). Определенные семейства генов/белков, особенно у эукариот, подвергаются экстремальным расширениям и сокращениям в ходе эволюции, иногда в сочетании с дупликациями всего генома . Это расширение и сокращение белковых семейств является одной из характерных особенностей эволюции генома , но его важность и последствия в настоящее время неясны.

Филогенетическое дерево надсемейства RAS: это дерево было создано с помощью FigTree (бесплатное онлайн-программное обеспечение).

Использование и важность белковых семейств

По мере увеличения общего количества секвенированных белков и расширения интереса к анализу протеома продолжаются попытки организовать белки в семейства и описать их составные домены и мотивы. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства и суперсемейства белков в качестве основы для разработки основанной на последовательности/структуре стратегии крупномасштабного функционального назначения ферментов с неизвестной функцией. ^[5] Алгоритмические средства создания белковых семейств в больших масштабах основаны на понятии сходства. В большинстве случаев единственное сходство с доступом к — это сходство последовательностей.

Ресурсы белковой семьи

Многие биологические базы данных записывают примеры белковых семейств и позволяют пользователям определить, принадлежат ли недавно идентифицированные белки к известному семейству. Вот несколько примеров:

Pfam - база данных выравниваний и HMM белковых семейств
PROSITE - База данных белковых доменов, семейств и функциональных сайтов
PIRSF - Система классификации SuperFamily
PASS2 - Выравнивание белков как структурные суперсемейства v2 - PASS2 @ NCBS ^[6]
SUPERFAMILY - библиотека HMM, представляющая суперсемейства, и база данных аннотаций (надсемейств и семейств) для всех полностью секвенированных организмов.
SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены.

Точно так же существует множество алгоритмов поиска в базе данных, например:

BLAST - поиск сходства последовательностей ДНК
BLASTp - Поиск сходства белковых последовательностей
OrthoFinder быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) ^[7]^[8]

Смотрите также

Семья Джин
Аннотация генома
Кластеризация последовательностей

Белковые семейства

использованная литература

^ Кунин В., Дела I, Энрайт А.Дж., де Лоренцо В., Узунис К.А. (2003). «Мириады белковых семейств, и их число продолжает расти» . Биология генома . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ПВК 151299 . PMID 12620116 .
↑ Дайхофф, Миссури (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–2316. PMID 4435228 .
^ Dayhoff MO , McLaughlin PJ, Barker WC, Hunt LT (1975). «Эволюция последовательностей внутри белковых суперсемейств». Die Naturwissenschaften . 62 (4): 154–161. Бибкод : 1975NW.....62..154D . DOI : 10.1007/ BF00608697 . S2CID 40304076 .
↑ Дайхофф, Миссури (август 1976 г.). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–2138. PMID 181273 .
↑ Gerlt JA, Allen KN, Almo SC, Armstrong RN, Babbitt PC, Cronan JE, Dunaway-Mariano D, Imker HJ, Jacobson MP, Minor W, Poulter CD, Raushel FM, Sali A, Shoichet BK, Sweedler JV (ноябрь 2011 г. ). «Инициатива функции фермента» . Биохимия . 50 (46): 9950–62. дои : 10.1021/bi201312u . ПВК 3238057 . PMID 21999478 .
↑ Гандимати А., Наир А.Г., Соудхамини Р. (январь 2012 г.). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследование нуклеиновых кислот . 40 (выпуск базы данных): D531–4. doi : 10.1093/нар/гкр1096 . ПВК 3245109 . PMID 22123743 .
^ Эммс Д.М., Келли С. (август 2015 г.). «OrthoFinder: устранение фундаментальных погрешностей при сравнении целых геномов значительно повышает точность вывода ортогрупп» . Биология генома . 16 : 157. doi : 10.1186/s13059-015-0721-2 . ПМС 4531804 . PMID 26243257 .
↑ Эммс Д.М., Келли С. (ноябрь 2019 г.). «OrthoFinder: вывод филогенетической ортологии для сравнительной геномики» . Биология генома . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ПВК 6857279 . PMID 31727128 .

внешняя ссылка

СМИ, связанные с семействами белков , на Викискладе?

[pmid12620116-1] Кунин В., Дела I, Энрайт А.Дж., де Лоренцо В., Узунис К.А. (2003). «Мириады белковых семейств, и их число продолжает расти» . Биология генома . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ПВК 151299 . PMID 12620116 .

[pmid4435228-2] Дайхофф, Миссури (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–2316. PMID 4435228 .

[3] Dayhoff MO , McLaughlin PJ, Barker WC, Hunt LT (1975). «Эволюция последовательностей внутри белковых суперсемейств». Die Naturwissenschaften . 62 (4): 154–161. Бибкод : 1975NW.....62..154D . DOI : 10.1007/ BF00608697 . S2CID 40304076 .

[pmid181273-4] Дайхофф, Миссури (август 1976 г.). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–2138. PMID 181273 .

[pmid21999478-5] ↑ Gerlt JA, Allen KN, Almo SC, Armstrong RN, Babbitt PC, Cronan JE, Dunaway-Mariano D, Imker HJ, Jacobson MP, Minor W, Poulter CD, Raushel FM, Sali A, Shoichet BK, Sweedler JV (ноябрь 2011 г. ). «Инициатива функции фермента» . Биохимия . 50 (46): 9950–62. дои : 10.1021/bi201312u . ПВК 3238057 . PMID 21999478 .

[pmid22123743-6] ↑ Гандимати А., Наир А.Г., Соудхамини Р. (январь 2012 г.). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследование нуклеиновых кислот . 40 (выпуск базы данных): D531–4. doi : 10.1093/нар/гкр1096 . ПВК 3245109 . PMID 22123743 .

[pmid26243257-7] Эммс Д.М., Келли С. (август 2015 г.). «OrthoFinder: устранение фундаментальных погрешностей при сравнении целых геномов значительно повышает точность вывода ортогрупп» . Биология генома . 16 : 157. doi : 10.1186/s13059-015-0721-2 . ПМС 4531804 . PMID 26243257 .

[pmid31727128-8] Эммс Д.М., Келли С. (ноябрь 2019 г.). «OrthoFinder: вывод филогенетической ортологии для сравнительной геномики» . Биология генома . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ПВК 6857279 . PMID 31727128 .

[1]

втеФерменты
Мероприятия	Активный сайт Сайт привязки Каталитическая триада Оксианион отверстие Ферментная распущенность Каталитически совершенный фермент Коэнзим Кофактор Ферментный катализ
Регулирование	Аллостерическая регуляция Кооперативность Ингибитор фермента Активатор ферментов
Классификация	номер ЕС Суперсемейство ферментов Семейство ферментов Список ферментов
Кинетика	Кинетика ферментов Диаграмма Иди – Хофсти Сюжет Хейнса – Вульфа Сюжет Лайнуивера – Берка Кинетика Михаэлиса – Ментена
Типы	Оксидоредуктазы EC1 ( список ) Трансферазы EC2 ( список ) EC3 гидролазы ( список ) Лиазы EC4 ( список ) Изомеры EC5 ( список ) Лигазы EC6 ( список ) Транслоказы EC7 ( список )