Семейство белков

Белок семейства представляет собой группу эволюционно о связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1: 1. Термин « семейство белков» не следует путать с термином « семейство», поскольку он используется в таксономии.

Семейство циклофилинов человека , представленное структурами изомеразных доменов некоторых из его членов.

Белки в семье происходят от общего предка и обычно имеют похожие трехмерные структуры , функции и значительное сходство последовательностей ^{[ необходима ссылка ]} . Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), поскольку это самый строгий индикатор гомологии и, следовательно, самый четкий индикатор общего происхождения ^{[ цитата необходима ]} . Существует довольно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей.методы. Очень маловероятно, что белки, не имеющие общего предка, покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков ^{[ необходима цитата ]} .

Семейства иногда группируются в более крупные клады, называемые суперсемействами, на основании структурного и механистического сходства, даже если нет идентифицируемой гомологии последовательностей.

В настоящее время определено более 60 000 семейств белков ^[1], хотя неоднозначность определения семейства белков приводит различных исследователей к сильно различающимся числам.

Терминология и использование

Как и в случае со многими биологическими терминами, использование семейства белков в некоторой степени зависит от контекста; он может указывать на большие группы белков с минимально возможным уровнем детектируемого сходства последовательностей, или очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или любые промежуточные группы. Чтобы различать эти ситуации, термин « суперсемейство белков» часто используется для обозначения отдаленно родственных белков, родство которых определяется не по сходству последовательностей, а только по общим структурным особенностям. ^[2]^[3]^[4] Другие термины, такие как класс белков , группа , клан и подсемейство , были изобретены годами, но все они имеют одинаковую двусмысленность в использовании. Обычно суперсемейства ( структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, суперсемейство, такое как клан протеаз PA , имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. Маловероятно, что будет согласовано точное определение, и читатель должен понять, как именно эти термины используются в конкретном контексте.

Выше показано сохранение последовательности 250 членов протеаз клана PA ( надсемейство ). Ниже представлена консервация последовательности 70 членов семейства протеаз C04. Стрелки указывают остатки каталитической триады . Унифицированные на основе структуры с помощью DALI

.

Белковые домены и мотивы

Концепция семейства белков зародилась в то время, когда было известно очень мало структур или последовательностей белков; в то время были структурно понятны в первую очередь небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром c . С того времени было обнаружено, что многие белки содержат множество независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. В последние годы это привело к сосредоточению внимания на семействах белковых доменов. Определению и каталогизации таких доменов посвящен ряд онлайн-ресурсов (см. Список ссылок в конце этой статьи).

Области каждого белка имеют разные функциональные ограничения (особенности, важные для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. С другой стороны, граница связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. Множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами , хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. Д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов (см. Список в конце статьи).

Эволюция белковых семейств

Согласно нынешнему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных потомка позволяет гену / белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще может выполнять свою функцию, дублированный ген может свободно расходиться и может приобретать новые функции (путем случайной мутации). Определенные семейства генов / белков, особенно у эукариот , в ходе эволюции претерпевают экстремальные расширения и сокращения, иногда вместе с дупликациями всего генома . Это расширение и сокращение семейств белков - одна из характерных черт эволюции генома , но его важность и разветвления в настоящее время неясны.

Филогенетическое дерево надсемейства РАН. Дерево было создано с помощью FigTree (бесплатное онлайн-программное обеспечение).

Использование и важность белковых семейств

По мере того как общее количество секвенированных белков увеличивается и интерес к протеомному анализу возрастает , предпринимаются постоянные усилия по организации белков в семейства и описанию составляющих их доменов и мотивов. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Фермент Функция Инициатива (EFI) использует белок семейство и надсемейство в качестве основы для разработки стратегии / структур на основе последовательности для крупномасштабного функционального назначения ферментов неизвестной функции. ^[5]

Алгоритмические средства для создания семейств белков в большом масштабе основаны на понятии сходства. В большинстве случаев единственное сходство, к которому мы имеем доступ, - это сходство последовательностей.

Ресурсы белковой семьи

Существует множество биологических баз данных, которые записывают примеры семейств белков и позволяют пользователям определять, принадлежат ли вновь идентифицированные белки к известному семейству. Вот несколько примеров:

Pfam - База данных выравниваний и HMM семейств белков
PROSITE - База данных белковых доменов, семейств и функциональных сайтов
PIRSF - Система классификации суперсемейства
PASS2 - Выравнивание белков как структурных суперсемейств v2 - PASS2 @ NCBS ^[6]
SUPERFAMILY - Библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены

Аналогичным образом существует множество алгоритмов поиска в базе данных, например:

BLAST - поиск сходства последовательностей ДНК
BLASTp - поиск сходства белковой последовательности
OrthoFinder: быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) ^[7]^[8]

Смотрите также

Семья Джин
Белковое суперсемейство
Подсемейство белков
Белковая структура
Белковые домены
Выравнивание последовательности
Кластеризация последовательностей
Аннотации генома

Семейства белков

Внешние ссылки

СМИ, связанные с семействами белков на Викискладе?

[pmid12620116-1] Кунин V, футляры I, Энрайт AJ, де Лоренцо V, Ouzounis CA (2003). «Мириады белковых семейств, и их число продолжает расти» . Геномная биология . 4 (2): 401. DOI : 10,1186 / GB-2003-4-2-401 . PMC 151299 . PMID 12620116 .

[pmid4435228-2] Dayhoff MO (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–6. PMID 4435228 .

[3] Дэйхофф МО , Маклафлин П.Дж., Баркер В.К. , Хант Л.Т. (1975). «Эволюция последовательностей в суперсемействах белков». Die Naturwissenschaften . 62 (4): 154–161. Bibcode : 1975NW ..... 62..154D . DOI : 10.1007 / BF00608697 . S2CID 40304076 .

[pmid181273-4] Dayhoff MO (август 1976 г.). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–8. PMID 181273 .

[pmid21999478-5] Герлт Дж. А., Аллен К. Н., Альмо СК, Армстронг Р. Н., Бэббит П. К., Кронан Дж. Э., Данауэй-Мариано Д., Имкер Х. Дж., Якобсон М. П., Минор В., Поултер компакт-диск, Раушель FM, Сали А., Шойхет Б. К., Свидлер СП (ноябрь 2011 г.) . «Инициатива ферментной функции» . Биохимия . 50 (46): 9950–62. DOI : 10.1021 / bi201312u . PMC 3238057 . PMID 21999478 .

[pmid22123743-6] Гандхимати А., Наир А.Г., Соудхамини Р. (январь 2012 г.). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D531–4. DOI : 10.1093 / NAR / gkr1096 . PMC 3245109 . PMID 22123743 .

[pmid26243257-7] Emms DM, Kelly S (август 2015 г.). «OrthoFinder: устранение фундаментальных ошибок при сравнении полных геномов значительно повышает точность вывода ортогрупп» . Геномная биология . 16 : 157. DOI : 10.1186 / s13059-015-0721-2 . PMC 4531804 . PMID 26243257 .

[pmid31727128-8] Emms DM, Kelly S (ноябрь 2019 г.). "OrthoFinder: вывод филогенетической ортологии для сравнительной геномики" . Геномная биология . 20 (1): 238. DOI : 10.1186 / s13059-019-1832-y . PMC 6857279 . PMID 31727128 .

[1],