Белок семейства представляет собой группу эволюционно о связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1: 1. Термин « семейство белков» не следует путать с термином « семейство», поскольку он используется в таксономии.
Белки в семье происходят от общего предка и обычно имеют похожие трехмерные структуры , функции и значительное сходство последовательностей [ необходима ссылка ] . Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), поскольку это самый строгий индикатор гомологии и, следовательно, самый четкий индикатор общего происхождения [ цитата необходима ] . Существует довольно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей.методы. Очень маловероятно, что белки, не имеющие общего предка, покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков [ необходима цитата ] .
Семейства иногда группируются в более крупные клады, называемые суперсемействами, на основании структурного и механистического сходства, даже если нет идентифицируемой гомологии последовательностей.
В настоящее время определено более 60 000 семейств белков [1], хотя неоднозначность определения семейства белков приводит различных исследователей к сильно различающимся числам.
Терминология и использование
Как и в случае со многими биологическими терминами, использование семейства белков в некоторой степени зависит от контекста; он может указывать на большие группы белков с минимально возможным уровнем детектируемого сходства последовательностей, или очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или любые промежуточные группы. Чтобы различать эти ситуации, термин « суперсемейство белков» часто используется для обозначения отдаленно родственных белков, родство которых определяется не по сходству последовательностей, а только по общим структурным особенностям. [2] [3] [4] Другие термины, такие как класс белков , группа , клан и подсемейство , были изобретены годами, но все они имеют одинаковую двусмысленность в использовании. Обычно суперсемейства ( структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, суперсемейство, такое как клан протеаз PA , имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. Маловероятно, что будет согласовано точное определение, и читатель должен понять, как именно эти термины используются в конкретном контексте.
.
Белковые домены и мотивы
Концепция семейства белков зародилась в то время, когда было известно очень мало структур или последовательностей белков; в то время были структурно понятны в первую очередь небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром c . С того времени было обнаружено, что многие белки содержат множество независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. В последние годы это привело к сосредоточению внимания на семействах белковых доменов. Определению и каталогизации таких доменов посвящен ряд онлайн-ресурсов (см. Список ссылок в конце этой статьи).
Области каждого белка имеют разные функциональные ограничения (особенности, важные для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. С другой стороны, граница связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. Множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами , хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. Д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов (см. Список в конце статьи).
Эволюция белковых семейств
Согласно нынешнему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных потомка позволяет гену / белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще может выполнять свою функцию, дублированный ген может свободно расходиться и может приобретать новые функции (путем случайной мутации). Определенные семейства генов / белков, особенно у эукариот , в ходе эволюции претерпевают экстремальные расширения и сокращения, иногда вместе с дупликациями всего генома . Это расширение и сокращение семейств белков - одна из характерных черт эволюции генома , но его важность и разветвления в настоящее время неясны.
Использование и важность белковых семейств
По мере того как общее количество секвенированных белков увеличивается и интерес к протеомному анализу возрастает , предпринимаются постоянные усилия по организации белков в семейства и описанию составляющих их доменов и мотивов. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Фермент Функция Инициатива (EFI) использует белок семейство и надсемейство в качестве основы для разработки стратегии / структур на основе последовательности для крупномасштабного функционального назначения ферментов неизвестной функции. [5]
Алгоритмические средства для создания семейств белков в большом масштабе основаны на понятии сходства. В большинстве случаев единственное сходство, к которому мы имеем доступ, - это сходство последовательностей.
Ресурсы белковой семьи
Существует множество биологических баз данных, которые записывают примеры семейств белков и позволяют пользователям определять, принадлежат ли вновь идентифицированные белки к известному семейству. Вот несколько примеров:
- Pfam - База данных выравниваний и HMM семейств белков
- PROSITE - База данных белковых доменов, семейств и функциональных сайтов
- PIRSF - Система классификации суперсемейства
- PASS2 - Выравнивание белков как структурных суперсемейств v2 - PASS2 @ NCBS [6]
- SUPERFAMILY - Библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
- SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены
Аналогичным образом существует множество алгоритмов поиска в базе данных, например:
- BLAST - поиск сходства последовательностей ДНК
- BLASTp - поиск сходства белковой последовательности
- OrthoFinder: быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) [7] [8]
Смотрите также
- Семья Джин
- Белковое суперсемейство
- Подсемейство белков
- Белковая структура
- Белковые домены
- Выравнивание последовательности
- Кластеризация последовательностей
- Аннотации генома
Семейства белков
Рекомендации
- ^ Кунин V, футляры I, Энрайт AJ, де Лоренцо V, Ouzounis CA (2003). «Мириады белковых семейств, и их число продолжает расти» . Геномная биология . 4 (2): 401. DOI : 10,1186 / GB-2003-4-2-401 . PMC 151299 . PMID 12620116 .
- ^ Dayhoff MO (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–6. PMID 4435228 .
- ^ Дэйхофф МО , Маклафлин П.Дж., Баркер В.К. , Хант Л.Т. (1975). «Эволюция последовательностей в суперсемействах белков». Die Naturwissenschaften . 62 (4): 154–161. Bibcode : 1975NW ..... 62..154D . DOI : 10.1007 / BF00608697 . S2CID 40304076 .
- ^ Dayhoff MO (август 1976 г.). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–8. PMID 181273 .
- ^ Герлт Дж. А., Аллен К. Н., Альмо СК, Армстронг Р. Н., Бэббит П. К., Кронан Дж. Э., Данауэй-Мариано Д., Имкер Х. Дж., Якобсон М. П., Минор В., Поултер компакт-диск, Раушель FM, Сали А., Шойхет Б. К., Свидлер СП (ноябрь 2011 г.) . «Инициатива ферментной функции» . Биохимия . 50 (46): 9950–62. DOI : 10.1021 / bi201312u . PMC 3238057 . PMID 21999478 .
- ^ Гандхимати А., Наир А.Г., Соудхамини Р. (январь 2012 г.). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D531–4. DOI : 10.1093 / NAR / gkr1096 . PMC 3245109 . PMID 22123743 .
- ^ Emms DM, Kelly S (август 2015 г.). «OrthoFinder: устранение фундаментальных ошибок при сравнении полных геномов значительно повышает точность вывода ортогрупп» . Геномная биология . 16 : 157. DOI : 10.1186 / s13059-015-0721-2 . PMC 4531804 . PMID 26243257 .
- ^ Emms DM, Kelly S (ноябрь 2019 г.). "OrthoFinder: вывод филогенетической ортологии для сравнительной геномики" . Геномная биология . 20 (1): 238. DOI : 10.1186 / s13059-019-1832-y . PMC 6857279 . PMID 31727128 .
Внешние ссылки
- СМИ, связанные с семействами белков на Викискладе?