Белок семейства представляет собой группу эволюционно о связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1: 1. Термин « семейство белков» не следует путать с термином « семейство», поскольку он используется в таксономии.
Белки в семье происходят от общего предка и обычно имеют похожие трехмерные структуры , функции и значительное сходство последовательностей [ необходима ссылка ] . Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), поскольку это самый строгий индикатор гомологии и, следовательно, самый четкий индикатор общего происхождения [ цитата необходима ] . Существует довольно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей.методы. Очень маловероятно, что белки, не имеющие общего предка, покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков [ необходима цитата ] .
Семейства иногда группируются в более крупные клады, называемые суперсемействами, на основе структурного и механистического сходства, даже если нет идентифицируемой гомологии последовательностей.
В настоящее время определено более 60 000 семейств белков [1], хотя неоднозначность определения семейства белков приводит различных исследователей к сильно различающимся цифрам.
Терминология и использование [ править ]
Как и во многих биологических терминах, использование семейства белков в некоторой степени зависит от контекста; он может указывать на большие группы белков с минимально возможным уровнем детектируемого сходства последовательностей, или очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или на любую промежуточную группу. Чтобы различать эти ситуации, термин « суперсемейство белков» часто используется для обозначения отдаленно родственных белков, родство которых определяется не по сходству последовательностей, а только по общим структурным особенностям. [2] [3] [4] Другие термины, такие как класс белков , группа , клан и подсемейство.были придуманы годами, но все страдают схожей двусмысленностью использования. Обычно суперсемейства ( структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, суперсемейство, такое как клан протеаз PA , имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. Маловероятно, что будет согласовано точное определение, и читатель должен понять, как именно эти термины используются в конкретном контексте.
.
Белковые домены и мотивы [ править ]
Концепция семейства белков зародилась в то время, когда было известно очень мало структур или последовательностей белков; в то время структурно понимались в первую очередь небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром c . С того времени было обнаружено, что многие белки содержат несколько независимых структурных и функциональных единиц или доменов . В результате эволюционной перетасовки различные домены в белке развивались независимо. Это привело в последние годы к сосредоточению внимания на семействах белковых доменов. Определению и каталогизации таких доменов посвящен ряд онлайн-ресурсов (см. Список ссылок в конце этой статьи).
Области каждого белка имеют разные функциональные ограничения (особенности, важные для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. С другой стороны, граница связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. Множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами., хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов (см. Список в конце статьи).
Эволюция белковых семейств [ править ]
Согласно нынешнему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных потомка позволяет гену / белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще может выполнять свою функцию, дублированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации). Определенные семейства генов / белков, особенно у эукариот, претерпевают экстремальные расширения и сокращения в ходе эволюции, иногда вместе с дупликациями всего генома . Это расширение и сокращение семейств белков является одной из характерных черт эволюции генома , но его важность и разветвления в настоящее время неясны.
Использование и важность семейств белков [ править ]
По мере того как общее количество секвенированных белков увеличивается и интерес к протеомному анализу возрастает , предпринимаются постоянные усилия по организации белков в семейства и описанию составляющих их доменов и мотивов. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Программа Enzyme Function Initiative (EFI) использует семейства и суперсемейства белков в качестве основы для разработки стратегии на основе последовательности / структуры для крупномасштабного функционального назначения ферментов с неизвестной функцией. [5]
Алгоритмические средства для установления семейств белков в большом масштабе основаны на понятии сходства. В большинстве случаев единственное сходство, к которому мы имеем доступ, - это сходство последовательностей.
Ресурсы по семейству белков [ править ]
Существует множество биологических баз данных, которые записывают примеры семейств белков и позволяют пользователям определять, принадлежат ли вновь идентифицированные белки к известному семейству. Вот несколько примеров:
- Pfam - База данных семейств белков выравниваний и HMM
- PROSITE - База данных белковых доменов, семейств и функциональных сайтов
- PIRSF - Система классификации суперсемейства
- PASS2 - Выравнивание белков как структурные суперсемейства v2 - PASS2 @ NCBS [6]
- SUPERFAMILY - библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов
- SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены
Аналогичным образом существует множество алгоритмов поиска в базе данных, например:
- BLAST - поиск сходства последовательностей ДНК
- BLASTp - поиск сходства белковой последовательности
- OrthoFinder: быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) [7] [8]
См. Также [ править ]
- Семья Джин
- Белковое суперсемейство
- Подсемейство белков
- Белковая структура
- Белковые домены
- Выравнивание последовательности
- Кластеризация последовательностей
- Аннотации генома
Семейства белков [ править ]
Ссылки [ править ]
- ^ Кунин V, футляры I, Энрайт AJ, де Лоренцо V, Ouzounis CA (2003). «Мириады белковых семейств, и их число продолжает расти» . Геномная биология . 4 (2): 401. DOI : 10,1186 / GB-2003-4-2-401 . PMC 151299 . PMID 12620116 .
- ^ Dayhoff МО (декабрь 1974). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–6. PMID 4435228 .
- ^ Dayhoff MO , McLaughlin PJ, Баркер WC, Hunt LT (1975). «Эволюция последовательностей в суперсемействах белков». Die Naturwissenschaften . 62 (4): 154–161. Bibcode : 1975NW ..... 62..154D . DOI : 10.1007 / BF00608697 . S2CID 40304076 .
- ^ Dayhoff MO (август 1976). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–8. PMID 181273 .
- ^ Герлт Дж. А., Аллен К. Н., Альмо СК, Армстронг Р. Н., Бэббит ПК, Кронан Дж. Э., Данауэй-Мариано Д., Имкер Х. Дж., Якобсон М. П., Минор В, Полтер CD, Раушель FM, Сали А., Шойхет Б. К., Свидлер СП (ноябрь 2011 г.) ). «Инициатива ферментной функции» . Биохимия . 50 (46): 9950–62. DOI : 10.1021 / bi201312u . PMC 3238057 . PMID 21999478 .
- ^ Gandhimathi A, Наир AG, Sowdhamini R (январь 2012). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D531–4. DOI : 10.1093 / NAR / gkr1096 . PMC 3245109 . PMID 22123743 .
- ^ Emms DM, Kelly S (август 2015). «OrthoFinder: устранение фундаментальных ошибок при сравнении всего генома значительно повышает точность вывода ортогрупп» . Геномная биология . 16 : 157. DOI : 10.1186 / s13059-015-0721-2 . PMC 4531804 . PMID 26243257 .
- ^ Emms DM, Келли S (ноябрь 2019). "OrthoFinder: вывод филогенетической ортологии для сравнительной геномики" . Геномная биология . 20 (1): 238. DOI : 10.1186 / s13059-019-1832-y . PMC 6857279 . PMID 31727128 .
Внешние ссылки [ править ]
- СМИ, связанные с семействами белков на Викискладе?