Семейство белков


Из Википедии, свободной энциклопедии
  (Перенаправлено из семейства белков )
Перейти к навигации Перейти к поиску
Семейство циклофилинов человека , представленное структурами изомеразных доменов некоторых его членов.

Семейство белков — это группа эволюционно родственных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1:1. Термин «семейство белков» не следует путать с семейством , поскольку он используется в таксономии.

Белки в одном семействе происходят от общего предка и обычно имеют сходные трехмерные структуры , функции и значительное сходство последовательностей . [ править ] Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), так как это самый строгий показатель гомологии и, следовательно, самый четкий показатель общего происхождения. [ нужна цитата ] Существует достаточно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей .методы. Очень маловероятно, что белки, не имеющие общего предка, продемонстрируют статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов белковых семейств . Семейства иногда группируются в более крупные клады , называемые суперсемействами , на основании структурного и механистического сходства, даже если не наблюдается идентифицируемой гомологии последовательностей.

В настоящее время определено более 60 000 белковых семейств [1] , хотя неоднозначность в определении «белкового семейства» приводит к тому, что разные исследователи приводят к очень разным цифрам.

Терминология и использование

Как и многие биологические термины, использование семейства белков в некоторой степени зависит от контекста; это может указывать на большие группы белков с минимально возможным уровнем обнаруживаемого сходства последовательностей, или на очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или на любую промежуточную группу. Чтобы различать эти ситуации, термин « суперсемейство белков » часто используется для отдаленно родственных белков, чье родство можно обнаружить не по сходству последовательностей, а только по общим структурным особенностям. [2] [3] [4] Другие термины, такие как класс белков, группа, клан и подсемейство, были придуманы на протяжении многих лет, но все они имеют аналогичную двусмысленность в использовании. Обычное использование состоит в том, что суперсемейства' (структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, надсемейство, такое как клан PA протеаз, имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. точное определение вряд ли будет согласовано, и читатель должен понять, как именно эти термины используются в конкретном контексте.

Выше консервативная последовательность 250 членов протеаз клана PA ( суперсемейство ). Ниже показано сохранение последовательности 70 членов семейства протеаз C04: Стрелки указывают на остатки каталитической триады , выровненные на основе структуры с помощью DALI .

Белковые домены и мотивы

Концепция семейства белков возникла в то время, когда было известно очень мало белковых структур или последовательностей; в то время структурно понимались преимущественно небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром с . С того времени было обнаружено, что многие белки состоят из нескольких независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. Это привело в последние годы к сосредоточению внимания на семействах белковых доменов. Идентификации и каталогизации таких доменов посвящен ряд онлайн-ресурсов.

Области каждого белка имеют различные функциональные ограничения (особенности, критические для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. Интерфейс связывания белок-белок, тем не менее, может состоять из большой поверхности с ограничениями по гидрофобности или полярности аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ).). Эти блоки чаще всего называют мотивами, хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов.

Эволюция белковых семейств

Согласно существующему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательности. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще способен выполнять свою функцию, дуплицированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации). Определенные семейства генов/белков, особенно у эукариот, подвергаются экстремальным расширениям и сокращениям в ходе эволюции, иногда в сочетании с дупликациями всего генома . Это расширение и сокращение белковых семейств является одной из характерных особенностей эволюции генома , но его важность и последствия в настоящее время неясны.

Филогенетическое дерево надсемейства RAS: это дерево было создано с помощью FigTree (бесплатное онлайн-программное обеспечение).

Использование и важность белковых семейств

По мере увеличения общего количества секвенированных белков и расширения интереса к анализу протеома продолжаются попытки организовать белки в семейства и описать их составные домены и мотивы. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства и суперсемейства белков в качестве основы для разработки основанной на последовательности/структуре стратегии крупномасштабного функционального назначения ферментов с неизвестной функцией. [5] Алгоритмические средства создания белковых семейств в больших масштабах основаны на понятии сходства. В большинстве случаев единственное сходство с доступом к — это сходство последовательностей.

Ресурсы белковой семьи

Многие биологические базы данных записывают примеры белковых семейств и позволяют пользователям определить, принадлежат ли недавно идентифицированные белки к известному семейству. Вот несколько примеров:

  • Pfam - база данных выравниваний и HMM белковых семейств
  • PROSITE - База данных белковых доменов, семейств и функциональных сайтов
  • PIRSF - Система классификации SuperFamily
  • PASS2 - Выравнивание белков как структурные суперсемейства v2 - PASS2 @ NCBS [6]
  • SUPERFAMILY - библиотека HMM, представляющая суперсемейства, и база данных аннотаций (надсемейств и семейств) для всех полностью секвенированных организмов.
  • SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены.

Точно так же существует множество алгоритмов поиска в базе данных, например:

  • BLAST - поиск сходства последовательностей ДНК
  • BLASTp - Поиск сходства белковых последовательностей
  • OrthoFinder быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) [7] [8]

Смотрите также

  • Семья Джин
  • Аннотация генома
  • Кластеризация последовательностей

Белковые семейства

использованная литература

  1. ^ Кунин В., Дела I, Энрайт А.Дж., де Лоренцо В., Узунис К.А. (2003). «Мириады белковых семейств, и их число продолжает расти» . Биология генома . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ПВК 151299  . PMID 12620116 . 
  2. Дайхофф, Миссури (декабрь 1974 г.). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–2316. PMID 4435228 . 
  3. ^ Dayhoff MO , McLaughlin PJ, Barker WC, Hunt LT (1975). «Эволюция последовательностей внутри белковых суперсемейств». Die Naturwissenschaften . 62 (4): 154–161. Бибкод : 1975NW.....62..154D . DOI : 10.1007/ BF00608697 . S2CID 40304076 . 
  4. Дайхофф, Миссури (август 1976 г.). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–2138. PMID 181273 . 
  5. ↑ Gerlt JA, Allen KN, Almo SC, Armstrong RN, Babbitt PC, Cronan JE, Dunaway-Mariano D, Imker HJ, Jacobson MP, Minor W, Poulter CD, Raushel FM, Sali A, Shoichet BK, Sweedler JV (ноябрь 2011 г. ). «Инициатива функции фермента» . Биохимия . 50 (46): 9950–62. дои : 10.1021/bi201312u . ПВК 3238057 . PMID 21999478 .  
  6. ↑ Гандимати А., Наир А.Г., Соудхамини Р. (январь 2012 г.). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследование нуклеиновых кислот . 40 (выпуск базы данных): D531–4. doi : 10.1093/нар/гкр1096 . ПВК 3245109 . PMID 22123743 .  
  7. ^ Эммс Д.М., Келли С. (август 2015 г.). «OrthoFinder: устранение фундаментальных погрешностей при сравнении целых геномов значительно повышает точность вывода ортогрупп» . Биология генома . 16 : 157. doi : 10.1186/s13059-015-0721-2 . ПМС 4531804 . PMID 26243257 .  
  8. Эммс Д.М., Келли С. (ноябрь 2019 г.). «OrthoFinder: вывод филогенетической ортологии для сравнительной геномики» . Биология генома . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ПВК 6857279 . PMID 31727128 .  

внешняя ссылка

  • СМИ, связанные с семействами белков , на Викискладе?
Получено с https://en.wikipedia.org/w/index.php?title=Protein_family&oldid=1059994469 .