Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Семейство циклофилинов человека , представленное структурами изомеразных доменов некоторых из его членов.

Белок семейства представляет собой группу эволюционно о связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок в соотношении 1: 1. Термин « семейство белков» не следует путать с термином « семейство», поскольку он используется в таксономии.

Белки в семье происходят от общего предка и обычно имеют похожие трехмерные структуры , функции и значительное сходство последовательностей [ необходима ссылка ] . Наиболее важным из них является сходство последовательностей (обычно аминокислотная последовательность), поскольку это самый строгий индикатор гомологии и, следовательно, самый четкий индикатор общего происхождения [ цитата необходима ] . Существует довольно хорошо разработанная структура для оценки значимости сходства между группой последовательностей с использованием выравнивания последовательностей.методы. Очень маловероятно, что белки, не имеющие общего предка, покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков [ необходима цитата ] .

Семейства иногда группируются в более крупные клады, называемые суперсемействами, на основе структурного и механистического сходства, даже если нет идентифицируемой гомологии последовательностей.

В настоящее время определено более 60 000 семейств белков [1], хотя неоднозначность определения семейства белков приводит различных исследователей к сильно различающимся числам.

Терминология и использование [ править ]

Как и в случае со многими биологическими терминами, использование семейства белков в некоторой степени зависит от контекста; он может указывать на большие группы белков с минимально возможным уровнем детектируемого сходства последовательностей, или очень узкие группы белков с почти идентичной последовательностью, функцией и трехмерной структурой, или любые промежуточные группы. Чтобы различать эти ситуации, термин суперсемейство белков часто используется для обозначения отдаленно связанных белков, родство которых не определяется сходством последовательностей, а определяется только общими структурными особенностями. [2] [3] [4] Другие термины, такие как класс белков , группа , клан и подсемейство.были придуманы годами, но все страдают схожей двусмысленностью использования. Обычно суперсемейства ( структурные гомологии ) содержат семейства ( гомологии последовательностей ), которые содержат подсемейства . Следовательно, суперсемейство, такое как клан протеаз PA , имеет гораздо более низкую консервативность последовательности, чем одно из содержащихся в нем семейств, семейство C04. Маловероятно, что будет согласовано точное определение, и читатель должен понять, как именно эти термины используются в конкретном контексте.

Выше показано сохранение последовательности 250 членов протеаз клана PA ( надсемейство ). Ниже представлена ​​консервация последовательности 70 членов семейства протеаз C04. Стрелки указывают остатки каталитической триады . Унифицированные на основе структуры с помощью DALI

.

Белковые домены и мотивы [ править ]

Концепция семейства белков зародилась в то время, когда было известно очень мало структур или последовательностей белков; в то время структурно понимались в первую очередь небольшие однодоменные белки, такие как миоглобин , гемоглобин и цитохром c . С того времени было обнаружено, что многие белки содержат множество независимых структурных и функциональных единиц или доменов . Из-за эволюционной перетасовки разные домены в белке развивались независимо. В последние годы это привело к сосредоточению внимания на семействах белковых доменов. Определению и каталогизации таких доменов посвящен ряд онлайн-ресурсов (см. Список ссылок в конце этой статьи).

Области каждого белка имеют разные функциональные ограничения (особенности, важные для структуры и функции белка). Например, активный центр фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы в трех измерениях. С другой стороны, интерфейс связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению различимых блоков консервативной последовательности при сравнении последовательностей семейства белков (см. Множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами., хотя используется много других терминов (блоки, подписи, отпечатки пальцев и т. д.). Опять же, многие онлайн-ресурсы посвящены идентификации и каталогизации белковых мотивов (см. Список в конце статьи).

Эволюция белковых семейств [ править ]

Согласно нынешнему консенсусу, белковые семейства возникают двумя путями. Во-первых, разделение родительского вида на два генетически изолированных потомка позволяет гену / белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к семейству ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ). Поскольку исходный ген все еще может выполнять свою функцию, дублированный ген может свободно расходиться и может приобретать новые функции (путем случайной мутации). Определенные семейства генов / белков, особенно у эукариот, претерпевают экстремальные расширения и сокращения в ходе эволюции, иногда в сочетании с дупликациями всего генома . Это расширение и сокращение семейств белков - одна из характерных черт эволюции генома , но его важность и разветвления в настоящее время неясны.

Филогенетическое дерево надсемейства РАН. Дерево было создано с помощью FigTree (бесплатное онлайн-программное обеспечение).

Использование и важность семейств белков [ править ]

По мере того как общее количество секвенированных белков увеличивается и интерес к протеомному анализу возрастает , предпринимаются постоянные попытки организовать белки в семейства и описать их составляющие домены и мотивы. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Фермент Функция Инициатива (EFI) использует белок семейство и надсемейство в качестве основы для разработки стратегии / структур на основе последовательности для крупномасштабного функционального назначения ферментов неизвестной функции. [5]

Алгоритмические средства для создания семейств белков в большом масштабе основаны на понятии сходства. В большинстве случаев единственное сходство, к которому мы имеем доступ, - это сходство последовательностей.

Ресурсы по семейству белков [ править ]

Существует множество биологических баз данных, которые записывают примеры семейств белков и позволяют пользователям определять, принадлежат ли вновь идентифицированные белки к известному семейству. Вот несколько примеров:

  • Pfam - База данных выравниваний и HMM семейств белков
  • PROSITE - База данных белковых доменов, семейств и функциональных сайтов
  • PIRSF - Система классификации суперсемейства
  • PASS2 - Выравнивание белков как структурных суперсемейств v2 - PASS2 @ NCBS [6]
  • SUPERFAMILY - Библиотека HMM, представляющая суперсемейства, и база данных аннотаций (суперсемейства и семейства) для всех полностью секвенированных организмов.
  • SCOP и CATH - классификации белковых структур на суперсемейства, семейства и домены

Аналогичным образом существует множество алгоритмов поиска в базе данных, например:

  • BLAST - поиск сходства последовательностей ДНК
  • BLASTp - поиск сходства белковой последовательности
  • OrthoFinder: быстрый, масштабируемый и точный метод кластеризации белков в семейства (ортогруппы) [7] [8]


См. Также [ править ]

  • Семья Джин
  • Белковое суперсемейство
  • Подсемейство белков
  • Белковая структура
  • Белковые домены
  • Выравнивание последовательности
  • Кластеризация последовательностей
  • Аннотации генома

Семейства белков [ править ]

Ссылки [ править ]

  1. ^ Кунин V, футляры I, Энрайт AJ, де Лоренцо V, Ouzounis CA (2003). «Мириады белковых семейств, и их число продолжает расти» . Геномная биология . 4 (2): 401. DOI : 10,1186 / GB-2003-4-2-401 . PMC  151299 . PMID  12620116 .
  2. ^ Dayhoff МО (декабрь 1974). «Компьютерный анализ белковых последовательностей». Труды Федерации . 33 (12): 2314–6. PMID 4435228 . 
  3. ^ Dayhoff MO , McLaughlin PJ, Баркер WC, Hunt LT (1975). «Эволюция последовательностей в суперсемействах белков». Die Naturwissenschaften . 62 (4): 154–161. Bibcode : 1975NW ..... 62..154D . DOI : 10.1007 / BF00608697 . S2CID 40304076 . 
  4. ^ Dayhoff MO (август 1976). «Происхождение и эволюция белковых суперсемейств». Труды Федерации . 35 (10): 2132–8. PMID 181273 . 
  5. ^ Герлт Дж. А., Аллен К. Н., Альмо СК, Армстронг Р. Н., Бэббит ПК, Кронан Дж. Э., Данауэй-Мариано Д., Имкер Х. Дж., Якобсон М. П., Минор В, Полтер CD, Раушель FM, Сали А., Шойхет Б. К., Свидлер СП (ноябрь 2011 г. ). «Инициатива ферментной функции» . Биохимия . 50 (46): 9950–62. DOI : 10.1021 / bi201312u . PMC 3238057 . PMID 21999478 .  
  6. ^ Gandhimathi A, Наир AG, Sowdhamini R (январь 2012). «PASS2 версия 4: обновление базы данных структурных выравниваний последовательностей суперсемейств структурных доменов» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D531–4. DOI : 10.1093 / NAR / gkr1096 . PMC 3245109 . PMID 22123743 .  
  7. ^ Emms DM, Kelly S (август 2015). «OrthoFinder: устранение фундаментальных ошибок при сравнении полных геномов значительно повышает точность вывода ортогрупп» . Геномная биология . 16 : 157. DOI : 10.1186 / s13059-015-0721-2 . PMC 4531804 . PMID 26243257 .  
  8. ^ Emms DM, Келли S (ноябрь 2019). "OrthoFinder: вывод филогенетической ортологии для сравнительной геномики" . Геномная биология . 20 (1): 238. DOI : 10.1186 / s13059-019-1832-y . PMC 6857279 . PMID 31727128 .  

Внешние ссылки [ править ]

  • СМИ, связанные с семействами белков на Викискладе?