Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Филогенетическое профилирование - это метод биоинформатики , в котором совместное присутствие или совместное отсутствие двух признаков у большого числа видов используется для вывода значимой биологической связи, такой как участие двух разных белков в одном и том же биологическом пути . Наряду с рассмотрением сохраняющейся синтении , сохраняющейся оперон структуры, или «Розеттский камень» домен слитыми , сравнивая филогенетические профили является назначенным методом «пост-гомологии», в том , что вычисление необходимо для этого метода начинается после того, как определенно , какие белки являются гомологичными с который. Ряд этих методов был разработан Дэвидом Айзенбергом.и коллеги; Сравнение филогенетических профилей было введено в 1999 г. Pellegrini et al. [1]

Метод [ править ]

Более 2000 видов бактерий , архей и эукариот теперь представлены полными последовательностями генома ДНК . Обычно каждый ген в геноме кодирует белок, который может быть отнесен к определенному семейству белков на основе гомологии . Для данного семейства белков его присутствие или отсутствие в каждом геноме (в исходной бинарной рецептуре) обозначается либо 1 (присутствует), либо 0 (отсутствует). Следовательно, филогенетическийраспределение семейства белков может быть представлено длинным двоичным числом с цифрой для каждого генома; такие бинарные представления легко сравниваются друг с другом для поиска коррелированных филогенетических распределений. Большое количество полных геномов делает эти профили богатыми информацией. Преимущество использования только полных геномов заключается в том, что значения 0, представляющие отсутствие признака, обычно надежны.

Теория [ править ]

Следует ожидать, что у близкородственных видов будут очень похожие наборы генов. Однако изменения накапливаются между более отдаленно родственными видами посредством процессов, которые включают горизонтальный перенос генов и потерю генов. Отдельные белки выполняют определенные молекулярные функции, такие как выполнение единственной ферментативной реакции или выполнение функций одной субъединицы более крупного белкового комплекса. Биологический процесс, такой как фотосинтез , метаногенез или биосинтез гистидина, может потребовать согласованного действия многих белков. Если какой-то белок, важный для процесса, потерян, другие белки, предназначенные для этого процесса, станут бесполезными; естественный отборделает маловероятным, что эти бесполезные белки будут сохраняться в течение эволюционного времени. Следовательно, если два разных семейства белков постоянно имеют тенденцию присутствовать или отсутствовать вместе, вероятная гипотеза состоит в том, что эти два белка взаимодействуют в каком-то биологическом процессе.

Успехи и проблемы [ править ]

Филогенетическое профилирование привело к многочисленным открытиям в биологии, включая ранее неизвестные ферменты метаболических путей , факторы транскрипции, которые связываются с консервативными регуляторными участками , и объяснения роли определенных мутаций в заболеваниях человека . [2]Улучшение самого метода является активной областью научных исследований, поскольку сам метод имеет несколько ограничений. Во-первых, совместное присутствие двух семейств белков часто представляет недавнее общее происхождение двух видов, а не консервативную функциональную связь; Устранение неоднозначности этих двух источников корреляции может потребовать усовершенствованных статистических методов. Во-вторых, белки, сгруппированные как гомологи, могут различаться по функциям, или белки, консервативные по функциям, могут не регистрироваться как гомологи; улучшенные методы настройки размера каждого семейства белков для отражения функциональной консервации приведут к улучшенным результатам.

Инструменты [ править ]

Инструменты включают PLEX (Protein Link Explorer). [3] (ныне несуществующий) и филогенетический профилировщик JGI IMG (интегрированные микробные геномы) (как для отдельных генов, так и для генных кассет ). [4]

Заметки [ править ]

  1. ^ Пеллегрини M, Маркотт EM, Томпсон MJ, Эйзенберг D, Йейтс TO. Proc Natl Acad Sci US A. 13 апреля 1999; 96 (8): 4285-8.
  2. ^ Kensche PR, ван Ноорт В, Dutilh BE, Huynen МА. Интерфейс JR Soc. 6 февраля 2008 г .; 5 (19): 151-70.
  3. ^ Дата, Шайлеш V .; Маркотт, Эдвард М. (2005-05-15). «Прогнозирование функции белков с помощью Protein Link EXplorer (PLEX)» . Биоинформатика . 21 (10): 2558–2559. DOI : 10.1093 / биоинформатики / bti313 . ISSN  1367-4803 . PMID  15701682 .
  4. ^ Chen, I.-Min A .; Чу, Кен; Паланиаппан, Кришна; Пиллэй, Манодж; Ратнер, Анна; Хуанг, Цзинхуа; Huntemann, Марсель; Варгезе, Неха; Уайт, Джеймс Р. (05.10.2018). «IMG / M v.5.0: интегрированная система управления данными и сравнительного анализа микробных геномов и микробиомов» . Исследования нуклеиновых кислот . 47 (D1): D666 – D677. DOI : 10.1093 / NAR / gky901 . ISSN 1362-4962 . PMC 6323987 . PMID 30289528 .