Кластеры метаболических генов или кластеры биосинтетических генов представляют собой тесно связанные наборы в основном негомологичных генов, участвующих в общем дискретном метаболическом пути. Гены находятся в непосредственной близости друг от друга в геноме, и их экспрессия часто координируется. [1] [2] [3] Кластеры метаболических генов являются общими чертами геномов бактерий [4] и большинства грибов [5] и реже встречаются у других [6] организмов. Они наиболее широко известны производством вторичных метаболитов , которые являются источником или основой большинства фармацевтических соединений, природных токсинов., а также химическая связь и химическая война между организмами. Кластеры метаболических генов также участвуют в усвоении питательных веществ, деградации токсинов [7], устойчивости к противомикробным препаратам и биосинтезе витаминов. [5] Учитывая все эти свойства кластеров метаболических генов, они играют ключевую роль в формировании микробных экосистем, включая взаимодействие микробиома с хозяином. Таким образом , было разработано несколько инструментов вычислительной геномики для прогнозирования метаболических кластеров генов.
Биоинформатические инструменты были разработаны для прогнозирования и определения численности и экспрессии этого типа кластера генов в образцах микробиома на основе метагеномных данных. [8] Поскольку размер метагеномных данных значителен, их фильтрация и кластеризация являются важными частями этих инструментов. Эти процессы могут состоять из методов -уменьшения размерности, такие как Minhash , [9] и алгоритмов кластеризации , такие как K-medoids и аффинного распространение . Также было разработано несколько показателей и сходств для их сравнения.
Извлечение генома для биосинтетических кластеров генов (BGC) стало неотъемлемой частью открытия природных продуктов. В настоящее время в открытом доступе более 200 000 микробных геномов содержат информацию о множестве новых химических свойств. Один из способов ориентироваться в этом огромном геномном разнообразии - это сравнительный анализ гомологичных BGC, который позволяет идентифицировать межвидовые паттерны, которые можно сопоставить с наличием метаболитов или биологической активностью. Однако текущим инструментам мешает узкое место, вызванное дорогостоящим сетевым подходом, используемым для группировки этих BGC в семейства кластеров генов (GCF). BiG-SLiCE (Biosynthetic Genes Super-Linear Clustering Engine), инструмент, предназначенный для кластеризации большого количества BGC. Представляя их в евклидовом пространстве, BiG-SLiCE может сгруппировать BGC в GCF непарным, почти линейным образом.
Satria et. al, 2021 [10] через BiG-SLiCE демонстрируют полезность такого анализа, реконструируя глобальную карту вторичного метаболического разнообразия по таксономии для выявления неизведанного биосинтетического потенциала, открывает новые возможности для ускорения открытия естественных продуктов и предлагает первый шаг к построению глобальная и доступная для поиска взаимосвязанная сеть BGC. По мере того, как все больше геномов секвенировано из недостаточно изученных таксонов, можно получить больше информации, чтобы выделить их потенциально новый химический состав. [10]
инструменты на основе машинного обучения
Эволюция
Происхождение и эволюция кластеров метаболических генов обсуждаются с 1990-х годов. [11] [12] С тех пор было продемонстрировано, что метаболические кластеры генов могут возникать в геноме путем перестройки генома, дупликации генов или горизонтального переноса генов , [13] и некоторые метаболические кластеры эволюционировали конвергентно у нескольких видов. [14] Горизонтальный перенос кластера генов был связан с экологическими нишами, в которых кодируемые пути, как считается, приносят пользу. [15]Утверждалось, что кластеризация генов экологических функций является результатом репродуктивных тенденций среди организмов и вносит свой вклад в ускоренную адаптацию, увеличивая уточнение сложных функций в пангеноме популяции. [16]
Перейти ↑ Miller BL, Miller KY, Roberti KA, Timberlake WE (январь 1987 г.). «Позиционно-зависимые и независимые механизмы регулируют клеточно-специфическую экспрессию кластера генов SpoC1 Aspergillus nidulans» . Молекулярная и клеточная биология . 7 (1): 427–34. DOI : 10,1128 / MCB.7.1.427 . PMC 365085 . PMID 3550422 .
^ Banf М, Чжао К, Рхи SY (сентябрь 2019). «Пакет METACLUSTER-an R для контекстно-зависимого анализа экспрессии кластеров метаболических генов» . Биоинформатика . 35 (17): 3178–3180. DOI : 10.1093 / биоинформатики / btz021 . PMC 6735823 . PMID 30657869 .
^ Cimermancic P, Medema MH, Claesen J, Kurita K, Wieland Brown LC, Mavrommatis K и др. (Июль 2014 г.). «Понимание вторичного метаболизма из глобального анализа кластеров генов биосинтеза прокариот» . Cell . 158 (2): 412–421. DOI : 10.1016 / j.cell.2014.06.034 . PMC 4123684 . PMID 25036635 .
^ a b Слот JC (2017). «Разнообразие и эволюция грибковых кластеров генов». Успехи в генетике . 100 : 141–178. DOI : 10.1016 / bs.adgen.2017.09.005 . ISBN 9780128132616. PMID 29153399 .
^ Wisecaver JH, Боровский AT, V Цин, Jander G, Kliebenstein DJ, Rokas A (май 2017). «Подход глобальной сети коэкспрессии для подключения генов к специализированным метаболическим путям у растений» . Растительная клетка . 29 (5): 944–959. DOI : 10.1105 / tpc.17.00009 . PMC 5466033 . PMID 28408660 .
Перейти ↑ Gluck-Thaler E, Slot JC (июнь 2018). «Специализированная биохимия растений управляет кластеризацией генов в грибах» . Журнал ISME . 12 (7): 1694–1705. DOI : 10.1038 / s41396-018-0075-3 . PMC 6018750 . PMID 29463891 .
^ Паскаль-Андреу В, Augustijn Н, ван ден Берг K, ван - дер - Хофта J, M, Fischbach Medema M (2020). «BiG-MAP: автоматизированный конвейер для профилирования метаболических кластеров генов и их экспрессии в микробиомах». bioRxiv : 32. DOI : 10,1101 / 2020.12.14.422671 .
^ Ondov В, Treangen Т, Melsted Р, Mallonee А, Бергман N, S Корен, Phillippy А (2016). «Mash: быстрая оценка расстояния между геномами и метагеномами с использованием MinHash» . Геномная биология . 17 (32): 14. DOI : 10.1186 / s13059-016-0997-x . PMC 4915045 . PMID 27323842 .
^ a b Каутсар, Сатрия А; ван дер Хоофт, Джастин Джей Джей; де Риддер, Дик; Медема, Марникс Х (13 января 2021 г.). «BiG-SLiCE: инструмент с высокой степенью масштабируемости, отображающий разнообразие 1,2 миллиона кластеров биосинтетических генов» . GigaScience . 10 (1): giaa154. DOI : 10,1093 / gigascience / giaa154 . PMC 7804863 . PMID 33438731 .
^ Слот, Джейсон С .; Рокас, Антонис (01.06.2010). «Множественные кластеры генов пути GAL развивались у грибов независимо и с помощью различных механизмов» . Труды Национальной академии наук . 107 (22): 10136–10141. PMC 2890473 .
^ Грин, Джордж Х .; McGary, Kriston L .; Рокас, Антонис; Слот, Джейсон С. (январь 2014 г.). «Экология управляет распределением специализированных модулей метаболизма тирозина в грибах» . Геномная биология и эволюция . 6 (1): 121–132. DOI : 10.1093 / GbE / evt208 . ISSN 1759-6653 . PMC 3914699 . PMID 24391152 .
^ «Метаболические кластеры генов, разнообразие грибов и создание дополнительных функций» . Текущее мнение в области генетики и развития . 58–59: 17–24. 2019-10-01. DOI : 10.1016 / j.gde.2019.07.006 . ISSN 0959-437X .