Проект "1000 геномов растений"

Проект « 1000 геномов растений» (1KP) был международным исследовательским усилием по созданию наиболее подробного каталога генетической изменчивости растений. Об этом было объявлено в 2008 году, и его возглавили доктор Гане Ка-Шу Вонг и доктор Майкл Дейхолос из Университета Альберты . К 2014 году в рамках проекта были успешно секвенированы транскриптомы (экспрессируемые гены) 1000 различных видов растений; ^[1]^[2] его окончательные продукты были опубликованы в 2019 году. ^[3]^[4]

Проект "1000 геномов растений"
Финансирующее агентство	Альберта внедряет инновации в технологическое будущее Институт сельскохозяйственных исследований Альберты (AARI) Геном Альберты Университет Альберты BGI Китайский национальный генетический банк (CNGB) Musea Ventures (Фонд семьи Сомех)
Продолжительность	2008 - 2019 гг.
Веб-сайт	www .onekp .com

1KP был одним из крупномасштабных (с участием многих организмов) проектов секвенирования, разработанных для использования преимуществ более широкой доступности высокопроизводительных («следующего поколения») технологий секвенирования ДНК . В рамках аналогичного проекта «1000 геномов» , например, были получены последовательности генома с высоким уровнем охвата 1000 отдельных людей в период с 2008 по 2015 год, чтобы лучше понять генетические вариации человека . ^[5]^[6] Этот проект предоставляет шаблон для дальнейших проектов генома планетарного масштаба, включая проект 10KP, секвенирующий полные геномы 10 000 растений, ^[7] и проект Earth BioGenome Project с целью упорядочить, каталогизировать и охарактеризовать геномы все эукариотическое биоразнообразие Земли . ^[8]

Цели

По состоянию на 2002 г.^{[Обновить]}, количество классифицированных видов зеленых растений оценивается примерно в 370 000, однако, вероятно, существует еще много тысяч, еще не классифицированных. ^[9] Несмотря на это количество, очень немногие из этих видов на сегодняшний день имеют подробную информацию о последовательности ДНК ; 125 426 видов в GenBank , по состоянию на 11 апреля 2012 г.^{[Обновить]}, ^[10] но большинство (> 95%) имеют последовательность ДНК только для одного или двух генов. «... почти ни один из примерно полумиллиона видов растений, известных человечеству, не был затронут геномикой ни на каком уровне». ^[1] Проект «1000 геномов растений» направлен на увеличение примерно в 100 раз количества видов растений с доступной широкой последовательностью генома.

Эволюционные отношения

Были попытки определить эволюционные отношения между известными видами растений ^[11]^[12], но филогении (или филогенетические деревья) созданы исключительно с использованием морфологических данных, клеточных структур, отдельных ферментов или только нескольких последовательностей (например, рРНК ) может быть подвержено ошибкам; ^[13] морфологические особенности особенно уязвимы, когда два вида выглядят физически похожими, хотя они не имеют близкого родства (например, в результате конвергентной эволюции ) или гомологии , или когда два близкородственных вида выглядят очень разными, потому что, например, они могут очень хорошо меняться в ответ на свое окружение. Эти ситуации очень распространены в царстве растений. Альтернативный метод построения эволюционных отношений заключается в изменении последовательности ДНК многих генов между разными видами, что часто более устойчиво к проблемам схожих по внешнему виду видов. ^[13] С количеством геномных последовательностей, созданных в рамках этого проекта, многие предсказанные эволюционные взаимосвязи могут быть лучше проверены путем выравнивания последовательностей, чтобы повысить их достоверность. С 383 679 филогенезами семейств ядерных генов и 2 306 возрастными распределениями генов с графиками Ks, использованными в окончательном анализе и опубликованными в GigaDB вместе с заключительным документом. ^[14]

Приложения биотехнологии

Список геномов растений, секвенированных в рамках проекта, не был случайным; вместо этого растения, которые производят ценные химические вещества или другие продукты ( во многих случаях вторичные метаболиты ), были сосредоточены в надежде, что характеристика задействованных генов позволит использовать или модифицировать лежащие в основе процессы биосинтеза. ^[1] Например, известно множество растений, производящих масла (например, оливки), а некоторые масла определенных растений имеют сильное химическое сходство с нефтепродуктами, такими как масличная пальма и виды, производящие углеводороды . ^[15] Если бы эти механизмы растений можно было бы использовать для производства массовых количеств промышленно полезного масла или модифицировать так, чтобы они это делали, то они были бы очень ценными. Здесь знание последовательности генов растения, участвующих в метаболическом пути, производящем масло, - большой первый шаг к такому использованию. Недавним примером того, как работают инженерные естественные биохимические пути, является золотой рис, который включал генетическую модификацию этого пути, так что предшественник витамина А производится в больших количествах, что делает рис коричневого цвета потенциальным решением проблемы дефицита витамина А. ^[16] Это популярная концепция создания растений для выполнения «работы» ^[17], и ее потенциал резко возрастет в результате получения информации о генах этих 1000 видов растений. Биосинтетические пути также могут быть использованы для массового производства лекарственных соединений с использованием растений, а не ручных органических химических реакций, поскольку большинство из них создается в настоящее время.

Проектный подход

Первоначально секвенирование выполнялось на платформе секвенирования ДНК следующего поколения Illumina Genome Analyzer GAII в Пекинском институте геномики (BGI, Шэньчжэнь, Китай), но более поздние образцы обрабатывались на более быстрой платформе Illumina HiSeq 2000 . Начиная с 28 машин для секвенирования ДНК следующего поколения Illumina Genome Analyzer , они в конечном итоге были модернизированы до 100 секвенаторов HiSeq 2000 в Пекинском институте геномики . Первоначальная пропускная способность каждой из этих машин в 3 Гбит / цикл (3 миллиарда пар оснований на эксперимент) обеспечивала быстрое и точное определение последовательности образцов растений. ^[18]

Выбор видов

Выбор видов растений для секвенирования был проведен в результате международного сотрудничества различных финансовых агентств и исследовательских групп, выражающих свой интерес к определенным растениям. ^[1] Особое внимание было уделено тем видам растений, которые, как известно, обладают полезной биосинтетической способностью для содействия достижению биотехнологических целей проекта, и отбору других видов, чтобы заполнить пробелы и объяснить некоторые неизвестные эволюционные взаимосвязи текущей филогении растений. Помимо способности к биосинтезу промышленных соединений, видам растений, о которых известно или предполагается, что они производят активные с медицинской точки зрения химические вещества (например, мак, производящий опиаты ), был отведен высокий приоритет для лучшего понимания процесса синтеза, изучения потенциала коммерческого производства и открытия новых фармацевтических возможностей. Большое количество видов растений с лечебными свойствами было выбрано из традиционной китайской медицины (ТКМ). ^[1] Полный список отобранных видов можно публично просмотреть на веб-сайте ^[19], а методологические сведения и сведения о доступе к данным были подробно опубликованы. ^[20]^[21]

Транскриптом против секвенирования генома

Вместо того, чтобы секвенировать весь геном (всю последовательность ДНК) различных видов растений, проект секвенировал только те области генома, которые производят белковый продукт ( кодирующие гены ); транскриптомный . ^[1] Этот подход оправдан акцентом на биохимических путях, где для понимания синтетического механизма требуются только гены, продуцирующие задействованные белки, и потому, что эти тысячи последовательностей будут представлять адекватные детали последовательности для построения очень надежных эволюционных отношений посредством сравнения последовательностей. Число кодирующих генов у видов растений может значительно различаться, но все они насчитывают десятки тысяч или более, что делает транскриптом большим набором информации. Однако некодирующая последовательность составляет большую часть (> 90%) содержимого генома. ^[22] Хотя этот подход концептуально аналогичен меткам экспрессируемой последовательности (EST), он принципиально отличается тем, что вся последовательность каждого гена будет получена с высоким охватом, а не только небольшая часть последовательности гена с EST. ^[23] Чтобы различать эти два метода, метод без EST известен как «секвенирование транскриптома с дробовиком». ^[23]

Секвенирование транскриптома

мРНК ( матричной РНК ) собирают из образца, превращают в кДНК с помощью обратной транскриптазы , а затем фрагментирован , так что он может быть секвенированы. ^[1]^[18] Помимо секвенирования транскриптома , этот метод получил название РНК-секвенирование и полное транскриптомное секвенирование (WTSS). ^[23] После секвенирования фрагментов кДНК они будут собраны de novo (без выравнивания с эталонной последовательностью генома ) обратно в полную последовательность гена путем объединения всех фрагментов этого гена на этапе анализа данных. Для этого проекта был создан новый ассемблер транскриптома de novo, разработанный специально для RNA-Seq, ^[24] SOAPdenovo-Trans является частью набора инструментов сборки генома SOAP от BGI .

Отбор образцов тканей растений

Образцы были доставлены со всего мира, причем ряд особо редких видов был доставлен из ботанических садов, таких как Ботанический сад «Озеро фей» (Шэньчжэнь, Китай). ^{[ необходима цитата ]} Тип собранной ткани определялся ожидаемым местоположением биосинтетической активности; например, если известно, что интересный процесс или химическое вещество существует в основном в листьях, использовался образец листа. Ряд протоколов РНК-секвенирования был адаптирован и протестирован для различных типов тканей ^[21], и они были открыто распространены через платформу Protocol.io. ^[25]

Возможные ограничения

Поскольку был секвенирован только транскриптом, проект не раскрыл информацию о регуляторной последовательности гена , некодирующих РНК , повторяющихся элементах ДНК или других геномных особенностях, которые не являются частью кодирующей последовательности. Основываясь на нескольких собранных к настоящему времени геномах целых растений, эти некодирующие области фактически будут составлять большую часть генома ^[22]^[26], а некодирующая ДНК может фактически быть основным фактором различий в признаках, наблюдаемых между разновидность. ^[27]

Поскольку мРНК была исходным материалом, количество представленных последовательностей для данного гена основано на уровне экспрессии (сколько молекул мРНК он производит). Это означает, что высокоэкспрессированные гены получают лучшее покрытие, потому что есть больше последовательностей, с которыми можно работать. ^[27] Таким образом, результатом является то, что некоторые важные гены, возможно, не были надежно обнаружены проектом, если они экспрессируются на низком уровне, но все же выполняют важные биохимические функции.

Известно, что многие виды растений (особенно те, которые обрабатываются в сельском хозяйстве) ^[26] , претерпели значительные изменения в масштабе всего генома в результате дублирования всего генома. Геномы риса и пшеницы, например, могут иметь 4-6 копий полных геномов ^[26] ( пшеница ), тогда как животные обычно имеют только 2 ( диплоидия ). Эти дублированные гены могут представлять проблему для сборки фрагментов последовательностей de novo , потому что повторяющиеся последовательности сбивают компьютерные программы с толку при попытке собрать фрагменты вместе, и их может быть трудно отследить в процессе эволюции.

Сравнение с проектом 1000 геномов

Сходства

Так же, как Пекинский институт геномики в Шэньчжэне, Китай, является одним из основных центров геномики, участвующих в проекте « 1000 геномов» , этот институт является местом секвенирования для проекта «1000 геномов растений». ^[28] Оба проекта представляют собой крупномасштабные усилия по получению подробной информации о последовательностях ДНК для улучшения нашего понимания организмов, и оба проекта будут использовать секвенирование следующего поколения для облегчения своевременного завершения.

Отличия

Цели двух проектов существенно различаются. В то время как проект « 1000 геномов» фокусируется на генетической изменчивости одного вида, проект «1000 геномов растений» рассматривает эволюционные взаимоотношения и гены 1000 различных видов растений.

В то время как проект « 1000 геномов» оценивался в сумму до 50 миллионов долларов США, ^[5] проект «1000 геномов растений» был не таким дорогостоящим; разница в стоимости, исходящая от целевой последовательности в геномах. ^[1] Поскольку проект «1000 геномов растений» секвенировал только транскриптом, в то время как проект человека секвенировал столько генома, сколько сочтено возможным, ^[5] требуется гораздо меньше усилий по секвенированию в этом более конкретном подходе. Хотя это означает, что общий вывод последовательностей был меньше по сравнению с проектом « 1000 геномов» , некодирующие части геномов, исключенные в проекте «1000 геномов растений», не были так важны для его целей, как для человеческого проекта. Таким образом, более сфокусированный подход проекта «1000 геномов растений» минимизировал затраты, но при этом достиг своих целей.

Финансирование

Проект финансировался Alberta Innovates - Technology Futures (слияние iCORE [1] , Института сельскохозяйственных исследований Альберты (AARI), Genome Alberta , Университета Альберты , Пекинского института геномики (BGI) и Musea Ventures (США). на основе частных инвестиций фирмы). ^[29] дата To, проект первоначально получил $ 1,5 миллионов канадских долларов от правительства Альберты и еще $ 0,5 млн Musea Ventures. ^[29] Еще $ 2500000 CAD затем предоставлены правительством Альберты. ^[29] В январе 2010 года BGI объявила, что внесет 100 миллионов долларов в крупномасштабные проекты секвенирования растений и животных (включая проект «1000 геномов растений», а затем проект «10 000 геномов растений» ^[7] ) ^[28]).

Связанные проекты

Проект «1000 геномов» - подробный каталог генетических вариаций человека ^[5]
Проект «1001 геном» - секвенирование всего генома 1001 штамма Arabidopsis ^[30]
Геном 10K - последовательность всего генома 10 000 видов позвоночных ^[31]

Смотрите также

Проект 1000 геномов - международное исследование генетической изменчивости
Международный проект HapMap
Human Genome Project - Исследовательская программа по секвенированию генома человека
Проект 100000 геномов - проект правительства Великобритании по секвенированию полных геномов пациентов Национальной службы здравоохранения.
Список биологических баз данных

Внешние ссылки

Официальный веб-сайт

[onekp-1] Проверено 25 февраля 2010 г.

[1KP_Data_Access-2] Matasci N, Hung LH, Yan Z, Carpenter EJ, Wickett NJ, Mirarab S и др. (2014). «Доступ к данным для проекта« 1000 заводов »(1KP)» . GigaScience . 3 (17): 17. DOI : 10,1186 / 2047-217X-3-17 . PMC 4306014 . PMID 25625010 .

[3] Инициатива One Thousand Plant Transcriptomes (октябрь 2019 г.). «Тысяча транскриптомов растений и филогеномика зеленых растений» . Природа . 574 (7780): 679–685. DOI : 10.1038 / s41586-019-1693-2 . PMC 6872490 . PMID 31645766 .

[4] Вонг, Гане Ка-Шу; Солтис, Дуглас Э .; Либенс-Мак, Джим; Wickett, Norman J .; Баркер, Майкл С .; де Пер, Ив Ван; Грэм, Шон У .; Мелконян, Майкл (04.05.2016). «Секвенирование и анализ транскриптомов тысячи видов на древе жизни для зеленых растений» . Ежегодный обзор биологии растений . 71 : 741–765. DOI : 10,1146 / annurev-arplant-042916-041040 . ISSN 1543-5008 . PMID 31851546 .

[two-5] а б в г Хайден ЕС (январь 2008 г.). «Запущен международный геномный проект». Природа . 451 (7177): 378–9. Bibcode : 2008Natur.451R.378C . DOI : 10.1038 / 451378b . PMID 18216809 .

[6] «О IGSR и проекте« 1000 геномов »» . IGSR: Международный ресурс образцов генома . Проверено 2 октября 2018 года .

[:0-7] а б Ченг, Шифэн; Мелконян, Майкл; Смит, Стивен А .; Брокингтон, Сэмюэл; Арчибальд, Джон М .; Дело, Пьер-Марк; Ли, Фэй-Вэй; Мелконян, Барбара; Мавродиев, Евгений В .; Солнце, Венцзин; Фу, Юань (2018-03-01). «10KP: план секвенирования филодиверсионного генома» . GigaScience . 7 (3): 1–9. DOI : 10,1093 / gigascience / giy013 . PMC 5869286 . PMID 29618049 .

[8] Lewin, Harris A .; Робинсон, Джин Э .; Кресс, У. Джон; Бейкер, Уильям Дж .; Коддингтон, Джонатан; Crandall, Keith A .; Дурбин, Ричард; Эдвардс, Скотт V .; Форест, Феликс; Гилберт, М. Томас П .; Гольдштейн, Мелисса М. (24 апреля 2018 г.). "Earth BioGenome Project: последовательность жизни для будущего жизни" . Труды Национальной академии наук . 115 (17): 4325–4333. DOI : 10.1073 / pnas.1720115115 . ISSN 0027-8424 . PMC 5924910 . PMID 29686065 .

[three-9] Питман NC, Йоргенсен П.М. (ноябрь 2002 г.). «Оценка размера флоры мира, находящейся под угрозой исчезновения». Наука . 298 (5595): 989. DOI : 10.1126 / science.298.5595.989 . PMID 12411696 . S2CID 891010 .

[four-10] «Таксономия NCBI» . NCBI . Проверено 11 апреля 2012 .

[five-11] Бремер К. (1985). «Краткое изложение филогении и классификации зеленых растений». Кладистика . 1 (4): 369–385. DOI : 10.1111 / j.1096-0031.1985.tb00434.x .

[six-12] Грэм Л.Е., Делвиче CF, Мишлер Б.Д. (1991). «Филогенетические связи между« зелеными водорослями »и« бриофитами » ». Успехи бриологии . 213–44 (3): 451–483. JSTOR 2399900 .

[seven-13] а б Дойл Дж. Дж. (Январь 1992 г.). «Генные деревья и деревья видов: молекулярная систематика как однозначная таксономия». Систематическая ботаника . 1 (1): 144–63. DOI : 10.2307 / 2419070 . JSTOR 2419070 .

[14] Ли, Чжэн; Баркер, Майкл С. (01.02.2020). «Выявление предполагаемых древних дупликаций всего генома в инициативе« 1000 растений »(1KP): доступ к филогении генных семейств и возрастному распределению» . GigaScience . 9 (2). DOI : 10,1093 / gigascience / giaa004 . PMC 7011446 . PMID 32043527 .

[eight-15] Август Г.Д., Джаябалан М., Раджаратинам К., Рэй А.К., Зайлер Г.Дж. (2002). «Виды потенциальных углеводородов в Западных Гатах, Тамил Наду, Индия» . Биомасса и биоэнергетика . 23 (3): 165–169. DOI : 10.1016 / S0961-9534 (02) 00045-4 .

[nine-16] Йе Х, Аль-Бабили С., Клоти А., Чжан Дж., Лукка П., Бейер П., Потрикус I. (январь 2000 г.). «Разработка пути биосинтеза провитамина А (бета-каротина) в (не содержащий каротиноидов) эндосперм риса». Наука . 287 (5451): 303–5. Bibcode : 2000Sci ... 287..303Y . DOI : 10.1126 / science.287.5451.303 . PMID 10634784 .

[17] Таиз Л., Зейгер Э. (2006). «Глава 13: Вторичные метаболиты и защита растений». Физиология растений (4-е изд.). Sinauer Associates. ISBN 978-0-87893-856-8.

[eleven-18] а б «Проверено 25 февраля 2010 г.» . Архивировано из оригинала на 2010-03-07 . Проверено 3 марта 2010 .

[19] «Средство просмотра списка образцов 1kP» . www.onekp.com . Проверено 10 апреля 2020 .

[20] Карпентер EJ, Matasci N, Ayyampalayam S, Wu S, Sun J, Yu J и др. (Октябрь 2019 г.). «Доступ к данным РНК-секвенирования от 1173 видов растений: инициатива 1000 транскриптомов растений (1KP)» . GigaScience . 8 (10). DOI : 10,1093 / gigascience / giz126 . PMC 6808545 . PMID 31644802 .

[:1-21] а б Джонсон, Марк Т.Дж.; Карпентер, Эрик Дж .; Тиан, Чжицзянь; Брускевич, Ричард; Беррис, Джейсон Н .; Карриган, Шарлотта Т .; Чейз, Марк В .; Кларк, Нил Д .; Ковшофф, Сара; dePamphilis, Claude W .; Edger, Патрик П. (21 ноября 2012 г.). «Оценка методов выделения общей РНК и прогнозирования успеха секвенирования филогенетически разнообразных транскриптомов растений» . PLOS ONE . 7 (11): e50226. DOI : 10.1371 / journal.pone.0050226 . ISSN 1932-6203 . PMC 3504007 . PMID 23185583 .

[twelve-22] а б Морганте М (апрель 2006 г.). «Организация и разнообразие генома растений: год мусора!». Текущее мнение в области биотехнологии . 17 (2): 168–73. DOI : 10.1016 / j.copbio.2006.03.001 . PMID 16530402 .

[thirteen-23] а б в Морозова О., Херст М., Марра М.А. (2009). «Применение новых технологий секвенирования для анализа транскриптома». Ежегодный обзор геномики и генетики человека . 10 : 135–51. DOI : 10.1146 / annurev-genom-082908-145957 . PMID 19715439 . S2CID 26713396 .

[24] Се, Иньлун; У, Гэнксюн; Тан, Цзинбо; Ло, Руибанг; Паттерсон, Джордан; Лю, Шанлинь; Хуанг, Вэйхуа; Он, Гуанчжу; Гу, Шэнчан; Ли, Шэнкан; Чжоу, Синь (15.06.2014). «SOAPdenovo-Trans: сборка транскриптома de novo с короткими чтениями RNA-Seq» . Биоинформатика . 30 (12): 1660–1666. DOI : 10.1093 / биоинформатики / btu077 . ISSN 1367-4803 . PMID 24532719 .

[25] Т, Марк; J, Эрик; Тиан, Чжицзянь; Брускевич, Ричард; N, Джейсон; Т, Шарлотта; W, Марк; D, Нил; Ковшофф, Сара; W, Клод; П, Патрик. «Выделение РНК из растительной ткани v1 (протоколы .io.439gyr6)» . DOI : 10.17504 / protocols.io.439gyr6 . Цитировать журнал требует |journal=( помощь )

[fourteen-26] а б в Ю. Дж., Ху С., Ван Дж., Вонг Г. К., Ли С., Лю Б. и др. (Апрель 2002 г.). «Проект последовательности генома риса (Oryza sativa L. ssp. Indica)». Наука . 296 (5565): 79–92. Bibcode : 2002Sci ... 296 ... 79Y . DOI : 10.1126 / science.1068037 . PMID 11935017 .

[fifteen-27] а б Bird CP, Stranger BE, Лю М., Томас DJ, Ingle CE, Beazley C и др. (2007). «Быстро развивающиеся некодирующие последовательности в геноме человека» . Геномная биология . 8 (6): R118. DOI : 10.1186 / GB-2007-8-6-R118 . PMC 2394770 . PMID 17578567 .

[sixteen-28] а б «BGI ищет предложения по секвенированию 1000 геномов растений и животных; обещает 100 миллионов долларов на цели» . GenomeWeb . Проверено 25 февраля 2010 года .

[seventeen-29] а б в «Исследователь из Альберты iCORE возглавляет международный геномный проект» . Правительство Альберты. 13 ноября 2008 года архивации от оригинала на 2012-09-25 . Проверено 21 августа 2018 .

[eighteen-30] Вайгель Д., Мотт Р. (2009). «Проект 1001 генома Arabidopsis thaliana» . Геномная биология . 10 (5): 107. DOI : 10.1186 / GB-2009-10-5-107 . PMC 2718507 . PMID 19519932 .

[nineteen-31] Сообщество ученых Genome 10K (2009). «Геном 10К: предложение о получении полногеномной последовательности для 10 000 видов позвоночных» . Журнал наследственности . 100 (6): 659–74. DOI : 10.1093 / jhered / esp086 . PMC 2877544 . PMID 19892720 .

[1]