Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
При печати последовательность генома человека занимает около 100 огромных книг, отпечатанных крупным шрифтом.

Геномные проекты - это научные усилия, которые в конечном итоге направлены на определение полной последовательности генома организма (будь то животное , растение , гриб , бактерия , архея , простейший или вирус ) и аннотирование генов, кодирующих белок и других важные особенности, закодированные геномом. [1] Геномная последовательность организма включает в себя коллективные последовательности ДНК каждой хромосомы в организме. Для бактериисодержащий одну хромосому, проект генома будет направлен на отображение последовательности этой хромосомы. Для человеческого вида, геном которого включает 22 пары аутосом и 2 половые хромосомы, полная последовательность генома будет включать 46 отдельных последовательностей хромосом.

Проект « Геном человека» был знаковым проектом в области генома, который уже оказывает большое влияние на исследования в области наук о жизни и может стимулировать многочисленные медицинские и коммерческие разработки. [2]

Сборка генома [ править ]

Сборка генома относится к процессу взятия большого количества коротких последовательностей ДНК и их объединения, чтобы создать представление исходных хромосом, из которых произошла ДНК. В проекте секвенирования с дробовиком вся ДНК из источника (обычно от одного организма , от бактерии до млекопитающего ) сначала разбивается на миллионы маленьких кусочков. Затем эти фрагменты «считываются» автоматическими секвенирующими машинами, которые могут считывать до 1000 нуклеотидов или оснований за раз. (Четыре основания - это аденин , гуанин , цитозин и тимин., представленный как AGCT.) Алгоритм сборки генома работает, беря все части и выравнивая их друг с другом, и обнаруживая все места, где две короткие последовательности или считывания перекрываются. Эти перекрывающиеся чтения могут быть объединены, и процесс продолжается.

Сборка генома - очень сложная вычислительная задача, которая усложняется тем, что многие геномы содержат большое количество идентичных последовательностей, известных как повторы . Эти повторы могут иметь длину в тысячи нуклеотидов, а некоторые встречаются в тысячах разных мест, особенно в больших геномах растений и животных .

Результирующую (черновую) последовательность генома получают путем комбинирования информационных секвенированных контигов и последующего использования информации связывания для создания каркасов. Каркасы расположены вдоль физической карты хромосом, образуя «золотой путь».

Программное обеспечение для сборки [ править ]

Первоначально большинство крупных центров секвенирования ДНК разрабатывали собственное программное обеспечение для сборки производимых ими последовательностей. Однако это изменилось по мере усложнения программного обеспечения и увеличения числа центров секвенирования. Пример такого ассемблера Short Oligonucleotide Analysis Package, разработанный BGI для сборки de novo геномов человеческого размера, выравнивания, обнаружения SNP , повторного секвенирования, поиска индел и анализа структурных вариаций. [3] [4] [5]

Аннотации генома [ править ]

С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотации ДНК . Аннотации ДНК или аннотации генома - это процесс идентификации присоединения биологической информации к последовательностям , и, в частности, определения местоположения генов и определения того, что эти гены делают.

Время завершения [ править ]

При секвенировании генома обычно есть участки, которые трудно секвенировать (часто участки с очень повторяющейся ДНК ). Таким образом, «завершенные» последовательности генома редко когда-либо бывают полными, и такие термины, как «рабочий проект» или «по существу завершены», использовались для более точного описания статуса таких геномных проектов. Даже когда была определена каждая пара оснований в последовательности генома, все равно могут быть ошибки, потому что секвенирование ДНК не является полностью точным процессом. Можно также утверждать, что проект полного генома должен включать последовательности митохондрий и (для растений) хлоропластов, поскольку эти органеллы имеют свои собственные геномы.

Часто сообщается, что целью секвенирования генома является получение информации о полном наборе генов в этой конкретной последовательности генома. Доля генома, кодирующего гены, может быть очень маленькой (особенно у эукариот, таких как люди, где кодирующая ДНК может составлять лишь несколько процентов от всей последовательности). Однако не всегда возможно (или желательно) отдельно секвенировать только кодирующие области . Кроме того, по мере того, как ученые больше понимают роль этой некодирующей ДНК (часто называемой мусорной ДНК ), становится более важным иметь полную последовательность генома как основу для понимания генетики и биологии любого данного организма.

Во многих случаях проекты генома не ограничиваются только определением последовательности ДНК организма. Такие проекты могут также включать генное предсказание, чтобы узнать, где гены находятся в геноме и что они делают. Также могут быть связанные проекты по секвенированию EST или мРНК, чтобы помочь выяснить, где на самом деле находятся гены.

Исторические и технологические перспективы [ править ]

Исторически сложилось так, что при секвенировании геномов эукариот (таких как червь Caenorhabditis elegans ) обычно сначала наносили на карту геном, чтобы обеспечить серию ориентиров по всему геному. Вместо того, чтобы секвенировать хромосому за один раз, она будет секвенирована по частям (с предварительным знанием приблизительно того, где эта часть расположена на большей хромосоме). Изменения в технологии и, в частности, улучшение вычислительной мощности компьютеров означает, что теперь геномы можно « секвенировать дробовиком » за один раз (хотя у этого подхода есть оговорки по сравнению с традиционным подходом).

Улучшения в технологии секвенирования ДНК означают, что стоимость секвенирования новой последовательности генома неуклонно снижается (с точки зрения стоимости пары оснований ), а новые технологии также означают, что геномы можно секвенировать гораздо быстрее.

Когда исследовательские агентства решают, какие новые геномы секвенировать, упор делается на виды, которые имеют большое значение в качестве модельных организмов или имеют отношение к здоровью человека (например, патогенные бактерии или переносчики болезней, такие как комары ), или виды, имеющие коммерческое значение ( например, домашний скот и культурные растения). Вторичный упор делается на виды, геномы которых помогут ответить на важные вопросы молекулярной эволюции (например, обыкновенный шимпанзе ).

Вполне вероятно, что в будущем секвенирование генома станет еще дешевле и быстрее. Это позволит определить полные последовательности генома у многих разных особей одного и того же вида. Для людей это позволит нам лучше понять аспекты генетического разнообразия человека .

Примеры [ править ]

L1 Доминетта 01449, герефорд, которая является объектом Проекта генома крупного рогатого скота

У многих организмов есть проекты генома, которые либо завершены, либо будут завершены в ближайшее время, в том числе:

  • Люди , Homo sapiens ; см. Проект "Геном человека"
  • Люди, Homo sapiens ; см. Проект "Геном человека" - запись
  • Палео-эскимосский , [4] древний-человек
  • Неандерталец , Homo sapiens neanderthalensis (частичный); см. Проект "Геном неандертальца"
  • Обыкновенный шимпанзе Pan troglodytes ; см. Проект генома шимпанзе
  • Шерстистый мамонт , Mammuthus primigenius [6]
  • Домашняя корова , [7] [8] Bos taurus
  • Геном крупного рогатого скота
  • Консорциум по секвенированию генома медоносной пчелы
  • Геном лошади [9]
  • Проект человеческого микробиома
  • Международная программа по геному винограда
  • Международный проект HapMap
  • Проект по изменению последовательности генома Tomato 150+
  • Проект 100000 геномов
  • Проект генома 100K патогенов
  • Международный консорциум по фенотипированию мышей IMPC
  • Проект по фенотипированию мышей Knockout KOMP2

См. Также [ править ]

  • Объединенный институт генома
  • Illumina , частная компания, занимающаяся секвенированием генома
  • Knome , частная компания, предлагающая анализ генома и секвенирование
  • Модельный организм
  • Национальный центр биотехнологической информации

Ссылки [ править ]

  1. ^ Певзнер, Джонатан (2009). Биоинформатика и функциональная геномика (2-е изд.). Хобокен, Нью-Джерси: Уайли-Блэквелл. ISBN 9780470085851.
  2. ^ «Потенциальные выгоды от исследований проекта генома человека» . Министерство энергетики , Информация о проекте "Геном человека". 2009-10-09. Архивировано из оригинала на 2013-07-08 . Проверено 18 июня 2010 .
  3. Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K, Li S, Yang H, Wang J, Wang J (февраль 2010 г.). «Сборка de novo человеческих геномов с массовым параллельным секвенированием короткого чтения» . Геномные исследования . 20 (2): 265–272. DOI : 10.1101 / gr.097261.109 . ISSN 1549-5469 . PMC 2813482 . PMID 20019144 .   
  4. ^ a b Расмуссен М., Ли Y, Линдгрин С., Педерсен Дж. С., Альбрехтсен А., Мольтке I, Мецпалу М., Мецпалу Е., Кивисилд Т., Гупта Р., Берталан М., Нильсен К., Гилберт М. Т., Ван И, Рагхаван М., Кампос П. Ф. , Камп Х.М., Уилсон А.С., Гледхилл А., Тридико С., Банс М., Лоренцен Э.Д., Бинладен Дж., Го Х, Чжао Дж., Чжан Х, Чжан Х., Ли З., Чен М., Орландо Л., Кристиансен К., Бак М., Томмеруп N, Bendixen C, Pierre TL, Grønnow B, Meldgaard M, Andreasen C, Fedorova SA, Osipova LP, Higham TF, Ramsey CB, Hansen TV, Nielsen FC, Crawford MH, Brunak S, Sicheritz-Pontén T, Villems R, Nielsen Р., Крог А., Ван Дж., Виллерслев Э. (11 февраля 2010 г.). «Древняя последовательность генома человека вымершего палео-эскимоса» . Природа . 463 (7282): 757–762. doi :10.1038 / природа08835 . ISSN  1476-4687 . PMC  3951495 . PMID  20148029 .
  5. ^ Wang J, Wang W, Li R, Li Y, Tian G, Goodman L, Fan W, Zhang J, Li J, Zhang J, Guo Y, Feng B, Li H, Lu Y, Fang X, Liang H, Du Z, Li D, Zhao Y, Hu Y, Yang Z, Zheng H, Hellmann I, Inouye M, Pool J, Yi X, Zhao J, Duan J, Zhou Y, Qin J, Ma L, Li G, Yang Z, Чжан Г, Ян Б, Ю Ц, Лян Ф, Ли В, Ли С, Ли Д, Ни П, Жуань Дж, Ли Кью, Чжу Х, Лю Д, Лу З, Ли Н, Го Г, Чжан Дж, Йе Дж , Фанг Л., Хао Ц., Чен Ц., Лян И, Су И, Сан А, Пинг Ц, Ян С., Чен Ф, Ли Л, Чжоу К., Чжэн Х, Рен И, Ян Л, Гао И, Ян Г, Ли З, Фэн Х, Кристиансен К., Вонг Г.К., Нильсен Р., Дурбин Р., Болунд Л., Чжан Х, Ли С., Ян Х, Ван Дж. (2008-11-06). «Последовательность диплоидного генома азиатского человека» . Природа . 456 (7218): 60–65. DOI : 10.1038 / nature07484. ISSN  0028-0836 . PMC  2716080 . PMID  18987735 .
  6. ^ Гош, Паллаб. «Последовательность генома мамонта завершена» . BBC News .
  7. ^ Йейтс, Диана (2009-04-23). «Что делает корову коровой? Последовательность генома проливает свет на эволюцию жвачных животных» (пресс-релиз) . EurekAlert! . Проверено 22 декабря 2012 .
  8. ^ Эльсик, CG; Эльсик, Р.Л .; Теллам, KC; Уорли, РА; Гиббс, DM; Музны, ГМ; Weinstock, DL; Адельсон, Э. Eichler, L .; Ельницкий, Р .; Guigó, DL; Хамерник, С.М. Каппес, штат Гавайи; Левин, диджей; Линн, ФВ; Николай, А .; Reymond, M .; Рейнкельс, ЛК; Skow, EM; Здобнов, Л .; Schook, J .; Womack, T .; Alioto, SE; Антонаракис, А .; Асташин, СЕ; Chapple, H. -C .; Chen, J .; Chrast, F .; Câmara, O .; и другие. (2009). «Последовательность генома тауринового скота: окно в биологию и эволюцию жвачных животных» . Наука . 324 (5926): 522–528. DOI : 10.1126 / science.1169588 . PMC 2943200 . PMID 19390049 .  
  9. ^ «Выпуск 2007: Геном лошади собран» . Национальный институт исследования генома человека (NHGRI) . Проверено 19 апреля 2018 года .

Внешние ссылки [ править ]

  • ЗОЛОТО: База данных геномов онлайн
  • База данных проекта генома
  • Утилита для именования белков
  • СУПЕРСЕМЬЯ
  • EchinoBase Геномная база данных иглокожих (предыдущая SpBase, база данных генома морских ежей)
  • NRCPB .
  • Глобальный альянс по геномике беспозвоночных (GIGA)
  • Институт Wellcome Sanger
  • Кампус Wellcome Genome