Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Nucleic acid primary structureNucleic acid secondary structureNucleic acid tertiary structureNucleic acid quaternary structure
Изображение выше содержит интерактивные ссылки
Интерактивное изображение из кислотной структуры нуклеиновой (первичный, вторичный, третичный и четвертичный) с помощью спиралей ДНК и примеры из рибозима VS и теломеразы и нуклеосом . ( PDB : ADNA , 1BNA , 4OCB , 4R4V , 1YMO , 1EQZ )

Последовательность нуклеиновой кислоты - это последовательность оснований, обозначенная серией из пяти разных букв, которые указывают порядок нуклеотидов, образующих аллели в молекуле ДНК (с использованием GACT) или РНК (GACU). По соглашению последовательности обычно представлены от конца 5 'до конца 3' . Для ДНК используется смысловая цепь. Поскольку нуклеиновые кислоты обычно представляют собой линейные (неразветвленные) полимеры , определение последовательности эквивалентно определению ковалентной структуры всей молекулы. По этой причине последовательность нуклеиновой кислоты также называется первичной структурой .

Последовательность может представлять информацию . Биологическая дезоксирибонуклеиновая кислота представляет собой информацию, которая управляет функциями живого существа.

Нуклеиновые кислоты также имеют вторичную структуру и третичную структуру . Первичную структуру иногда ошибочно называют первичной последовательностью . И наоборот, не существует параллельной концепции вторичной или третичной последовательности.

Нуклеотиды [ править ]

Химическая структура РНК
Ряд кодонов в части молекулы мРНК . Каждый кодон состоит из трех нуклеотидов , обычно представляющих одну аминокислоту .

Нуклеиновые кислоты состоят из цепочки связанных звеньев, называемых нуклеотидами. Каждый нуклеотид состоит из трех субъединиц: фосфатная группа и сахар ( рибоза в случае РНК , дезоксирибоза в ДНК ) составляют основу цепи нуклеиновой кислоты, а прикрепленный к сахару один из набора азотистых оснований . Нуклеиновые основания важны в спаривании оснований цепей для образования вторичной и третичной структуры более высокого уровня, такой как знаменитая двойная спираль .

Возможные буквы , С , G и Т , представляющий четыре нуклеотидных оснований из цепи ДНК - аденин , цитозин , гуанин , тимин - ковалентно связан с фосфодиэфирным позвоночником. В типичном случае последовательности печатаются вплотную друг к другу без промежутков, как в последовательности AAAGTCTGAC, читаемой слева направо в направлении от 5 'до 3' . Что касается транскрипции , последовательность находится на кодирующей цепи, если она имеет тот же порядок, что и транскрибируемая РНК.

Одна последовательность может быть комплементарной к другой последовательности, что означает, что они имеют основание в каждой позиции в комплементарной (то есть от A до T, от C до G) и в обратном порядке. Например, дополнительная последовательность к TTAC - GTAA. Если одна цепь двухцепочечной ДНК считается смысловой цепью, тогда другая цепь, считающаяся антисмысловой цепью, будет иметь последовательность, комплементарную смысловой цепи.

Обозначение [ править ]

Сравнение и определение% разницы между двумя нуклеотидными последовательностями.

  • AA T CC GC TAG
  • AA A CC CT TAG
  • Учитывая две 10-нуклеотидные последовательности, выровняйте их и сравните различия между ними. Вычислите процент сходства, разделив количество различных оснований ДНК на общее количество нуклеотидов. В приведенном выше случае есть три различия в последовательности из 10 нуклеотидов. Следовательно, разделите 7/10, чтобы получить 70% сходства, и вычтите это из 100%, чтобы получить разницу в 30%.

Хотя A, T, C и G обозначают конкретный нуклеотид в позиции, есть также буквы, которые обозначают неоднозначность, которые используются, когда в этом положении может встречаться более одного вида нуклеотидов. Правила Международного союза теоретической и прикладной химии ( IUPAC ) следующие: [1]

Эти символы также действительны для РНК, за исключением того, что U (урацил) заменяет T (тимин). [1]

Помимо аденина (A), цитозина (C), гуанина (G), тимина (T) и урацила (U), ДНК и РНК также содержат основания, которые были модифицированы после образования цепи нуклеиновой кислоты. В ДНК наиболее распространенным модифицированным основанием является 5-метилцитидин (m5C). В РНК есть много модифицированных оснований, включая псевдоуридин (Ψ), дигидроуридин (D), инозин (I), риботимидин (rT) и 7-метилгуанозин (m7G). [3] [4] Гипоксантин и ксантин - два из многих оснований, созданных в результате присутствия мутагена , причем оба они образуются в результате дезаминирования (замены аминогруппы карбонильной группой). Гипоксантин производится из аденина , а ксантин - из гуанина.. [5] Аналогичным образом дезаминирование цитозина приводит к образованию урацила .

Биологическое значение [ править ]

Изображение генетического кода , с помощью которого информация, содержащаяся в нуклеиновых кислотах , транслируется в аминокислотные последовательности белков .

В биологических системах нуклеиновые кислоты содержат информацию, которая используется живой клеткой для создания определенных белков . Последовательность азотистых оснований на цепи нуклеиновой кислоты транслируется с помощью клеточного аппарата в последовательность аминокислот, составляющих цепь белка. Каждая группа из трех оснований, называемая кодоном , соответствует одной аминокислоте, и существует определенный генетический код, по которому каждая возможная комбинация из трех оснований соответствует определенной аминокислоте.

Центральная догма молекулярной биологии описывает механизм , с помощью которого белки построены с использованием информации , содержащейся в нуклеиновых кислотах. ДНК является транскрибируется в мРНК молекул, которая движется к рибосоме , где мРНК используется в качестве шаблона для построения белковой цепи. Поскольку нуклеиновые кислоты могут связываться с молекулами с комплементарными последовательностями, существует различие между « смысловыми » последовательностями, которые кодируют белки, и комплементарной «антисмысловой» последовательностью, которая сама по себе нефункциональна, но может связываться со смысловой цепью.

Определение последовательности [ править ]

Распечатка электрофореграммы с автоматического секвенатора для определения части последовательности ДНК

Секвенирование ДНК - это процесс определения нуклеотидной последовательности данного фрагмента ДНК . Последовательность ДНК живого существа кодирует необходимую информацию для того, чтобы живое существо могло выжить и воспроизвести. Следовательно, определение последовательности полезно в фундаментальных исследованиях того, почему и как живут организмы, а также в прикладных предметах. Из-за важности ДНК для живых существ знание последовательности ДНК может быть полезно практически в любом биологическом исследовании . Например, в медицине оно может быть использовано для выявления, диагностики и потенциально разработать процедуры для генетических заболеваний . Точно так же исследования патогеновможет привести к лечению заразных заболеваний. Биотехнология - это развивающаяся дисциплина, которая может дать множество полезных продуктов и услуг.

РНК напрямую не секвенируется. Вместо этого он копируется в ДНК с помощью обратной транскриптазы , а затем эта ДНК секвенируется.

Современные методы секвенирования полагаются на дискриминационную способность ДНК-полимераз и поэтому могут различать только четыре основания. Инозин (созданный из аденозина во время редактирования РНК ) читается как G, а 5-метилцитозин (созданный из цитозина в результате метилирования ДНК ) читается как C. С современными технологиями трудно секвенировать небольшие количества ДНК, поскольку сигнал слишком слаб для измерения. Это преодолевается амплификацией полимеразной цепной реакции (ПЦР).

Цифровое представление [ править ]

Генетическая последовательность в цифровом формате.

После получения последовательности нуклеиновой кислоты из организма она сохраняется in silico в цифровом формате. Цифровые генетические последовательности могут храниться в базах данных последовательностей , анализироваться (см. Анализ последовательностей ниже), изменяться в цифровом виде и использоваться в качестве шаблонов для создания новой реальной ДНК с использованием искусственного синтеза генов .

Анализ последовательности [ править ]

Цифровые генетические последовательности могут быть проанализированы с использованием инструментов биоинформатики, чтобы попытаться определить их функцию.

Генетическое тестирование [ править ]

ДНК в геноме организма может быть проанализирована для диагностики уязвимости к наследственным заболеваниям , а также может быть использована для определения отцовства ребенка (генетического отца) или происхождения человека . Обычно каждый человек несет по два варианта каждого гена , один унаследован от матери, а другой - от отца. Геном человека , как полагают, содержит около 20,000-25,000 генов. Помимо изучения хромосом на уровне отдельных генов, генетическое тестирование в более широком смысле включает биохимические тесты на возможное наличие генетических заболеваний., или мутантные формы генов, связанные с повышенным риском развития генетических нарушений.

Генетическое тестирование выявляет изменения в хромосомах, генах или белках. [6] Обычно тестирование используется для выявления изменений, связанных с наследственными заболеваниями. Результаты генетического теста могут подтвердить или исключить подозреваемое генетическое заболевание или помочь определить вероятность развития или передачи генетического заболевания у человека. В настоящее время используется несколько сотен генетических тестов, и еще больше разрабатываются. [7] [8]

Выравнивание последовательности [ править ]

В биоинформатике выравнивание последовательностей - это способ упорядочивания последовательностей ДНК , РНК или белка для выявления областей сходства, которые могут быть обусловлены функциональными, структурными или эволюционными отношениями между последовательностями. [9] Если две последовательности в выравнивании имеют общего предка, несовпадения могут быть интерпретированы как точечные мутации, а пробелы - как инсерционные или делеционные мутации ( инсерции ), внесенные в одну или обе линии за время, прошедшее с момента их расхождения. При выравнивании последовательностей белков степень сходства между аминокислотамизанятие определенной позиции в последовательности можно интерпретировать как приблизительную меру того, насколько консервативна конкретная область или мотив последовательности среди клонов. Отсутствие замен или наличие только очень консервативных замен (то есть замена аминокислот, боковые цепи которых имеют сходные биохимические свойства) в определенной области последовательности, предполагают [10], что эта область имеет структурное или функциональное значение. . Хотя нуклеотидные основания ДНК и РНК более похожи друг на друга, чем аминокислоты, сохранение пар оснований может указывать на аналогичную функциональную или структурную роль. [11]

Вычислительная филогенетика широко использует выравнивание последовательностей при построении и интерпретации филогенетических деревьев , которые используются для классификации эволюционных отношений между гомологичными генами, представленными в геномах дивергентных видов. Степень, в которой последовательности в наборе запроса различаются, качественно связана с эволюционным расстоянием последовательностей друг от друга. Грубо говоря, высокая идентичность последовательностей предполагает, что рассматриваемые последовательности имеют сравнительно молодого самого недавнего общего предка , тогда как низкая идентичность предполагает, что дивергенция более древняя. Это приближение, которое отражает гипотезу « молекулярных часов » о том, что примерно постоянная скорость эволюционных измененийможет использоваться для экстраполяции времени, прошедшего с момента первого расхождения двух генов (то есть времени слияния ), предполагает, что эффекты мутации и отбора постоянны для разных клонов последовательностей. Следовательно, он не учитывает возможные различия между организмами или видами в скорости репарации ДНК или возможной функциональной консервации конкретных областей в последовательности. (В случае нуклеотидных последовательностей гипотеза молекулярных часов в ее самой основной форме также не учитывает разницу в скорости принятия между молчащими мутациями, которые не изменяют значение данного кодона, и другими мутациями, которые приводят к другой аминокислоте. встраивается в белок.) Более статистически точные методы позволяют варьировать скорость эволюции на каждой ветви филогенетического дерева, таким образом обеспечивая более точные оценки времени слияния генов.

Последовательные мотивы [ править ]

Часто первичная структура кодирует мотивы, которые имеют функциональное значение. Некоторые примеры мотивов последовательности являются: C / D [12] и H / ACA коробки [13] из snoRNAs , Sm сайт связывания найдены в spliceosomal РНК , таких как U1 , U2 , U4 , U5 , U6 , U12 и U3 , в обуви -Dalgarno последовательности , [14] консенсусная последовательность Козака [15] , и РНК - полимераза III терминатора . [16]

Корреляции на большие расстояния [ править ]

Peng et al. [17] [18] обнаружили существование дальних корреляций в некодирующих последовательностях пар оснований ДНК. Напротив, такие корреляции, похоже, не проявляются в кодирующих последовательностях ДНК. Это открытие было объяснено Grosberg et al. [19] глобальной пространственной структурой ДНК.

Энтропия последовательности [ править ]

В биоинформатике энтропия последовательности, также известная как сложность последовательности или информационный профиль [20], представляет собой числовую последовательность, обеспечивающую количественную меру локальной сложности последовательности ДНК, независимо от направления обработки. Манипуляции с информационными профилями позволяют анализировать последовательности с использованием методов без выравнивания, таких как, например, обнаружение мотивов и перестроек. [20] [21] [22]

См. Также [ править ]

  • Структура гена
  • Четвертичная система счисления
  • Однонуклеотидный полиморфизм (SNP)

Ссылки [ править ]

  1. ^ a b Номенклатура неполностью определенных оснований в последовательностях нуклеиновых кислот , NC-IUB, 1984.
  2. ^ Номенклатурный комитет Международного союза биохимиков (NC-IUB) (1984). «Номенклатура не полностью определенных оснований в последовательностях нуклеиновых кислот» . Проверено 4 февраля 2008 .
  3. ^ «BIOL2060: Перевод» . mun.ca .
  4. ^ «Исследование» . uw.edu.pl .
  5. ^ Нгуен, Т; Брансон, Д.; Креспи, CL; Penman, BW; Wishnok, JS; Танненбаум, SR (апрель 1992 г.). «Повреждение ДНК и мутации в клетках человека, подвергшихся действию оксида азота in vitro» . Proc Natl Acad Sci USA . 89 (7): 3030–034. Bibcode : 1992PNAS ... 89.3030N . DOI : 10.1073 / pnas.89.7.3030 . PMC 48797 . PMID 1557408 .  
  6. ^ "Что такое генетическое тестирование?" . Домашний справочник по генетике . 16 марта 2015. Архивировано из оригинала 29 мая 2006 года . Проверено 19 мая 2010 года .
  7. ^ «Генетическое тестирование» . nih.gov .
  8. ^ «Определения генетического тестирования» . Определения генетического тестирования (Хорхе Секейрос и Барбара Гимарайнш) . EuroGentest Network of Excellence Project. 11 сентября 2008 г. Архивировано из оригинала на 4 февраля 2009 года . Проверено 10 августа 2008 .
  9. ^ Смонтируйте DM. (2004). Биоинформатика: анализ последовательности и генома (2-е изд.). Пресса лаборатории Колд-Спринг-Харбор: Колд-Спринг-Харбор, Нью-Йорк. ISBN 0-87969-608-7.
  10. ^ Нг, ПК; Геникофф, С. (2001). «Прогнозирование вредных аминокислотных замен» . Геномные исследования . 11 (5): 863–74. DOI : 10.1101 / gr.176601 . PMC 311071 . PMID 11337480 .  
  11. ^ Witzany, G (2016). «Важнейшие шаги к жизни: от химических реакций до кода с использованием агентов» . Биосистемы . 140 : 49–57. DOI : 10.1016 / j.biosystems.2015.12.007 . PMID 26723230 . 
  12. ^ Самарский, ДА; Фурнье MJ; Певец RH; Бертран Э (1998). «Мотив C / D snoRNA box направляет ядрышковое нацеливание, а также связывает синтез и локализацию snoRNA» . Журнал EMBO . 17 (13): 3747–57. DOI : 10.1093 / emboj / 17.13.3747 . PMC 1170710 . PMID 9649444 .  
  13. ^ Гано, Филипп; Кайзерг-Феррер, Мишель; Поцелуй, Тамаш (1 апреля 1997 г.). «Семейство малых ядрышковых РНК box ACA определяется эволюционно консервативной вторичной структурой и повсеместными элементами последовательности, необходимыми для накопления РНК» . Гены и развитие . 11 (7): 941–56. DOI : 10,1101 / gad.11.7.941 . PMID 9106664 . 
  14. Перейти ↑ Shine J, Dalgarno L (1975). «Детерминант специфичности цистронов в бактериальных рибосомах». Природа . 254 (5495): 34–38. Bibcode : 1975Natur.254 ... 34S . DOI : 10.1038 / 254034a0 . PMID 803646 . S2CID 4162567 .  
  15. Перейти ↑ Kozak M (октябрь 1987). «Анализ 5'-некодирующих последовательностей из 699 матричных РНК позвоночных» . Nucleic Acids Res . 15 (20): 8125–48. DOI : 10.1093 / NAR / 15.20.8125 . PMC 306349 . PMID 3313277 .  
  16. ^ Bogenhagen DF, Brown DD (1981). «Нуклеотидные последовательности в ДНК Xenopus 5S, необходимые для терминации транскрипции». Cell . 24 (1): 261–70. DOI : 10.1016 / 0092-8674 (81) 90522-5 . PMID 6263489 . S2CID 9982829 .  
  17. ^ Peng, C.-K .; Булдырев С.В.; Goldberger, AL; Havlin, S .; Sciortino, F .; Simons, M .; Стэнли, HE (1992). «Дальние корреляции в нуклеотидных последовательностях». Природа . 356 (6365): 168–70. Bibcode : 1992Natur.356..168P . DOI : 10.1038 / 356168a0 . ISSN 0028-0836 . PMID 1301010 . S2CID 4334674 .   
  18. ^ Peng, C.-K .; Булдырев С.В.; Havlin, S .; Simons, M .; Стэнли, HE; Гольдбергер, А. Л. (1994). «Мозаичная организация нуклеотидов ДНК» . Physical Review E . 49 (2): 1685–89. Bibcode : 1994PhRvE..49.1685P . DOI : 10.1103 / PhysRevE.49.1685 . ISSN 1063-651X . PMID 9961383 .  
  19. ^ Гросберг, А; Рабин, Y; Хэвлин, S; Нир, А (1993). «Смятая глобула, модель трехмерной структуры ДНК». Письма Еврофизики . 23 (5): 373–78. Bibcode : 1993EL ..... 23..373G . DOI : 10.1209 / 0295-5075 / 23/5/012 .
  20. ^ а б Пинхо, А; Гарсия, S; Пратас, Д; Феррейра, П. (21 ноября 2013 г.). «Последовательности ДНК с первого взгляда» . PLOS ONE . 8 (11): e79922. Bibcode : 2013PLoSO ... 879922P . DOI : 10.1371 / journal.pone.0079922 . PMC 3836782 . PMID 24278218 .  
  21. ^ Пратас, D; Silva, R; Пинхо, А; Феррейра, П. (18 мая 2015 г.). «Метод без выравнивания для поиска и визуализации перестроек между парами последовательностей ДНК» . Научные отчеты . 5 : 10203. Bibcode : 2015NatSR ... 510203P . DOI : 10.1038 / srep10203 . PMC 4434998 . PMID 25984837 .  
  22. ^ Троянская, О; Арбелл, О; Корен, Y; Ландау, G; Большой, А (2002). «Профили сложности последовательности прокариотических геномных последовательностей: быстрый алгоритм для расчета лингвистической сложности» . Биоинформатика . 18 (5): 679–88. DOI : 10.1093 / биоинформатики / 18.5.679 . PMID 12050064 . 

Внешние ссылки [ править ]

  • Библиография по особенностям, закономерностям, корреляциям в текстах ДНК и белков.