Из Википедии, бесплатной энциклопедии
  (Перенаправлено из кодовой последовательности )
Перейти к навигации Перейти к поиску

Кодирующая область из гена , также известная как CDS (от кодирующей последовательности ), представляет собой часть гена в ДНК или РНК , который кодирует белка . [1] Изучение длины, состава, регуляции, сплайсинга, структур и функций кодирующих областей по сравнению с некодирующими областями в течение различных видов и периодов времени может предоставить значительный объем важной информации об организации генов и эволюции прокариот и эукариот . [2] Это может дополнительно помочь в картировании генома человека и разработке генной терапии.[3]

Определение [ править ]

Хотя этот термин также иногда используется как синоним экзона , это не одно и то же: экзон состоит из кодирующей области, а также 3 'и 5' нетранслируемых областей РНК, и, следовательно, экзон будет частично состоит из кодирующих областей. 3 'и 5' нетранслируемые области РНК, которые не кодируют белок, называются некодирующими областями и не обсуждаются на этой странице. [4]

Часто возникает путаница между кодирующими областями и экзомами, и между этими терминами существует четкое различие. В то время как экзом относится ко всем экзонам в геноме, кодирующая область относится к единственному участку ДНК или РНК, который специфически кодирует определенный вид белка.  

История [ править ]

В 1978 году Уолтер Гилберт опубликовал книгу «Почему гены в кусочках», в которой впервые начал исследовать идею о том, что ген представляет собой мозаику - что каждая полная цепь нуклеиновой кислоты не кодируется непрерывно, а прерывается «молчащими» некодирующими областями. Это было первым признаком того, что необходимо различать части генома, которые кодируют белок, теперь называемые кодирующими областями, и те, которые этого не делают. [5]

Состав [ править ]

Типы точечных мутаций: количество переходов (синий) увеличено по сравнению с трансверсиями (красный) в GC-богатых кодирующих областях. [6]

Данные свидетельствуют о том, что существует общая взаимозависимость между паттернами базового состава и доступностью кодирующей области. [7] Считается, что кодирующая область содержит более высокий GC-контент, чем некодирующие области. Дальнейшие исследования показали, что чем длиннее кодирующая цепь, тем выше содержание GC. Короткие кодирующие нити сравнительно все еще бедны GC, что аналогично низкому содержанию GC в трансляционных стоп-кодонах базовой композиции, таких как TAG, TAA и TGA. [8]

В областях, богатых GC, также немного изменяется соотношение точечных мутаций : имеется больше переходов , которые представляют собой изменения от пурина к пурину или пиримидина к пиримидину, по сравнению с трансверсиями , которые представляют собой изменения от пурина к пиримидину или пиримидина к пурину. Переходы с меньшей вероятностью изменят кодируемую аминокислоту и останутся скрытой мутацией (особенно если они происходят в третьем нуклеотиде кодона), которая обычно полезна для организма во время трансляции и образования белка. [9]

Это указывает на то, что основные кодирующие области (богатые генами) имеют более высокое содержание GC, более стабильны и устойчивы к мутации по сравнению с дополнительными и второстепенными областями (бедные генами). [10] Однако до сих пор неясно, произошло ли это в результате нейтральной и случайной мутации или в результате отбора . [11] Также ведутся споры о том, являются ли используемые методы, такие как окна генов, для установления взаимосвязи между GC-содержимым и областью кодирования, точными и беспристрастными. [12]

Структура и функции [ править ]

Транскрипция : РНК-полимераза (RNAP) использует цепочку ДНК-матрицы и начинает кодирование с промоторной последовательности (зеленый) и заканчивается на терминаторной последовательности (красный), чтобы охватить всю кодирующую область в мРНК продукта (бирюзовый). [Я сомневаюсь, что конец 5 'и 3' показан на этом рисунке неправильно]

В ДНК кодирующая область фланкируется промоторной последовательностью на 5'-конце цепи матрицы и терминирующей последовательностью на 3'-конце. Во время транскрипции , то РНК - полимераза (РНКП) связывается с промоторной последовательностью и двигается вдоль матричной нити в кодирующей области. Затем RNAP добавляет нуклеотиды РНК, комплементарные кодирующей области, чтобы сформировать мРНК , заменяя урацил вместо тимина . [13] Это продолжается до тех пор, пока RNAP не достигнет последовательности завершения. [13]

После транскрипции и созревания сформированная зрелая мРНК включает в себя несколько частей, важных для ее возможной трансляции в белок . Кодирующий участок в мРНК примыкает к нетранслируемой области 5' (5'-UTR) и 3' - нетранслируемой области (3'-UTR), [1] в колпачка 5' , и поли-A хвостом . Во время перевода , то рибосома облегчает прикрепление тРНКа в кодирующей область, 3 нуклеотидов в то время ( кодоны ). [14] ТРНК переносят связанные с ними аминокислоты в растущий полипептид. цепи, в конечном итоге формируя белок, определенный в начальной кодирующей области ДНК.

Кодирующая область (бирюзовый) фланкирована нетранслируемыми областями, 5'-кэпом и поли (A) хвостом, которые вместе образуют зрелую мРНК . [15]

Регламент [ править ]

Кодирующая область может быть изменена для регулирования экспрессии гена.

Алкилирование - одна из форм регуляции кодирующей области. [16] Ген, который должен был быть транскрибирован, может быть заглушен путем нацеливания на определенную последовательность. Основания в этой последовательности блокируются с помощью алкильных групп , которые создают эффект сайленсинга . [17]

В то время как регуляция экспрессии генов управляет обилием РНК или белка, вырабатываемого в клетке, регулирование этих механизмов может контролироваться регуляторной последовательностью, обнаруженной до того, как открытая рамка считывания начинается в цепи ДНК. Затем регуляторная последовательность будет определять место и время, когда будет происходить экспрессия для области, кодирующей белок. [18]

Сплайсинг РНК в конечном итоге определяет, какая часть последовательности будет транслироваться и экспрессироваться, и этот процесс включает вырезание интронов и соединение экзонов. Тем не менее, если сплайсосомы РНК разрезаются, это определяется распознаванием сайтов сплайсинга , в частности 5'-сайта сплайсинга, который является одним из субстратов для первого этапа сплайсинга. [19] Кодирующие области находятся внутри экзонов, которые ковалентно соединяются вместе, образуя зрелую информационную РНК .

Мутации [ править ]

Мутации в кодирующей области могут иметь самые разные эффекты на фенотип организма. В то время как некоторые мутации в этой области ДНК / РНК могут привести к полезным изменениям, другие могут быть вредными, а иногда даже смертельными для выживания организма. Напротив, изменения в кодирующей области не всегда могут приводить к обнаруживаемым изменениям фенотипа.

Типы мутации [ править ]

Примеры различных форм точечных мутаций, которые могут существовать в кодирующих областях. Такие изменения могут иметь или не иметь фенотипические изменения в зависимости от того, кодируют ли они различные аминокислоты во время трансляции. [20]

Существуют различные формы мутаций, которые могут возникать в кодирующих областях. Одна из форм - молчащие мутации , при которых изменение нуклеотидов не приводит к изменению аминокислот после транскрипции и трансляции. [21] Существуют также бессмысленные мутации , когда изменения оснований в кодирующей области кодируют преждевременный стоп-кодон, производя более короткий конечный белок. Точечные мутации или изменения одной пары оснований в кодирующей области, которые кодируют различные аминокислоты во время трансляции, называются миссенс-мутациями . Другие типы мутаций включают мутации сдвига рамки считывания, такие как вставки или делеции . [21]

Формирование [ править ]

Некоторые формы мутаций являются наследственными ( мутации зародышевой линии ) или передаются от родителя к его потомству. [22] Такие мутировавшие кодирующие области присутствуют во всех клетках организма. Другие формы мутаций приобретаются ( соматические мутации ) в течение жизни организма и могут не быть постоянными от клетки к клетке. [22] Эти изменения могут быть вызваны мутагенами , канцерогенами или другими факторами окружающей среды (например, УФ ). Приобретенные мутации также могут быть результатом ошибок копирования во время репликации ДНК и не передаются потомству. Изменения в области кодирования также могут быть произведены de novo.(новый); такие изменения, как полагают, происходят вскоре после оплодотворения , приводя к мутации, присутствующей в ДНК потомства, но отсутствующей как в сперматозоидах, так и в яйцеклетках. [22]

Профилактика [ править ]

Существует множество механизмов транскрипции и трансляции для предотвращения летальности из-за вредных мутаций в кодирующей области. Такие меры включают проверку некоторыми ДНК-полимеразами во время репликации, исправление несовпадений после репликации [23] и « гипотезу колебания », которая описывает вырожденность третьего основания в кодоне мРНК. [24]

Области ограниченного кодирования (CCR) [ править ]

Хотя хорошо известно, что геном одного человека может иметь значительные различия по сравнению с геномом другого, недавние исследования показали, что некоторые кодирующие области сильно ограничены или устойчивы к мутации между особями одного и того же вида. Это похоже на концепцию межвидовых ограничений в консервативных последовательностях . Исследователи назвали эти сильно ограниченные последовательности кодирующими областями (CCR), а также обнаружили, что такие области могут участвовать в селекции с высокой степенью очистки . В среднем на каждые 7 кодирующих оснований приходится примерно 1 мутация, изменяющая белок, но некоторые CCR могут иметь последовательность более 100 оснований без наблюдаемых мутаций, изменяющих белок, а некоторые даже без синонимичных мутаций. [25]Эти паттерны ограничений между геномами могут дать ключ к разгадке источников редких заболеваний развития или потенциально даже эмбриональной летальности. Клинически подтвержденные варианты и мутации de novo в CCR ранее были связаны с такими расстройствами, как детская эпилептическая энцефалопатия , задержка развития и тяжелые сердечные заболевания. [25]

Обнаружение последовательности кодирования [ править ]

В то время как идентификация открытых рамок считывания в последовательности ДНК является простой задачей, идентификация кодирующих последовательностей - нет, потому что клетка транслирует только часть всех открытых рамок считывания в белки. [26] В настоящее время прогнозирование CDS использует выборку и секвенирование мРНК из клеток, хотя все еще существует проблема определения того, какие части данной мРНК фактически транслируются в белок. Прогнозирование CDS - это подмножество предсказания генов , последнее также включает предсказание последовательностей ДНК, которые кодируют не только белок, но и другие функциональные элементы, такие как гены РНК и регуляторные последовательности.

В обоих прокариот и эукариот , ген перекрывание происходит относительно часто в обоих вирусов ДНК и РНК в качестве эволюционное преимущество , чтобы уменьшить размер генома, сохраняя при этом способность производить различные белки из доступных областей кодирования. [27] [28] Как для ДНК, так и для РНК, попарное выравнивание может обнаруживать перекрывающиеся кодирующие области, включая короткие открытые рамки считывания у вирусов, но потребует известной кодирующей цепи для сравнения с потенциальной перекрывающейся кодирующей цепью. [29]Альтернативный метод, использующий одиночные последовательности генома, не потребовал бы множественных последовательностей генома для выполнения сравнений, но потребовал бы по крайней мере 50 перекрывающихся нуклеотидов, чтобы быть чувствительным. [30]

См. Также [ править ]

  • Кодирующая цепь. Нить ДНК, которая кодирует белок.
  • Экзон Вся транскрибируемая часть цепи.
  • Зрелая мРНК Часть продукта транскрипции мРНК, которая транслируется.
  • Структура гена Другие элементы, составляющие ген
  • Некодирующая ДНК Части геномов, которые не кодируют гены, кодирующие белок
  • Некодирующие молекулы РНК, которые не кодируют белки, поэтому не имеют CDS

Ссылки [ править ]

  1. ^ a b Твайман, Ричард (1 августа 2003 г.). «Генная структура» . Wellcome Trust. Архивировано из оригинального 28 марта 2007 года . Проверено 6 апреля 2003 года .
  2. ^ Хёглунд М, Т Саль, Røhme D (февраль 1990 г.). «О происхождении кодирующих последовательностей из случайных открытых рамок считывания». Журнал молекулярной эволюции . 30 (2): 104–108. Bibcode : 1990JMolE..30..104H . DOI : 10.1007 / bf02099936 . ISSN 0022-2844 . S2CID 5978109 .  
  3. ^ Sakharkar М.К., Chow VT, Kangueane P (2004). «Распределение экзонов и интронов в геноме человека». В биологии Silico . 4 (4): 387–93. PMID 15217358 . 
  4. ^ Парнелл, Лоуренс Д. (01.01.2012). «Достижения в технологиях и дизайне исследований» . In Bouchard, C .; Ордовас, JM (ред.). Последние достижения в области нутригенетики и нутригеномики . Прогресс в молекулярной биологии и трансляционной науке . Последние достижения в области нутригенетики и нутригеномики. 108 . Академическая пресса. С. 17–50. DOI : 10.1016 / B978-0-12-398397-8.00002-2 . ISBN 9780123983978. PMID  22656372 . Проверено 7 ноября 2019 .
  5. Перейти ↑ Gilbert W (февраль 1978 г.). «Почему гены по частям?». Природа . 271 (5645): 501. Bibcode : 1978Natur.271..501G . DOI : 10.1038 / 271501a0 . PMID 622185 . S2CID 4216649 .  
  6. ^ (nd). Получено с https://www.differencebetween.com/wp-content/uploads/2017/03/Difference-Between-Transition-and-Transversion-3.png.
  7. ^ Lercher MJ, Уррутиа А.О., Павличек A, Hurst LD (октябрь 2003). «Объединение мозаичных структур в геноме человека» . Молекулярная генетика человека . 12 (19): 2411–5. DOI : 10,1093 / HMG / ddg251 . PMID 12915446 . 
  8. Оливер Дж. Л., Марин А. (сентябрь 1996 г.). «Взаимосвязь между содержанием GC и длиной кодирующей последовательности». Журнал молекулярной эволюции . 43 (3): 216–23. Bibcode : 1996JMolE..43..216O . DOI : 10.1007 / pl00006080 . PMID 8703087 . 
  9. ^ "ROSALIND | Глоссарий | Кодирующая область генов" . rosalind.info . Проверено 31 октября 2019 .
  10. Виноградов А.Е. (апрель 2003 г.). «Спираль ДНК: как важно быть GC-богатым» . Исследования нуклеиновых кислот . 31 (7): 1838–44. DOI : 10.1093 / NAR / gkg296 . PMC 152811 . PMID 12654999 .  
  11. ^ Болин Дж, Eldholm В, Петерсон JH, Brynildsrud О, Snipen л (февраль 2017 г.). «Нуклеотидный состав микробных геномов указывает на дифференциальные модели отбора на основных и дополнительных геномах» . BMC Genomics . 18 (1): 151. DOI : 10,1186 / s12864-017-3543-7 . PMC 5303225 . PMID 28187704 .  
  12. ^ Семон M, Mouchiroud D, L Duret (февраль 2005). «Связь между экспрессией генов и GC-содержанием у млекопитающих: статистическая значимость и биологическая значимость» . Молекулярная генетика человека . 14 (3): 421–7. DOI : 10,1093 / HMG / ddi038 . PMID 15590696 . 
  13. ^ a b Обзор транскрипции. (nd). Получено с https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.
  14. ^ Клэнси, Сюзанна (2008). «Перевод: ДНК в мРНК в белок» . Scitable: Естественное образование .
  15. ^ Plociam (2005-08-08), английский: Структура зрелой эукариотической мРНК. Полностью процессированная мРНК включает 5'-кэп, 5'-UTR, кодирующую область, 3'-UTR и поли (A) хвост. , получено 19.11.2019
  16. ^ Shinohara К, Sasaki S, Minoshima М, Бандо Т, Сугияма Н (2006-02-13). «Алкилирование матричной цепи кодирующей области вызывает эффективное молчание гена» . Исследования нуклеиновых кислот . 34 (4): 1189–95. DOI : 10.1093 / NAR / gkl005 . PMC 1383623 . PMID 16500890 .  
  17. ^ "Термин онтологии гена алкилирования ДНК (GO: 0006305)" . www.informatics.jax.org . Проверено 30 октября 2019 .
  18. ^ Shafee Т, Лоу R (2017). «Структура эукариотических и прокариотических генов» . WikiJournal of Medicine . 4 (1). DOI : 10.15347 / wjm / 2017.002 .
  19. ^ Konarska М. (1998). «Распознавание 5'-сайта сплайсинга сплайсосомой» . Acta Biochimica Polonica . 45 (4): 869–81. DOI : 10,18388 / abp.1998_4346 . PMID 10397335 . 
  20. ^ Jonsta247 (2013-05-10), английский: Пример тихой мутации , получено 2019-11-19
  21. ^ a b Ян, Дж. (23 марта 2016 г.). Что такое генетическая мутация? Получено с https://www.singerinstruments.com/resource/what-are-genetic-mutation/.
  22. ^ a b c Что такое мутация гена и как возникают мутации? - Домашний справочник по генетике - NIH. (nd). Получено с https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.
  23. ^ Вычитка и исправление ДНК. (nd). Получено с https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-discovery-and-structure-of-dna/a/dna-proofreading-and-repair.
  24. ^ Перето Дж. (2011) Гипотеза колебания (генетика). В: Gargaud M. et al. (ред.) Энциклопедия астробиологии. Шпрингер, Берлин, Гейдельберг
  25. ^ а б Хаврилла, Дж. М., Педерсен, Б. С., Лайер, Р. М. и Куинлан, А. Р. (2018). Карта ограниченных кодирующих областей в геноме человека. Nature Genetics , 88–95. DOI: 10.1101 / 220814
  26. ^ Furuno М, Kasukawa Т, Р Саито, Адачи Дж, Сузуки Н, BALDARELLI Р, и др. (Июнь 2003 г.). «Аннотации CDS в полноразмерной последовательности кДНК» . Геномные исследования . Лабораторный пресс Колд-Спринг-Харбор. 13 (6B): 1478–87. DOI : 10.1101 / gr.1060303 . PMC 403693 . PMID 12819146 .  
  27. Рогозин И.Б., Спиридонов А.Н., Сорокин А.В., Вольф Ю.И., Джордан И.К., Татусов Р.Л., Кунин Е.В. (май 2002 г.). «Очищающий и направленный отбор перекрывающихся прокариотических генов» . Тенденции в генетике . 18 (5): 228–32. DOI : 10.1016 / S0168-9525 (02) 02649-5 . PMID 12047938 . 
  28. ^ Кирико N, Vianelli A, Belshaw R (декабрь 2010). «Почему у вирусов перекрываются гены» . Ход работы. Биологические науки . 277 (1701): 3809–17. DOI : 10.1098 / rspb.2010.1052 . PMC 2992710 . PMID 20610432 .  
  29. Перейти ↑ Firth AE, Brown CM (февраль 2005 г.). «Обнаружение перекрывающихся кодирующих последовательностей с попарным выравниванием» . Биоинформатика . 21 (3): 282–92. DOI : 10.1093 / биоинформатики / bti007 . PMID 15347574 . 
  30. ^ Schlub TE, Бухманн JP, Holmes EC (октябрь 2018). Малик Х (ред.). «Простой метод обнаружения перекрывающихся генов-кандидатов в вирусах с использованием одиночных геномных последовательностей» . Молекулярная биология и эволюция . 35 (10): 2572–2581. DOI : 10.1093 / molbev / msy155 . PMC 6188560 . PMID 30099499 .