Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Кодирующая область из гена , также известная как CDS (от кодирующей последовательности ), представляет собой часть гена в ДНК или РНК , который кодирует белка . [1] Изучение длины, состава, регуляции, сплайсинга, структур и функций кодирующих областей по сравнению с некодирующими областями в течение различных видов и периодов времени может предоставить значительный объем важной информации об организации генов и эволюции прокариот и эукариот . [2] Это может дополнительно помочь в картировании генома человека и разработке генной терапии.[3]

Определение [ править ]

Хотя этот термин также иногда используется как синоним экзона , это не одно и то же: экзон состоит из кодирующей области, а также 3 'и 5' нетранслируемых областей РНК, и, следовательно, экзон будет частично состоит из кодирующих областей. 3 'и 5' нетранслируемые области РНК, которые не кодируют белок, называются некодирующими областями и не обсуждаются на этой странице. [4]

Часто возникает путаница между кодирующими областями и экзомами, и между этими терминами существует четкое различие. В то время как экзом относится ко всем экзонам в геноме, кодирующая область относится к единственному участку ДНК или РНК, который специфически кодирует определенный вид белка.  

История [ править ]

В 1978 году Уолтер Гилберт опубликовал книгу «Почему гены в кусочках», в которой впервые начал исследовать идею о том, что ген представляет собой мозаику - что каждая полная цепь нуклеиновой кислоты не кодируется непрерывно, а прерывается «молчаливыми» некодирующими областями. Это было первым признаком того, что необходимо различать части генома, которые кодируют белок, теперь называемые кодирующими областями, и те, которые этого не делают. [5]

Состав [ править ]

Типы точечных мутаций: количество переходов (синий) увеличено по сравнению с трансверсиями (красный) в GC-богатых кодирующих областях. [6]

Данные свидетельствуют о том, что существует общая взаимозависимость между паттернами базового состава и доступностью кодирующей области. [7] Считается, что кодирующая область содержит более высокий GC-контент, чем некодирующие области. Дальнейшие исследования показали, что чем длиннее кодирующая цепь, тем выше содержание GC. Короткие кодирующие нити все еще сравнительно бедны GC, как и низкое содержание GC в трансляционных стоп-кодонах базовой композиции, таких как TAG, TAA и TGA. [8]

В областях, богатых GC, также немного изменяется соотношение точечных мутаций : имеется больше переходов , которые представляют собой изменения от пурина к пурину или пиримидина к пиримидину, по сравнению с трансверсиями , которые представляют собой изменения от пурина к пиримидину или пиримидина к пурину. Переходы с меньшей вероятностью изменят кодируемую аминокислоту и останутся скрытой мутацией (особенно если они происходят в третьем нуклеотиде кодона), которая обычно полезна для организма во время трансляции и образования белка. [9]

Это указывает на то, что основные кодирующие области (богатые генами) имеют более высокое содержание GC, более стабильны и устойчивы к мутации по сравнению с дополнительными и второстепенными областями (бедные генами). [10] Однако до сих пор неясно, произошло ли это в результате нейтральной и случайной мутации или в результате отбора . [11] Также ведутся споры о том, являются ли используемые методы, такие как окна генов, для установления взаимосвязи между GC-содержимым и областью кодирования, точными и беспристрастными. [12]

Структура и функции [ править ]

Транскрипция : РНК-полимераза (RNAP) использует цепочку ДНК-матрицы и начинает кодирование с промоторной последовательности (зеленый) и заканчивается на терминаторной последовательности (красный), чтобы охватить всю кодирующую область в мРНК продукта (бирюзовый). [Я сомневаюсь, что конец 5 'и 3' показан на этом рисунке неправильно]
Электронно-микроскопический снимок нитей ДНК, украшенных сотнями молекул РНКП, которые слишком малы, чтобы их можно было разобрать. Каждая РНКП транскрибирует цепь РНК, которая, как можно видеть, ответвляется от ДНК. «Начало» указывает на 3'-конец ДНК, где РНКП инициирует транскрипцию; «Конец» обозначает 5'-конец, на котором полностью транскрибируются более длинные молекулы РНК.

В ДНК кодирующая область фланкируется промоторной последовательностью на 5'-конце цепи матрицы и терминирующей последовательностью на 3'-конце. Во время транскрипции , то РНК - полимераза (РНКП) связывается с промоторной последовательностью и двигается вдоль матричной нити в кодирующей области. Затем RNAP добавляет нуклеотиды РНК, комплементарные кодирующей области, чтобы сформировать мРНК , заменяя урацил вместо тимина . [13] Это продолжается до тех пор, пока RNAP не достигнет последовательности завершения. [13]

После транскрипции и созревания сформированная зрелая мРНК включает в себя несколько частей, важных для ее возможной трансляции в белок . Кодирующий участок в мРНК примыкает к нетранслируемой области 5' (5'-UTR) и 3' - нетранслируемой области (3'-UTR), [1] в колпачка 5' , и поли-A хвостом . Во время перевода , то рибосома облегчает прикрепление тРНКа в кодирующей область, 3 нуклеотидов в то время ( кодоны ). [14] ТРНК переносят связанные с ними аминокислоты в растущий полипептид. цепи, в конечном итоге формируя белок, определенный в начальной кодирующей области ДНК.

Кодирующая область (бирюзовый) фланкирована нетранслируемыми областями, 5'-кэпом и поли (A) хвостом, которые вместе образуют зрелую мРНК . [15]

Регламент [ править ]

Кодирующая область может быть изменена для регулирования экспрессии гена.

Алкилирование - одна из форм регуляции кодирующей области. [16] Ген, который должен был быть транскрибирован, может быть заглушен путем нацеливания на определенную последовательность. Основания в этой последовательности могут быть заблокированы с помощью алкильных групп , которые создают эффект сайленсинга . [17]

В то время как регулирование экспрессии генов управляет изобилием РНК или белка, производимого в клетке, регулирование этих механизмов может контролироваться регуляторной последовательностью, обнаруженной до того, как открытая рамка считывания начинается в цепи ДНК. Затем регуляторная последовательность будет определять место и время, когда будет происходить экспрессия для области, кодирующей белок. [18]

Сплайсинг РНК в конечном итоге определяет, какая часть последовательности будет транслироваться и экспрессироваться, и этот процесс включает вырезание интронов и соединение экзонов. Тем не менее, если сплайсосомы РНК разрезаются, это определяется распознаванием сайтов сплайсинга , в частности 5'-сайта сплайсинга, который является одним из субстратов для первого этапа сплайсинга. [19] Кодирующие области находятся внутри экзонов, которые ковалентно соединяются вместе, образуя зрелую информационную РНК .

Мутации [ править ]

Мутации в кодирующей области могут иметь самые разные эффекты на фенотип организма. В то время как некоторые мутации в этой области ДНК / РНК могут привести к полезным изменениям, другие могут быть вредными, а иногда даже смертельными для выживания организма. Напротив, изменения в кодирующей области не всегда могут приводить к обнаруживаемым изменениям фенотипа.

Типы мутации [ править ]

Примеры различных форм точечных мутаций, которые могут существовать в кодирующих областях. Такие изменения могут иметь или не иметь фенотипические изменения в зависимости от того, кодируют ли они различные аминокислоты во время трансляции. [20]

Существуют различные формы мутаций, которые могут возникать в кодирующих областях. Одна из форм - молчащие мутации , при которых изменение нуклеотидов не приводит к изменению аминокислот после транскрипции и трансляции. [21] Существуют также бессмысленные мутации , когда изменения оснований в кодирующей области кодируют преждевременный стоп-кодон, производя более короткий конечный белок. Точечные мутации или изменения одной пары оснований в кодирующей области, которые кодируют различные аминокислоты во время трансляции, называются миссенс-мутациями . Другие типы мутаций включают мутации сдвига рамки считывания, такие как вставки или делеции . [21]

Формирование [ править ]

Некоторые формы мутаций являются наследственными ( мутации зародышевой линии ) или передаются от родителя к его потомству. [22] Такие мутировавшие кодирующие области присутствуют во всех клетках организма. Другие формы мутаций приобретаются ( соматические мутации ) в течение жизни организма и могут не быть постоянными от клетки к клетке. [22] Эти изменения могут быть вызваны мутагенами , канцерогенами или другими факторами окружающей среды (например, УФ ). Приобретенные мутации также могут быть результатом ошибок копирования во время репликации ДНК и не передаются потомству. Изменения в области кодирования также могут быть произведены de novo.(новый); такие изменения, как полагают, происходят вскоре после оплодотворения , приводя к мутации, присутствующей в ДНК потомства, но отсутствующей как в сперматозоидах, так и в яйцеклетках. [22]

Профилактика [ править ]

Существует множество механизмов транскрипции и трансляции для предотвращения летальности из-за вредных мутаций в кодирующей области. Такие меры включают проверку некоторыми ДНК-полимеразами во время репликации, исправление несовпадений после репликации [23] и « гипотезу колебания », которая описывает вырожденность третьего основания в кодоне мРНК. [24]

Области ограниченного кодирования (CCR) [ править ]

Хотя хорошо известно, что геном одного человека может иметь значительные различия по сравнению с геномом другого, недавние исследования показали, что некоторые кодирующие области сильно ограничены или устойчивы к мутации между особями одного и того же вида. Это похоже на концепцию межвидовых ограничений в консервативных последовательностях . Исследователи назвали эти сильно ограниченные последовательности кодирующими областями (CCR), а также обнаружили, что такие области могут участвовать в селекции с высокой степенью очистки . В среднем на каждые 7 кодирующих оснований приходится примерно 1 мутация, изменяющая белок, но некоторые CCR могут иметь последовательность более 100 оснований без наблюдаемых мутаций, изменяющих белок, а некоторые даже без синонимичных мутаций. [25]Эти паттерны ограничений между геномами могут дать ключ к разгадке источников редких заболеваний развития или потенциально даже эмбриональной летальности. Клинически подтвержденные варианты и мутации de novo в CCR ранее были связаны с такими расстройствами, как детская эпилептическая энцефалопатия , задержка развития и тяжелые сердечные заболевания. [25]

Обнаружение кодовой последовательности [ править ]

В то время как идентификация открытых рамок считывания в последовательности ДНК проста, идентификация кодирующих последовательностей - нет, потому что клетка транслирует в белки только часть всех открытых рамок считывания. [26] В настоящее время для прогнозирования CDS используется выборка и секвенирование мРНК из клеток, хотя все еще существует проблема определения того, какие части данной мРНК фактически транслируются в белок. Прогнозирование CDS - это подмножество предсказания генов , последнее также включает предсказание последовательностей ДНК, которые кодируют не только белок, но и другие функциональные элементы, такие как гены РНК и регуляторные последовательности.

В обоих прокариот и эукариот , ген перекрывание происходит относительно часто в обоих вирусов ДНК и РНК в качестве эволюционное преимущество , чтобы уменьшить размер генома, сохраняя при этом способность производить различные белки из доступных областей кодирования. [27] [28] Как для ДНК, так и для РНК, попарное выравнивание может обнаруживать перекрывающиеся кодирующие области, включая короткие открытые рамки считывания у вирусов, но потребует известной кодирующей цепи для сравнения с потенциальной перекрывающейся кодирующей цепью. [29]Альтернативный метод, использующий одиночные последовательности генома, не потребовал бы множественных последовательностей генома для выполнения сравнений, но потребовал бы по крайней мере 50 перекрывающихся нуклеотидов, чтобы быть чувствительным. [30]

См. Также [ править ]

  • Кодирующая цепь. Нить ДНК, которая кодирует белок.
  • Экзон Вся транскрибируемая часть цепи.
  • Зрелая мРНК Часть продукта транскрипции мРНК, которая транслируется.
  • Структура гена Другие элементы, составляющие ген
  • Некодирующая ДНК Части геномов, которые не кодируют гены, кодирующие белок
  • Некодирующие молекулы РНК, которые не кодируют белки, поэтому не имеют CDS

Ссылки [ править ]

  1. ^ a b Твайман, Ричард (1 августа 2003 г.). «Генная структура» . Wellcome Trust. Архивировано из оригинального 28 марта 2007 года . Проверено 6 апреля 2003 года .
  2. ^ Хёглунд М, Т Саль, Røhme D (февраль 1990 г.). «О происхождении кодирующих последовательностей из случайных открытых рамок считывания». Журнал молекулярной эволюции . 30 (2): 104–108. Bibcode : 1990JMolE..30..104H . DOI : 10.1007 / bf02099936 . ISSN 0022-2844 . S2CID 5978109 .  
  3. ^ Sakharkar М.К., Chow VT, Kangueane P (2004). «Распределение экзонов и интронов в геноме человека». В биологии Silico . 4 (4): 387–93. PMID 15217358 . 
  4. ^ Парнелл, Лоуренс Д. (01.01.2012). «Достижения в технологиях и дизайне исследований» . In Bouchard, C .; Ордовас, JM (ред.). Последние достижения в области нутригенетики и нутригеномики . Прогресс в молекулярной биологии и трансляционной науке . Последние достижения в области нутригенетики и нутригеномики. 108 . Академическая пресса. С. 17–50. DOI : 10.1016 / B978-0-12-398397-8.00002-2 . ISBN 9780123983978. PMID  22656372 . Проверено 7 ноября 2019 .
  5. Перейти ↑ Gilbert W (февраль 1978 г.). "Почему гены разваливаются на части?" . Природа . 271 (5645): 501. Bibcode : 1978Natur.271..501G . DOI : 10.1038 / 271501a0 . PMID 622185 . S2CID 4216649 .  
  6. ^ (nd). Получено с https://www.differencebetween.com/wp-content/uploads/2017/03/Difference-Between-Transition-and-Transversion-3.png.
  7. ^ Lercher MJ, Уррутиа А.О., Павличек A, Hurst LD (октябрь 2003). «Объединение мозаичных структур в геноме человека» . Молекулярная генетика человека . 12 (19): 2411–5. DOI : 10,1093 / HMG / ddg251 . PMID 12915446 . 
  8. Оливер Дж. Л., Марин А. (сентябрь 1996 г.). «Взаимосвязь между содержанием GC и длиной кодирующей последовательности». Журнал молекулярной эволюции . 43 (3): 216–23. Bibcode : 1996JMolE..43..216O . DOI : 10.1007 / pl00006080 . PMID 8703087 . 
  9. ^ "ROSALIND | Глоссарий | Кодирующая область генов" . rosalind.info . Проверено 31 октября 2019 .
  10. Виноградов А.Е. (апрель 2003 г.). «Спираль ДНК: как важно быть GC-богатым» . Исследования нуклеиновых кислот . 31 (7): 1838–44. DOI : 10.1093 / NAR / gkg296 . PMC 152811 . PMID 12654999 .  
  11. ^ Болин Дж, Eldholm В, Петерсон JH, Brynildsrud О, Snipen л (февраль 2017 г.). «Нуклеотидный состав микробных геномов указывает на дифференциальные модели отбора на основных и дополнительных геномах» . BMC Genomics . 18 (1): 151. DOI : 10,1186 / s12864-017-3543-7 . PMC 5303225 . PMID 28187704 .  
  12. ^ Семон M, Mouchiroud D, L Duret (февраль 2005). «Связь между экспрессией генов и GC-содержанием у млекопитающих: статистическая значимость и биологическая значимость» . Молекулярная генетика человека . 14 (3): 421–7. DOI : 10,1093 / HMG / ddi038 . PMID 15590696 . 
  13. ^ a b Обзор транскрипции. (nd). Получено с https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.
  14. ^ Клэнси, Сюзанна (2008). «Перевод: ДНК в мРНК в белок» . Scitable: Естественное образование .
  15. ^ Plociam (2005-08-08), английский: Структура зрелой эукариотической мРНК. Полностью процессированная мРНК включает 5'-кэп, 5'-UTR, кодирующую область, 3'-UTR и поли (A) хвост. , получено 19.11.2019
  16. ^ Shinohara К, Sasaki S, Minoshima М, Бандо Т, Сугияма Н (2006-02-13). «Алкилирование матричной цепи кодирующей области вызывает эффективное молчание гена» . Исследования нуклеиновых кислот . 34 (4): 1189–95. DOI : 10.1093 / NAR / gkl005 . PMC 1383623 . PMID 16500890 .  
  17. ^ "Термин онтологии гена алкилирования ДНК (GO: 0006305)" . www.informatics.jax.org . Проверено 30 октября 2019 .
  18. ^ Shafee Т, Лоу R (2017). «Структура эукариотических и прокариотических генов» . WikiJournal of Medicine . 4 (1). DOI : 10.15347 / wjm / 2017.002 .
  19. ^ Konarska М. (1998). «Распознавание 5'-сайта сплайсинга сплайсосомой» . Acta Biochimica Polonica . 45 (4): 869–81. DOI : 10,18388 / abp.1998_4346 . PMID 10397335 . 
  20. ^ Jonsta247 (2013-05-10), английский: Пример тихой мутации , получено 2019-11-19
  21. ^ a b Ян, Дж. (23 марта 2016 г.). Что такое генетическая мутация? Получено с https://www.singerinstruments.com/resource/what-are-genetic-mutation/.
  22. ^ a b c Что такое мутация гена и как возникают мутации? - Домашний справочник по генетике - NIH. (nd). Получено с https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.
  23. ^ Вычитка и исправление ДНК. (nd). Получено с https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-discovery-and-structure-of-dna/a/dna-proofreading-and-repair.
  24. ^ Перето Дж. (2011) Гипотеза колебания (генетика). В: Gargaud M. et al. (ред.) Энциклопедия астробиологии. Шпрингер, Берлин, Гейдельберг
  25. ^ а б Хаврилла, Дж. М., Педерсен, Б. С., Лайер, Р. М. и Куинлан, А. Р. (2018). Карта ограниченных кодирующих областей в геноме человека. Nature Genetics , 88–95. DOI: 10.1101 / 220814
  26. ^ Furuno М, Kasukawa Т, Р Саито, Адачи Дж, Сузуки Н, BALDARELLI Р, и др. (Июнь 2003 г.). «Аннотации CDS в полноразмерной последовательности кДНК» . Геномные исследования . Лабораторный пресс Колд-Спринг-Харбор. 13 (6B): 1478–87. DOI : 10.1101 / gr.1060303 . PMC 403693 . PMID 12819146 .  
  27. Рогозин И.Б., Спиридонов А.Н., Сорокин А.В., Вольф Ю.И., Джордан И.К., Татусов Р.Л., Кунин Е.В. (май 2002 г.). «Очищающий и направленный отбор перекрывающихся прокариотических генов» . Тенденции в генетике . 18 (5): 228–32. DOI : 10.1016 / S0168-9525 (02) 02649-5 . PMID 12047938 . 
  28. ^ Кирико N, Vianelli A, Belshaw R (декабрь 2010). «Почему у вирусов перекрываются гены» . Ход работы. Биологические науки . 277 (1701): 3809–17. DOI : 10.1098 / rspb.2010.1052 . PMC 2992710 . PMID 20610432 .  
  29. Перейти ↑ Firth AE, Brown CM (февраль 2005 г.). «Обнаружение перекрывающихся кодирующих последовательностей с попарным выравниванием» . Биоинформатика . 21 (3): 282–92. DOI : 10.1093 / биоинформатики / bti007 . PMID 15347574 . 
  30. ^ Schlub TE, Бухманн JP, Holmes EC (октябрь 2018). Малик Х (ред.). «Простой метод обнаружения перекрывающихся генов-кандидатов в вирусах с использованием одиночных геномных последовательностей» . Молекулярная биология и эволюция . 35 (10): 2572–2581. DOI : 10.1093 / molbev / msy155 . PMC 6188560 . PMID 30099499 .