Правила Чаргаффа гласят, что ДНК любого вида любого организма должна иметь стехиометрическое соотношение пуриновых и пиримидиновых оснований 1: 1 (т. Е. A + G = T + C ) и, более конкретно, что количество гуанина должно быть равно цитозину. а количество аденина должно быть равно тимину . Этот образец обнаруживается в обеих цепях ДНК. Они были обнаружены австрийского происхождения химиком Эрвин Чаргаффа , [1] [2] в конце 1940 - х годов.
Определения
Правило первой четности
Первое правило гласит, что двухцепочечная молекула ДНК глобально имеет процентное равенство пар оснований:% A =% T и% G =% C. Строгая проверка правила составляет основу пар Уотсона-Крика в модели двойной спирали ДНК.
Правило второй четности
Второе правило гласит, что как% A ≈% T, так и% G ≈% C действительны для каждой из двух цепей ДНК. [3] Это описывает только глобальную особенность состава оснований в одной цепи ДНК. [4]
Исследовать
Второе правило четности было открыто в 1968 году [3]. Оно гласит, что в одноцепочечной ДНК количество адениновых единиц примерно равно количеству тимина (% A ≈ % T), а количество цитозиновых единиц примерно равно. равен гуанину (% C ≈ % G).
Первое эмпирическое обобщение второго правила четности Чаргаффа, называемое принципом симметрии, было предложено Винаякумаром В. Прабху [5] в 1993 году. Этот принцип утверждает, что для любого данного олигонуклеотида его частота приблизительно равна частоте его комплементарного обратного олигонуклеотида. . Теоретическое обобщение [6] было математически выведено Мишелем Э. Б. Ямагиши и Роберто Х. Хераи в 2011 г. [7]
В 2006 году было показано, что это правило применимо к четырем [2] из пяти типов двухцепочечных геномов; в частности, это относится к эукариотическим хромосомам , бактериальным хромосомам, вирусным геномам с двухцепочечной ДНК и архейным хромосомам. [8] Он не применяется к органеллярным геномам ( митохондриям и пластидам ) размером менее ~ 20-30 т.п.н. , а также не применяется к геномам одноцепочечной ДНК (вирусной) или любому типу генома РНК . Основа для этого правила все еще исследуется, хотя размер генома может иметь значение.
Само правило имеет последствия. В большинстве бактериальных геномов (которые обычно кодируют на 80-90%) гены расположены таким образом, что примерно 50% кодирующей последовательности лежит на любой цепи. Вацлав Шибальский в 1960-х годах показал, что в последовательности, кодирующей бактериофаги , пурины (A и G) превосходят пиримидины (C и T). [9] Это правило с тех пор было подтверждено на других организмах и, вероятно, теперь должно быть названо « правилом Шибальского ». Хотя правило Шибальского в целом соблюдается, известны исключения. [10] [11] [12] Биологическая основа правила Шибальского, как и правила Чаргаффа, еще не известна.
Комбинированный эффект второго правила Чаргаффа и правила Шибальского можно увидеть в бактериальных геномах, где кодирующие последовательности распределены неравномерно. Генетический код имеет 64 - кодоны 3 из которых функционируют как терминации кодона: Есть только 20 аминокислот , обычно присутствующие в белках. (Есть две необычные аминокислоты - селеноцистеин и пирролизин - обнаруженные в ограниченном количестве белков и кодируемые стоп-кодонами - TGA и TAG соответственно.) Несоответствие между количеством кодонов и аминокислот позволяет нескольким кодонам кодировать один аминокислота - такие кодоны обычно различаются только по позиции третьего кодона.
Многомерный статистический анализ использования кодонов в геномах с неравными количествами кодирующих последовательностей на двух цепях показал, что использование кодонов в третьей позиции зависит от цепи, на которой расположен ген. Вероятно, это результат правил Шибальского и Чаргаффа. Из-за асимметрии использования пиримидина и пурина в кодирующих последовательностях цепь с большим кодирующим содержанием будет иметь тенденцию иметь большее количество пуриновых оснований (правило Шибальского). Поскольку количество пуриновых оснований будет с очень хорошим приближением равняться количеству их комплементарных пиримидинов в одной и той же цепи, и, поскольку кодирующие последовательности занимают 80-90% цепи, по-видимому, существует (1) давление отбора на третьем основании, чтобы минимизировать количество пуриновых оснований в цепи с большим кодирующим содержанием; и (2) это давление пропорционально несовпадению длины кодирующих последовательностей между двумя цепями.
Было высказано предположение, что происхождение отклонения от правила Чаргаффа в органеллах является следствием механизма репликации. [13] Во время репликации нити ДНК разделяются. В одноцепочечной ДНК цитозин спонтанно медленно дезаминируется до аденозина ( трансверсия от С к А ). Чем длиннее разделены пряди, тем больше дезаминирование. По причинам, которые еще не ясны, эти цепи имеют тенденцию существовать в митохондриях дольше в одиночной форме, чем в хромосомной ДНК. Этот процесс имеет тенденцию давать одну цепь, обогащенную гуанином (G) и тимином (T), с его комплементом, обогащенным цитозином (C) и аденозином (A), и этот процесс, возможно, вызвал отклонения, обнаруженные в митохондриях. [ необходима цитата ] [ сомнительно ]
Второе правило Чаргаффа, по-видимому, является следствием более сложного правила четности: в одной цепи ДНК любой олигонуклеотид ( k-мер или n-грамм ; длина ≤ 10) присутствует в равных количествах по отношению к его обратному комплементарному нуклеотиду. Из-за вычислительных требований это не было проверено во всех геномах для всех олигонуклеотидов. Это было проверено для триплетных олигонуклеотидов на большом наборе данных. [14] Альбрехт-Бюлер предположил, что это правило является следствием эволюции геномов в процессе инверсии и транспозиции . [14] Этот процесс, по-видимому, не повлиял на митохондриальные геномы. Второе правило четности Чаргаффа, по-видимому, распространяется с уровня нуклеотидов на популяции триплетов кодонов в случае цельной одноцепочечной ДНК генома человека. [15] Предлагается своего рода «второе правило четности Чаргаффа на уровне кодонов»:
Первый кодон | Второй кодон | Предлагаемая связь | Подробности |
---|---|---|---|
Twx (1-я базовая позиция - T) | yzA (3-я базовая позиция - A) | % Twx % yzA | Twx и yzA являются зеркальными кодонами, например TCG и CGA. |
Cwx (1-я базовая позиция - C) | yzG (3-я базовая позиция - G) | % Cwx % yzG | Cwx и yzG - зеркальные кодоны, например CTA и TAG. |
wTx (2-я базовая позиция - T) | yAz (2-я базовая позиция - A) | % wTx % yAz | wTx и yAz - зеркальные кодоны, например CTG и CAG. |
wCx (2-я базовая позиция - C) | yGz (2-я базовая позиция - G) | % wCx % yGz | wCx и yGz - зеркальные кодоны, например TCT и AGA. |
wxT (3-я базовая позиция - T) | Айз (1-я базовая позиция - А) | % wxT % Айз | wxT и Ayz - зеркальные кодоны, например CTT и AAG. |
wxC (3-я базовая позиция - C) | Гыз (1-я базовая позиция - G) | % wxC % Gyz | wxC и Gyz - зеркальные кодоны, например GGC и GCC. |
Примеры - вычисление всего генома человека с использованием первой рамки считывания кодонов обеспечивает:36530115 TTT и 36381293 AAA (соотношение% = 1,00409). 2087242 TCG и 2085226 CGA (соотношение% = 1.00096) и т. Д.
В 2020 году предполагается, что физические свойства дцДНК (двухцепочечной ДНК) и стремление к максимальной энтропии всех физических систем являются причиной второго правила четности Чаргаффа. [16] Симметрии и паттерны, присутствующие в последовательностях дцДНК, могут возникать из-за физических особенностей молекулы дцДНК и принципа максимальной энтропии, а не из-за биологического или эволюционного давления окружающей среды.
Процент оснований в ДНК
Следующая таблица представляет собой репрезентативный образец данных Эрвина Чаргаффа за 1952 год, в котором перечислены основные составы ДНК различных организмов и поддерживаются оба правила Чаргаффа. [17] Организм, такой как φX174, со значительным отклонением от A / T и G / C, равного единице, указывает на одноцепочечную ДНК.
Организм | Таксон | % А | %ГРАММ | % C | % T | В | G / C | % GC | %В |
---|---|---|---|---|---|---|---|---|---|
Кукуруза | Зеа | 26,8 | 22,8 | 23,2 | 27,2 | 0,99 | 0,98 | 46,1 | 54,0 |
Осьминог | Осьминог | 33,2 | 17,6 | 17,6 | 31,6 | 1.05 | 1,00 | 35,2 | 64,8 |
Курица | Галл | 28,0 | 22,0 | 21,6 | 28,4 | 0,99 | 1.02 | 43,7 | 56,4 |
Крыса | Раттус | 28,6 | 21,4 | 20,5 | 28,4 | 1.01 | 1,00 | 42,9 | 57,0 |
Человек | Гомо | 29,3 | 20,7 | 20,0 | 30,0 | 0,98 | 1.04 | 40,7 | 59,3 |
Кузнечик | Прямокрылые | 29,3 | 20,5 | 20,7 | 29,3 | 1,00 | 0,99 | 41,2 | 58,6 |
Морской еж | Echinoidea | 32,8 | 17,7 | 17,3 | 32,1 | 1.02 | 1.02 | 35,0 | 64,9 |
Пшеница | Тритикум | 27,3 | 22,7 | 22,8 | 27,1 | 1.01 | 1,00 | 45,5 | 54,4 |
Дрожжи | Сахаромицеты | 31,3 | 18,7 | 17,1 | 32,9 | 0,95 | 1.09 | 35,8 | 64,4 |
Кишечная палочка | Эшерихия | 24,7 | 26,0 | 25,7 | 23,6 | 1.05 | 1.01 | 51,7 | 48,3 |
φX174 | PhiX174 | 24,0 | 23,3 | 21,5 | 31,2 | 0,77 | 1.08 | 44,8 | 55,2 |
Смотрите также
- Генетические коды
Рекомендации
- Перейти ↑ Elson D, Chargaff E (1952). «О содержании дезоксирибонуклеиновой кислоты в гаметах морского ежа». Experientia . 8 (4): 143–145. DOI : 10.1007 / BF02170221 . PMID 14945441 . S2CID 36803326 .
- ^ а б Чаргафф Э., Липшиц Р., Грин С. (1952). «Состав дезоксипентозных нуклеиновых кислот четырех родов морских ежей». J Biol Chem . 195 (1): 155–160. PMID 14938364 . S2CID 11358561 .
- ^ а б Руднер, Р; Каркас, JD; Чаргафф, Э (1968). «Разделение ДНК B. Subtilis на комплементарные цепи. 3. Прямой анализ» . Труды Национальной академии наук Соединенных Штатов Америки . 60 (3): 921–2. Полномочный код : 1968PpAS ... 60..921R . DOI : 10.1073 / pnas.60.3.921 . PMC 225140 . PMID 4970114 .
- ^ Чжан СТ, Чжан Р., Оу ХЙ (2003). «База данных кривой Z: графическое представление последовательностей генома» . Биоинформатика . 19 [issue = 5: 590–599. DOI : 10.1093 / биоинформатики / btg041 . PMID 12651717 .
- ^ Прабху В.В. (1993). «Наблюдение симметрии в длинных нуклеотидных последовательностях» . Исследования нуклеиновых кислот . 21 (12): 2797–2800. DOI : 10.1093 / NAR / 21.12.2797 . PMC 309655 . PMID 8332488 .
- ^ Ямагиши MEB (2017). Математическая грамматика биологии . SpringerBriefs по математике. Springer. arXiv : 1112.1528 . DOI : 10.1007 / 978-3-319-62689-5 . ISBN 978-3-319-62688-8. S2CID 16742066 .
- ^ Ямагиши MEB, Herai RH (2011). «Грамматика биологии» Чаргаффа: новые фрактальные правила . SpringerBriefs по математике. arXiv : 1112.1528 . DOI : 10.1007 / 978-3-319-62689-5 . ISBN 978-3-319-62688-8. S2CID 16742066 .CS1 maint: использует параметр авторов ( ссылка )
- ^ Митчелл Д., Мост Р. (2006). «Проверка второго правила Чаргаффа». Biochem Biophys Res Commun . 340 (1): 90–94. DOI : 10.1016 / j.bbrc.2005.11.160 . PMID 16364245 .
- ^ Шибальский В., Кубинский Н., Шелдрик О. (1966). «Пиримидиновые кластеры на транскрибирующей цепи ДНК и их возможная роль в инициации синтеза РНК». Колд Спринг Харб Symp Quant Biol . 31 : 123–127. DOI : 10.1101 / SQB.1966.031.01.019 . PMID 4966069 .
- ^ Кристильо А.Д. (1998). Характеристика генов переключения G0 / G1 в культивируемых Т-лимфоцитах . Кандидатская диссертация . Кингстон, Онтарио, Канада: Королевский университет.
- ^ Белл SJ, Форсдайк Д.Р. (1999). «Отклонения от второго правила четности Чаргаффа коррелируют с направлением транскрипции». J Theor Biol . 197 (1): 63–76. DOI : 10,1006 / jtbi.1998.0858 . PMID 10036208 .
- ^ Лао П.Дж., Форсдайк Д.Р. (2000). «Термофильные бактерии строго подчиняются правилу направления транскрипции Шибальского и содержат вежливо пуриновые РНК как с аденином, так и с гуанином» . Геномные исследования . 10 (2): 228–236. DOI : 10.1101 / gr.10.2.228 . PMC 310832 . PMID 10673280 .
- ^ Николау C, Альмирантис Y (2006). «Отклонения от второго правила четности Чаргаффа в органелларной ДНК. Понимание эволюции органеллярных геномов». Джин . 381 : 34–41. DOI : 10.1016 / j.gene.2006.06.010 . PMID 16893615 .
- ^ а б Альбрехт-Бюлер Г (2006). «Асимптотически увеличивающееся соответствие геномов правилам второй четности Чаргаффа посредством инверсий и инвертированных транспозиций» . Proc Natl Acad Sci USA . 103 (47): 17828–17833. Bibcode : 2006PNAS..10317828A . DOI : 10.1073 / pnas.0605553103 . PMC 1635160 . PMID 17093051 .
- ^ Перес, Ж.-К. (Сентябрь 2010 г.). «Популяции кодонов в одноцепочечной цельной геномной ДНК человека фрактальны и регулируются золотым сечением 1,618». Междисциплинарные науки: вычислительная наука о жизни . 2 (3): 228–240. DOI : 10.1007 / s12539-010-0022-0 . PMID 20658335 . S2CID 54565279 .
- ^ Пьеро Фаризель, Кристиан Таччоли, Лука Пагани и Амос Маритан (апрель 2020 г.). «Симметрии последовательности ДНК от случайности: происхождение второго правила четности Чаргаффа» . Брифинги по биоинформатике (bbaa04): 1–10. DOI : 10.1093 / нагрудник / bbaa041 . PMID 32266404 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Бансал М (2003). "Структура ДНК: Возвращаясь к двойной спирали Уотсона-Крика" (PDF) . Современная наука . 85 (11): 1556–1563. Архивировано из оригинального (PDF) 26 июля 2014 года . Проверено 26 июля 2013 .
дальнейшее чтение
- Шибальский В., Кубинский Н., Шелдрик П. (1966). «Пиримидиновые кластеры на транскрибирующих цепях ДНК и их возможная роль в инициации синтеза РНК». Симпозиумы Колд-Спринг-Харбор по количественной биологии . 31 : 123–127. DOI : 10.1101 / SQB.1966.031.01.019 . PMID 4966069 .
- Лобры-младший (1996). «Асимметричные схемы замещения в двух цепях ДНК бактерий» . Мол. Биол. Evol . 13 (5): 660–665. DOI : 10.1093 / oxfordjournals.molbev.a025626 . PMID 8676740 .
- Лафай Б., Ллойд А.Т., Маклин М.Дж., Дивайн К.М., Шарп П.М., Вулф К.Х. (1999). «Протеомный состав и использование кодонов у спирохет: видоспецифичные и специфичные для цепи ДНК мутационные ошибки» . Nucleic Acids Res . 27 (7): 1642–1649. DOI : 10.1093 / NAR / 27.7.1642 . PMC 148367 . PMID 10075995 .
- Маклин MJ, Вулф KH, Devine KM (1998). «Несовпадение состава оснований, ориентация репликации и ориентация генов в 12 геномах прокариот». J Mol Evol . 47 (6): 691–696. Bibcode : 1998JMolE..47..691M . CiteSeerX 10.1.1.28.9035 . DOI : 10.1007 / PL00006428 . PMID 9847411 . S2CID 12917481 .
- Макинерни Джо (1998). «Репликационный и транскрипционный отбор на использование кодонов в Borrelia burgdorferi» . Proc Natl Acad Sci USA . 95 (18): 10698–10703. Bibcode : 1998PNAS ... 9510698M . DOI : 10.1073 / pnas.95.18.10698 . PMC 27958 . PMID 9724767 .
Внешние ссылки
- База данных CBS Genome Atlas Database - содержит сотни примеров базовых перекосов и выявленных проблем. [1]
- База данных геномов по кривой Z - инструмент трехмерной визуализации и анализа геномов. [2]
- ^ Холлин П.Ф., Дэвид Уссери Д. (2004). «База данных Атласа генома CBS: динамическое хранилище биоинформатических результатов и данных последовательностей» . Биоинформатика . 20 (18): 3682–3686. DOI : 10.1093 / биоинформатики / bth423 . PMID 15256401 .
- ^ Чжан СТ, Чжан Р., Оу ХЙ (2003). «База данных кривой Z: графическое представление последовательностей генома» . Биоинформатика . 19 (5): 593–599. DOI : 10.1093 / биоинформатики / btg041 . PMID 12651717 .