Хребты ( г egions из I ncrease д г ен е Xpression) являются домены генома с высокой экспрессии гена ; Противоположными гребням выступают антимостики . Этот термин впервые был использован Caron et al. в 2001 году. [1] Характеристики хребтов: [1]
- Джин плотный
- Содержат много азотистых оснований C и G
- Гены имеют короткие интроны
- Высокая плотность повторения SINE
- Низкая плотность повторов LINE
Открытие
Кластеризация генов у прокариот была известна давно. Их гены сгруппированы в опероны , гены внутри оперонов имеют общую промоторную единицу. Эти гены в основном функционально связаны. Геном прокариот относительно очень прост и компактен. У эукариот геном огромен, и лишь небольшая его часть является функционально генами, кроме того, гены не организованы в опероны. За исключением нематод и трипаносом ; хотя их опероны отличаются от оперонов прокариот. У эукариот каждый ген имеет собственный сайт регуляции транскрипции. Следовательно, для совместной экспрессии гены не обязательно должны находиться в непосредственной близости. Поэтому долгое время считалось, что эукариотические гены случайным образом распределяются по геному из-за высокой скорости хромосомных перестроек. Но поскольку стала доступна полная последовательность геномов, стало возможным точно определить местонахождение гена и измерить его расстояние до других генов.
Первым секвенированным геномом эукариот был геном Saccharomyces cerevisiae , или почкующихся дрожжей, в 1996 году. Полгода спустя после этого Велкулеску и др. (1997) опубликовали исследование, в котором они объединили данные SAGE с доступной сейчас картой генома. Во время клеточного цикла в клетке активны разные гены. Поэтому они использовали данные SAGE для трех моментов клеточного цикла (логарифмическая фаза, остановка S-фазы и остановка G2 / M- фазы клеток). Поскольку в дрожжах все гены имеют собственную промоторную единицу, не предполагалось, что гены будут кластеризоваться рядом друг с другом, но это было так. Кластеры присутствовали на всех 16 хромосомах дрожжей. [2] Год спустя Cho et al. также сообщили (хотя и более подробно), что определенные гены у дрожжей расположены рядом друг с другом. [3]
Характеристики и функции
Совместное выражение
Cho et al. были первыми, кто определил, что кластерные гены имеют одинаковые уровни экспрессии. Они идентифицировали транскрипты, которые показывают зависимую от клеточного цикла периодичность. Из этих генов 25% были расположены в непосредственной близости от других генов, транскриптованных в том же клеточном цикле. Cohen et al. (2000) также идентифицировали кластеры коэкспрессируемых генов.
Caron et al. (2001) сделали карту транскриптома человека 12 различных тканей (раковых клеток) и пришли к выводу, что гены не распределены случайным образом по хромосомам. Вместо этого гены имеют тенденцию группироваться в группы, иногда по 39 генов в непосредственной близости. Кластеры были не только генными. Они идентифицировали 27 кластеров генов с очень высоким уровнем экспрессии и назвали их RIDGE. Обычный RIDGE насчитывает от 6 до 30 генов на сантиметр. Однако были большие исключения: от 40 до 50% RIDGE не имели такой генной плотности; как и у дрожжей, эти хребты располагались в областях теломер . [1]
Lercher et al. (2002) указали на некоторые слабые стороны подхода Кэрон. Кластеры генов в непосредственной близости и с высоким уровнем транскрипции могут быть легко созданы тандемными дубликатами. Гены могут генерировать свои дубликаты, которые включаются в их окрестности. Эти дубликаты могут либо стать функциональной частью пути их родительского гена, либо (поскольку естественный отбор больше не поддерживает их) получить вредные мутации и превратиться в псевдогены. Поскольку эти дубликаты являются ложноположительными при поиске кластеров генов, их необходимо исключить. Леркер исключил соседние гены с большим сходством друг с другом, после чего он поискал с помощью скользящего окна области с 15 соседними генами. [4]
Было ясно, что существуют генные плотные области. Была поразительная корреляция между плотностью генов и высоким содержанием CG. Некоторые кластеры действительно имели высокий уровень экспрессии. Но большинство высокоэкспрессированных регионов состояли из генов домашнего хозяйства; гены, которые высоко экспрессируются во всех тканях, потому что они кодируют базальные механизмы. Только меньшая часть кластеров содержала гены, которые были ограничены конкретными тканями.
Versteeg et al. (2003) попытались с помощью более качественной карты генома человека и более точных данных SAGE определить характеристики RIDGEs более специфичными. Перекрывающиеся гены рассматривались как один ген, а гены без интронов отвергались как псевдогены. Они определили, что RIDGE очень гены, имеют высокую экспрессию генов, короткие интроны, высокую плотность повторений SINE и низкую плотность повторений LINE. Кластеры, содержащие гены с очень низкими уровнями транскрипции, имели характеристики, противоположные RIDGE, поэтому эти кластеры были названы анти-мостиками. [5] Повторы LINE представляют собой мусорную ДНК, которая содержит сайт расщепления эндонуклеазой (TTTTA). Их нехватка в RIDGEs может быть объяснена тем фактом, что естественный отбор способствует нехватке LINE-повторов в ORF, потому что их эндонуклеазные сайты могут вызывать вредные мутации в генах. Почему так много SINE-повторов, пока не понятно.
Versteeg et al. также пришли к выводу, что, в отличие от анализа Lerchers, уровни транскрипции многих генов в RIDGEs (например, кластер на хромосоме 9) могут сильно различаться между разными тканями. Ли и др. (2003) проанализировали тенденцию кластеризации генов между разными видами. Они сравнили Saccharomyces cerevisiae , Homo sapiens , Caenorhabditis elegans , Arabidopsis thaliana и Drosophila melanogaster и обнаружили степень кластеризации в виде доли генов в рыхлых кластерах соответственно (37%), (50%), (74%), ( 52%) и (68%). Они пришли к выводу, что пути, по которым гены являются кластерами у многих видов, редки. Они обнаружили семь универсально сгруппированных путей: гликолиз , биосинтез аминоацил-тРНК , АТФ-синтаза , ДНК-полимераза , деградация гексахлорциклогексана , метаболизм цианоаминокислот и фотосинтез ( синтез АТФ у нерастительных видов). Неудивительно, что это основные клеточные пути. [6]
Ли и др. использовались очень разнообразные группы животных. Внутри этих групп кластеризация сохраняется, например, кластерные мотивы Homo sapiens и Mus musculus более или менее одинаковы. [7]
Спеллман и Рубин (2002) составили карту транскриптома дрозофилы . Из всех проанализированных генов 20% были сгруппированы. Кластеры состояли из 10-30 генов, размер группы составлял около 100 килобаз. Члены кластеров не были функционально связаны, и расположение кластеров не коррелировало с известными структурами хроматина. [8]
Это исследование также показало, что внутри кластеров уровни экспрессии в среднем 15 генов были примерно одинаковыми во многих использованных экспериментальных условиях. Это сходство было настолько поразительным, что авторы пришли к выводу, что гены в кластерах не регулируются индивидуально с помощью их личного промотора, но что здесь участвуют изменения в структуре хроматина. Аналогичный паттерн совместной регуляции был опубликован в том же году Roy et al. (2002) у C. elegans. [9]
Многие гены, сгруппированные в кластеры, демонстрируют одинаковые профили экспрессии в инвазивных карциномах протоков молочной железы человека. Примерно 20% генов коррелируют со своими соседями. Кластеры коэкспрессируемых генов были разделены по областям с меньшей корреляцией между генами. Эти кластеры могут охватывать целое плечо хромосомы.
В отличие от ранее обсуждавшихся отчетов Johnidis et al. (2005) обнаружили, что (по крайней мере, некоторые) гены в кластерах не регулируются совместно. Aire - это фактор транскрипции, который оказывает повышающее и понижающее влияние на различные гены. Он действует при отрицательном отборе тимоцитов, которые реагируют на собственные эпитопы организма медуллярными клетками. [10]
Гены, которые контролировались воздухом, сгруппировались. 53 из генов, наиболее активированных с помощью aire, имели соседа, активированного с помощью aire, в пределах 200 кбайт или меньше, а 32 гена, наиболее репрессированных с помощью aire, имели соседа, репрессированного с помощью aire, в пределах 200 кбайт; это меньше, чем ожидалось из-за изменений. Они провели такой же скрининг на регулятор транскрипции CIITA.
Эти регуляторы транскрипции не имели одинакового эффекта на все гены в одном кластере. Гены, которые были активированы, репрессированы или не затронуты, иногда присутствовали в одном и том же кластере. В этом случае невозможно, чтобы гены, регулируемые воздухом, были сгруппированы, потому что все они совместно регулируются.
Поэтому не очень ясно, совместно регулируются домены или нет. Очень эффективный способ проверить это - вставить синтетические гены в RIDGE, анти-мостики и / или случайные места в геноме и определить их экспрессию. Эти уровни экспрессии необходимо сравнивать друг с другом. Gierman et al. (2007) были первыми, кто доказал совместное регулирование с использованием этого подхода. В качестве инсерционной конструкции они использовали флуоресцирующий ген GFP , управляемый повсеместно экспрессируемым промотором человеческой фосфоглицераткиназы (PGK). Они интегрировали эту конструкцию в 90 различных положениях в геноме клеток HEK293 человека . Они обнаружили, что экспрессия конструкции в Ridges была действительно выше, чем экспрессия конструкции, встроенной в антисвязи (в то время как все конструкции имеют один и тот же промотор). [11]
Они исследовали, были ли эти различия в экспрессии следствием генов в непосредственном соседстве с конструкциями или доменом в целом. Они обнаружили, что конструкции, расположенные рядом с высокоэкспрессируемыми генами, были немного более выражены, чем другие. Но когда увеличили размер окна до окружающих 49 генов (уровень домена), они увидели, что конструкции, расположенные в доменах с общей высокой экспрессией, имеют более чем в 2 раза более высокую экспрессию, чем конструкции, расположенные в доменах с низким уровнем экспрессии.
Они также проверили, экспрессируется ли конструкция на том же уровне, что и соседние гены, и присутствует ли эта тесная коэкспрессия только в пределах RIDGE. Они обнаружили, что выражения сильно коррелировали внутри хребтов и почти отсутствовали ближе к концу и за пределами хребтов.
Предыдущие наблюдения и исследования Gierman et al. доказали, что активность домена имеет большое влияние на экспрессию расположенных в нем генов. И гены в RIDGE коэкспрессируются. Однако конструкции, использованные Gierman et al. регулировались всеми постоянно активными промоторами. Гены исследования Johnidis et al. зависели от наличия фактора транскрипции воздуха. Странная экспрессия генов, регулируемых aire, могла частично быть вызвана различиями в экспрессии и конформации самого фактора транскрипции aire.
Функциональное отношение
Еще до начала геномной эры было известно, что сгруппированные гены имеют тенденцию быть функционально связанными. Abderrahim et al. (1994) показали, что все гены главного комплекса гистосовместимости сгруппированы на хромосоме 6p21. Рой и др. (2002) показали, что у нематод C. elegans гены, которые экспрессируются исключительно в мышечной ткани во время личиночной стадии, имеют тенденцию группироваться в небольшие группы из 2-5 генов. Они выделили 13 кластеров.
Yamashita et al. (2004) показали, что гены, относящиеся к определенным функциям органов, имеют тенденцию к кластеризации. Шесть связанных с печенью доменов содержали гены метаболизма ксенобиотиков, липидов и алкоголя. Пять доменов, связанных с толстой кишкой, имели гены апоптоза, пролиферации клеток, переносчика ионов и продукции муцина. Эти кластеры были очень маленькими, а уровни экспрессии были низкими. Гены, связанные с мозгом и грудью, не сгруппировались. [12]
Это показывает, что по крайней мере некоторые кластеры состоят из функционально связанных генов. Однако бывают большие исключения. Спеллман и Рубин показали, что существуют кластеры коэкспрессируемых генов, которые функционально не связаны. Кажется, что кластеры появляются в самых разных формах.
Регулирование
Cohen et al. обнаружили, что из пары коэкспрессируемых генов только один промотор имеет восходящую активирующую последовательность (UAS), связанную с этим паттерном экспрессии. Они предположили, что UAS могут активировать гены, которые не находятся в непосредственном соседстве с ними. Это объяснение могло бы объяснить совместную экспрессию небольших кластеров, но многие кластеры содержат множество генов, которые должны регулироваться одним UAS.
Изменения хроматина являются правдоподобным объяснением совместной регуляции, наблюдаемой в кластерах. Хроматин состоит из нити ДНК и гистонов , прикрепленных к ДНК. Области, в которых хроматин очень плотно упакован, называются гетерохроматином. Гетерохроматин очень часто состоит из остатков вирусных геномов, транспозонов и другой мусорной ДНК. Из-за плотной упаковки ДНК почти недоступна для механизма транскрипции, покрытие вредоносной ДНК белками - это способ, которым клетка может защитить себя. Хроматин, состоящий из функциональных генов, часто представляет собой открытую структуру, в которой ДНК доступна. Однако нет необходимости постоянно экспрессировать большинство генов.
ДНК с ненужными генами может быть покрыта гистонами. Когда ген должен быть экспрессирован, особые белки могут изменять химические соединения, прикрепленные к гистонам (модификации гистонов), которые заставляют гистоны открывать структуру. Когда хроматин одного гена открыт, хроматин соседних генов также остается, пока эта модификация не встретит граничный элемент. Таким образом, гены в непосредственной близости выражаются в одно и то же время. Итак, гены сгруппированы в «центры экспрессии». По сравнению с этой моделью Gilbert et al. (2004) показали, что RIDGEs в основном присутствуют в структурах открытого хроматина. [13] [14]
Однако Johnidis et al. (2005) показали, что гены в одном и том же кластере могут выражаться по-разному. Как именно работает регуляция эукариотических генов и связанные с ними изменения хроматина, все еще очень неясно, и по этому поводу нет единого мнения. Чтобы получить четкое представление о механизме кластеров генов, сначала необходимо осветить работу хроматина и регуляцию генов. Более того, большинство работ, в которых идентифицированы кластеры совместно регулируемых генов, сосредоточены на уровнях транскрипции, тогда как немногие сосредоточены на кластерах, регулируемых одними и теми же факторами транскрипции. Johnides et al. открыли странные явления, когда они это сделали.
Происхождение
Первые модели, которые пытались объяснить кластеризацию генов, были, конечно, сосредоточены на оперонах, потому что они были открыты до того, как были обнаружены кластеры генов эукариот. В 1999 году Лоуренс предложил модель оперонов происхождения. Эта эгоистичная модель оперона предполагает, что отдельные гены были сгруппированы вместе путем вертикального и горизонтального переноса и сохранялись как единое целое, потому что это было полезно для генов, а не для организма как такового. Эта модель предсказывает, что кластеры генов должны сохраняться между видами. Это не так для многих оперонов и кластеров генов, наблюдаемых у эукариот. [15]
Согласно Эйхлеру и Санкофф, двумя средними процессами в эволюции хромосом эукариот являются 1) перестройки хромосомных сегментов и 2) локализованная дупликация генов. Кластеризацию можно объяснить тем, что все гены в кластере произошли от тандемных дубликатов общего предка. Если бы все совместно экспрессируемые гены в кластере произошли от общего предкового гена, можно было бы ожидать, что они совместно экспрессируются, потому что все они имеют сопоставимые промоторы. Однако кластеризация генов является очень распространенным явлением в геномах, и неясно, как эта модель дупликации может объяснить всю кластеризацию. Более того, многие гены, которые присутствуют в кластерах, не гомологичны.
Как вообще эволюционно не связанные гены оказались в непосредственной близости? Либо существует сила, которая сближает функционально связанные гены, либо гены сближаются в результате изменения. Сингер и др. предположили, что гены оказались в непосредственной близости от случайной рекомбинации сегментов генома. Когда функционально связанные гены оказывались в непосредственной близости друг от друга, эта близость сохранялась. Они определили все возможные сайты рекомбинации между генами человека и мыши. После этого они сравнили кластеризацию генома мыши и человека и посмотрели, произошла ли рекомбинация в потенциально рекомбинационных сайтах. Оказалось, что рекомбинация между генами одного кластера происходит очень редко. Итак, как только функциональный кластер образуется, рекомбинация подавляется клеткой. На половых хромосомах количество кластеров очень мало как у человека, так и у мыши. По мнению авторов, это связано с низкой скоростью хромосомных перестроек половых хромосом.
Области открытого хроматина являются активными областями. Более вероятно, что гены будут перенесены в эти регионы. В эти области чаще вставляются гены органелл и генома вируса. Таким образом негомологичные гены могут быть спрессованы в небольшой домен. [16]
Возможно, что некоторые участки генома лучше подходят для важных генов. Для клетки важно, чтобы гены, отвечающие за базовые функции, были защищены от рекомбинации. У дрожжей и червей было обнаружено, что важные гены имеют тенденцию группироваться в регионах с небольшой скоростью репликации. [17]
Возможно, в результате изменения гены оказались в непосредственной близости. Были предложены и другие модели, но ни одна из них не может объяснить все наблюдаемые явления. Понятно, что как только кластеры образуются, они сохраняются естественным отбором. Однако точной модели того, как гены оказались в непосредственной близости, все еще нет.
Большая часть нынешних кластеров, должно быть, сформировалась относительно недавно, потому что только семь кластеров функционально связанных генов сохраняются между типами. Некоторые из этих различий можно объяснить тем фактом, что экспрессия генов очень по-разному регулируется разными типами. Например, у позвоночных и растений метилирование ДНК используется, тогда как у дрожжей и мух оно отсутствует. [18]
Смотрите также
- Хроматин
- Последовательность ДНК
- Фактор транскрипции
Заметки
- ^ a b c Карон Х., ван Шайк Б., ван дер Ми М. и др. (Февраль 2001 г.). «Карта транскриптома человека: кластеризация высокоэкспрессированных генов в хромосомных доменах» . Наука . 291 (5507): 1289–92. DOI : 10.1126 / science.1056794 . PMID 11181992 .
- ^ Велкулеску В.Е., Чжан Л., Чжоу В. и др. (Январь 1997 г.). «Характеристика дрожжевого транскриптома». Cell . 88 (2): 243–51. DOI : 10.1016 / S0092-8674 (00) 81845-0 . PMID 9008165 .
- ^ Чо Р.Дж., Кэмпбелл М.Дж., Винзелер Е.А. и др. (Июль 1998 г.). «Полногеномный транскрипционный анализ митотического клеточного цикла». Мол. Cell . 2 (1): 65–73. DOI : 10.1016 / S1097-2765 (00) 80114-8 . PMID 9702192 .
- ^ Леркер М.Дж., Уррутия А.О., Херст Л.Д. (июнь 2002 г.). «Кластеризация генов домашнего хозяйства обеспечивает единую модель порядка генов в геноме человека». Nat. Genet . 31 (2): 180–3. DOI : 10.1038 / ng887 . PMID 11992122 .
- ^ Верстег Р., ван Шайк Б.Д., ван Батенбург М.Ф. и др. (Сентябрь 2003 г.). «Карта транскриптома человека выявляет крайние значения плотности генов, длины интронов, содержания GC и паттерна повторов для доменов сильно и слабо экспрессируемых генов» . Genome Res . 13 (9): 1998–2004. DOI : 10.1101 / gr.1649303 . PMC 403669 . PMID 12915492 .
- ^ Ли Дж. М., Зоннхаммер Э.Л. (май 2003 г.). "Геномный анализ кластеризации генов путей у эукариот" . Genome Res . 13 (5): 875–82. DOI : 10.1101 / gr.737703 . PMC 430880 . PMID 12695325 .
- ^ Певец Г.А., Ллойд А.Т., Гуминецкий Л. Б., Вулф К. Х. (март 2005 г.). «Кластеры коэкспрессируемых генов в геномах млекопитающих законсервированы естественным отбором» . Мол. Биол. Evol . 22 (3): 767–75. DOI : 10.1093 / molbev / msi062 . PMID 15574806 .
- ^ Спеллман П.Т., Рубин Г.М. (2002). «Доказательства наличия больших доменов генов, экспрессируемых одинаково в геноме дрозофилы » . J. Biol . 1 (1): 5. DOI : 10,1186 / 1475-4924-1-5 . PMC 117248 . PMID 12144710 .
- ^ Рой П.Дж., Стюарт Дж. М., Лунд Дж., Ким С. К. (август 2002 г.). «Хромосомная кластеризация генов, экспрессируемых мышцами у Caenorhabditis elegans ». Природа . 418 (6901): 975–9. DOI : 10,1038 / природа01012 . PMID 12214599 .
- ^ Johnnidis JB, Venanzi ES, Taxman DJ, Ting JP, Benoist CO, Mathis DJ (май 2005 г.). «Хромосомная кластеризация генов, контролируемых фактором транскрипции воздуха» . Proc. Natl. Акад. Sci. США . 102 (20): 7233–8. DOI : 10.1073 / pnas.0502670102 . PMC 1129145 . PMID 15883360 .
- ^ Гирман Х. Дж., Индеманс М. Х., Костер Дж. И др. (Сентябрь 2007 г.). «Общедоменная регуляция экспрессии генов в геноме человека» . Genome Res . 17 (9): 1286–95. DOI : 10.1101 / gr.6276007 . PMC 1950897 . PMID 17693573 .
- ^ Ямасита Т., Хонда М., Такатори Х., Нишино Р., Хосино Н., Канеко С. (ноябрь 2004 г.). «Полногеномный анализ картирования транскриптомов позволяет идентифицировать органоспецифические паттерны экспрессии генов вдоль хромосом человека». Геномика . 84 (5): 867–75. DOI : 10.1016 / j.ygeno.2004.08.008 . PMID 15475266 .
- ^ Kosak ST, Groudine M (октябрь 2004 г.). «Порядок генов и динамические домены». Наука . 306 (5696): 644–7. DOI : 10.1126 / science.1103864 . PMID 15499009 .
- ^ Гилберт Н., Бойл С., Фиглер Х, Вудфайн К., Картер Н. П., Бикмор В. А. (сентябрь 2004 г.). «Хроматиновая архитектура генома человека: богатые генами домены обогащены открытыми волокнами хроматина». Cell . 118 (5): 555–66. DOI : 10.1016 / j.cell.2004.08.011 . PMID 15339661 .
- ^ Лоуренс Дж. Г. (сентябрь 1997 г.). «Эгоистичные опероны и видообразование путем переноса генов». Trends Microbiol . 5 (9): 355–9. DOI : 10.1016 / S0966-842X (97) 01110-4 . PMID 9294891 .
- ^ Лефай Э., Фернандес-Морено М.А., Кагуни Л.С., Гарес Р. (июнь 2000 г.). «Очень компактная структура геномной области митохондриальной ДНК-полимеразы Drosophila melanogaster : функциональные и эволюционные последствия». Насекомое Мол. Биол . 9 (3): 315–22. DOI : 10.1046 / j.1365-2583.2000.00191.x . PMID 10886416 .
- ^ Пал С., Херст Л.Д. (март 2003 г.). «Доказательства совместной эволюции порядка генов и скорости рекомбинации». Nat. Genet . 33 (3): 392–5. DOI : 10.1038 / ng1111 . PMID 12577060 .
- ^ Регев А., Лэмб М.Дж., Яблонька Е. (июль 1998 г.). «Роль метилирования ДНК у беспозвоночных: регуляция развития или защита генома?» (PDF) . Mol Biol Evol . 15 (7): 880–891. DOI : 10.1093 / oxfordjournals.molbev.a025992 .