Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Краткое содержание SAGE. Внутри организмов гены транскрибируются и сплайсируютсяэукариот ) с образованием зрелых транскриптов мРНК (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную двухцепочечную кДНК ( ds - кДНК ; синий). В SAGE дц-кДНК расщепляется рестрикционными ферментами (в местах «X» и «X» + 11) с образованием 11-нуклеотидных «меточных» фрагментов. Эти теги объединяются и секвенируются с использованием длинночитаемого секвенирования по Сэнгеру (разные оттенки синего указывают на теги из разных генов). Последовательности деконволютируютсячтобы найти частоту каждого тега. Частота метки может использоваться для отчета о транскрипции гена, из которого произошла метка. [1]

Последовательный анализ экспрессии генов ( SAGE ) - это транскриптомный метод, используемый молекулярными биологами для создания снимка популяции информационной РНК в интересующей выборке в виде небольших меток, которые соответствуют фрагментам этих транскриптов. С тех пор было разработано несколько вариантов, в первую очередь более надежная версия, LongSAGE, [2] RL-SAGE [3] и самая последняя версия SuperSAGE. [4] Многие из них улучшили методику захвата более длинных меток, что позволяет более уверенно идентифицировать исходный ген.

Обзор [ править ]

Вкратце, эксперименты SAGE проходят следующим образом:

  1. МРНК входного образца (например, опухоли ) выделяют и обратной транскриптазы и биотинилированные праймеры используют для синтеза кДНК из мРНК .
  2. КДНК связывается с гранулами стрептавидина посредством взаимодействия с биотином, прикрепленным к праймерам, и затем расщепляется с помощью эндонуклеазы рестрикции, называемой заякоренным ферментом (AE). Расположение сайта расщепления и, следовательно, длина оставшейся кДНК, связанной с шариком, будет варьироваться для каждой отдельной кДНК (мРНК).
  3. Расщепленная кДНК ниже сайта расщепления затем отбрасывается, а оставшиеся неподвижные фрагменты кДНК выше сайтов расщепления делятся пополам и подвергаются воздействию одного из двух адапторных олигонуклеотидов (A или B), содержащих несколько компонентов в следующем порядке выше места прикрепления. сайт: 1) липкие концы с сайтом разреза AE для присоединения к расщепленной кДНК; 2) сайт узнавания для эндонуклеазы рестрикции, известной как фермент-метка (TE), который разрезает примерно на 15 нуклеотидов ниже своего сайта узнавания (в пределах исходной последовательности кДНК / мРНК); 3) Короткая последовательность праймера, уникальная для адаптера A или B, которая позже будет использоваться для дальнейшей амплификации с помощью ПЦР.
  4. После лигирования адаптера кДНК расщепляют с использованием ТЕ для удаления их с гранул, оставляя только короткий «тег» из примерно 11 нуклеотидов исходной кДНК (15 нуклеотидов минус 4, соответствующие сайту узнавания AE).
  5. Затем расщепленные метки кДНК восстанавливают с помощью ДНК-полимеразы для получения фрагментов кДНК с тупым концом.
  6. Эти фрагменты метки кДНК (с присоединенными адапторными праймерами и сайтами распознавания AE и TE) лигируют, соединяя две последовательности метки вместе и фланкируя адаптеры A и B на обоих концах. Эти новые конструкции, называемые ditags , затем амплифицируются с помощью ПЦР с использованием праймеров, специфичных для якоря A и B.
  7. Затем двойные теги расщепляются с использованием исходного AE и позволяют связываться вместе с другими ditags, которые будут лигированы для создания конкатемера кДНК, причем каждый ditag разделен сайтом узнавания AE.
  8. Эти конкатемеры затем трансформируются в бактерии для амплификации посредством бактериальной репликации.
  9. Затем конкатемеры кДНК могут быть выделены и секвенированы с использованием современных высокопроизводительных секвенаторов ДНК , и эти последовательности могут быть проанализированы с помощью компьютерных программ, которые количественно определяют повторяемость отдельных тегов.

Анализ [ править ]

Результатом SAGE является список тегов коротких последовательностей с указанием количества наблюдений за ними. Используя базы данных последовательностей, исследователь обычно может с некоторой уверенностью определить, из какой исходной мРНК (и, следовательно, из какого гена ) была извлечена метка.

Статистические методы могут применяться для пометки и подсчета списков из разных образцов, чтобы определить, какие гены экспрессируются более высоко. Например, образец нормальной ткани можно сравнить с соответствующей опухолью, чтобы определить, какие гены имеют тенденцию быть более (или менее) активными.

История [ править ]

В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro на амплификацию их библиотеки в бактериальных плазмидах. [5] В 1982–1983 годах идея выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования была исследована Грегом Сатклиффом и его сотрудниками. [6] и Putney et al. кто секвенировал 178 клонов из библиотеки кДНК мышц кролика. [7] В 1991 году Адамс и его сотрудники ввели термин « метка экспрессируемой последовательности» (EST) и инициировали более систематическое секвенирование кДНК в качестве проекта (начиная с 600 кДНК мозга). [8] Идентификация EST шла быстро, миллионы EST теперь доступны в общедоступных базах данных (например, GenBank ).

В 1995 году идея уменьшения длины метки со 100 до 800 п.н. до длины метки с 10 до 22 п.н. помогла снизить стоимость исследований мРНК. [9] В этом году оригинальный протокол SAGE был опубликован Виктором Велкулеску в Онкологическом центре Университета Джона Хопкинса . [9] Хотя SAGE изначально был задуман для использования в исследованиях рака, он успешно использовался для описания транскриптомов других заболеваний и у самых разных организмов.

Сравнение с микрочипами ДНК [ править ]

Общая цель метода аналогична микрочипу ДНК . Однако выборка SAGE основана на секвенировании выхода мРНК, а не на гибридизации выхода мРНК с зондами, поэтому уровни транскрипции измеряются более количественно, чем с помощью микроматрицы. Кроме того, последовательности мРНК не обязательно должны быть известны априори , поэтому гены или варианты генов, которые неизвестны, могут быть обнаружены. Эксперименты с микрочипами намного дешевле проводить, поэтому в крупномасштабных исследованиях SAGE обычно не используется. Количественная оценка экспрессии генов более точна в SAGE, поскольку она включает в себя прямой подсчет количества транскриптов, тогда как интенсивность пятен в микрочипах падает с недискретными градиентами и подвержена фоновому шуму.

Варианты протоколов [ править ]

клонирование miRNA [ править ]

МикроРНК , или сокращенно miRNA, представляют собой небольшие (~ 22nt) сегменты РНК, которые, как было обнаружено, играют решающую роль в регуляции генов. Один из наиболее часто используемых методов клонирования и идентификации miRNA в клетке или ткани был разработан в Bartel Lab и опубликован в статье Lau et al. (2001). С тех пор появилось несколько вариантов протоколов, но большинство из них имеют один и тот же базовый формат. Процедура очень похожа на SAGE: малая РНК выделяется, затем к каждой добавляются линкеры, и РНК преобразуется в кДНК с помощью ОТ-ПЦР.. После этого линкеры, содержащие внутренние сайты рестрикции, перевариваются подходящим рестрикционным ферментом, и липкие концы лигируются вместе в конкатамеры. После конкатенации фрагменты лигируют в плазмиды и используют для трансформации бактерий с целью создания множества копий плазмиды, содержащей вставки. Затем их можно секвенировать для идентификации присутствующей miRNA, а также для анализа уровней экспрессии данной miRNA путем подсчета количества раз, когда она присутствует, аналогично SAGE.

LongSAGE и RL-SAGE [ править ]

LongSAGE был более надежной версией оригинального SAGE, разработанного в 2002 году, который имел более высокую пропускную способность, используя 20 мкг мРНК для создания библиотеки кДНК из тысяч тегов. [10] Robust LongSage (RL-SAGE) Дальнейшее усовершенствование протокола LongSAGE с возможностью создания библиотеки с размером вставки 50 нг мРНК , что намного меньше, чем предыдущий размер вставки LongSAGE, равный 2 мкг мРНК [10], и с использованием меньшего размера. количество дитаг-полимеразных цепных реакций ( ПЦР ) для получения полной библиотеки кДНК . [11]

SuperSAGE [ править ]

SuperSAGE является производным SAGE, который использует эндонуклеазу типа III EcoP15I фага P1 , чтобы вырезать теги последовательности длиной 26 п.н. из кДНК каждого транскрипта , увеличивая размер метки по меньшей мере на 6 п.н. по сравнению с предшествующими методами SAGE и LongSAGE. [12] Более длинный размер тега позволяет более точно отнести тег к соответствующему транскрипту, поскольку каждая дополнительная база значительно увеличивает точность аннотации.

Как и в исходном протоколе SAGE, так называемые теги формируются с использованием тегов с тупым концом . Однако SuperSAGE позволяет избежать систематической ошибки, наблюдаемой во время менее случайного лигирования длинной 20 п.н. [13] Посредством прямого секвенирования с использованием высокопроизводительных методов секвенирования (секвенирование следующего поколения , т.е. пиросеквенирование ) сотни тысяч или миллионы тегов могут быть проанализированы одновременно, что дает очень точные и количественные профили экспрессии генов . Следовательно, профилирование экспрессии генов на основе тегов, также называемое «цифровым профилированием экспрессии генов» (DGE), сегодня может обеспечить наиболее точные профили транскрипции, которые преодолевают ограничения микрочипов . [14] [15]

Секвенирование 3'-концов мРНК, массовый анализ концов кДНК [ править ]

В середине 2010-х годов было разработано несколько методов в сочетании с секвенированием следующего поколения, в которых используется принцип «тегов» для «цифрового профилирования экспрессии генов», но без использования фермента-тега. Подход «MACE» (= массивный анализ концов кДНК) генерирует теги где-то в последних 1500 п.о. транскрипта. Этот метод больше не зависит от рестрикционных ферментов и, таким образом, позволяет избежать систематической ошибки, связанной с отсутствием или расположением сайта рестрикции в кДНК. Вместо этого кДНК фрагментируется случайным образом, а 3'-концы секвенируются от 5'-конца молекулы кДНК, которая несет поли-A-хвост. Длина последовательности тега может быть выбрана произвольно. Благодаря этому теги могут быть собраны в контиги, и аннотация тегов может быть значительно улучшена. Следовательно,MACE также используется для анализа немодельных организмов. Кроме того, более длинные контиги могут быть проверены на полиморфизм. Поскольку UTR демонстрируют большое количество полиморфизмов между индивидуумами, подход MACE может применяться для определения аллелей, профилирования аллель-специфической экспрессии генов и поиска молекулярных маркеров для разведения. Кроме того, подход позволяет определять альтернативное полиаденилирование транскриптов. Поскольку для MACE требуются только 3'-концы транскриптов, даже частично деградированная РНК может быть проанализирована с меньшим искажением, зависящим от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР.Подход MACE может применяться для определения аллелей, профилирования экспрессии аллель-специфических генов и поиска молекулярных маркеров для селекции. Кроме того, подход позволяет определять альтернативное полиаденилирование транскриптов. Поскольку для MACE требуются только 3'-концы транскриптов, даже частично деградированная РНК может быть проанализирована с меньшим искажением, зависящим от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР.Подход MACE может применяться для определения аллелей, профилирования экспрессии аллель-специфических генов и поиска молекулярных маркеров для селекции. Кроме того, подход позволяет определять альтернативное полиаденилирование транскриптов. Поскольку для MACE требуются только 3'-концы транскриптов, даже частично деградированная РНК может быть проанализирована с меньшим искажением, зависящим от деградации. Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР.Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР.Подход MACE использует уникальные молекулярные идентификаторы, позволяющие идентифицировать систематическую ошибку ПЦР. [16]

См. Также [ править ]

  • Секвенирование с высокой пропускной способностью
  • Транскриптомика
    • РНК-Seq
    • ДНК-микрочипы
    • Выраженные теги последовательности

Ссылки [ править ]

  1. ^ Шафи, Томас; Лоу, Рохан (2017). «Структура эукариотических и прокариотических генов» . WikiJournal of Medicine . 4 (1). DOI : 10.15347 / wjm / 2017.002 . ISSN  2002-4436 .
  2. ^ Saha S, et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol . 20 (5): 508–12. DOI : 10.1038 / nbt0502-508 . PMID 11981567 . 
  3. ^ Gowda M; Джантасуриярат С; Декан Р.А.; Ван ГЛ. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов» . Plant Physiol . 134 (3): 890–7. DOI : 10.1104 / pp.103.034496 . PMC 389912 . PMID 15020752 .  
  4. ^ Мацумура H; Ито А; Сайто Н; Winter P; Kahl G; Reuter M; Krüger DH; Тераучи Р. (2005). «СУПЕРШУМ». Cell Microbiol . 7 (1): 11–8. DOI : 10.1111 / j.1462-5822.2004.00478.x . PMID 15617519 . 
  5. ^ Sim GK; Кафатос ФК; Джонс CW; Koehler MD; Efstratiadis A; Маниатис Т. (декабрь 1979 г.). «Использование библиотеки кДНК для изучения эволюции и развития экспрессии мультигенных семейств хориона» . Cell . 18 (4): 1303–16. DOI : 10.1016 / 0092-8674 (79) 90241-1 . PMID 519770 . 
  6. ^ Сатклифф JG; Milner RJ; Bloom FE; Лернер Р.А. (август 1982 г.). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга» . Proc Natl Acad Sci USA . 79 (16): 4942–6. Bibcode : 1982PNAS ... 79.4942S . DOI : 10.1073 / pnas.79.16.4942 . PMC 346801 . PMID 6956902 .  
  7. ^ Путни SD; Herlihy WC; Шиммель П. (1983). «Новые клоны тропонина Т и кДНК для 13 различных мышечных белков, обнаруженные методом дробового секвенирования». Природа . 302 (5910): 718–21. Bibcode : 1983Natur.302..718P . DOI : 10.1038 / 302718a0 . PMID 6687628 . 
  8. ^ Адамс MD, Келли JM, Gocayne JD и др. (Июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессированной последовательности и проект генома человека». Наука . 252 (5013): 1651–6. Bibcode : 1991Sci ... 252.1651A . DOI : 10.1126 / science.2047873 . PMID 2047873 . 
  9. ^ a b Велкулеску В.Е. Zhang L; Фогельштейн B; Kinzler KW. (1995). «Серийный анализ экспрессии генов». Наука . 270 (5235): 484–7. Bibcode : 1995Sci ... 270..484V . DOI : 10.1126 / science.270.5235.484 . PMID 7570003 . 
  10. ^ a b Saha, S., et al. (2002). «Использование транскриптома для аннотирования генома». Nat Biotechnol 20 (5): 508-512.
  11. ^ Gowda, M., et al. (2004). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов». Физиология растений 134 (3): 890-897.
  12. ^ Matsumura, H .; Reich, S .; Ито, А .; Saitoh, H .; Kamoun, S .; Winter, P .; Kahl, G .; Reuter, M .; Krüger, D .; Тераучи, Р. (2003). «Анализ экспрессии генов при взаимодействии растений-хозяев-патогенов с помощью SuperSAGE» . Труды Национальной академии наук . 100 (26): 15718–15723. Bibcode : 2003PNAS..10015718M . DOI : 10.1073 / pnas.2536670100 . PMC 307634 . PMID 14676315 .  
  13. ^ Гауда, Малали; Джантасуриярат, Чатчаван; Дин, Ральф А .; Ван, Го-Лян (2004-03-01). «Robust-LongSAGE (RL-SAGE): существенно улучшенный метод LongSAGE для обнаружения генов и анализа транскриптомов» . Физиология растений . 134 (3): 890–897. DOI : 10.1104 / pp.103.034496 . ISSN 1532-2548 . PMC 389912 . PMID 15020752 .   
  14. ^ Shendure, J. (2008). «Начало конца для микрочипов?». Методы природы . 5 (7): 585–7. DOI : 10.1038 / nmeth0708-585 . PMID 18587314 . 
  15. ^ Matsumura, H .; Бин Насир, KH; Yoshida, K .; Ито, А .; Kahl, GN; Krüger, DH; Тераучи, Р. (2006). «Массив SuperSAGE: прямое использование тегов транскрипции из 26 пар оснований в массивах олигонуклеотидов». Методы природы . 3 (6): 469–74. DOI : 10.1038 / nmeth882 . PMID 16721381 . 
  16. ^ Zawada, Адам (январь 2014). «Массивный анализ концов кДНК (MACE) и профили экспрессии миРНК идентифицируют проатерогенные пути при хроническом заболевании почек» . Эпигенетика . 9 (1): 161–172. DOI : 10.4161 / epi.26931 . PMC 3928179 . PMID 24184689 .  

Внешние ссылки [ править ]

  • SAGEnet
  • SAGE для начинающих
  • Обзор техники SAGE в Science Creative Quarterly