Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Резюме RNA-Seq. Внутри организма гены транскрибируются и (в эукариотическом организме ) сплайсируются для получения зрелых транскриптов мРНК (красный). МРНК извлекается из организма, фрагментируется и копируется в стабильную дц-кДНК (синий). Дц-кДНК секвенируют с использованием высокопроизводительных методов секвенирования с коротким считыванием. Затем эти последовательности можно выровнять с эталонной последовательностью генома, чтобы реконструировать, какие участки генома транскрибировались. Эти данные можно использовать для аннотации, где находятся экспрессируемые гены, их относительные уровни экспрессии и любые альтернативные варианты сплайсинга. [1]

RNA-Seq (сокращенно от «секвенирования РНК») - это метод секвенирования , который использует секвенирование следующего поколения (NGS) для выявления присутствия и количества РНК в биологическом образце в данный момент, анализируя непрерывно изменяющийся клеточный транскриптом. . [2] [3]

В частности, RNA-Seq облегчает возможность просмотра альтернативных транскриптов сращивания генов , посттранскрипционных модификаций , слияния генов , мутаций / SNP и изменений в экспрессии генов с течением времени или различий в экспрессии генов в разных группах или в разных обработках. [4] Помимо транскриптов мРНК, RNA-Seq может анализировать различные популяции РНК, включая общую РНК, малую РНК, такую ​​как миРНК , тРНК , и профилирование рибосом . [5] RNA-Seq также может использоваться для определения границ экзона / интрона и проверки или исправления ранее аннотированных Границы генов 5 ' и 3' . Последние достижения в области RNA-Seq включают секвенирование отдельных клеток и секвенирование фиксированной ткани in situ. [6]

До RNA-Seq исследования экспрессии генов проводились с использованием микрочипов на основе гибридизации . Проблемы с микрочипами включают артефакты перекрестной гибридизации, плохую количественную оценку низко и высоко экспрессируемых генов и необходимость знать последовательность априори . [7] Из-за этих технических проблем, транскриптомика перешла на методы, основанные на секвенировании. Они прогрессировали от Sanger последовательности из экспрессируемых маркеров последовательностей библиотек, чтобы химическими методами на основе тегов (например, последовательный анализ экспрессии генов ), и , наконец , к текущей технологии, следующего поколения последовательности из кДНК ( в частности , Секвенирование РНК).

Методы [ править ]

Подготовка библиотеки [ править ]

Обзор типичного экспериментального рабочего процесса RNA-Seq. [8]

Общие шаги по подготовке библиотеки комплементарной ДНК (кДНК) для секвенирования описаны ниже, но часто варьируются в зависимости от платформы. [8] [3] [9]

  1. Выделение РНК: РНК выделяют из ткани и смешивают с дезоксирибонуклеазой (ДНКазой) . ДНКаза уменьшает количество геномной ДНК. Степень деградации РНК проверяется с помощью гель- электрофореза и капиллярного электрофореза и используется для присвоения пробе числа целостности РНК . Это качество РНК и общее количество исходной РНК учитываются на последующих этапах подготовки библиотеки, секвенирования и анализа.
  2. Отбор / истощение РНК: для анализа представляющих интерес сигналов выделенная РНК может либо храниться как есть, без рибосомальной РНК (рРНК) , фильтроваться на РНК с 3'-полиаденилированными (поли (A)) хвостами, чтобы включать только мРНК , и / или фильтруется на РНК, которая связывает определенные последовательности ( таблица методов отбора и истощения РНК , ниже). У эукариот РНК с 3'-поли (A) хвостами представляет собой зрелые процессированные кодирующие последовательности. Селекция поли (А) осуществляется путем смешивания эукариотической РНК с поли (Т) олигомерами, ковалентно прикрепленными к субстрату, обычно магнитным шарикам. [10] [11] Выбор Poly (A) игнорирует некодирующую РНК и вносит 3'-смещение, [12]чего можно избежать с помощью стратегии истощения рибосом. РРНК удаляется, потому что она составляет более 90% РНК в клетке, которая, если ее сохранить, затмит другие данные в транскриптоме.
  3. Синтез кДНК: РНК обратно транскрибируется в кДНК, потому что ДНК более стабильна и позволяет проводить амплификацию (в которой используются ДНК-полимеразы ) и использовать более зрелую технологию секвенирования ДНК. Амплификация после обратной транскрипции приводит к потере цепочечности , чего можно избежать с помощью химического мечения или секвенирования одной молекулы. Фрагментация и выбор размера выполняются для очистки последовательностей, которые имеют подходящую длину для секвенатора. РНК, кДНК или и то и другое фрагментируются ферментами, обработкой ультразвуком или распылителями. Фрагментация РНК снижает 5'-смещение произвольно праймированной обратной транскрипции и влияние сайтов связывания праймера [11]с другой стороны, 5 'и 3' концы превращаются в ДНК менее эффективно. За фрагментацией следует выбор размера, при котором либо удаляются небольшие последовательности, либо выбирается узкий диапазон длин последовательностей. Поскольку малые РНК, такие как miRNA , теряются, они анализируются независимо. КДНК для каждого эксперимента может быть проиндексирована штрих-кодом гексамера или октамера, так что эти эксперименты могут быть объединены в одну дорожку для мультиплексного секвенирования.

Секвенирование малой / некодирующей РНК [ править ]

При секвенировании РНК, отличной от мРНК, подготовка библиотеки изменяется. Клеточная РНК выбирается на основе желаемого диапазона размеров. Для малых РНК-мишеней, таких как миРНК , РНК выделяют путем отбора по размеру. Это может быть выполнено с помощью геля для исключения размера, с помощью магнитных шариков для выбора размера или с помощью коммерчески разработанного набора. После выделения линкеры добавляют к 3'- и 5'-концам, а затем очищают. Последний шаг - создание кДНК посредством обратной транскрипции.

Прямое секвенирование РНК [ править ]

Поскольку преобразование РНК в кДНК , лигирование, амплификация и другие манипуляции с образцами, как было показано, вносят систематические ошибки и артефакты, которые могут мешать как правильной характеристике, так и количественной оценке транскриптов, [13] прямое секвенирование РНК одной молекулы было исследовано компаниями, включая Helicos. (банкрот), Oxford Nanopore Technologies , [14] и другие. Эта технология обеспечивает прямую параллельную последовательность молекул РНК.

Секвенирование одноклеточной РНК (scRNA-Seq) [ править ]

Стандартные методы, такие как микроматрицы и стандартный объемный анализ РНК-Seq, анализируют экспрессию РНК из больших популяций клеток. В смешанных популяциях клеток эти измерения могут скрыть важные различия между отдельными клетками в этих популяциях. [15] [16]

Секвенирование одноклеточной РНК (scRNA-Seq) обеспечивает профили экспрессии отдельных клеток. Хотя невозможно получить полную информацию о каждой РНК, экспрессируемой каждой клеткой, из-за небольшого количества доступного материала, образцы экспрессии генов могут быть идентифицированы с помощью анализа кластеризации генов . Это может раскрыть существование в популяции клеток редких типов клеток, которые, возможно, никогда раньше не наблюдались. Например, редкие специализированные клетки в легких, называемые легочными ионоцитами, которые экспрессируют регулятор трансмембранной проводимости при муковисцидозе, были идентифицированы в 2018 году двумя группами, выполняющими scRNA-Seq на эпителии дыхательных путей легких. [17] [18]

Экспериментальные процедуры [ править ]

Рабочий процесс секвенирования одноклеточной РНК

Текущие протоколы scRNA-Seq включают следующие этапы: выделение отдельной клетки и РНК, обратная транскрипция (RT), амплификация, создание библиотеки и секвенирование. Ранние методы разделяли отдельные клетки на отдельные лунки; Более современные методы инкапсулируют отдельные клетки в капельки в микрофлюидном устройстве, где происходит реакция обратной транскрипции, превращающая РНК в кДНК. Каждая капля несет «штрих-код» ДНК, который однозначно маркирует кДНК, полученные из одной клетки. После завершения обратной транскрипции кДНК из многих клеток можно смешать вместе для секвенирования; транскрипты из конкретной клетки идентифицируются уникальным штрих-кодом. [19] [20]

Проблемы для scRNA-Seq включают сохранение исходного относительного количества мРНК в клетке и идентификацию редких транскриптов. [21] Этап обратной транскрипции имеет решающее значение, поскольку эффективность реакции RT определяет, какая часть популяции РНК клетки будет в конечном итоге проанализирована секвенатором. Процессивность обратных транскриптаз и используемые стратегии прайминга могут влиять на продукцию полноразмерной кДНК и создание библиотек, смещенных к 3 'или 5' концам генов.

На этапе амплификации в настоящее время для амплификации кДНК используется либо ПЦР, либо транскрипция in vitro (IVT). Одним из преимуществ методов на основе ПЦР является возможность генерировать полноразмерную кДНК. Однако различная эффективность ПЦР для конкретных последовательностей (например, содержимого GC и структуры snapback) также может быть экспоненциально усилена, создавая библиотеки с неравномерным покрытием. С другой стороны, хотя библиотеки, созданные с помощью IVT, могут избежать смещения последовательности, вызванного ПЦР, конкретные последовательности могут транскрибироваться неэффективно, что вызывает выпадение последовательности или генерирование неполных последовательностей. [22] [15] Было опубликовано несколько протоколов scRNA-Seq: Tang et al., [23] STRT, [24] SMART-seq, [25] CEL-seq,[26] RAGE-seq, [27] , Quartz-seq. [28] и C1-CAGE. [29] Эти протоколы различаются с точки зрения стратегий обратной транскрипции, синтеза и амплификации кДНК, а также возможности использования штрих-кодов, специфичных для последовательности (например, UMI ), или способности обрабатывать объединенные образцы. [30]

В 2017 году были внедрены два подхода для одновременного измерения экспрессии мРНК и белка в отдельных клетках с помощью меченных олигонуклеотидами антител, известных как REAP-seq, [31] и CITE-seq. [32]

Приложения [ править ]

scRNA-Seq становится широко используются в биологических дисциплин , в том числе развития, неврологии , [33] Oncology , [34] [35] [36] болезнь Аутоиммунные , [37] и инфекционное заболевание . [38]

scRNA-Seq обеспечил значительное понимание в развитие эмбрионов и организмов, в том числе червя Caenorhabditis Элеганс , [39] и регенеративного планарии Schmidtea Mediterranea . [40] [41] Первыми позвоночными животными, которые были нанесены на карту таким образом, были рыбки данио [42] [43] и Xenopus laevis . [44] В каждом случае были изучены несколько стадий эмбриона, что позволило картировать весь процесс развития на клеточной основе. [8] Наука признала эти достижения прорывом 2018 года . [45]

Экспериментальные соображения [ править ]

При разработке и проведении экспериментов по RNA-Seq учитываются самые разные параметры :

  • Тканевая специфичность: экспрессия генов варьируется внутри и между тканями, и RNA-Seq измеряет это сочетание типов клеток. Это может затруднить выделение интересующего биологического механизма. Секвенирование одной клетки можно использовать для изучения каждой клетки в отдельности, что устраняет эту проблему.
  • Зависимость от времени: экспрессия генов меняется со временем, а RNA-Seq делает только снимок. Можно проводить эксперименты с течением времени, чтобы наблюдать изменения в транскриптоме.
  • Охват (также известный как глубина): РНК содержит те же мутации, которые наблюдаются в ДНК, и для обнаружения требуется более глубокий охват. При достаточно высоком покрытии RNA-Seq можно использовать для оценки экспрессии каждого аллеля. Это может дать представление о таких явлениях, как импринтинг или цис-регуляторные эффекты . Глубина секвенирования, необходимая для конкретных приложений, может быть экстраполирована на основе экспериментального эксперимента. [46]
  • Артефакты генерации данных (также известные как технические отклонения): реагенты (например, комплект для подготовки библиотеки), задействованный персонал и тип секвенатора (например, Illumina , Pacific Biosciences ) могут привести к техническим артефактам, которые могут быть неверно интерпретированы как значимые результаты. . Как и в любом научном эксперименте, разумно проводить RNA-Seq в хорошо контролируемой обстановке. Если это невозможно или исследование представляет собой метаанализ , другим решением является обнаружение технических артефактов путем определения скрытых переменных (обычно анализ главных компонентов или факторный анализ ) и последующей корректировки этих переменных. [47]
  • Управление данными: один эксперимент RNA-Seq на людях обычно составляет порядка 1 ГБ . [48] Такой большой объем данных может создавать проблемы с хранением. Одним из решений является сжатие данных с использованием многоцелевых вычислительных схем (например, gzip ) или схем, специфичных для геномики. Последние могут быть основаны на эталонных последовательностях или de novo. Другое решение - провести эксперименты с микрочипами, которых может быть достаточно для работы, основанной на гипотезах, или исследований репликации (в отличие от исследовательских исследований).

Анализ [ править ]

Диаграмма, описывающая анализ RNA-Seq, описанный в этом разделе

Сборка транскриптома [ править ]

Два метода используются для присвоения считывания необработанной последовательности геномным признакам (т. Е. Сборка транскриптома):

  • De novo: этот подход не требует эталонного генома для реконструкции транскриптома и обычно используется, если геном неизвестен, неполный или существенно изменен по сравнению с эталоном. [49] Проблемы при использовании коротких чтений для сборки de novo включают: 1) определение того, какие чтения следует объединить в непрерывные последовательности ( контиги ), 2) устойчивость к ошибкам секвенирования и другим артефактам и 3) вычислительную эффективность. Первичный алгоритм, используемый для сборки de novo, перешел от графов перекрытия, которые идентифицируют все попарные перекрытия между чтениями, к графам де Брейна , которые разбивают чтение на последовательности длины k и сворачивают все k-мерки в хеш-таблицу. [50]Графики перекрытия использовались при секвенировании по Сэнгеру, но они плохо масштабируются до миллионов считываний, созданных с помощью RNA-Seq. Примерами ассемблеров, использующих графы де Брейна, являются Velvet , [51] Trinity, [49] Oases, [52] и Bridger. [53] Парное секвенирование конца и длинного чтения одного и того же образца может смягчить недостатки секвенирования короткого чтения, выступая в качестве шаблона или скелета. Метрики для оценки качества сборки de novo включают среднюю длину контига, количество контигов и N50 . [54]
Картирование RNA-Seq коротких чтений в соединениях экзон-экзон. Секвенируется конечная мРНК, в которой отсутствуют интронные участки пре-мРНК.
  • Управление геномом : этот подход основан на тех же методах, которые используются для выравнивания ДНК, с дополнительной сложностью выравнивания считываний, которые охватывают прерывистые части эталонного генома. [55] Эти прерывистые чтения являются результатом секвенирования сплайсированных транскриптов (см. Рисунок). Как правило, алгоритмы выравнивания состоят из двух этапов: 1) выравнивание коротких участков считываемых данных (т. Е. Засеивание генома) и 2) использование динамического программирования для поиска оптимального выравнивания, иногда в сочетании с известными аннотациями. Программные инструменты, использующие выравнивание на основе генома, включают Bowtie, [56] TopHat (который основан на результатах BowTie для выравнивания стыковок), [57] [58] Subread, [59] STAR, [55]HISAT2, [60] Sailfish, [61] Каллисто, [62] и GMAP. [63] Качество сборки, управляемой геномом, можно измерить с помощью 1) показателей сборки de novo (например, N50) и 2) сравнений с известными последовательностями транскрипта, сплайсинга, генома и белковых последовательностей с использованием точности, отзыва или их комбинации. (например, оценка F1). [54] Кроме того, оценка in silico может быть выполнена с использованием имитированных считываний. [64] [65]

Примечание о качестве сборки: в настоящее время консенсус заключается в том, что 1) качество сборки может варьироваться в зависимости от используемой метрики, 2) сборки, получившие хорошие оценки в одном виде, не обязательно хорошо работают в другом виде, и 3) сочетание различных подходов может быть самым надежным. [66] [67]

Количественная оценка экспрессии генов [ править ]

Экспрессия оценивается количественно для изучения клеточных изменений в ответ на внешние раздражители, различий между здоровым и болезненным состояниями и других исследовательских вопросов. Экспрессия генов часто используется в качестве показателя изобилия белка, но они часто не эквивалентны из-за посттранскрипционных событий, таких как интерференция РНК и нонсенс-опосредованный распад . [68]

Выражение количественно оценивается путем подсчета числа считываний, отображаемых в каждом локусе на этапе сборки транскриптома . Экспрессию экзонов или генов можно количественно оценить с помощью контигов или аннотаций эталонных транскриптов. [8] Эти наблюдаемые подсчеты считывания RNA-Seq были тщательно проверены на соответствие более старым технологиям, включая микроматрицы экспрессии и qPCR . [46] [69] Примерами инструментов для количественной оценки подсчетов являются HTSeq, [70] FeatureCounts, [71] Rcount, [72] maxcounts, [73] FIXSEQ, [74]и Cuffquant. Счетчики чтения затем преобразуются в соответствующие показатели для проверки гипотез, регрессий и других анализов. Параметры для этого преобразования:

  • Глубина секвенирования / охват : хотя глубина предварительно указывается при проведении нескольких экспериментов с RNA-Seq, она по-прежнему будет широко варьироваться между экспериментами. [75] Таким образом, общее количество считываний, сгенерированных в одном эксперименте, обычно нормализуется путем преобразования счетчиков во фрагменты, чтения или счета на миллион отображенных считываний (FPM, RPM или CPM). Глубину секвенирования иногда называют размером библиотеки , количеством промежуточных молекул кДНК в эксперименте.
  • Длина гена: более длинные гены будут иметь больше фрагментов / считываний / отсчетов, чем более короткие гены, если экспрессия транскриптов одинакова. Это регулируется путем деления FPM на длину гена, что дает метрические фрагменты на килобазу транскрипта на миллион отображенных считываний (FPKM). [76] При просмотре групп генов в образцах FPKM преобразуется в количество транскриптов на миллион (TPM) путем деления каждого FPKM на сумму FPKM в образце. [77] [78] [79]
  • Общий вывод РНК образца: поскольку из каждого образца извлекается одинаковое количество РНК, образцы с большим количеством общей РНК будут иметь меньше РНК на ген. Эти гены, по-видимому, имеют пониженную экспрессию, что приводит к ложноположительным результатам в последующих анализах. [75] Стратегии нормализации, включая квантиль, DESeq2, TMM и Median Ratio, пытаются учесть это различие путем сравнения набора генов, экспрессируемых недифференциально, между выборками и соответствующего масштабирования. [80]
  • Дисперсия для экспрессии каждого гена: моделируется для учета ошибки выборки (важно для генов с низким числом считываний), увеличения мощности и уменьшения ложноположительных результатов. Дисперсия может быть оценена как нормальное , пуассоновское или отрицательное биномиальное распределение [81] [82] [83] и часто разлагается на техническую и биологическую дисперсию.

Абсолютная количественная оценка [ править ]

Абсолютная количественная оценка экспрессии генов невозможна в большинстве экспериментов с RNA-Seq, которые определяют количественную экспрессию относительно всех транскриптов. Это возможно путем выполнения RNA-Seq с добавлением образцов РНК в известных концентрациях. После секвенирования счетчики считываний всплесков последовательностей используются для определения взаимосвязи между счетчиками считываний каждого гена и абсолютными количествами биологических фрагментов. [11] [84] В одном примере этот метод был использован у эмбрионов Xenopus tropicalis для определения кинетики транскрипции. [85]

Дифференциальное выражение [ править ]

Самое простое, но часто наиболее эффективное использование RNA-Seq - это обнаружение различий в экспрессии генов между двумя или более состояниями ( например , лечить или не лечить); этот процесс называется дифференциальным выражением. Выходы часто называют дифференциально экспрессируемыми генами (ДЭГ), и эти гены могут регулироваться либо с повышением, либо с понижением ( т.е. повышать или понижать в интересующем состоянии). Есть много инструментов, которые выполняют дифференциальное выражение . Большинство из них запускается в R , Python или командной строке Unix . Обычно используемые инструменты включают DESeq, [82] edgeR, [83] и voom + limma, [81] [86]все они доступны через R / Bioconductor . [87] [88] Вот общие соображения при выполнении дифференциального выражения:

  • Входные данные: входные данные для дифференциальной экспрессии включают (1) матрицу экспрессии RNA-Seq (M генов x N образцов) и (2) матрицу дизайна, содержащую экспериментальные условия для N образцов. Простейшая матрица плана содержит один столбец, соответствующий меткам проверяемого условия. Другие ковариаты (также называемые факторами, функциями, метками или параметрами) могут включать в себя пакетные эффекты , известные артефакты и любые метаданные, которые могут мешать или опосредовать экспрессию генов. В дополнение к известным ковариатам, неизвестные ковариаты также могут быть оценены с помощью подходов неконтролируемого машинного обучения, включая главную компоненту , суррогатную переменную, [89] и PEER [47]анализы. Анализ скрытых переменных часто используется для данных RNA-Seq тканей человека, которые обычно содержат дополнительные артефакты, не зафиксированные в метаданных ( например , время ишемии, источники из нескольких учреждений, основные клинические признаки, сбор данных за многие годы с участием большого количества сотрудников).
  • Методы: большинство инструментов используют регрессию или непараметрическую статистику для идентификации дифференциально экспрессируемых генов и основаны либо на подсчете (DESeq2, limma, edgeR), либо на сборке (через количественное определение без выравнивания, сыщик, [90] Cuffdiff, [91] ] Бальное платье [92] ). [93] После регрессии большинство инструментов используют корректировку р-значения либо на уровень семейных ошибок (FWER), либо на частоту ложных открытий (FDR) для учета нескольких гипотез (в исследованиях на людях ~ 20 000 генов, кодирующих белок, или ~ 50 000 биотипов).
  • Выходные данные: типичный выход состоит из строк, соответствующих количеству генов, и не менее трех столбцов, логарифмического кратного изменения каждого гена ( логарифмическое преобразование отношения в выражении между условиями, мера величины эффекта ), p-значения и p. -значение с поправкой на множественные сравнения . Гены считаются биологически значимыми, если они проходят пороговые значения по величине эффекта (логарифмическое изменение) и статистической значимости . Эти пороговые значения в идеале должны быть определены априори , но природа экспериментов с RNA-Seq часто носит исследовательский характер, поэтому сложно заранее предсказать размеры эффекта и соответствующие пороговые значения.
  • Ловушки: смысл существования этих сложных методов состоит в том, чтобы избежать множества ловушек, которые могут привести к статистическим ошибкам и неверным интерпретациям. К подводным камням относятся увеличение количества ложноположительных результатов (из-за множественных сравнений), артефакты подготовки образцов, неоднородность образцов (например, смешанный генетический фон), высококоррелированные образцы, неучтенные для многоуровневых экспериментальных дизайнов и плохой экспериментальный дизайн . Одна заметная ошибка - просмотр результатов в Microsoft Excel без использования функции импорта, чтобы имена генов оставались текстовыми. [94] Несмотря на удобство, Excel автоматически преобразует названия некоторых генов ( SEPT1 , DEC1 , MARCH2) в даты или числа с плавающей запятой.
  • Выбор инструментов и бенчмаркинг: предпринимаются многочисленные попытки сравнить результаты этих инструментов, при этом DESeq2 имеет тенденцию умеренно превосходить другие методы. [95] [96] [97] [98] [99] [93] [100] Как и в случае с другими методами, бенчмаркинг состоит из сравнения результатов работы инструментов друг с другом и с известными золотыми стандартами .

Последующий анализ списка дифференциально экспрессируемых генов бывает двух видов: подтверждение наблюдений и биологические выводы. Из-за ловушек дифференциальной экспрессии и RNA-Seq важные наблюдения воспроизводятся с помощью (1) ортогонального метода в тех же образцах (например, ПЦР в реальном времени ) или (2) другого, иногда предварительно зарегистрированного , эксперимента в новой когорте. . Последнее помогает обеспечить обобщаемость и, как правило, может сопровождаться метаанализом всех объединенных когорт. Наиболее распространенный метод получения более высокого уровня биологического понимания результатов - анализ обогащения набора генов., хотя иногда используются подходы к генам-кандидатам. Обогащение набора генов определяет, является ли перекрытие между двумя наборами генов статистически значимым, в этом случае перекрытие между дифференциально экспрессируемыми генами и наборами генов из известных путей / баз данных ( например , онтологии генов , KEGG , онтологии фенотипа человека ) или из дополнительных анализов в те же данные (например, сети коэкспрессии). Общие инструменты для обогащения набора генов включают веб-интерфейсы ( например , ENRICHR, g: profiler) и пакеты программного обеспечения. При оценке результатов обогащения одна эвристика состоит в том, чтобы сначала искать обогащение известной биологии в качестве проверки работоспособности, а затем расширять область поиска для поиска новой биологии.

Альтернативные типы событий сплайсинга РНК. Экзоны представлены синими и желтыми блоками, интроны - линиями между ними.

Альтернативное сращивание [ править ]

Сплайсинг РНК является неотъемлемой частью эукариот и вносит значительный вклад в регуляцию и разнообразие белков, происходя более чем в 90% генов человека. [101] Существует несколько альтернативных режимов сплайсинга : пропуск экзонов (наиболее распространенный способ сплайсинга у людей и высших эукариот), взаимоисключающие экзоны, альтернативные донорные или акцепторные сайты, удержание интронов (наиболее распространенный режим сплайсинга у растений, грибов и простейших), альтернативный сайт начала транскрипции (промотор) и альтернативное полиаденилирование. [101]Одна из целей RNA-Seq - выявить альтернативные события сплайсинга и проверить, различаются ли они в разных условиях. Секвенирование при длительном чтении фиксирует полный транскрипт и, таким образом, сводит к минимуму многие проблемы при оценке распространенности изоформ, такие как отображение неоднозначного чтения. Для коротко читаемой RNA-Seq существует несколько методов обнаружения альтернативного сплайсинга, которые можно разделить на три основные группы: [102] [103] [104]

  • На основе подсчета (также на основе событий, дифференциального сплайсинга): оценка удержания экзонов. Примеры: DEXSeq, [105] MATS, [106] и SeqGSEA. [107]
  • На основе изоформ (также модули с множественным считыванием, дифференциальное выражение изоформы) : сначала оцените численность изоформы, а затем относительную численность между условиями. Примеры: Cufflinks 2 [108] и DiffSplice. [109]
  • На основе иссечения интрона: рассчитайте альтернативный сплайсинг с использованием разделенных чтений. Примеры: MAJIQ [110] и Leafcutter. [104]

Инструменты дифференциальной экспрессии генов также могут использоваться для дифференциальной экспрессии изоформ, если изоформы заранее количественно определены с помощью других инструментов, таких как RSEM. [111]

Сети коэкспрессии [ править ]

Сети коэкспрессии - это основанные на данных представления генов, которые ведут себя одинаково в разных тканях и в экспериментальных условиях. [112] Их основная цель заключается в генерировании гипотез и подходах на основе ассоциации вины для определения функций ранее неизвестных генов. [112] Данные RNA-Seq были использованы для вывода генов, участвующих в определенных путях, на основе корреляции Пирсона как у растений [113], так и у млекопитающих. [114]Основное преимущество данных RNA-Seq в этом виде анализа по сравнению с платформами микрочипов заключается в возможности охвата всего транскриптома, что позволяет получить более полное представление о сетях регуляции генов. Дифференциальная регуляция изоформ сплайсинга одного и того же гена может быть обнаружена и использована для прогнозирования их биологических функций. [115] [116] Сетевой анализ взвешенной коэкспрессии геновбыл успешно использован для идентификации модулей коэкспрессии и внутримодульных хаб-генов на основе данных последовательности РНК. Модули коэкспрессии могут соответствовать типам клеток или путям. Высокосвязные внутримодульные концентраторы можно интерпретировать как представителей соответствующего модуля. Собственный ген - это взвешенная сумма экспрессии всех генов в модуле. Собственные гены - полезные биомаркеры (признаки) для диагностики и прогноза. [117] Были предложены подходы с преобразованием, стабилизирующим отклонения, для оценки коэффициентов корреляции на основе данных последовательности РНК. [113]

Вариант открытия [ править ]

RNA-Seq фиксирует вариации ДНК, включая варианты с одним нуклеотидом , небольшие вставки / делеции . и структурные вариации . Вызов вариантов в RNA-Seq аналогичен вызову вариантов ДНК и часто использует те же инструменты (включая SAMtools mpileup [118] и GATK HaplotypeCaller [119] ) с настройками для учета сплайсинга. Одним из уникальных параметров вариантов РНК является аллель-специфическая экспрессия (ASE) : варианты только из одного гаплотипа могут предпочтительно экспрессироваться из-за регуляторных эффектов, включая импринтинг и экспрессию локусов количественных признаков , а также некодирующие редкие варианты .[120] [121] Ограничения идентификации варианта РНК включают то, что он отражает только экспрессированные области (у людей, <5% генома) и имеет более низкое качество по сравнению с прямым секвенированием ДНК.

Редактирование РНК (посттранскрипционные изменения) [ править ]

Наличие совпадающих геномных и транскриптомных последовательностей человека может помочь обнаружить пост-транскрипционные изменения ( редактирование РНК ). [3] Событие посттранскрипционной модификации идентифицируется, если транскрипт гена имеет аллель / вариант, не обнаруженный в геномных данных.

Картирование RNA-Seq коротких считываний по соединениям экзон-экзон, в зависимости от того, где каждый конец отображается, это может быть определено как событие Trans или Cis .

Обнаружение гибридного гена [ править ]

Вызванные различными структурными модификациями в геноме, гибридные гены привлекли внимание из-за их связи с раком. [122] Способность RNA-Seq беспристрастно анализировать весь транскриптом образца делает его привлекательным инструментом для поиска подобных общих явлений при раке. [4]

Идея вытекает из процесса выравнивания коротких транскриптомных чтений с эталонным геномом. Большинство коротких прочтений попадают в один полный экзон, и ожидается, что меньший, но все же большой набор будет отображаться в известные экзон-экзонные соединения. Оставшиеся неотмеченные короткие считывания затем будут дополнительно проанализированы, чтобы определить, соответствуют ли они переходу экзон-экзон, где экзоны происходят от разных генов. Это свидетельствовало бы о возможном событии слияния, однако из-за продолжительности считывания это могло оказаться очень шумным. Альтернативный подход заключается в использовании считывания на конце пары, когда потенциально большое количество парных считываний будет отображать каждый конец на другой экзон, обеспечивая лучшее покрытие этих событий (см. Рисунок). Тем не менее,конечный результат состоит из множества и потенциально новых комбинаций генов, обеспечивающих идеальную отправную точку для дальнейшей проверки.

История [ править ]

Количество рукописей на PubMed, содержащих RNA-Seq, продолжает расти.

RNA-Seq была впервые разработана в середине 2000-х годов с появлением технологии секвенирования следующего поколения. [123] Первые рукописи, в которых использовалась RNA-Seq даже без использования этого термина, включают в себя рукописи клеточных линий рака простаты [124] (датированы 2006 г.), Medicago truncatula [125] (2006 г.), кукурузы [126] (2007 г.) и Arabidopsis. thaliana [127] (2007), а сам термин «RNA-Seq» впервые был упомянут в 2008 году [128] [129] . Количество рукописей, относящихся к RNA-Seq в названии или аннотации (рисунок, синяя линия), постоянно увеличилось с 6754 рукописями, опубликованными в 2018 г. (ссылку на поиск PubMed ). Пересечение RNA-Seq и медицины (рисунок, золотая линия, ссылка на поиск PubMed ) имеет аналогичную скорость. [ оригинальное исследование? ]

Приложения к медицине [ править ]

RNA-Seq имеет потенциал для выявления новой биологии заболевания, профильных биомаркеров для клинических показаний, определения путей воздействия лекарств и постановки генетического диагноза. Эти результаты могут быть дополнительно персонализированы для подгрупп или даже отдельных пациентов, потенциально подчеркивая более эффективную профилактику, диагностику и терапию. Осуществимость этого подхода частично диктуется денежными и временными затратами; связанное с этим ограничение - необходимая группа специалистов (биоинформатики, врачи / клиницисты, базовые исследователи, техники) для полной интерпретации огромного количества данных, генерируемых этим анализом. [130]

Масштабные усилия по секвенированию [ править ]

Большое внимание было уделено данным RNA-Seq после того, как проекты Энциклопедии элементов ДНК (ENCODE) и Атлас генома рака (TCGA) использовали этот подход для характеристики десятков клеточных линий [131] и тысяч образцов первичных опухолей, [132]соответственно. ENCODE направлен на идентификацию регуляторных областей всего генома в различных когортах клеточных линий, и транскриптомные данные имеют первостепенное значение для понимания последующего эффекта этих эпигенетических и генетических регуляторных слоев. TCGA, напротив, был нацелен на сбор и анализ тысяч образцов пациентов из 30 различных типов опухолей, чтобы понять основные механизмы злокачественной трансформации и прогрессирования. В этом контексте данные RNA-Seq предоставляют уникальный снимок транскриптомного статуса заболевания и позволяют рассматривать беспристрастную популяцию транскриптов, что позволяет идентифицировать новые транскрипты, гибридные транскрипты и некодирующие РНК, которые можно было бы не обнаружить с помощью различных технологий.

См. Также [ править ]

  • Транскриптомика
  • ДНК микрочип
  • Список инструментов биоинформатики RNA-Seq

Ссылки [ править ]

  1. ^ Shafee Т, Лоу R (2017). «Структура эукариотических и прокариотических генов» . WikiJournal of Medicine . 4 (1). DOI : 10.15347 / wjm / 2017.002 .
  2. Перейти ↑ Chu Y, Corey DR (август 2012). «Секвенирование РНК: выбор платформы, экспериментальный дизайн и интерпретация данных» . Нуклеиновые кислоты . 22 (4): 271–4. DOI : 10.1089 / nat.2012.0367 . PMC 3426205 . PMID 22830413 .  
  3. ^ a b c Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики» . Обзоры природы. Генетика . 10 (1): 57–63. DOI : 10.1038 / nrg2484 . PMC 2949280 . PMID 19015660 .  
  4. ^ а б Махер К.А., Кумар-Синха С., Цао Х, Каляна-Сундарам С., Хан Б., Цзин Х и др. (Март 2009 г.). «Секвенирование транскриптома для обнаружения слияния генов при раке» . Природа . 458 (7234): 97–101. Bibcode : 2009Natur.458 ... 97M . DOI : 10,1038 / природа07638 . PMC 2725402 . PMID 19136943 .  
  5. ^ Ingolia NT, Brar Г.А., Rouskin S, McGeachy AM, Вайсман JS (июль 2012). «Стратегия профилирования рибосом для мониторинга трансляции in vivo путем глубокого секвенирования защищенных рибосомами фрагментов мРНК» . Протоколы природы . 7 (8): 1534–50. DOI : 10.1038 / nprot.2012.086 . PMC 3535016 . PMID 22836135 .  
  6. ^ Ли JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC и др. (Март 2014 г.). «Высоко мультиплексное секвенирование субклеточной РНК in situ» . Наука . 343 (6177): 1360–3. Bibcode : 2014Sci ... 343.1360L . DOI : 10.1126 / science.1250212 . PMC 4140943 . PMID 24578530 .  
  7. ^ Kukurba KR, Montgomery SB (апрель 2015). «Секвенирование и анализ РНК» . Протоколы Колд-Спринг-Харбор . 2015 (11): 951–69. DOI : 10,1101 / pdb.top084970 . PMC 4863231 . PMID 25870306 .  
  8. ^ a b c d e Гриффит М., Уокер-младший, Шпионы NC, Эйнскау Б.Дж., Гриффит О.Л. (август 2015 г.). «Информатика для секвенирования РНК: веб-ресурс для анализа в облаке» . PLOS Вычислительная биология . 11 (8): e1004393. Bibcode : 2015PLSCB..11E4393G . DOI : 10.1371 / journal.pcbi.1004393 . PMC 4527835 . PMID 26248053 .  
  9. ^ "РНК-секлопедия" . rnaseq.uoregon.edu . Проверено 8 февраля 2017 .
  10. ^ Морин Р., Бейнбридж М., Фейес А., Херст М., Кшивински М., Пью Т. и др. (Июль 2008 г.). «Профилирование транскриптома HeLa S3 с использованием случайно примированной кДНК и массового параллельного секвенирования короткого чтения» . Биотехнологии . 45 (1): 81–94. DOI : 10.2144 / 000112900 . PMID 18611170 . 
  11. ^ a b c Мортазави А., Уильямс Б.А., МакКью К., Шеффер Л., Уолд Б. (июль 2008 г.). «Картирование и количественная оценка транскриптомов млекопитающих с помощью RNA-Seq». Методы природы . 5 (7): 621–8. DOI : 10.1038 / nmeth.1226 . PMID 18516045 . S2CID 205418589 .  
  12. ^ Chen EA, Souaiaia T, Херстейн JS, Евграфов О.В., Спицына В.Н., Rebolini DF, Knowles JA (октябрь 2014). «Влияние целостности РНК на однозначно картированные чтения в RNA-Seq» . BMC Research Notes . 7 (1): 753. DOI : 10,1186 / 1756-0500-7-753 . PMC 4213542 . PMID 25339126 .  
  13. ^ Лю D, Грабер JH (февраль 2006). «Количественное сравнение библиотек EST требует компенсации систематических ошибок в генерации кДНК» . BMC Bioinformatics . 7 : 77. DOI : 10,1186 / 1471-2105-7-77 . PMC 1431573 . PMID 16503995 .  
  14. ^ Garalde DR, Snell EA, Jachimowicz D, Sipos B, Lloyd JH, Bruce M и др. (Март 2018 г.). «Высоко параллельное прямое секвенирование РНК на массиве нанопор». Методы природы . 15 (3): 201–206. DOI : 10.1038 / nmeth.4577 . PMID 29334379 . S2CID 3589823 .  
  15. ^ a b « Shapiro E, Biezuner T, Linnarsson S (сентябрь 2013 г.).« Технологии на основе одноклеточного секвенирования произведут революцию в науке о целом организме ». Nature Reviews. Genetics . 14 (9): 618–30. doi : 10.1038 / nrg3542 . PMID 23897237 . S2CID 500845 .  "
  16. ^ Kolodziejczyk А.А., Ким JK, Свенссон V, Marioni JC, Teichmann SA (май 2015). «Технология и биология секвенирования одноклеточной РНК» . Молекулярная клетка . 58 (4): 610–20. DOI : 10.1016 / j.molcel.2015.04.005 . PMID 26000846 . 
  17. ^ Montoro DT, Haber AL, Biton M, Vinarsky V, Lin B, Birket SE и др. (Август 2018). «Пересмотренная иерархия эпителия дыхательных путей включает ионоциты, экспрессирующие CFTR» . Природа . 560 (7718): 319–324. Bibcode : 2018Natur.560..319M . DOI : 10.1038 / s41586-018-0393-7 . PMC 6295155 . PMID 30069044 .  
  18. ^ Plasschaert LW, ilionis R, Choo-Wing R, Savova V, Knehr J, Roma G и др. (Август 2018). «Одноклеточный атлас эпителия дыхательных путей показывает богатые CFTR легочные ионоциты» . Природа . 560 (7718): 377–381. Bibcode : 2018Natur.560..377P . DOI : 10.1038 / s41586-018-0394-6 . PMC 6108322 . PMID 30069046 .  
  19. ^ Кляйн AM, Mazutis L, Akartuna I, Tallapragada N, Veres A, Li V и др. (Май 2015 г.). «Капельное штрих-кодирование одноклеточной транскриптомики, применяемое к эмбриональным стволовым клеткам» . Cell . 161 (5): 1187–1201. DOI : 10.1016 / j.cell.2015.04.044 . PMC 4441768 . PMID 26000487 .  
  20. ^ Macosko EZ, Basu A, Satija R, Nemesh J, Shekhar K, Goldman M и др. (Май 2015 г.). «Профилирование экспрессии отдельных клеток с высокой параллельностью генома с использованием капель нанолитера» . Cell . 161 (5): 1202–1214. DOI : 10.1016 / j.cell.2015.05.002 . PMC 4481139 . PMID 26000488 .  
  21. ^ " Hebenstreit D (ноябрь 2012). "Методы, проблемы и Потенциалы Single Cell Секвенирование РНК" . Biology . 1 (3): 658-67. DOI : 10,3390 / biology1030658 . PMC 4009822 . PMID 24832513 .  "
  22. ^ Eberwine J, суль JY, Bartfai Т, Ким J (январь 2014). «Обещание секвенирования одной клетки». Методы природы . 11 (1): 25–7. DOI : 10.1038 / nmeth.2769 . PMID 24524134 . S2CID 11575439 .  
  23. ^ Тан Ф, Барбачору С, Ван И, Нордман Э, Ли С, Сюй Н и др. (Май 2009 г.). «Анализ целого транскриптома мРНК-Seq отдельной клетки». Методы природы . 6 (5): 377–82. DOI : 10.1038 / NMETH.1315 . PMID 19349980 . S2CID 16570747 .  
  24. ^ Ислам S, Kjällquist U, Молинер A, Zajac P, Вентилятор JB, Lönnerberg P, Linnarsson S (июль 2011). «Характеристика одноклеточного транскрипционного ландшафта с помощью высоко мультиплексной РНК-seq» . Геномные исследования . 21 (7): 1160–7. DOI : 10.1101 / gr.110882.110 . PMC 3129258 . PMID 21543516 .  
  25. ^ Ramsköld D, Ло S, Ван YC, Ли R, Дэн Q, Faridani ИЛИ, и др. (Август 2012 г.). «Полноразмерная мРНК-Seq из одноклеточных уровней РНК и отдельных циркулирующих опухолевых клеток» . Природа Биотехнологии . 30 (8): 777–82. DOI : 10.1038 / nbt.2282 . PMC 3467340 . PMID 22820318 .  
  26. ^ Hashimshony T, Wagner F, Sher N, Yanai I (сентябрь 2012). «CEL-Seq: одноклеточная РНК-Seq путем мультиплексной линейной амплификации» . Отчеты по ячейкам . 2 (3): 666–73. DOI : 10.1016 / j.celrep.2012.08.003 . PMID 22939981 . 
  27. ^ Сингх М., Аль-Эриани Дж., Карсуэлл С., Фергюсон Дж. М., Блэкберн Дж., Бартон К., Роден Д., Лучани Ф, Фан Т, Джунанкар С., Джексон К., Гуднау СС, Смит М. А., Сварбрик А. (2018). «Высокопроизводительное целевое долгосрочное секвенирование отдельных клеток выявляет клональный и транскрипционный ландшафт лимфоцитов» . bioRxiv . 10 (1): 3120. DOI : 10,1101 / 424945 . PMC 6635368 . PMID 31311926 .  
  28. ^ Sasagawa Y, Никайдо I, Hayashi T, H Danno, Uno KD, Имаи T, Ueda HR (апрель 2013). «Quartz-Seq: высоко воспроизводимый и чувствительный метод секвенирования одноклеточной РНК, выявляющий негенетическую гетерогенность экспрессии генов» . Геномная биология . 14 (4): R31. DOI : 10.1186 / GB-2013-14-4-R31 . PMC 4054835 . PMID 23594475 .  
  29. ^ Kouno Т, Moody Дж, Kwon АТ, Шибаяма Y, Като S, Y Хуанг и др. (Январь 2019). «C1 CAGE определяет сайты начала транскрипции и активность энхансера при разрешении одной клетки» . Nature Communications . 10 (1): 360. Bibcode : 2019NatCo..10..360K . DOI : 10.1038 / s41467-018-08126-5 . PMC 6341120 . PMID 30664627 .  
  30. ^ Даль Молин А, Ди Камилло В (2019). «Как разработать эксперимент по секвенированию одноклеточной РНК: подводные камни, проблемы и перспективы». Брифинги по биоинформатике . 20 (4): 1384–1394. DOI : 10.1093 / нагрудник / bby007 . PMID 29394315 . 
  31. ^ Петерсон В.М., Чжан К.Х., Кумар Н., Вонг Дж., Ли Л., Уилсон, округ Колумбия, и др. (Октябрь 2017 г.). «Мультиплексное количественное определение белков и транскриптов в отдельных клетках». Природа Биотехнологии . 35 (10): 936–939. DOI : 10.1038 / nbt.3973 . PMID 28854175 . S2CID 205285357 .  
  32. ^ Stoeckius M, Hafemeister C, Stephenson W, Houck-Loomis B, Chattopadhyay PK, Swerdlow H и др. (Сентябрь 2017 г.). «Одновременное измерение эпитопа и транскриптома в отдельных клетках» . Методы природы . 14 (9): 865–868. DOI : 10.1038 / nmeth.4380 . PMC 5669064 . PMID 28759029 .  
  33. Raj B, Wagner DE, McKenna A, Pandey S, Klein AM, Shendure J и др. (Июнь 2018). «Одновременное одноклеточное профилирование клонов и типов клеток в головном мозге позвоночных» . Природа Биотехнологии . 36 (5): 442–450. DOI : 10.1038 / nbt.4103 . PMC 5938111 . PMID 29608178 .  
  34. ^ Olmos D, Arkenau HT, Ang JE, Ledaki I, Attard G, Carden CP и др. (Январь 2009 г.). «Циркулирующие опухолевые клетки (ЦОК) считаются промежуточными конечными точками при устойчивом к кастрации раке простаты (CRPC): опыт одного центра» . Анналы онкологии . 20 (1): 27–33. DOI : 10.1093 / annonc / mdn544 . PMID 18695026 . 
  35. Levitin HM, Yuan J, Sims PA (апрель 2018 г.). "Одноклеточный транскриптомный анализ неоднородности опухоли" . Тенденции рака . 4 (4): 264–268. DOI : 10.1016 / j.trecan.2018.02.003 . PMC 5993208 . PMID 29606308 .  
  36. ^ Jerby-Арнон л, Шах Р, Куоко М.С., Родман С, Су МДж, Melms JC, и др. (Ноябрь 2018 г.). «Программа раковых клеток способствует исключению Т-клеток и устойчивости к блокаде контрольных точек» . Cell . 175 (4): 984–997.e24. DOI : 10.1016 / j.cell.2018.09.006 . PMC 6410377 . PMID 30388455 .  
  37. ^ Стивенсон В., Донлин Л. Т., Батлер А., Розо С., Бракен Б., Рашидфаррохи А. и др. (Февраль 2018). «Одноклеточная РНК-последовательность синовиальной ткани при ревматоидном артрите с использованием недорогих микрофлюидных инструментов» . Nature Communications . 9 (1): 791. Bibcode : 2018NatCo ... 9..791S . DOI : 10.1038 / s41467-017-02659-х . PMC 5824814 . PMID 29476078 .  
  38. ^ Авраам Р., Хэзли Н., Браун Д., Пенаранда С., Джиджон Х. Б., Тромбетта Дж. Дж. И др. (Сентябрь 2015 г.). «Изменчивость патогенов от клетки к клетке приводит к неоднородности иммунных ответов хозяина» . Cell . 162 (6): 1309–21. DOI : 10.1016 / j.cell.2015.08.027 . PMC 4578813 . PMID 26343579 .  
  39. ^ Цао Дж., Пакер Дж. С., Рамани В., Кусанович Д. А., Хюинь С., Даза Р. и др. (Август 2017 г.). «Комплексное одноклеточное транскрипционное профилирование многоклеточного организма» . Наука . 357 (6352): 661–667. Bibcode : 2017Sci ... 357..661C . DOI : 10.1126 / science.aam8940 . PMC 5894354 . PMID 28818938 .  
  40. ^ Пласс М, Солана Дж, Вольф Ф., АЙЮБ S, Misios А, Глазар Р, и др. (Май 2018). «Атлас клеточного типа и древо родословной всего сложного животного с помощью одноклеточной транскриптомики» . Наука . 360 (6391): eaaq1723. DOI : 10.1126 / science.aaq1723 . PMID 29674432 . 
  41. ^ Финчер CT, Вуртцель O де Хуг T, Kravarik KM, Reddien PW (май 2018). "Schmidtea mediterranea" . Наука . 360 (6391): eaaq1736. DOI : 10.1126 / science.aaq1736 . PMC 6563842 . PMID 29674431 .  
  42. Wagner DE, Weinreb C, Collins ZM, Briggs JA, Megason SG, Klein AM (июнь 2018 г.). «Одноклеточное картирование ландшафтов экспрессии генов и клонов в эмбрионе рыбок данио» . Наука . 360 (6392): 981–987. Bibcode : 2018Sci ... 360..981W . DOI : 10.1126 / science.aar4362 . PMC 6083445 . PMID 29700229 .  
  43. ^ Фаррелл JA, Ван Y, Riesenfeld SJ, Shekhar K, Regev A, Schier AF (июнь 2018). «Одноклеточная реконструкция траекторий развития во время эмбриогенеза рыбок данио» . Наука . 360 (6392): eaar3131. DOI : 10.1126 / science.aar3131 . PMC 6247916 . PMID 29700225 .  
  44. ^ Бриггс JA, Вайнреб C, Wagner DE, Megason S, L Пешкин, Киршнер MW, Klein AM (июнь 2018). «Динамика экспрессии генов в эмбриогенезе позвоночных при одноклеточном разрешении» . Наука . 360 (6392): eaar5780. DOI : 10.1126 / science.aar5780 . PMC 6038144 . PMID 29700227 .  
  45. ^ Ю Дж. «Научный прорыв 2018 года: отслеживание развития ячейка за ячейкой» . Научный журнал . Американская ассоциация развития науки.
  46. ^ а б Ли Х, Ловчи М.Т., Квон Ю.С., Розенфельд М.Г., Фу XD, Йео Г.В. (декабрь 2008 г.). «Определение плотности метки, необходимой для анализа цифрового транскриптома: приложение к андроген-чувствительной модели рака простаты» . Труды Национальной академии наук Соединенных Штатов Америки . 105 (51): 20179–84. Bibcode : 2008PNAS..10520179L . DOI : 10.1073 / pnas.0807121105 . PMC 2603435 . PMID 19088194 .  
  47. ^ a b Stegle O, Parts L, Piipari M, Winn J, Durbin R (февраль 2012 г.). «Использование вероятностной оценки остатков экспрессии (PEER) для получения повышенной мощности и интерпретируемости анализов экспрессии генов» . Протоколы природы . 7 (3): 500–7. DOI : 10.1038 / nprot.2011.457 . PMC 3398141 . PMID 22343431 .  
  48. Перейти ↑ Kingsford C, Patro R (июнь 2015 г.). «Основанное на ссылке сжатие коротко читаемых последовательностей с использованием кодирования пути» . Биоинформатика . 31 (12): 1920–8. DOI : 10.1093 / биоинформатики / btv071 . PMC 4481695 . PMID 25649622 .  
  49. ^ a b Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, et al. (Май 2011 г.). «Сборка транскриптома полной длины из данных RNA-Seq без эталонного генома» . Природа Биотехнологии . 29 (7): 644–52. DOI : 10.1038 / nbt.1883 . PMC 3571712 . PMID 21572440 .  
  50. ^ «Сборка De Novo с использованием Illumina Reads» (PDF) . Проверено 22 октября +2016 .
  51. ^ Zerbino DR, Birney E (май 2008). "Velvet: алгоритмы сборки короткого чтения de novo с использованием графов де Брейна" . Геномные исследования . 18 (5): 821–9. DOI : 10.1101 / gr.074492.107 . PMC 2336801 . PMID 18349386 .  
  52. ^ Oases: ассемблер транскриптомов для очень коротких чтений
  53. ^ Чанг З., Ли Г, Лю Дж, Чжан И, Эшби С., Лю Д. и др. (Февраль 2015 г.). «Бриджер: новая структура для сборки транскриптомов de novo с использованием данных RNA-seq» . Геномная биология . 16 (1): 30. DOI : 10.1186 / s13059-015-0596-2 . PMC 4342890 . PMID 25723335 .  
  54. ^ a b Ли Б., Филлмор Н., Бай И., Коллинз М., Томсон Дж. А., Стюарт Р., Дьюи К. Н. (декабрь 2014 г.). «Оценка сборок транскриптомов de novo по данным RNA-Seq» . Геномная биология . 15 (12): 553. DOI : 10.1186 / s13059-014-0553-5 . PMC 4298084 . PMID 25608678 .  
  55. ^ a b Добин А., Дэвис К.А., Шлезингер Ф., Дренкоу Дж., Залески С., Джа С. и др. (Январь 2013). «STAR: сверхбыстрый универсальный выравниватель RNA-seq» . Биоинформатика . 29 (1): 15–21. DOI : 10.1093 / биоинформатики / bts635 . PMC 3530905 . PMID 23104886 .  
  56. ^ Langmead B, C Trapnell, Pop M, Salzberg SL (2009). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с геномом человека» . Геномная биология . 10 (3): R25. DOI : 10.1186 / GB-2009-10-3-r25 . PMC 2690996 . PMID 19261174 .  
  57. ^ Trapnell C, Пэчтер L, Salzberg SL (май 2009). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq» . Биоинформатика . 25 (9): 1105–11. DOI : 10.1093 / биоинформатики / btp120 . PMC 2672628 . PMID 19289445 .  
  58. ^ Trapnell С, Робертс А, Гофф л, Pertea G, D Ким, Келли Д. Р., и др. (Март 2012 г.). «Дифференциальный анализ экспрессии генов и транскриптов в экспериментах с последовательностью РНК с TopHat и запонками» . Протоколы природы . 7 (3): 562–78. DOI : 10.1038 / nprot.2012.016 . PMC 3334321 . PMID 22383036 .  
  59. Перейти ↑ Liao Y, Smyth GK, Shi W (май 2013 г.). «Выравниватель Subread: быстрое, точное и масштабируемое отображение чтения по принципу seed-and-voice» . Исследования нуклеиновых кислот . 41 (10): e108. DOI : 10.1093 / NAR / gkt214 . PMC 3664803 . PMID 23558742 .  
  60. ^ Kim D, Langmead B, Salzberg SL (апрель 2015). «HISAT: выравниватель с быстрым сращиванием и малым объемом памяти» . Методы природы . 12 (4): 357–60. DOI : 10.1038 / nmeth.3317 . PMC 4655817 . PMID 25751142 .  
  61. ^ Patro R, Mount SM, Кингсфорд C (май 2014). «Sailfish обеспечивает количественную оценку изоформ без выравнивания по считыванию последовательности РНК с использованием легких алгоритмов» . Природа Биотехнологии . 32 (5): 462–4. arXiv : 1308,3700 . DOI : 10.1038 / nbt.2862 . PMC 4077321 . PMID 24752080 .  
  62. ^ Bray Н.Л., Пиментел Н, Melsted Р, Пэчтер л (май 2016). «Почти оптимальная вероятностная количественная оценка последовательности РНК». Природа Биотехнологии . 34 (5): 525–7. DOI : 10.1038 / nbt.3519 . PMID 27043002 . S2CID 205282743 .  
  63. Wu TD, Watanabe CK (май 2005 г.). «GMAP: программа геномного картирования и выравнивания последовательностей мРНК и EST» . Биоинформатика . 21 (9): 1859–75. DOI : 10.1093 / биоинформатики / bti310 . PMID 15728110 . 
  64. ^ Baruzzo G, Hayer KE, Ким Е.Ю., Ди Камилло B, Фитцджеральд Г.А., Грант GR (февраль 2017). «Комплексный бенчмаркинг на основе моделирования выравнивателей RNA-seq» . Методы природы . 14 (2): 135–139. DOI : 10.1038 / nmeth.4106 . PMC 5792058 . PMID 27941783 .  
  65. ^ Энгстрём П.Г., Steijger Т, Сипос В, Грант Р., Kahles А, Ratsch G, и др. (Декабрь 2013). «Систематическая оценка программ сплайсированного выравнивания для данных RNA-seq» . Методы природы . 10 (12): 1185–91. DOI : 10.1038 / nmeth.2722 . PMC 4018468 . PMID 24185836 .  
  66. Перейти ↑ Lu B, Zeng Z, Shi T (февраль 2013 г.). «Сравнительное исследование сборки de novo и стратегий сборки под геномом для реконструкции транскриптома на основе RNA-Seq» . Наука Китай Науки о жизни . 56 (2): 143–55. DOI : 10.1007 / s11427-013-4442-Z . PMID 23393030 . 
  67. ^ Bradnam KR, Fass JN, Alexandrov A, Baranay P, Bechner M, Birol I, et al. (Июль 2013). «Assemblathon 2: оценка de novo методов сборки генома у трех видов позвоночных» . GigaScience . 2 (1): 10. arXiv : 1301.5406 . Bibcode : 2013arXiv1301.5406B . DOI : 10.1186 / 2047-217X-2-10 . PMC 3844414 . PMID 23870653 .  
  68. ^ Greenbaum D, Colangelo C, Williams K, M Герштейн (2003). «Сравнение содержания белка и уровней экспрессии мРНК в геномной шкале» . Геномная биология . 4 (9): 117. DOI : 10,1186 / GB-2003-4-9-117 . PMC 193646 . PMID 12952525 .  
  69. ^ Чжан ZH, Jhaveri DJ, Маршалл В. М., Bauer DC, Edson J, Нарайанан РК и др. (Август 2014 г.). «Сравнительное исследование методов анализа дифференциальной экспрессии на данных RNA-Seq» . PLOS ONE . 9 (8): e103207. Bibcode : 2014PLoSO ... 9j3207Z . DOI : 10.1371 / journal.pone.0103207 . PMC 4132098 . PMID 25119138 .  
  70. Anders S, Pyl PT, Huber W (январь 2015 г.). «HTSeq - Python-фреймворк для работы с высокопроизводительными данными секвенирования» . Биоинформатика . 31 (2): 166–9. DOI : 10.1093 / биоинформатики / btu638 . PMC 4287950 . PMID 25260700 .  
  71. Перейти ↑ Liao Y, Smyth GK, Shi W (апрель 2014 г.). «featureCounts: эффективная программа общего назначения для сопоставления считываний последовательностей с геномными функциями». Биоинформатика . 30 (7): 923–30. arXiv : 1305,3347 . DOI : 10.1093 / биоинформатики / btt656 . PMID 24227677 . S2CID 15960459 .  
  72. ^ Schmid МВт, Grossniklaus U (февраль 2015). «Rcount: простой и гибкий подсчет чтения RNA-Seq» . Биоинформатика . 31 (3): 436–7. DOI : 10.1093 / биоинформатики / btu680 . PMID 25322836 . 
  73. ^ Finotello F, Lavezzo E, Bianco L, Barzon L, Mazzon P, Fontana P и др. (2014). «Снижение систематической ошибки в данных секвенирования РНК: новый подход к подсчетам» . BMC Bioinformatics . 15 Дополнение 1 (Дополнение 1): S7. DOI : 10,1186 / 1471-2105-15-s1-s7 . PMC 4016203 . PMID 24564404 .  
  74. Перейти ↑ Hashimoto TB, Edwards MD, Gifford DK (март 2014 г.). «Универсальная коррекция счета для высокопроизводительного секвенирования» . PLOS Вычислительная биология . 10 (3): e1003494. Bibcode : 2014PLSCB..10E3494H . DOI : 10.1371 / journal.pcbi.1003494 . PMC 3945112 . PMID 24603409 .  
  75. ^ a b Робинсон MD, Oshlack A (2010). «Метод масштабирования нормализации для анализа дифференциальной экспрессии данных РНК-seq» . Геномная биология . 11 (3): R25. DOI : 10.1186 / ГБ-2010-11-3-r25 . PMC 2864565 . PMID 20196867 .  
  76. ^ Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ и др. (Май 2010 г.). «Сборка и количественное определение транскриптов с помощью RNA-Seq выявляет неаннотированные транскрипты и переключение изоформ во время дифференцировки клеток» . Природа Биотехнологии . 28 (5): 511–5. DOI : 10.1038 / nbt.1621 . PMC 3146043 . PMID 20436464 .  
  77. ^ Пэчтер L (19 апреля 2011). «Модели для количественной оценки транскриптов из RNA-Seq». arXiv : 1104.3889 [ q-bio.GN ].
  78. ^ «Что такое FPKM? Обзор единиц экспрессии RNA-Seq» . Фарраго . 8 мая 2014 . Проверено 28 марта 2018 .
  79. Перейти ↑ Wagner GP, Kin K, Lynch VJ (декабрь 2012 г.). «Измерение количества мРНК с использованием данных RNA-seq: измерение RPKM несовместимо среди образцов». Теория в биологических науках = Theorie in den Biowissenschaften . 131 (4): 281–5. DOI : 10.1007 / s12064-012-0162-3 . PMID 22872506 . S2CID 16752581 .  
  80. ^ Эванс, Кьяран; Хардин, Джоанна; Штобель, Даниэль М. (28 сентября 2018 г.). «Выбор методов нормализации RNA-Seq между образцами с точки зрения их допущений» . Брифинги по биоинформатике . 19 (5): 776–792. DOI : 10.1093 / нагрудник / bbx008 . PMC 6171491 . PMID 28334202 .  
  81. ^ а б Ло CW, Чен Ю., Ши В., Смит Г.К. (февраль 2014 г.). «voom: прецизионные веса разблокируют инструменты анализа линейной модели для счетчиков чтения RNA-seq» . Геномная биология . 15 (2): R29. DOI : 10.1186 / GB-2014-15-2-R29 . PMC 4053721 . PMID 24485249 .  
  82. ^ а б Андерс S, Хубер W (2010). «Анализ дифференциальной экспрессии для данных подсчета последовательностей» . Геномная биология . 11 (10): R106. DOI : 10.1186 / ГБ-2010-11-10-r106 . PMC 3218662 . PMID 20979621 .  
  83. ^ a b Робинсон MD, McCarthy DJ, Smyth GK (январь 2010 г.). «edgeR: пакет Bioconductor для анализа дифференциальной экспрессии цифровых данных экспрессии генов» . Биоинформатика . 26 (1): 139–40. DOI : 10.1093 / биоинформатики / btp616 . PMC 2796818 . PMID 19910308 .  
  84. ^ Marguerat S, Шмидт А, Codlin S, Чен Вт, Aebersold R, Bähler J (октябрь 2012 г.). «Количественный анализ транскриптомов и протеомов делящихся дрожжей в пролиферирующих и покоящихся клетках» . Cell . 151 (3): 671–83. DOI : 10.1016 / j.cell.2012.09.019 . PMC 3482660 . PMID 23101633 .  
  85. ^ Owens ND, Blitz IL, Lane MA, Patrushev I, Overton JD, Gilchrist MJ, et al. (Январь 2016 г.). «Измерение абсолютного числа копий РНК при высоком временном разрешении выявляет кинетику транскриптома в развитии» . Отчеты по ячейкам . 14 (3): 632–647. DOI : 10.1016 / j.celrep.2015.12.050 . PMC 4731879 . PMID 26774488 .  
  86. ^ Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK (апрель 2015 г.). «Limma поддерживает анализ дифференциальной экспрессии для секвенирования РНК и исследований микрочипов» . Исследования нуклеиновых кислот . 43 (7): e47. DOI : 10.1093 / NAR / gkv007 . PMC 4402510 . PMID 25605792 .  
  87. ^ «Биокондуктор - программное обеспечение с открытым исходным кодом для биоинформатики» .
  88. ^ Хубер В., Кэри В.Дж., Джентльмен Р., Андерс С., Карлсон М., Карвалью Б.С. и др. (Февраль 2015 г.). «Организация высокопроизводительного геномного анализа с помощью Bioconductor» . Методы природы . 12 (2): 115–21. DOI : 10.1038 / nmeth.3252 . PMC 4509590 . PMID 25633503 .  
  89. ^ Порей JT Стори JD (сентябрь 2007). «Захват гетерогенности в исследованиях экспрессии генов с помощью анализа суррогатных переменных» . PLOS Genetics . 3 (9): 1724–35. DOI : 10.1371 / journal.pgen.0030161 . PMC 1994707 . PMID 17907809 .  
  90. ^ Пиментел Н, Bray Н.Л., Пуэнте S, Melsted Р, Пэчтер л (июль 2017 г.). «Дифференциальный анализ RNA-seq с учетом неопределенности количественного определения». Методы природы . 14 (7): 687–690. DOI : 10.1038 / nmeth.4324 . PMID 28581496 . S2CID 15063247 .  
  91. ^ Trapnell С, Хендриксон Д.Г., Соважо М, Гофф л, Ринн ДЛ, Пэчтер л (январь 2013 г. ). «Дифференциальный анализ регуляции генов при разрешении транскриптов с помощью RNA-seq» (PDF) . Природа Биотехнологии . 31 (1): 46–53. DOI : 10.1038 / nbt.2450 . PMC 3869392 . PMID 23222703 .   
  92. ^ Frazee AC, Pertea G, Джаффе AE, Langmead B, Salzberg SL, порей JT (март 2015). «Ballgown устраняет разрыв между сборкой транскриптома и анализом экспрессии» . Природа Биотехнологии . 33 (3): 243–6. DOI : 10.1038 / nbt.3172 . PMC 4792117 . PMID 25748911 .  
  93. ^ a b Сахрейан С.М., Мохиюддин М., Себра Р., Тилгнер Х., Афшар П.Т., Ау К.Ф. и др. (Июль 2017 г.). «Получение всестороннего биологического понимания транскриптома путем выполнения анализа РНК-секвенирования широкого спектра» . Nature Communications . 8 (1): 59. Bibcode : 2017NatCo ... 8 ... 59S . DOI : 10.1038 / s41467-017-00050-4 . PMC 5498581 . PMID 28680106 .  
  94. ^ Ziemann M, Эрен Y, Эль-Ост A (август 2016). «Ошибки в названиях генов широко распространены в научной литературе» . Геномная биология . 17 (1): 177. DOI : 10.1186 / s13059-016-1044-7 . PMC 4994289 . PMID 27552985 .  
  95. ^ Soneson C, Delorenzi M (март 2013). «Сравнение методов анализа дифференциальной экспрессии данных RNA-seq» . BMC Bioinformatics . 14 : 91. DOI : 10,1186 / 1471-2105-14-91 . PMC 3608160 . PMID 23497356 .  
  96. ^ Фонсека Н.А., Marioni Дж, Brazma (30 сентября 2014). «Профилирование генов RNA-Seq - систематическое эмпирическое сравнение» . PLOS ONE . 9 (9): e107026. Bibcode : 2014PLoSO ... 9j7026F . DOI : 10.1371 / journal.pone.0107026 . PMC 4182317 . PMID 25268973 .  
  97. ^ Seyednasrollah F, Laiho A, Elo LL (январь 2015). «Сравнение программных пакетов для обнаружения дифференциальной экспрессии в исследованиях RNA-seq» . Брифинги по биоинформатике . 16 (1): 59–70. DOI : 10.1093 / нагрудник / bbt086 . PMC 4293378 . PMID 24300110 .  
  98. ^ Rapaport F, Khanin R, Liang Y, Pirun M, Krek A, Zumbo P и др. (2013). «Комплексная оценка методов дифференциального анализа экспрессии генов по данным RNA-seq» . Геномная биология . 14 (9): R95. DOI : 10.1186 / GB-2013-14-9-R95 . PMC 4054597 . PMID 24020486 .  
  99. ^ Конес А, Мадригал Р, Таразон S, Гомес-Кабреро Д, Сервер А, МакФерсон А, и др. (Январь 2016 г.). «Обзор лучших практик анализа данных RNA-seq» . Геномная биология . 17 (1): 13. DOI : 10.1186 / s13059-016-0881-8 . PMC 4728800 . PMID 26813401 .  
  100. Перейти ↑ Costa-Silva J, Domingues D, Lopes FM (21 декабря 2017 г.). «Анализ дифференциальной экспрессии RNA-Seq: расширенный обзор и программный инструмент» . PLOS ONE . 12 (12): e0190152. Bibcode : 2017PLoSO..1290152C . DOI : 10.1371 / journal.pone.0190152 . PMC 5739479 . PMID 29267363 .  
  101. ^ a b Керен Х., Лев-Маор Г., Аст Г. (май 2010 г.). «Альтернативный сплайсинг и эволюция: диверсификация, определение экзона и функция». Обзоры природы. Генетика . 11 (5): 345–55. DOI : 10.1038 / nrg2776 . PMID 20376054 . S2CID 5184582 .  
  102. Перейти ↑ Liu R, Loraine AE, Dickerson JA (декабрь 2014 г.). «Сравнение вычислительных методов для дифференциального обнаружения альтернативного сплайсинга с использованием RNA-seq в растительных системах» . BMC Bioinformatics . 15 (1): 364. DOI : 10,1186 / s12859-014-0364-4 . PMC 4271460 . PMID 25511303 .  
  103. ^ Пэчтер, Лиор (19 апреля 2011). «Модели для количественной оценки транскриптов из RNA-Seq». arXiv : 1104.3889 [ q-bio.GN ].
  104. ↑ a b Li YI, Knowles DA, Humphrey J, Barbeira AN, Dickinson SP, Im HK, Pritchard JK (январь 2018 г.). «Количественная оценка сплайсинга РНК без аннотаций с использованием LeafCutter» . Генетика природы . 50 (1): 151–158. DOI : 10.1038 / s41588-017-0004-9 . PMC 5742080 . PMID 29229983 .  
  105. Перейти ↑ Anders S, Reyes A, Huber W (октябрь 2012 г.). «Обнаружение дифференциального использования экзонов из данных RNA-seq» . Геномные исследования . 22 (10): 2008–17. DOI : 10.1101 / gr.133744.111 . PMC 3460195 . PMID 22722343 .  
  106. ^ Шен С., Пак Дж. В., Хуанг Дж., Дитмар К. А., Лу З. X, Чжоу К. и др. (Апрель 2012 г.). «MATS: байесовская структура для гибкого обнаружения дифференциального альтернативного сплайсинга из данных RNA-Seq» . Исследования нуклеиновых кислот . 40 (8): e61. DOI : 10.1093 / NAR / gkr1291 . PMC 3333886 . PMID 22266656 .  
  107. Перейти ↑ Wang X, Cairns MJ (июнь 2014 г.). «SeqGSEA: пакет Bioconductor для анализа обогащения набора генов данных РНК-Seq, интегрирующий дифференциальную экспрессию и сплайсинг» . Биоинформатика . 30 (12): 1777–9. DOI : 10.1093 / биоинформатики / btu090 . PMID 24535097 . 
  108. ^ Trapnell С, Хендриксон Д.Г., Соважо М, Гофф л, Ринн ДЛ, Пэчтер л (январь 2013 г. ). «Дифференциальный анализ регуляции генов при разрешении транскриптов с помощью RNA-seq» . Природа Биотехнологии . 31 (1): 46–53. DOI : 10.1038 / nbt.2450 . PMC 3869392 . PMID 23222703 .  
  109. ^ Ху Y, Хуанг Y, Du Y, Orellana CF, Singh D, Johnson AR и др. (Январь 2013). «DiffSplice: обнаружение в масштабе всего генома событий дифференциального сплайсинга с помощью RNA-seq» . Исследования нуклеиновых кислот . 41 (2): e39. DOI : 10.1093 / NAR / gks1026 . PMC 3553996 . PMID 23155066 .  
  110. ^ Вакеро-Гарсиа Дж, Баррера А, Gazzara М.Р., Гонсалес-Vallinas Дж, Lahens NF, Hogenesch JB, и др. (Февраль 2016 г.). «Новый взгляд на сложность и регуляцию транскриптома через призму локальных вариаций сплайсинга» . eLife . 5 : e11752. DOI : 10.7554 / eLife.11752 . PMC 4801060 . PMID 26829591 .  
  111. ^ Merino Г.А., Conesa А, Фернандес EA (март 2019). «Сравнительный анализ рабочих процессов для обнаружения дифференциального сплайсинга и дифференциальной экспрессии на уровне изоформ в исследованиях человеческих последовательностей РНК». Брифинги по биоинформатике . 20 (2): 471–481. DOI : 10.1093 / нагрудник / bbx122 . PMID 29040385 . S2CID 22706028 .  
  112. ^ a b Marcotte EM, Pellegrini M, Thompson MJ, Yeates TO, Eisenberg D (ноябрь 1999 г.). «Комбинированный алгоритм для предсказания функции белка в масштабе всего генома». Природа . 402 (6757): 83–6. Bibcode : 1999Natur.402 ... 83M . DOI : 10.1038 / 47048 . PMID 10573421 . S2CID 144447 .  
  113. ^ a b Джорджи FM, Дель Фаббро C, Ликаузи F (март 2013 г.). «Сравнительное исследование сетей коэкспрессии на основе РНК-секвенций и микрочипов у Arabidopsis thaliana» . Биоинформатика . 29 (6): 717–24. DOI : 10.1093 / биоинформатики / btt053 . PMID 23376351 . 
  114. ^ Янку ОД, Kawane S, Bottomly D, Сирлс R, R Hitzemann, McWeeney S (июнь 2012). «Использование данных RNA-Seq для вывода сети de novo coexpression» . Биоинформатика . 28 (12): 1592–7. DOI : 10.1093 / биоинформатики / bts245 . PMC 3493127 . PMID 22556371 .  
  115. ^ Eksi R, Li HD, Менон R, Wen Y, Omenn GS, Kretzler M, Гуань Y (ноябрь 2013). «Систематическая дифференциация функций для альтернативно сплайсированных изоформ посредством интеграции данных RNA-seq» . PLOS Вычислительная биология . 9 (11): e1003314. Bibcode : 2013PLSCB ... 9E3314E . DOI : 10.1371 / journal.pcbi.1003314 . PMC 3820534 . PMID 24244129 .  
  116. Li HD, Menon R, Omenn GS, Guan Y (август 2014 г.). «Наступающая эра интеграции геномных данных для анализа функции изоформ сплайсинга» . Тенденции в генетике . 30 (8): 340–7. DOI : 10.1016 / j.tig.2014.05.005 . PMC 4112133 . PMID 24951248 .  
  117. ^ Foroushani A, Agrahari R, Docking R, Chang L, Duns G, Hudoba M и др. (Март 2017 г.). «Крупномасштабный анализ генной сети показывает важность пути внеклеточного матрикса и генов гомеобокса при остром миелоидном лейкозе: введение в пакет Pigengene и его приложения» . BMC Medical Genomics . 10 (1): 16. DOI : 10,1186 / s12920-017-0253-6 . PMC 5353782 . PMID 28298217 .  
  118. ^ Ли Х, Хандакер Б., Вайсокер А., Феннелл Т., Руан Дж, Гомер Н. и др. (Август 2009 г.). «Формат выравнивания / карты последовательностей и SAMtools» . Биоинформатика . 25 (16): 2078–9. DOI : 10.1093 / биоинформатики / btp352 . PMC 2723002 . PMID 19505943 .  
  119. ^ ДеПристо М.А., Бэнкс Э., Поплин Р., Гаримелла К.В., Магуайр Дж. Р., Хартл С. и др. (Май 2011 г.). «Основа для открытия вариаций и генотипирования с использованием данных секвенирования ДНК следующего поколения» . Генетика природы . 43 (5): 491–8. DOI : 10.1038 / ng.806 . PMC 3083463 . PMID 21478889 .  
  120. Battle A, Brown CD, Engelhardt BE, Montgomery SB (октябрь 2017 г.). «Генетические эффекты на экспрессию генов в тканях человека» . Природа . 550 (7675): 204–213. Bibcode : 2017Natur.550..204A . DOI : 10.1038 / nature24277 . PMC 5776756 . PMID 29022597 .  
  121. ^ Рихтер Ф., Хоффман Г.Е., Манхеймер КБ, Патель Н., Шарп А.Дж., Маккин Д. и др. (Март 2019 г.). «ORE определяет экстремальные эффекты экспрессии, обогащенные редкими вариантами» . Биоинформатика . 35 (20): 3906–3912. DOI : 10.1093 / биоинформатики / btz202 . PMC 6792115 . PMID 30903145 .  
  122. Перейти ↑ Teixeira MR (декабрь 2006 г.). «Рецидивирующие онкогены слияния при карциномах». Критические обзоры онкогенеза . 12 (3–4): 257–71. DOI : 10.1615 / critrevoncog.v12.i3-4.40 . PMID 17425505 . 
  123. ^ Вебер AP (ноябрь 2015 г.). «Открытие новой биологии через секвенирование РНК» . Физиология растений . 169 (3): 1524–31. DOI : 10.1104 / pp.15.01081 . PMC 4634082 . PMID 26353759 .  
  124. ^ Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A и др. (Сентябрь 2006 г.). «Анализ транскриптома клеточной линии рака простаты LNCaP с использованием подхода секвенирования путем синтеза» . BMC Genomics . 7 : 246. DOI : 10.1186 / 1471-2164-7-246 . PMC 1592491 . PMID 17010196 .  
  125. Cheung F, Haas BJ, Goldberg SM, May GD, Xiao Y, Town CD (октябрь 2006 г.). «Секвенирование Medicago truncatula экспрессировало секвенированные метки с использованием технологии 454 Life Sciences» . BMC Genomics . 7 : 272. DOI : 10.1186 / 1471-2164-7-272 . PMC 1635983 . PMID 17062153 .  
  126. ^ Emrich SJ, Barbazuk WB, Li L, Schnable PS (январь 2007). «Открытие и аннотация генов с использованием секвенирования транскриптома LCM-454» . Геномные исследования . 17 (1): 69–73. DOI : 10.1101 / gr.5145806 . PMC 1716268 . PMID 17095711 .  
  127. ^ Вебер П., Вебер KL, Карр K, Вилкерсон C, Ohlrogge JB (май 2007). «Отбор образцов транскриптома Arabidopsis с массовым параллельным пиросеквенированием» . Физиология растений . 144 (1): 32–42. DOI : 10.1104 / pp.107.096677 . PMC 1913805 . PMID 17351049 .  
  128. ^ Нагалакшми U, Ван Z, Waern К, Шо С, D Раха, Герштейн М, М Снайдер (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК» . Наука . 320 (5881): 1344–9. Bibcode : 2008Sci ... 320.1344N . DOI : 10.1126 / science.1158441 . PMC 2951732 . PMID 18451266 .  
  129. ^ Lister R, OMalley RC, Tonti-Filippini J, Грегори BD, Berry CC, Миллар AH, Экер JR (май 2008). "Высокоинтегрированные карты с одним базовым разрешением эпигенома у Arabidopsis" . Cell . 133 (3): 523–536. DOI : 10.1016 / j.cell.2008.03.029 . PMC 2723732 . PMID 18423832 .  
  130. ^ Сандберг, Рикард (2013-12-30). «Вступая в эру транскриптомики одиночных клеток в биологии и медицине» . Методы природы . 11 (1): 22–24. DOI : 10.1038 / nmeth.2764 . ISSN 1548-7091 . PMID 24524133 . S2CID 27632439 .   
  131. ^ «КОДИРОВАТЬ матрицу данных» . Проверено 28 июля 2013 .
  132. ^ "Атлас генома рака - портал данных" . Проверено 28 июля 2013 .

Внешние ссылки [ править ]

  • RNA-Seq для всех : руководство высокого уровня по разработке и реализации эксперимента RNA-Seq.
  • Тагучи, Ю.-х. (2019). «Сравнительный транскриптомический анализ». Энциклопедия биоинформатики и вычислительной биологии . С. 814–818. DOI : 10.1016 / B978-0-12-809633-8.20163-5 . ISBN 9780128114322.
  • Справочный модуль по естественным наукам