Эта статья была опубликована в рецензируемом журнале PLOS Computational Biology (2017). Щелкните, чтобы просмотреть опубликованную версию.
Это хорошая статья. Для получения дополнительной информации нажмите здесь.
Из Википедии, свободной энциклопедии
  (Перенаправлено из Transcriptomics )
Перейти к навигации Перейти к поиску

Технологии транскриптомики - это методы, используемые для изучения транскриптома организма , суммы всех его транскриптов РНК . Информационное содержание организма записывается в ДНК его генома и выражается посредством транскрипции . Здесь мРНК служит временной промежуточной молекулой в информационной сети, в то время как некодирующие РНК выполняют дополнительные разнообразные функции. Транскриптом фиксирует моментальный снимок общего количества транскриптов, присутствующих в клетке.. Технологии транскриптомики обеспечивают широкое представление о том, какие клеточные процессы активны, а какие бездействуют. Основная проблема молекулярной биологии заключается в понимании того, как один и тот же геном может давать начало различным типам клеток и как регулируется экспрессия генов.

Первые попытки изучить полные транскриптомы начались в начале 1990-х годов. Последующие технологические достижения с конца 1990-х годов неоднократно трансформировали эту область и сделали транскриптомику широко распространенной дисциплиной в биологических науках. В этой области используются два ключевых современных метода: микроматрицы , которые позволяют количественно определять набор заранее определенных последовательностей, и RNA-Seq , в котором используется высокопроизводительное секвенирование.для записи всех стенограмм. По мере совершенствования технологии объем данных, производимых каждым экспериментом с транскриптомом, увеличивался. В результате методы анализа данных постоянно адаптируются для более точного и эффективного анализа постоянно растущих объемов данных. Базы данных транскриптомов росли, и их полезность увеличивалась по мере того, как исследователи собирают и распространяют больше транскриптомов. Было бы почти невозможно интерпретировать информацию, содержащуюся в транскриптоме, без контекста предыдущих экспериментов.

Измерение экспрессии генов организма в разных тканях или условиях или в разное время дает информацию о том, как гены регулируются, и раскрывает детали биологии организма. Его также можно использовать для определения функций ранее не аннотированных генов. Анализ транскриптома позволил изучить, как изменяется экспрессия генов у разных организмов, и сыграл важную роль в понимании болезней человека . Анализ экспрессии генов в целом позволяет выявить широкие согласованные тенденции, которые невозможно выявить с помощью более целенаправленных анализов .

История [ править ]

Использование метода транскриптомики с течением времени. Опубликованные статьи, относящиеся к RNA-Seq (черный), микроматрице РНК (красный), метке экспрессируемой последовательности (синий), цифровому дифференциальному дисплею (зеленый) и серийному / кэп-анализу экспрессии генов (желтый) с 1990 года [1].

Транскриптомика характеризовалась развитием новых методов, которые переопределяли то, что возможно, каждые десять лет или около того и делали предыдущие технологии устаревшими. Первая попытка захвата частичного транскриптома человека была опубликована в 1991 году и сообщила о 609 последовательностях мРНК из человеческого мозга . [2] В 2008 году были опубликованы два человеческих транскриптома, состоящие из миллионов производных от транскриптов последовательностей, охватывающих 16 000 генов, [3] [4], а к 2015 году были опубликованы транскриптомы для сотен людей. [5] [6] Транскриптомы различных болезненных состояний, тканей или даже отдельных клеток.теперь обычно генерируются. [6] [7] [8] Этот взрыв в транскриптомике был вызван быстрым развитием новых технологий с повышенной чувствительностью и экономичностью. [9] [10] [11] [12]

Перед транскриптомикой [ править ]

Исследования отдельных транскриптов проводились за несколько десятилетий до того, как стали доступны какие-либо подходы к транскриптомике. Библиотеки из шелкопряда транскриптов мРНК были собраны и преобразованы в комплементарной ДНК (кДНК) для хранения с помощью обратной транскриптазы в конце 1970 - х годов. [13] В 1980-х годах низкопроизводительное секвенирование с использованием метода Сэнгера использовалось для секвенирования случайных транскриптов с получением тегов экспрессируемой последовательности (EST). [2] [14] [15] [16] Зангер метод секвенирования преобладал до появлениявысокопроизводительные методы, такие как секвенирование путем синтеза (Solexa / Illumina). EST приобрели известность в 1990-х годах как эффективный метод определения содержания генов в организме без секвенирования всего генома . [16] Количества отдельных транскриптов были определены количественно с использованием Нозерн-блоттинга , нейлоновых мембранных массивов и более поздних методов количественной ПЦР с обратной транскриптазой (RT-qPCR), [17] [18], но эти методы трудоемки и могут захватить только крошечный фрагмент транскриптом. [12] Следовательно, способ, которым транскриптом в целом экспрессируется и регулируется, оставался неизвестным до тех пор, пока не были разработаны методы с более высокой пропускной способностью.

Ранние попытки [ править ]

Слово «транскриптом» впервые было использовано в 1990-х годах. [19] [20] В 1995 году был разработан один из первых транскриптомных методов, основанный на секвенировании, последовательный анализ экспрессии генов (SAGE), который работал с секвенированием по Сэнгеру конкатенированных случайных фрагментов транскриптов. [21] Транскрипты были количественно определены путем сопоставления фрагментов с известными генами. Также кратко использовался вариант SAGE с использованием методов высокопроизводительного секвенирования, называемый цифровым анализом экспрессии генов. [9] [22] Однако эти методы в значительной степени уступили место высокопроизводительному секвенированию полных транскриптов, которое предоставило дополнительную информацию о структуре транскриптов, например, о вариантах сплайсинга .[9]

Развитие современных техник [ править ]

Доминирующие современные методы, микроматрицы и RNA-Seq , были разработаны в середине 1990-х и 2000-х годах. [9] [33] Микроматрицы, которые измеряют численность определенного набора транскриптов посредством их гибридизации с массивом комплементарных зондов, были впервые опубликованы в 1995 году. [34] [35] Технология микроматриц позволяла анализировать тысячи транскриптов одновременно и при значительно сниженная стоимость одного гена и экономия труда. [36] Как пятнистые массивы олигонуклеотидов, так и Affymetrix.массивы высокой плотности были методом выбора для транскрипционного профилирования до конца 2000-х годов. [12] [33] За этот период был произведен ряд микрочипов, чтобы охватить известные гены в модельных или экономически важных организмах. Достижения в разработке и производстве наборов улучшили специфичность зондов и позволили тестировать большее количество генов на одном массиве. Достижения в области обнаружения флуоресценции повысили чувствительность и точность измерения транскриптов с низким содержанием. [35] [37]

RNA-Seq осуществляется путем обратной транскрипции РНК in vitro и секвенирования полученных кДНК . [10] Обилие транскриптов определяется количеством отсчетов для каждого транскрипта. Таким образом, на этот метод сильно повлияло развитие технологий высокопроизводительного секвенирования . [9] [11] Массивно-параллельное секвенирование сигнатур (MPSS) было ранним примером, основанным на создании последовательностей из 16-20  п.н. посредством сложной серии гибридизаций , [38] [примечание 1] и использовалось в 2004 году для проверки экспрессии десяти тысячи генов у Arabidopsis thaliana . [39]Самая ранняя работа RNA-Seq была опубликована в 2006 году, когда сто тысяч транскриптов секвенировались с использованием технологии 454 . [40] Этого покрытия было достаточно для количественной оценки относительного количества транскриптов. Популярность RNA-Seq начала расти после 2008 года, когда новые технологии Solexa / Illumina позволили записать один миллиард последовательностей транскриптов. [4] [10] [41] [42] Теперь этот результат позволяет количественно определять и сравнивать человеческие транскриптомы. [43]

Сбор данных [ править ]

Получение данных о транскриптах РНК может быть достигнуто с помощью одного из двух основных принципов: секвенирования отдельных транскриптов ( EST или RNA-Seq) или гибридизации транскриптов с упорядоченным массивом нуклеотидных зондов (микроматрицы). [23]

Выделение РНК [ править ]

Все транскриптомные методы требуют, чтобы сначала была выделена РНК из экспериментального организма, прежде чем можно будет записать транскрипты. Хотя биологические системы невероятно разнообразны, экстракция РНК метода в целом аналогична и включает механическое разрушение клеток или тканей, нарушение РНКазы с хаотропными солями , [44] разрушение макромолекул и нуклеотидных комплексов, разделение РНКА от нежелательных биомолекул , включая ДНК и концентраций РНК осаждением из раствора или элюированием из твердой матрицы . [44] [45] Изолированную РНК можно дополнительно обработатьДНКаза для переваривания любых следов ДНК. [46] Необходимо обогатить информационную РНК, поскольку экстракты общей РНК обычно на 98% состоят из рибосомальной РНК . [47] Обогащение транскриптов может быть выполнено методами поли-А- аффинности или истощением рибосомной РНК с использованием зондов, специфичных для последовательности. [48] Деградированная РНК может повлиять на последующие результаты; например, обогащение мРНК из деградированных образцов приведет к истощению 5'-концов мРНК и неравномерному сигналу по длине транскрипта. Типичным является мгновенное замораживание ткани перед выделением РНК, и после завершения выделения предпринимаются меры по снижению воздействия ферментов РНКазы. [45]

Выраженные теги последовательности [ править ]

Выражается последовательность тэгов (EST) представляет собой короткий нуклеотидная последовательность генерируется из одной РНК - транскрипта. РНК сначала копируется как комплементарная ДНК (кДНК) ферментом обратной транскриптазы, прежде чем полученная кДНК секвенируется. [16] Поскольку EST можно собирать без предварительного знания организма, из которого они происходят, их можно приготовить из смесей организмов или образцов окружающей среды. [49] [16] Хотя сейчас используются высокопроизводительные методы, библиотеки EST обычно предоставляли информацию о последовательностях для ранних дизайнов микрочипов; например, микрочип ячменя был разработан из 350 000 секвенированных ранее EST. [50]

Серийный и ограничительный анализ экспрессии генов (SAGE / CAGE) [ править ]

Краткое содержание SAGE . Внутри организмов гены транскрибируются и сплайсируются (у эукариот ) с образованием зрелых транскриптов мРНК (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную двухцепочечную кДНК ( ds - кДНК ; синий). В SAGE ds-кДНК расщепляется рестрикционными ферментами (в положении «X» и «X» + 11) с образованием 11-нуклеотидных «меточных» фрагментов. Эти теги объединяются и секвенируются с использованием длинночитаемого секвенирования по Сэнгеру (разные оттенки синего указывают на теги из разных генов). Последовательностидеконволюция, чтобы найти частоту каждого тега. Частота метки может использоваться для отчета о транскрипции гена, из которого произошла метка. [51]

Последовательный анализ экспрессии генов (SAGE) был развитием методологии EST для увеличения пропускной способности генерируемых тегов и обеспечения возможности некоторого количественного определения количества транскриптов. [21] кДНК генерируется из РНК, но затем расщепляется на «теговые» фрагменты размером 11 п.н. с использованием рестрикционных ферментов, которые разрезают ДНК по определенной последовательности и 11 парам оснований вдоль этой последовательности. Эти теги кДНК затем соединяются « голова к хвосту» в длинные цепи (> 500 п.н.) и секвенируются с использованием методов с низкой пропускной способностью, но с большой длиной считывания, таких как секвенирование по Сенгеру . Затем последовательности делятся обратно на их исходные теги размером 11 пар оснований с использованием компьютерного программного обеспечения в процессе, называемом деконволюцией .[21] Еслидоступен эталонный геном , эти теги могут быть сопоставлены с их соответствующим геном в геноме. Если эталонный геном недоступен, теги можно напрямую использовать в качестве диагностических маркеров, если будет обнаружено, что они по- разному выражаются в болезненном состоянии. [21]

Метод экспрессии генов кэп-анализа (CAGE) представляет собой вариант SAGE, который устанавливает последовательность тегов только с 5'-конца транскрипта мРНК. [52] Таким образом, сайт начала транскрипции генов может быть идентифицирован, когда теги выровнены по эталонному геному. Идентификация сайтов старта генов используется для анализа промоторов и для клонирования полноразмерных кДНК.

Методы SAGE и CAGE позволяют получить информацию о большем количестве генов, чем было возможно при секвенировании отдельных EST, но подготовка образцов и анализ данных обычно более трудозатратны. [52]

Микроматрицы [ править ]

Резюме микрочипов ДНК . Внутри организмов гены транскрибируются и сплайсируются (у эукариот) с образованием зрелых транскриптов мРНК (красный). МРНК извлекается из организма, и обратная транскриптаза используется для копирования мРНК в стабильную дц-кДНК (синий). В микрочипах ds-кДНК фрагментирована и флуоресцентно помечена (оранжевый). Меченые фрагменты связываются с упорядоченным массивом комплементарных олигонуклеотидов, и измерение интенсивности флуоресценции в массиве указывает на наличие заранее определенного набора последовательностей. Эти последовательности обычно специально выбирают, чтобы сообщить об интересующих генах в геноме организма. [51]

Принципы и достижения [ править ]

Микроматрицы состоят из коротких нуклеотидных олигомеров , известных как « зонды », которые обычно выстраиваются в виде сетки на предметном стекле. [53] Обилие транскриптов определяется гибридизацией флуоресцентно меченных транскриптов с этими зондами. [54] интенсивность флуоресценции в каждом месте зонда на массиве указывает на обилие транскрипта для этой последовательности зонда. [54]

Микромассивы требуют некоторых геномных знаний от интересующего организма, например, в форме аннотированной последовательности генома или библиотеки EST, которые можно использовать для создания зондов для массива. [36]

Методы [ править ]

Микроматрицы для транскриптомики обычно попадают в одну из двух широких категорий: пятнистые массивы низкой плотности или массивы коротких зондов высокой плотности. Обилие транскриптов определяется по интенсивности флуоресценции, полученной от транскриптов, меченных флуорофором, которые связываются с массивом. [36]

Пятнистые массивы с низкой плотностью обычно содержат пиколитровые [примечание 2] капли ряда очищенных кДНК, размещенных на поверхности предметного стекла. [55] Эти зонды длиннее, чем у массивов с высокой плотностью, и не могут идентифицировать альтернативные события сплайсинга . В пятнистых массивах используются два разных флуорофора для маркировки тестируемого и контрольного образцов, а соотношение флуоресценции используется для расчета относительной меры численности. [56] В массивах высокой плотности используется одна флуоресцентная метка, и каждый образец гибридизируется и детектируется индивидуально. [57] Массивы высокой плотности были популяризированы Affymetrix GeneChip.массив, где каждый транскрипт количественно с помощью нескольких коротких 25 -mer зондов , которые вместе для анализа одного гена. [58]

Массивы NimbleGen представляли собой массивы высокой плотности, полученные методом фотохимии без масок , что позволяло гибко производить массивы в малых или больших количествах. Эти массивы содержали 100000 зондов, содержащих от 45 до 85 элементов, и были гибридизированы с образцом, помеченным одним цветом, для анализа экспрессии. [59] Некоторые дизайны включали до 12 независимых массивов на слайд.

RNA-Seq [ править ]

Резюме RNA-Seq . Внутри организмов гены транскрибируются и сплайсируются (у эукариот) с образованием зрелых транскриптов мРНК (красный). МРНК извлекается из организма, фрагментируется и копируется в стабильную дц-кДНК (синий). Дц-кДНК секвенируют с использованием высокопроизводительных методов секвенирования с коротким считыванием. Затем эти последовательности можно выровнять с эталонной последовательностью генома, чтобы реконструировать, какие участки генома транскрибировались. Эти данные можно использовать для аннотации, где находятся экспрессируемые гены, их относительные уровни экспрессии и любые альтернативные варианты сплайсинга. [51]

Принципы и достижения [ править ]

RNA-Seq относится к комбинации методологии высокопроизводительного секвенирования с вычислительными методами для захвата и количественной оценки транскриптов, присутствующих в экстракте РНК. [10] Генерируемые нуклеотидные последовательности обычно имеют длину около 100 п.н., но могут варьироваться от 30 п.н. до более 10 000 п.н. в зависимости от используемого метода секвенирования. RNA-Seq использует глубокую выборку транскриптома с множеством коротких фрагментов транскриптома, чтобы обеспечить вычислительную реконструкцию исходного транскрипта РНК путем выравнивания считываний с эталонным геномом или друг с другом ( сборка de novo ). [9] РНК как с низким, так и с высоким содержанием могут быть количественно определены в эксперименте RNA-Seq (динамический диапазон 5 порядков ) - ключевое преимущество перед транскриптомами микрочипов. Кроме того, количество входящей РНК намного ниже для RNA-Seq (количество в нанограммах) по сравнению с микрочипами (количество в микрограммах), что позволяет более точно исследовать клеточные структуры вплоть до уровня одной клетки в сочетании с линейной амплификацией кДНК. [25] [60] Теоретически не существует верхнего предела количественной оценки в RNA-Seq, а фоновый шум очень низкий для считывания 100 п.н. в неповторяющихся областях. [10]

RNA-Seq может использоваться для идентификации генов в геноме или определения того, какие гены активны в конкретный момент времени, а счетчик считываний может использоваться для точного моделирования относительного уровня экспрессии генов. Методология RNA-Seq постоянно совершенствуется, в первую очередь за счет развития технологий секвенирования ДНК для увеличения пропускной способности, точности и длины считывания. [61] С момента первых описаний в 2006 и 2008 годах [40] [62] RNA-Seq был быстро принят и обогнал микроматрицы в качестве доминирующей техники транскриптомики в 2015 году. [63]

Поиски данных транскриптома на уровне отдельных клеток привели к прогрессу в методах подготовки библиотек RNA-Seq, что привело к значительному повышению чувствительности. Одноклеточные транскриптомы теперь хорошо описаны и даже были расширены до RNA-Seq in situ, где транскриптомы отдельных клеток непосредственно опрашиваются в фиксированных тканях. [64]

Методы [ править ]

Компания RNA-Seq была создана вместе с быстрым развитием ряда технологий высокопроизводительного секвенирования ДНК. [65] Однако перед секвенированием выделенных транскриптов РНК выполняется несколько ключевых этапов обработки. Методы различаются по использованию обогащения транскриптов, фрагментации, амплификации, одно- или парного секвенирования, а также по сохранению информации о цепи. [65]

Чувствительность эксперимента RNA-Seq может быть увеличена путем обогащения классов РНК, которые представляют интерес, и истощения известных распространенных РНК. Молекулы мРНК можно разделить с использованием олигонуклеотидных зондов, которые связывают их поли-A-хвосты . В качестве альтернативы, рибо-истощение можно использовать для специфического удаления обильных, но неинформативных рибосомных РНК (рРНК) путем гибридизации с зондами, адаптированными к специфическим последовательностям рРНК таксона (например, рРНК млекопитающих, рРНК растений). Однако рибо-истощение также может вносить некоторую систематическую ошибку из-за неспецифического истощения нецелевых транскриптов. [66] Небольшие РНК, такие как микро РНК , можно очистить в зависимости от их размера с помощью гель-электрофореза и экстракции.

Поскольку мРНК длиннее, чем длина чтения типичных высокопроизводительных методов секвенирования, транскрипты обычно фрагментируются перед секвенированием. [67] Метод фрагментации является ключевым аспектом построения библиотеки секвенирования. Фрагментация может быть достигнута путем химического гидролиза , распыления , обработки ультразвуком или обратной транскрипции с помощью обрывающих цепь нуклеотидов . [67] В качестве альтернативы, фрагментация и мечение кДНК могут выполняться одновременно с использованием ферментов транспозазы . [68]

Во время подготовки к секвенированию копии транскриптов кДНК могут быть амплифицированы с помощью ПЦР для обогащения фрагментов, которые содержат ожидаемые 5 'и 3' адаптерные последовательности. [69] Амплификация также используется для секвенирования очень низких вводимых количеств РНК, вплоть до 50 пг в экстремальных условиях. [70] Пиковые контроли известных РНК могут использоваться для оценки контроля качества, чтобы проверить подготовку библиотеки и секвенирование с точки зрения GC-содержимого , длины фрагмента, а также смещения из-за положения фрагмента в транскрипте. [71] Уникальные молекулярные идентификаторы(UMI) - это короткие случайные последовательности, которые используются для индивидуальной маркировки фрагментов последовательности во время подготовки библиотеки, чтобы каждый помеченный фрагмент был уникальным. [72] UMI обеспечивают абсолютную шкалу для количественной оценки, возможность корректировать смещение последующей амплификации, внесенное во время создания библиотеки, и точно оценивать исходный размер выборки. UMI особенно хорошо подходят для транскриптомики RNA-Seq одной клетки, где количество входящей РНК ограничено и требуется расширенная амплификация образца. [73] [74] [75]

После получения молекул транскрипта их можно секвенировать только в одном направлении (односторонний) или в обоих направлениях (спаренный конец). Одинарную последовательность обычно быстрее получить, дешевле, чем секвенирование парных концов, и ее достаточно для количественной оценки уровней экспрессии генов. Парное секвенирование дает более надежные сопоставления / сборки, что полезно для аннотации генов и обнаружения изоформ транскриптов . [10] Нить-специфичные методы РНК-Seq сохраняют информацию о цепочке секвенированного транскрипта. [76] Без информации о цепи чтения могут быть выровнены по локусу гена, но не сообщают, в каком направлении ген транскрибируется. Stranded-RNA-Seq полезен для расшифровки транскрипции длягены, которые перекрываются в разных направлениях, и для более надежных прогнозов генов у немодельных организмов. [76]

Легенда: NCBI SRA - Национальный центр биотехнологии. Последовательность чтения архива информации.

В настоящее время RNA-Seq полагается на копирование молекул РНК в молекулы кДНК до секвенирования; следовательно, последующие платформы одинаковы для транскриптомных и геномных данных. Следовательно, развитие технологий секвенирования ДНК было определяющей особенностью RNA-Seq. [78] [80] [81] Прямое секвенирование РНК с использованием секвенирования нанопор представляет собой современный метод RNA-Seq. [82] [83] нанопору секвенирование РНК может обнаружить модифицированных оснований , которые были бы в противном случае , когда замаскированные секвенирования кДНК , а также исключает амплификации шаги , которые в противном случае могут ввести смещение. [11] [84]

Чувствительность и точность эксперимента RNA-Seq зависят от количества считываний, полученных от каждого образца. [85] [86] Большое количество считываний необходимо для обеспечения достаточного покрытия транскриптома, что позволяет обнаруживать транскрипты с низким содержанием. Дизайн эксперимента дополнительно усложняется технологиями секвенирования с ограниченным диапазоном выходных данных, переменной эффективностью создания последовательности и переменным качеством последовательности. К этим соображениям следует добавить, что у каждого вида разное количество генов.и, следовательно, требует индивидуального выхода последовательности для эффективного транскриптома. В ранних исследованиях подходящие пороговые значения определялись эмпирически, но по мере развития технологии подходящее покрытие предсказывалось расчетным путем по насыщению транскриптома. Несколько противоречиво, но наиболее эффективный способ улучшить обнаружение дифференциальной экспрессии в генах с низкой экспрессией - это добавить больше биологических реплик, а не добавлять больше считываний. [87] Текущие тесты, рекомендованные проектом « Энциклопедия элементов ДНК» (ENCODE), предназначены для 70-кратного покрытия экзома для стандартной РНК-Seq и до 500-кратного покрытия экзома для обнаружения редких транскриптов и изоформ. [88] [89] [90]

Анализ данных [ править ]

Методы транскриптомики очень параллельны и требуют значительных вычислений для получения значимых данных как для экспериментов с микрочипами, так и для экспериментов с RNA-Seq. [91] [92] [93] [94] Данные микроматрицы записываются как изображения с высоким разрешением , что требует обнаружения признаков и спектрального анализа. [95] Каждый файл необработанных изображений микроматрицы имеет размер около 750 МБ, тогда как размер обработанных изображений составляет около 60 МБ. Несколько коротких зондов, соответствующих одному транскрипту, могут раскрыть подробности об интроне - экзоне.структура, требующая статистических моделей для определения подлинности результирующего сигнала. Исследования RNA-Seq производят миллиарды коротких последовательностей ДНК, которые необходимо выровнять для эталонных геномов, состоящих из миллионов или миллиардов пар оснований. Сборка операций чтения в наборе данных de novo требует построения очень сложных графов последовательностей . [96] Операции RNA-Seq очень часто повторяются и выигрывают от распараллеливания вычислений, но современные алгоритмы означают, что потребительского вычислительного оборудования достаточно для простых экспериментов с транскриптомикой, которые не требуют сборки операций чтения de novo . [97]Человеческий транскриптом может быть точно зафиксирован с помощью RNA-Seq с 30 миллионами последовательностей по 100 п.н. на образец. [85] [86] В этом примере потребуется примерно 1,8 гигабайта дискового пространства на выборку при сохранении в сжатом формате fastq . Обработанные данные подсчета для каждого гена будут намного меньше, что эквивалентно интенсивности обработанных микрочипов. Данные последовательности могут храниться в общедоступных репозиториях, таких как Архив чтения последовательностей (SRA). [98] Наборы данных RNA-Seq могут быть загружены через Омнибус экспрессии генов. [99]

Обработка изображений [ править ]

Микроматрица и проточная ячейка для секвенирования . Microarrays и RNA-seq по-разному полагаются на анализ изображений. В чипе микроматрицы каждое пятно на чипе представляет собой определенный олигонуклеотидный зонд, а интенсивность флуоресценции напрямую определяет количество конкретной последовательности (Affymetrix). В проточной кювете для высокопроизводительного секвенирования пятна секвенируются по одному нуклеотиду за раз, причем цвет на каждом этапе указывает следующий нуклеотид в последовательности (Illumina Hiseq). В других вариантах этих методов используется больше или меньше цветовых каналов. [51] [100]

Обработка изображений микроматрицы должна правильно идентифицировать регулярную сетку функций в изображении и независимо количественно определять интенсивность флуоресценции для каждой особенности. Артефакты изображения должны быть дополнительно идентифицированы и удалены из общего анализа. Интенсивность флуоресценции напрямую указывает на численность каждой последовательности, поскольку последовательность каждого зонда в массиве уже известна. [101]

Первые шаги RNA-seq также включают аналогичную обработку изображений; однако преобразование изображений в данные последовательности обычно выполняется автоматически программным обеспечением прибора. Метод секвенирования путем синтеза компании Illumina приводит к получению массива кластеров, распределенных по поверхности проточной кюветы. [102] Проточная ячейка визуализируется до четырех раз в течение каждого цикла секвенирования, всего от десятков до сотен циклов. Кластеры проточных кювет аналогичны пятнам микрочипов и должны быть правильно идентифицированы на ранних этапах процесса секвенирования. В Roche «ы ПиросеквенированиеВ этом методе интенсивность излучаемого света определяет количество следующих друг за другом нуклеотидов в гомополимерном повторе. Существует множество вариантов этих методов, каждый из которых имеет свой профиль ошибок для полученных данных. [103]

Анализ данных RNA-Seq [ править ]

Эксперименты с RNA-Seq генерируют большой объем считываний необработанных последовательностей, которые необходимо обработать, чтобы получить полезную информацию. Для анализа данных обычно требуется комбинация программных инструментов биоинформатики (см. Также Список инструментов биоинформатики RNA-Seq ), которые различаются в зависимости от плана эксперимента и целей. Процесс можно разбить на четыре этапа: контроль качества, согласование, количественная оценка и дифференциальное выражение. [104] Наиболее популярные программы RNA-Seq запускаются из интерфейса командной строки либо в среде Unix, либо в статистической среде R / Bioconductor . [93]

Контроль качества [ править ]

Считывание последовательности неидеально, поэтому для последующего анализа необходимо оценить точность каждой базы в последовательности. Необработанные данные проверяются, чтобы убедиться: оценки качества для базовых вызовов высоки, содержимое GC соответствует ожидаемому распределению, короткие мотивы последовательностей ( k-мер ) не представлены чрезмерно, а скорость дублирования чтения является приемлемо низкой. [86] Существует несколько программных опций для анализа качества последовательности, включая FastQC и FaQC. [105] [106] Аномалии могут быть удалены (обрезаны) или помечены для специального лечения во время последующих процессов.

Выравнивание [ править ]

Чтобы связать количество считанных последовательностей с экспрессией конкретного гена, последовательности транскриптов выравниваются по эталонному геному или de novo выровнены друг с другом, если ссылка недоступна. [107] [108] Основные проблемы программного обеспечения для центровкивключают в себя достаточную скорость, позволяющую выровнять миллиарды коротких последовательностей в значимые временные рамки, гибкость для распознавания и обработки интронного сплайсинга эукариотической мРНК, а также правильное назначение считываний, которые отображаются в нескольких местах. Достижения программного обеспечения в значительной степени решили эти проблемы, а увеличение длины последовательного чтения снижает вероятность неоднозначного выравнивания чтения. Список доступных в настоящее время высокопроизводительных выравнивателей последовательностей поддерживается EBI . [109] [110]

Выравнивание последовательностей мРНК первичных транскриптов , полученных от эукариот, с эталонным геномом требует специальной обработки последовательностей интронов , которые отсутствуют в зрелой мРНК. [111] Выравниватели с коротким считыванием выполняют дополнительный цикл выравниваний, специально предназначенных для идентификации соединений сплайсинга , на основе канонических последовательностей сайта сплайсинга и известной информации о сайте сплайсинга интрона. Идентификация сплайсинговых соединений интронов предотвращает неправильное выравнивание считываний по сплайсинговым стыкам или ошибочное отклонение, позволяя выровнять большее количество считываний с эталонным геномом и повышая точность оценок экспрессии генов. Поскольку генная регуляция может происходить вУровни изоформ мРНК , выравнивания с учетом сплайсинга также позволяют обнаруживать изменения численности изоформ, которые в противном случае были бы потеряны при групповом анализе. [112]

Сборку de novo можно использовать для выравнивания считываний друг с другом для создания полноразмерных последовательностей транскриптов без использования эталонного генома. [113] Проблемы, характерные для сборки de novo, включают большие вычислительные требования по сравнению с основанным на ссылке транскриптомом, дополнительную проверку вариантов или фрагментов генов и дополнительную аннотацию собранных транскриптов. Показано, что первые метрики, используемые для описания сборок транскриптомов, такие как N50 , вводят в заблуждение [114], и теперь доступны улучшенные методы оценки. [115] [116] Метрики на основе аннотаций лучше оценивают полноту сборки, например, contigвзаимное количество лучших совпадений. После сборки de novo сборку можно использовать в качестве эталона для последующих методов выравнивания последовательностей и количественного анализа экспрессии генов.

Условные обозначения: RAM - оперативная память; MPI - интерфейс передачи сообщений; EST - тэг выраженной последовательности.

Количественная оценка [ править ]

Идентификация на тепловой карте паттернов коэкспрессии генов в разных образцах. Каждый столбец содержит измерения изменения экспрессии генов для одного образца. Относительная экспрессия генов обозначается цветом: высокая экспрессия (красный), средняя экспрессия (белый) и низкая экспрессия (синий). Гены и образцы со схожими профилями экспрессии могут быть автоматически сгруппированы (левое и верхнее деревья). Образцы могут быть разными людьми, тканями, средой или состоянием здоровья. В этом примере экспрессия набора генов 1 высокая, а экспрессия набора генов 2 низкая в образцах 1, 2 и 3. [51] [127]

Количественная оценка выравнивания последовательностей может выполняться на уровне гена, экзона или транскрипта. [87] Типичные выходные данные включают в себя таблицу счетчиков считываний для каждой функции, предоставленной программному обеспечению; например, для генов в файле общего формата признаков . Счетчик считывания генов и экзонов может быть довольно легко рассчитан, например, с помощью HTSeq. [128] Количественный анализ на уровне транскрипта более сложен и требует вероятностных методов для оценки распространенности изоформ транскрипта на основе короткой информации чтения; например, с помощью программного обеспечения для запонок. [112] Считывания, которые одинаково хорошо совпадают с несколькими местоположениями, должны быть идентифицированы и либо удалены, либо выровнены по одному из возможных местоположений, либо выровнены по наиболее вероятному местоположению.

Некоторые методы количественной оценки могут полностью обойти необходимость в точном сопоставлении считываемой информации с эталонной последовательностью. Программный метод kallisto объединяет псевдо-выравнивание и количественную оценку в один этап, который выполняется на 2 порядка быстрее, чем современные методы, такие как те, которые используются в программном обеспечении tophat / cufflinks, с меньшими вычислительными затратами. [129]

Дифференциальное выражение [ править ]

Когда доступны количественные подсчеты каждого транскрипта, измеряется дифференциальная экспрессия генов путем нормализации, моделирования и статистического анализа данных. [107] Большинство инструментов будут считывать таблицу генов и считывать счетчики в качестве входных данных, но некоторые программы, такие как cuffdiff, будут принимать в качестве входных данных сопоставления чтения в формате карты двоичного выравнивания . Конечными результатами этих анализов являются списки генов с соответствующими попарными тестами на дифференциальную экспрессию между видами лечения и оценками вероятности этих различий. [130]

Легенда: мРНК - информационная РНК.

Проверка [ править ]

Транскриптомный анализ может быть подтвержден с использованием независимого метода, например, количественной ПЦР (qPCR), которая распознается и поддается статистической оценке. [133] Экспрессия генов измеряется по определенным стандартам как для интересующего гена, так и для контрольных генов. Измерение с помощью qPCR аналогично измерению, полученному с помощью RNA-Seq, где значение может быть рассчитано для концентрации целевой области в данном образце. Однако qPCR ограничивается ампликонами меньше 300 п.н., обычно ближе к 3'-концу кодирующей области, избегая 3'UTR . [134] Если требуется проверка изоформ транскрипта, проверка выравнивания считывания RNA-Seq должна указать, где qPCRпраймеры могут быть размещены для максимальной дискриминации. Измерение нескольких контрольных генов вместе с интересующими генами дает стабильный эталон в биологическом контексте. [135] Проверка данных RNA-Seq методом qPCR в целом показала, что различные методы RNA-Seq сильно коррелированы. [62] [136] [137]

Функциональная проверка ключевых генов является важным аспектом посттранскриптомного планирования. Наблюдаемые паттерны экспрессии генов могут быть функционально связаны с фенотипом с помощью независимого исследования « нокдаун / спасение» в интересующем организме. [138]

Приложения [ править ]

Диагностика и профилирование болезней [ править ]

Транскриптомные стратегии нашли широкое применение в различных областях биомедицинских исследований, включая диагностику заболеваний и профилирование . [10] [139] Подходы RNA-Seq позволили крупномасштабную идентификацию стартовых сайтов транскрипции , выявили использование альтернативных промоторов и новые изменения сплайсинга . Эти регуляторные элементы важны при заболеваниях человека и, следовательно, определение таких вариантов имеет решающее значение для интерпретации исследований ассоциации заболеваний . [140] RNA-Seq может также идентифицировать связанные с заболеванием однонуклеотидные полиморфизмы.(SNP), аллель-специфическая экспрессия и слияние генов , что способствует пониманию причинных вариантов заболевания. [141]

Ретротранспозоны - это мобильные элементы, которые размножаются в геномах эукариот посредством процесса, включающего обратную транскрипцию . RNA-Seq может предоставить информацию о транскрипции эндогенных ретротранспозонов, которые могут влиять на транскрипцию соседних генов с помощью различных эпигенетических механизмов, которые приводят к заболеванию. [142] Точно так же потенциал использования RNA-Seq для понимания связанных с иммунитетом заболеваний быстро расширяется благодаря способности анализировать популяции иммунных клеток и секвенировать репертуары рецепторов Т-клеток и В-клеток у пациентов. [143] [144]

Транскриптомы человека и патогенов [ править ]

Последовательность РНК патогенов человека стала признанным методом количественной оценки изменений экспрессии генов, выявления новых факторов вирулентности , прогнозирования устойчивости к антибиотикам и выявления иммунных взаимодействий между хозяином и патогеном . [145] [146] Основная цель этой технологии - разработать оптимизированные меры инфекционного контроля и целенаправленное индивидуальное лечение . [144]

Транскриптомный анализ преимущественно сосредоточен либо на хозяине, либо на возбудителе. Dual RNA-Seq применялся для одновременного профилирования экспрессии РНК как у патогена, так и у хозяина на протяжении всего процесса заражения. Этот метод позволяет изучать динамический ответ и межвидовые регуляторные сети генов у обоих партнеров по взаимодействию от начального контакта до инвазии и окончательной персистенции патогена или клиренса иммунной системой хозяина. [147] [148]

Ответы на окружающую среду [ править ]

Транскриптомика позволяет идентифицировать гены и пути, которые реагируют на биотические и абиотические стрессы окружающей среды и противодействуют им . [149] [138] Ненаргетированная природа транскриптомики позволяет идентифицировать новые транскрипционные сети в сложных системах. Например, сравнительный анализ диапазона нута линий на разных стадиях развития , определенных отдельных транскрипционных профилей , связанных с засухи и солености напряжений, в том числе определения роли транскриптов изоформ из AP2 - EREBP . [149]Исследование экспрессии генов во время образования биопленок грибковым патогеном Candida albicans выявило совместно регулируемый набор генов, критических для образования и поддержания биопленки. [150]

Транскриптомное профилирование также дает важную информацию о механизмах лекарственной устойчивости . Анализ более 1000 изолятов Plasmodium falciparum , вирулентного паразита, ответственного за малярию у людей, [151] выявил, что усиленная регуляция развернутого белкового ответа и более медленное прогрессирование на ранних стадиях цикла бесполого внутриэритроцитарного развития были связаны с устойчивостью к артемизинину у изолятов из Юго-Восточная Азия . [152]

Аннотация функции гена [ править ]

Все транскриптомные методы оказались особенно полезными для идентификации функций генов и определения тех, кто отвечает за определенные фенотипы. Транскриптомика экотипов Arabidopsis, которые гипераккумулируют металлы, коррелирует гены, участвующие в поглощении металлов , толерантности и гомеостазе, с фенотипом. [153] Интеграция наборов данных RNA-Seq в различных тканях использовалась для улучшения аннотации функций генов у коммерчески важных организмов (например, огурцов ) [154] или исчезающих видов (например, коала ). [155]

Сборка считываний RNA-Seq не зависит от эталонного генома [120] и поэтому идеально подходит для исследований экспрессии генов немодельных организмов с несуществующими или плохо развитыми геномными ресурсами. Например, база данных SNP, используемых в программах разведения пихты Дугласа , была создана с помощью анализа транскриптомов de novo в отсутствие секвенированного генома . [156] Точно так же гены, которые функционируют в развитии сердечной, мышечной и нервной ткани у омаров, были идентифицированы путем сравнения транскриптомов различных типов тканей без использования последовательности генома. [157] RNA-Seq также может использоваться для идентификации ранее неизвестных кодирующих областей белка. в существующих секвенированных геномах.

Часы старения на основе транскриптома [ править ]

Профилактические вмешательства, связанные со старением, невозможны без измерения скорости старения. Самый современный и сложный способ измерения скорости старения - это использование различных биомаркеров старения человека, основанный на использовании глубоких нейронных сетей, которые могут быть обучены на любом типе биологических данных омики для прогнозирования возраста субъекта. Было показано, что старение является сильной движущей силой изменений транскриптома. [158] [159] Часы старения, основанные на транскриптомах, страдали от значительного разброса данных и относительно низкой точности. Однако подход, который использует временное масштабирование и бинаризацию транскриптомов для определения набора генов, который предсказывает биологический возраст с точностью, позволил достичь оценки, близкой к теоретическому пределу. [158]

Некодирующая РНК [ править ]

Транскриптомика чаще всего применяется к содержанию мРНК клетки. Однако те же методы в равной степени применимы к некодирующим РНК (нкРНК), которые не транслируются в белок, но вместо этого имеют прямые функции (например, роль в трансляции белка , репликации ДНК , сплайсинге РНК и регуляции транскрипции ). [160] [161] [162] [163] Многие из этих нкРНК влияют на болезненные состояния, включая рак, сердечно-сосудистые и неврологические заболевания. [164]

Базы данных транскриптомов [ править ]

Исследования транскриптомики генерируют большие объемы данных, которые имеют потенциальное применение, выходящее далеко за рамки первоначальных целей эксперимента. Таким образом, необработанные или обработанные данные могут быть депонированы в общедоступных базах данных, чтобы обеспечить их полезность для более широкого научного сообщества. Например, по состоянию на 2018 год Омнибус экспрессии генов содержал миллионы экспериментов. [165]

Легенда: NCBI - Национальный центр биотехнологической информации; EBI - Европейский институт биоинформатики; DDBJ - Банк данных ДНК Японии; ENA - Европейский архив нуклеотидов; MIAME - Минимум информации об эксперименте с микрочипом; MINSEQE - Минимум информации об эксперименте SEQuencing с высокой пропускной способностью.

См. Также [ править ]

  • омики
    • Геномика
    • Протеомика
    • Метаболомика

Ссылки [ править ]

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 ( 2017 ) ( отчеты рецензента ): «Технологии транскриптомики» . PLOS Вычислительная биология . 13 (5): e1005457. 18 мая 2017 г. doi : 10.1371 / JOURNAL.PCBI.1005457 . ISSN  1553-734X . PMC  5436640 . PMID  28545146 . S2CID  3714586 . Викиданные  Q33703532 .

  1. ^ «Тенденция Medline: автоматическая годовая статистика результатов PubMed по любому запросу» . dan.corlan.net . Проверено 5 октября 2016 .
  2. ^ а б Адамс MD, Келли JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al. (Июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессированной последовательности и проект генома человека». Наука . 252 (5013): 1651–6. Bibcode : 1991Sci ... 252.1651A . DOI : 10.1126 / science.2047873 . PMID 2047873 . S2CID 13436211 .  
  3. ^ Pan Q, Шай O, Ли LJ, Frey BJ, Blencowe BJ (декабрь 2008). «Глубокое исследование альтернативной сложности сплайсинга в человеческом транскриптоме с помощью высокопроизводительного секвенирования». Генетика природы . 40 (12): 1413–5. DOI : 10.1038 / ng.259 . PMID 18978789 . S2CID 9228930 .  
  4. ^ a b Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M и др. (Август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг путем глубокого секвенирования человеческого транскриптома». Наука . 321 (5891): 956–60. Bibcode : 2008Sci ... 321..956S . DOI : 10.1126 / science.1160342 . PMID 18599741 . S2CID 10013179 .  
  5. ^ Lappalainen T, Sammeth M, Friedländer MR, 't Hoen PA, Monlong J, Rivas MA и др. (Сентябрь 2013). «Секвенирование транскриптома и генома раскрывает функциональные вариации у людей» . Природа . 501 (7468): 506–11. Bibcode : 2013Natur.501..506L . DOI : 10,1038 / природа12531 . PMC 3918453 . PMID 24037378 .  
  6. ^ а б Меле М., Феррейра П.Г., Ревертер Ф., ДеЛука Д.С., Монлонг Дж., Саммет М. и др. (Май 2015 г.). «Геномика человека. Человеческий транскриптом в тканях и отдельных лицах» . Наука . 348 (6235): 660–5. Bibcode : 2015Sci ... 348..660M . DOI : 10.1126 / science.aaa0355 . PMC 4547472 . PMID 25954002 .  
  7. Sandberg R (январь 2014 г.). «Вступая в эру транскриптомики одиночных клеток в биологии и медицине» . Методы природы . 11 (1): 22–4. DOI : 10.1038 / nmeth.2764 . PMID 24524133 . S2CID 27632439 .  
  8. ^ Kolodziejczyk А.А., Ким JK, Свенссон V, Marioni JC, Teichmann SA (май 2015). «Технология и биология секвенирования одноклеточной РНК» . Молекулярная клетка . 58 (4): 610–20. DOI : 10.1016 / j.molcel.2015.04.005 . PMID 26000846 . 
  9. ^ Б с д е е McGettigan PA (февраль 2013 г. ). «Транскриптомика в эпоху RNA-seq». Текущее мнение в химической биологии . 17 (1): 4–11. DOI : 10.1016 / j.cbpa.2012.12.008 . PMID 23290152 . 
  10. ^ a b c d e f g h i j k l Ван З., Герштейн М., Снайдер М. (январь 2009 г.). «RNA-Seq: революционный инструмент для транскриптомики» . Природа Обзоры Генетики . 10 (1): 57–63. DOI : 10.1038 / nrg2484 . PMC 2949280 . PMID 19015660 .  
  11. ^ a b c Озсолак Ф., Милош П.М. (февраль 2011 г.). «Секвенирование РНК: достижения, проблемы и возможности» . Природа Обзоры Генетики . 12 (2): 87–98. DOI : 10.1038 / nrg2934 . PMC 3031867 . PMID 21191423 .  
  12. ^ a b c Морозова О., Херст М., Марра М.А. (2009). «Применение новых технологий секвенирования для анализа транскриптома». Ежегодный обзор геномики и генетики человека . 10 : 135–51. DOI : 10.1146 / annurev-genom-082908-145957 . PMID 19715439 . 
  13. Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (декабрь 1979). «Использование библиотеки кДНК для изучения эволюции и развития экспрессии мультигенных семейств хориона» . Cell . 18 (4): 1303–16. DOI : 10.1016 / 0092-8674 (79) 90241-1 . PMID 519770 . 
  14. ^ Сатклифф JG, Милнер RJ, Bloom FE, Lerner RA (август 1982). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга» . Труды Национальной академии наук Соединенных Штатов Америки . 79 (16): 4942–6. Bibcode : 1982PNAS ... 79.4942S . DOI : 10.1073 / pnas.79.16.4942 . PMC 346801 . PMID 6956902 .  
  15. ^ Putney SD, Herlihy WC, Шиммеля P (апрель 1983). «Новые клоны тропонина Т и кДНК для 13 различных мышечных белков, обнаруженные методом дробового секвенирования». Природа . 302 (5910): 718–21. Bibcode : 1983Natur.302..718P . DOI : 10.1038 / 302718a0 . PMID 6687628 . S2CID 4364361 .  
  16. ^ a b c d Marra MA, Hillier L, Waterston RH (январь 1998 г.). «Экспрессированные теги последовательностей - установление мостов между геномами». Тенденции в генетике . 14 (1): 4–7. DOI : 10.1016 / S0168-9525 (97) 01355-3 . PMID 9448457 . 
  17. ^ Alwine JC, Кемп DJ, Stark GR (декабрь 1977). «Метод обнаружения специфических РНК в агарозных гелях путем переноса на диазобензилоксиметилбумагу и гибридизации с ДНК-зондами» . Труды Национальной академии наук Соединенных Штатов Америки . 74 (12): 5350–4. Bibcode : 1977PNAS ... 74.5350A . DOI : 10.1073 / pnas.74.12.5350 . PMC 431715 . PMID 414220 .  
  18. ^ Becker-Андре M, Hahlbrock K (ноябрь 1989). «Абсолютное количественное определение мРНК с использованием полимеразной цепной реакции (ПЦР). Новый подход с помощью анализа титрования транскриптов с помощью ПЦР (PATTY)» . Исследования нуклеиновых кислот . 17 (22): 9437–46. DOI : 10.1093 / NAR / 17.22.9437 . PMC 335144 . PMID 2479917 .  
  19. ^ Pietų G, Mariage-Samson R, Fayein Н.А., Matingou С, Эвено Е, Houlgatte R, Decraene С, Vandenbrouck Y, Тахи F, Devignes MD, Wirkner U, Ansorge Вт, Кокс Д, Нагасе Т, Nomura Н, Auffray С (Февраль 1999 г.). «База знаний Genexpress IMAGE транскриптома человеческого мозга: прототип интегрированного ресурса для функциональной и вычислительной геномики» . Геномные исследования . 9 (2): 195–209. doi : 10.1101 / gr.9.2.195 (неактивный 2021-01-15). PMC 310711 . PMID 10022985 .  CS1 maint: DOI неактивен с января 2021 г. ( ссылка )
  20. ^ Velculescu В.Е., Чжан L, W, Чжоу Vogelstein J, Basrai MA, Бассет DE, Hieter P, B, Vogelstein Кинзлер кВт (январь 1997 года). «Характеристика дрожжевого транскриптома». Cell . 88 (2): 243–51. DOI : 10.1016 / S0092-8674 (00) 81845-0 . PMID 9008165 . S2CID 11430660 .  
  21. ^ a b c d Велкулеску В.Э., Чжан Л., Фогельштейн Б., Кинзлер К.В. (октябрь 1995 г.). «Серийный анализ экспрессии генов». Наука . 270 (5235): 484–7. Bibcode : 1995Sci ... 270..484V . DOI : 10.1126 / science.270.5235.484 . PMID 7570003 . S2CID 16281846 .  
  22. ^ Audic S, Claverie JM (октябрь 1997). «Значение цифровых профилей экспрессии генов» . Геномные исследования . 7 (10): 986–95. DOI : 10.1101 / gr.7.10.986 . PMID 9331369 . 
  23. ^ a b c d e f Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB (август 2014 г.). «Сравнение методов профилирования экспрессии биоинформатических генов: микрочип и RNA-Seq» . Монитор медицинских наук. Основные исследования . 20 : 138–42. DOI : 10.12659 / MSMBR.892101 . PMC 4152252 . PMID 25149683 .  
  24. Перейти ↑ Zhao S, Fung-Leung WP, Bittner A, Ngo K, Liu X (2014). «Сравнение РНК-Seq и микроматрицы в профилировании транскриптома активированных Т-клеток» . PLOS ONE . 9 (1): e78644. Bibcode : 2014PLoSO ... 978644Z . DOI : 10.1371 / journal.pone.0078644 . PMC 3894192 . PMID 24454679 .  
  25. ^ a b Hashimshony T, Wagner F, Sher N, Yanai I (сентябрь 2012 г.). «CEL-Seq: одноклеточная РНК-Seq путем мультиплексной линейной амплификации» . Отчеты по ячейкам . 2 (3): 666–73. DOI : 10.1016 / j.celrep.2012.08.003 . PMID 22939981 . 
  26. ^ Stears RL, RC Гетц, Gullans SR (август 2000). «Новая чувствительная система обнаружения микрочипов высокой плотности с использованием дендримерной технологии». Физиологическая геномика . 3 (2): 93–9. DOI : 10.1152 / physiolgenomics.2000.3.2.93 . PMID 11015604 . 
  27. ^ Б с д е е Illumina (2011-07-11). «Сравнение данных РНК-Seq с микрочипами экспрессии генов» (PDF) . Европейский фармацевтический обзор.
  28. ^ a b Black MB, Parks BB, Pluta L, Chu TM, Allen BC, Wolfinger RD, Thomas RS (февраль 2014 г.). «Сравнение микроматриц и РНК-seq для анализа экспрессии генов в экспериментах по реакции на дозу» . Токсикологические науки . 137 (2): 385–403. DOI : 10.1093 / toxsci / kft249 . PMID 24194394 . 
  29. ^ Marioni JC, Мэйсон CE, Mane SM, Stephens M, Гилад Y (сентябрь 2008). «RNA-seq: оценка технической воспроизводимости и сравнение с массивами экспрессии генов» . Геномные исследования . 18 (9): 1509–17. DOI : 10.1101 / gr.079558.108 . PMC 2527709 . PMID 18550803 .  
  30. ^ ГЭКЦ / MAQC-III Consortium (сентябрь 2014). «Комплексная оценка точности, воспроизводимости и информационного содержания РНК-секвенирования Консорциумом контроля качества секвенирования» . Природа Биотехнологии . 32 (9): 903–14. DOI : 10.1038 / nbt.2957 . PMC 4321899 . PMID 25150838 .  
  31. ^ Chen JJ, Сюэ HM, Delongchamp RR, Лин CJ, Tsai CA (октябрь 2007). «Воспроизводимость данных микроматрицы: дальнейший анализ данных контроля качества микроматрицы (MAQC)» . BMC Bioinformatics . 8 : 412. DOI : 10,1186 / 1471-2105-8-412 . PMC 2204045 . PMID 17961233 .  
  32. ^ Ларкин JE, Франк БК, Гаврас Н, R Султана, Квакенбуш J (май 2005 г.). «Независимость и воспроизводимость на микрочиповых платформах». Методы природы . 2 (5): 337–44. DOI : 10.1038 / nmeth757 . PMID 15846360 . S2CID 16088782 .  
  33. ^ a b Нельсон Нью-Джерси (апрель 2001 г.). «Микроматрицы прибыли: инструмент экспрессии генов созрел». Журнал Национального института рака . 93 (7): 492–4. DOI : 10.1093 / JNCI / 93.7.492 . PMID 11287436 . 
  34. ^ Schena M, Shalon D, Davis RW, Brown PO (октябрь 1995). «Количественный мониторинг паттернов экспрессии генов с комплементарной ДНК-микрочипом». Наука . 270 (5235): 467–70. Bibcode : 1995Sci ... 270..467S . DOI : 10.1126 / science.270.5235.467 . PMID 7569999 . S2CID 6720459 .  
  35. ^ a b Пожитков А.Е., Таутц Д., Благородный П.А. (июнь 2007 г.). «Олигонуклеотидные микрочипы: широко применяются - плохо изучены» . Брифинги по функциональной геномике и протеомике . 6 (2): 141–8. DOI : 10.1093 / bfgp / elm014 . PMID 17644526 . 
  36. ^ a b c Хеллер MJ (2002). «Технология ДНК-микрочипов: устройства, системы и приложения». Ежегодный обзор биомедицинской инженерии . 4 : 129–53. DOI : 10.1146 / annurev.bioeng.4.020702.153438 . PMID 12117754 . 
  37. ^ Маклэчлэн GJ, Do K , Амбруаз C (2005). Анализ данных экспрессии генов микрочипов . Хобокен: Джон Уайли и сыновья. ISBN 978-0-471-72612-8.[ требуется страница ]
  38. ^ Бреннер S, Джонсон M, Бриджем J, Голда G, Ллойд DH, Джонсон D, Луо S, МакКарди S, Фой М, Юэн М, Рот R, Джордж D, Элетр S, Альбрехт G, Вермаас E, Уильямс SR, Луна К., Бурчам Т., Паллас М., ДюБридж Р. Б., Киршнер Дж., Фирон К., Мао Дж., Коркоран К. (июнь 2000 г.). «Анализ экспрессии генов путем массового параллельного секвенирования сигнатур (MPSS) на массивах микрогранул». Природа Биотехнологии . 18 (6): 630–4. DOI : 10.1038 / 76469 . PMID 10835600 . S2CID 13884154 .  
  39. ^ Мейерс BC, Vu TH, Tej SS, Ghazal H, Matvienko M, Agrawal V, Ning J, Haudenschild CD (август 2004). «Анализ сложности транскрипции Arabidopsis thaliana путем массового параллельного секвенирования сигнатур». Природа Биотехнологии . 22 (8): 1006–11. DOI : 10.1038 / nbt992 . PMID 15247925 . S2CID 15336496 .  
  40. ^ a b Bainbridge MN, Warren RL, Hirst M, Romanuik T, Zeng T, Go A, Delaney A, Griffith M, Hickenbotham M, Magrini V, Mardis ER, Sadar MD, Siddiqui AS, Marra MA, Jones SJ (сентябрь 2006 г. ). «Анализ транскриптома клеточной линии рака простаты LNCaP с использованием подхода секвенирования путем синтеза» . BMC Genomics . 7 : 246. DOI : 10.1186 / 1471-2164-7-246 . PMC 1592491 . PMID 17010196 .  
  41. ^ Mortazavi A, Williams BA, МакКью K, L Шеффер, Уолд B (июль 2008). «Картирование и количественная оценка транскриптомов млекопитающих с помощью RNA-Seq». Методы природы . 5 (7): 621–8. DOI : 10.1038 / nmeth.1226 . PMID 18516045 . S2CID 205418589 .  
  42. ^ Вильгельм Б.Т., Маргерат С., Ватт С., Шуберт Ф, Вуд V, Гудхед I, Пенкетт С.Дж., Роджерс Дж., Бэлер Дж. (Июнь 2008 г.). «Динамический репертуар эукариотического транскриптома, исследуемый при разрешении одного нуклеотида». Природа . 453 (7199): 1239–43. Bibcode : 2008Natur.453.1239W . DOI : 10,1038 / природа07002 . PMID 18488015 . S2CID 205213499 .  
  43. ^ Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, Seifert M, Borodina T, Soldatov A, Parkhomchuk D, Schmidt D, O'Keeffe S, Haas S, Vingron M, Lehrach H, Yaspo ML (Август 2008 г.). «Глобальный взгляд на активность генов и альтернативный сплайсинг путем глубокого секвенирования человеческого транскриптома». Наука . 321 (5891): 956–60. Bibcode : 2008Sci ... 321..956S . DOI : 10.1126 / science.1160342 . PMID 18599741 . S2CID 10013179 .  
  44. ^ a b Chomczynski P, Sacchi N (апрель 1987 г.). «Одностадийный метод выделения РНК кислотной экстракцией тиоцианат-фенол-хлороформ гуанидиния». Аналитическая биохимия . 162 (1): 156–9. DOI : 10.1016 / 0003-2697 (87) 90021-2 . PMID 2440339 . 
  45. ^ a b Chomczynski P, Sacchi N (2006). «Одностадийный метод выделения РНК кислотной экстракцией тиоцианат-фенол-хлороформ гуанидиния: двадцать с лишним лет спустя». Протоколы природы . 1 (2): 581–5. DOI : 10.1038 / nprot.2006.83 . PMID 17406285 . S2CID 28653075 .  
  46. Перейти ↑ Grillo M, Margolis FL (сентябрь 1990 г.). «Использование обратной транскриптазы полимеразной цепной реакции для мониторинга экспрессии безинтронных генов». Биотехнологии . 9 (3): 262, 264, 266–8. PMID 1699561 . 
  47. Перейти ↑ Bryant S, Manning DL (1998). «Выделение информационной РНК». Протоколы выделения и характеристики РНК . Методы молекулярной биологии. 86 . С. 61–4. DOI : 10.1385 / 0-89603-494-1: 61 . ISBN 978-0-89603-494-5. PMID  9664454 .
  48. ^ Чжао W, X Он, Hoadley KA, Parker JS, Hayes Д.Н., Perou CM (июнь 2014). «Сравнение RNA-Seq с помощью захвата поли (A), истощения рибосомной РНК и ДНК-микрочипа для профилирования экспрессии» . BMC Genomics . 15 : 419. DOI : 10.1186 / 1471-2164-15-419 . PMC 4070569 . PMID 24888378 .  
  49. ^ Примеры проб окружающей среды: морская вода, почва или воздух.
  50. Close TJ, Wanamaker SI, Caldo RA, Turner SM, Ashlock DA, Dickerson JA, Wing RA, Muehlbauer GJ, Kleinhofs A, Wise RP (март 2004 г.). «Новый ресурс для геномики зерновых: 22K GeneChip ячменя достиг совершеннолетия» . Физиология растений . 134 (3): 960–8. DOI : 10.1104 / pp.103.034462 . PMC 389919 . PMID 15020760 .  
  51. ^ а б в г д Лоу Р., Ширли Н., Бликли М., Долан С., Шафи Т. (май 2017 г.). «Транскриптомические технологии» . PLOS Вычислительная биология . 13 (5): e1005457. Bibcode : 2017PLSCB..13E5457L . DOI : 10.1371 / journal.pcbi.1005457 . PMC 5436640 . PMID 28545146 .  
  52. ^ a b Сираки Т., Кондо С., Катаяма С., Ваки К., Касукава Т., Кавадзи Х, Кодзиус Р., Ватахики А., Накамура М., Аракава Т., Фукуда С., Сасаки Д., Подхайска А., Харберс М., Кавай Дж., Карнинчи П. , Hayashizaki Y (декабрь 2003 г.). «Экспрессия гена анализа кэпа для высокопроизводительного анализа начальной точки транскрипции и идентификации использования промотора» . Труды Национальной академии наук Соединенных Штатов Америки . 100 (26): 15776–81. Bibcode : 2003PNAS..10015776S . DOI : 10.1073 / pnas.2136655100 . PMC 307644 . PMID 14663149 .  
  53. Романов В., Дэвидофф С.Н., Майлз А.Р., Грейнджер Д.В., Гейл Б.К., Брукс Б.Д. (март 2014). «Критическое сравнение технологий изготовления белковых микрочипов». Аналитик . 139 (6): 1303–26. Bibcode : 2014Ana ... 139.1303R . DOI : 10.1039 / c3an01577g . PMID 24479125 . 
  54. ^ a b Barbulovic-Nad I, Lucente M, Sun Y, Zhang M, Wheeler AR, Bussmann M (01.10.2006). «Методы изготовления биомикрочипов - обзор». Критические обзоры в биотехнологии . 26 (4): 237–59. CiteSeerX 10.1.1.661.6833 . DOI : 10.1080 / 07388550600978358 . PMID 17095434 . S2CID 13712888 .   
  55. ^ Auburn РП, Kreil ДП, Мидоуз Л.А., Фишер В, Matilla СС, Рассел S (июль 2005 г.). «Роботизированное определение кДНК и олигонуклеотидных микрочипов». Тенденции в биотехнологии . 23 (7): 374–9. DOI : 10.1016 / j.tibtech.2005.04.002 . PMID 15978318 . 
  56. Перейти ↑ Shalon D, Smith SJ, Brown PO (июль 1996). «Система микрочипов ДНК для анализа сложных образцов ДНК с использованием гибридизации двухцветных флуоресцентных зондов» . Геномные исследования . 6 (7): 639–45. DOI : 10.1101 / gr.6.7.639 . PMID 8796352 . 
  57. Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, Mittmann M, Wang C, Kobayashi M, Horton H, Brown EL (декабрь 1996). «Мониторинг экспрессии путем гибридизации с массивами олигонуклеотидов высокой плотности». Природа Биотехнологии . 14 (13): 1675–80. DOI : 10.1038 / nbt1296-1675 . PMID 9634850 . S2CID 35232673 .  
  58. ^ Irizarry Р.А., Болстад Б.М., Collin F, Коуп LM, Hobbs B, скорость TP (февраль 2003). «Сводные данные об уровне датчиков Affymetrix GeneChip» . Исследования нуклеиновых кислот . 31 (4): 15e – 15. DOI : 10.1093 / NAR / gng015 . PMC 150247 . PMID 12582260 .  
  59. ^ Selzer RR, Richmond TA, Pofahl NJ, зеленый RD, Айс PS, Наир P, Brothman AR, Сталлингс RL (ноябрь 2005). «Анализ хромосомных точек разрыва в нейробластоме при разрешении менее килобаз с использованием точного мозаичного массива олигонуклеотидов CGH». Гены, хромосомы и рак . 44 (3): 305–19. DOI : 10.1002 / gcc.20243 . PMID 16075461 . S2CID 39437458 .  
  60. Перейти ↑ Svensson V, Vento-Tormo R, Teichmann SA (апрель 2018 г.). «Экспоненциальное масштабирование одноклеточной последовательности РНК за последнее десятилетие». Протоколы природы . 13 (4): 599–604. DOI : 10.1038 / nprot.2017.149 . PMID 29494575 . S2CID 3560001 .  
  61. ^ Татибана С (2015-08-18). «Транскриптомика сегодня: микроматрицы, последовательность РНК и многое другое» . Наука . 349 (6247): 544. Bibcode : 2015Sci ... 349..544T . DOI : 10.1126 / science.opms.p1500095 .
  62. ^ a b Нагалакшми У, Ван З., Верн К., Шоу С., Раха Д., Герштейн М., Снайдер М. (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК» . Наука . 320 (5881): 1344–9. Bibcode : 2008Sci ... 320.1344N . DOI : 10.1126 / science.1158441 . PMC 2951732 . PMID 18451266 .  
  63. ^ Su Z, Fang H, Hong H, Shi L, Zhang W, Zhang W, Zhang Y, Dong Z, Lancashire LJ, Bessarabova M, Yang X, Ning B, Gong B, Meehan J, Xu J, Ge W, Perkins Р., Фишер М., Тонг В. (декабрь 2014 г.). «Исследование биомаркеров, полученных из устаревших данных микрочипов, на предмет их полезности в эпоху RNA-seq» . Геномная биология . 15 (12): 523. DOI : 10.1186 / s13059-014-0523-у . PMC 4290828 . PMID 25633159 .  
  64. ^ Lee JH, Daugharthy ER, Scheiman J, Kalhor R, Yang JL, Ferrante TC, Terry R, ​​Jeanty SS, Li C, Amamoto R, Peters DT, Turczyk BM, Marblestone AH, Inverso SA, Bernard A, Mali P, Rios X, Aach J, Church GM (март 2014 г.). «Высоко мультиплексное секвенирование субклеточной РНК in situ» . Наука . 343 (6177): 1360–3. Bibcode : 2014Sci ... 343.1360L . DOI : 10.1126 / science.1250212 . PMC 4140943 . PMID 24578530 .  
  65. ^ a b Shendure J, Ji H (октябрь 2008 г.). «Секвенирование ДНК нового поколения». Природа Биотехнологии . 26 (10): 1135–45. DOI : 10.1038 / nbt1486 . PMID 18846087 . S2CID 6384349 .  
  66. ^ Lahens NF, Kavakli IH, Zhang R, Hayer K, черный MB, Дик Н, Писарро А, Ким J, Irizarry R, Томас Р. Грант GR, Hogenesch JB (июнь 2014). «IVT-seq показывает крайнюю предвзятость в секвенировании РНК» . Геномная биология . 15 (6): R86. DOI : 10.1186 / GB-2014-15-6-R86 . PMC 4197826 . PMID 24981968 .  
  67. ^ a b Knierim E, Lucke B, Schwarz JM, Schuelke M, Seelow D (2011). «Систематическое сравнение трех методов фрагментации продуктов ПЦР дальнего действия для секвенирования следующего поколения» . PLOS ONE . 6 (11): e28240. Bibcode : 2011PLoSO ... 628240K . DOI : 10.1371 / journal.pone.0028240 . PMC 3227650 . PMID 22140562 .  
  68. ^ Рауса A, глава SR, Ordoukhanian P, Johnson JE (август 2015). "ClickSeq: Секвенирование следующего поколения без фрагментации посредством лигирования адаптеров со стохастически завершенными 3'-азидо кДНК" . Журнал молекулярной биологии . 427 (16): 2610–6. DOI : 10.1016 / j.jmb.2015.06.011 . PMC 4523409 . PMID 26116762 .  
  69. ^ Парекх S, Цигенхайн С, Вит В, Enard Вт, Hellmann я (май 2016). «Влияние амплификации на анализ дифференциальной экспрессии с помощью RNA-seq» . Научные отчеты . 6 : 25533. Bibcode : 2016NatSR ... 625533P . DOI : 10.1038 / srep25533 . PMC 4860583 . PMID 27156886 .  
  70. ^ Шанкер S, Полсон А, Edenberg HJ, Пик А, Переру А, Алексеевым YO, Beckloff N, Bivens штат Нью - Джерси, Доннелли R, Gillaspy А.Ф., Гроув D, Гу Вт, Джафари N, Керли-Гамильтон JS, Lyons RH, Теппер С , Николет CM (апрель 2015 г.). «Оценка коммерчески доступных наборов для амплификации РНК для секвенирования РНК с использованием очень низких вводимых количеств общей РНК» . Журнал биомолекулярных методов . 26 (1): 4–18. DOI : 10.7171 / jbt.15-2601-001 . PMC 4310221 . PMID 25649271 .  
  71. Jiang L, Schlesinger F, Davis CA, Zhang Y, Li R, Salit M, Gingeras TR, Oliver B (сентябрь 2011 г.). «Синтетические стандарты для экспериментов с последовательностью РНК» . Геномные исследования . 21 (9): 1543–51. DOI : 10.1101 / gr.121095.111 . PMC 3166838 . PMID 21816910 .  
  72. ^ Kivioja Т, Vähärautio А, Karlsson К, Bonke М, Энж М, Linnarsson S, Taipale J (ноябрь 2011 года). «Подсчет абсолютного числа молекул с использованием уникальных молекулярных идентификаторов». Методы природы . 9 (1): 72–4. DOI : 10.1038 / nmeth.1778 . PMID 22101854 . S2CID 39225091 .  
  73. ^ Тан Ф, Барбачору С, Ван И, Нордман Э, Ли С, Сюй Н, Ван Х, Бодо Дж, Туч ББ, Сиддики А, Лао К., Сурани Массачусетс (май 2009 г.). «Анализ целого транскриптома мРНК-Seq отдельной клетки». Методы природы . 6 (5): 377–82. DOI : 10.1038 / nmeth.1315 . PMID 19349980 . S2CID 16570747 .  
  74. Islam S, Zeisel A, Joost S, La Manno G, Zajac P, Kasper M, Lönnerberg P, Linnarsson S (февраль 2014 г.). «Количественный анализ одноклеточной РНК-последовательности с уникальными молекулярными идентификаторами». Методы природы . 11 (2): 163–6. DOI : 10.1038 / nmeth.2772 . PMID 24363023 . S2CID 6765530 .  
  75. ^ Jaitin DA, Кенигсберг E, Керен-Шауль H, N Elefant, Пол F, Зарецкий I, Mildner A, Cohen N, Jung S, Tanay A, Amit I (февраль 2014). «Массивно-параллельная одноклеточная последовательность РНК для безмаркерного разложения тканей на типы клеток» . Наука . 343 (6172): 776–9. Bibcode : 2014Sci ... 343..776J . DOI : 10.1126 / science.1247651 . PMC 4412462 . PMID 24531970 .  
  76. ^ a b Левин Дж. З., Яссур М., Адиконис Х, Нусбаум С., Томпсон Д. А., Фридман Н., Гнирке А., Регев А. (сентябрь 2010 г.). «Комплексный сравнительный анализ методов секвенирования нити-специфической РНК» . Методы природы . 7 (9): 709–15. DOI : 10.1038 / nmeth.1491 . PMC 3005310 . PMID 20711195 .  
  77. Перейти ↑ Quail MA, Smith M, Coupland P, Otto TD, Harris SR, Connor TR, Bertoni A, Swerdlow HP, Gu Y (июль 2012 г.). «Рассказ о трех платформах секвенирования нового поколения: сравнение секвенсоров Ion Torrent, Pacific Biosciences и Illumina MiSeq» . BMC Genomics . 13 : 341. DOI : 10.1186 / 1471-2164-13-341 . PMC 3431227 . PMID 22827831 .  
  78. ^ а б Лю Л., Ли И, Ли С., Ху Н, Хе И, Понг Р., Линь Д., Лу Л., Закон М. (2012). «Сравнение систем секвенирования нового поколения» . Журнал биомедицины и биотехнологии . 2012 : 251364. дои : 10,1155 / 2012/251364 . PMC 3398667 . PMID 22829749 .  
  79. ^ "SRA" . Проверено 6 октября 2016 .Архив чтения последовательности NCBI (SRA) был выполнен с использованием «RNA-Seq [Strategy]» и одного из «LS454 [Platform]», «Illumina [platform]», «ABI Solid [Platform]», «Ion Torrent [Platform] »,« PacBio SMRT »[Платформа]», чтобы сообщить количество запусков RNA-Seq, депонированных для каждой платформы.
  80. ^ Ломан NJ, Мишр RV, Dallman TJ, Constantinidou C, Гарбий SE, Вайн J, Pallen MJ (май 2012). «Сравнение производительности настольных высокопроизводительных платформ секвенирования». Природа Биотехнологии . 30 (5): 434–9. DOI : 10.1038 / nbt.2198 . PMID 22522955 . S2CID 5300923 .  
  81. Перейти ↑ Goodwin S, McPherson JD, McCombie WR (май 2016 г.). «Достигнув совершеннолетия: десять лет технологий секвенирования следующего поколения». Природа Обзоры Генетики . 17 (6): 333–51. DOI : 10.1038 / nrg.2016.49 . PMID 27184599 . S2CID 8295541 .  
  82. ^ Garalde ДР, Снелл Е.А., Jachimowicz Д, Сипос В, Ллойд JH, Брюс М, Пантич Н, Admassu Т, Джеймс Р, Warland А, Джордан М, Чикконе Дж, Серра S, Кинан J, Мартин S, Макнеилл л, Уоллес EJ, Jayasinghe L, Wright C, Blasco J, Young S, Brocklebank D, Juul S, Clarke J, Heron AJ, Turner DJ (март 2018 г.). «Высоко параллельное прямое секвенирование РНК на массиве нанопор». Методы природы . 15 (3): 201–206. DOI : 10.1038 / nmeth.4577 . PMID 29334379 . S2CID 3589823 .  
  83. ^ Ломан NJ, Quick J, Симпсон JT (август 2015). «Полный бактериальный геном собран de novo с использованием только данных секвенирования нанопор». Методы природы . 12 (8): 733–5. DOI : 10.1038 / nmeth.3444 . PMID 26076426 . S2CID 15053702 .  
  84. ^ Ozsolak Р, Платт Р., Джонс Д. Р., Reifenberger Ю.Г., Сасс Л.Е., McInerney Р, Томпсон Ф., Bowers Дж, Джеросз М, Милош ЛС (октябрь 2009 г.). «Прямое секвенирование РНК». Природа . 461 (7265): 814–8. Bibcode : 2009Natur.461..814O . DOI : 10,1038 / природа08390 . PMID 19776739 . S2CID 4426760 .  
  85. ^ a b Hart SN, Therneau TM, Zhang Y, Poland GA, Kocher JP (декабрь 2013 г.). «Расчет оценок размера выборки для данных секвенирования РНК» . Журнал вычислительной биологии . 20 (12): 970–8. DOI : 10,1089 / cmb.2012.0283 . PMC 3842884 . PMID 23961961 .  
  86. ^ a b c Конеса А., Мадригал П., Таразона С., Гомес-Кабреро Д., Сервера А., Макферсон А., Щесняк М. В., Гаффни Д. Д., Эло Л. Л., Чжан Х, Мортазави А. (январь 2016 г.). «Обзор лучших практик анализа данных RNA-seq» . Геномная биология . 17 : 13. DOI : 10.1186 / s13059-016-0881-8 . PMC 4728800 . PMID 26813401 .  
  87. ^ a b Rapaport F, Khanin R, Liang Y, Pirun M, Krek A, Zumbo P, Mason CE, Socci ND, Betel D (2013). «Комплексная оценка методов дифференциального анализа экспрессии генов по данным RNA-seq» . Геномная биология . 14 (9): R95. DOI : 10.1186 / GB-2013-14-9-R95 . PMC 4054597 . PMID 24020486 .  
  88. ^ Консорциум проекта ENCODE; Олдред, Шелли Ф .; Коллинз, Патрик Дж .; Дэвис, Кэрри А .; Дойл, Фрэнсис; Эпштейн, Чарльз Б.; Фритце, Сет; Харроу, Дженнифер; Каул, Раджиндер; Хатун, Джайнаб; Lajoie, Bryan R .; Ландт, Стивен Дж .; Ли, Бум-Кю; Паули, Флоренсия; Розенблум, Кейт Р .; Сабо, Питер; Сафи, Алексиас; Саньял, Амартья; Шореш, Ноам; Саймон, Джереми М .; Песня, Линьюнь; Альтшулер, Роберт С .; Бирни, Юэн; Браун, Джеймс Б .; Ченг, Чао; Джебали, Сара; Дун, Сяньцзюнь; Данэм, Ян; Эрнст, Джейсон; и другие. (Сентябрь 2012 г.). «Интегрированная энциклопедия элементов ДНК в геноме человека» . Природа . 489 (7414): 57–74. Bibcode : 2012Natur.489 ... 57T . doi :10.1038 / природа11247 . PMC  3439153 . PMID  22955616 .
  89. ^ Sloan CA, Chan ET, Davidson JM, Malladi VS, Strattan JS, Hitz BC, et al. (Январь 2016 г.). «КОДИРОВАТЬ данные на портале ENCODE» . Исследования нуклеиновых кислот . 44 (D1): D726–32. DOI : 10.1093 / NAR / gkv1160 . PMC 4702836 . PMID 26527727 .  
  90. ^ "ENCODE: Энциклопедия элементов ДНК" . encodeproject.org .
  91. ^ a b Ричи М.Э., Фипсон Б., Ву Д., Ху Y, Ло С.В., Ши В., Смит Г.К. (апрель 2015 г.). «Limma поддерживает анализ дифференциальной экспрессии для секвенирования РНК и исследований микрочипов» . Исследования нуклеиновых кислот . 43 (7): e47. DOI : 10.1093 / NAR / gkv007 . PMC 4402510 . PMID 25605792 .  
  92. ^ a b Робинсон MD, McCarthy DJ, Smyth GK (январь 2010 г.). «edgeR: пакет Bioconductor для анализа дифференциальной экспрессии цифровых данных экспрессии генов» . Биоинформатика . 26 (1): 139–40. DOI : 10.1093 / биоинформатики / btp616 . PMC 2796818 . PMID 19910308 .  
  93. ^ а б Хубер В., Кэри В.Дж., Джентльмен Р., Андерс С., Карлсон М., Карвалью Б.С. и др. (Февраль 2015 г.). «Организация высокопроизводительного геномного анализа с помощью Bioconductor» . Методы природы . 12 (2): 115–21. DOI : 10.1038 / nmeth.3252 . PMC 4509590 . PMID 25633503 .  
  94. Перейти ↑ Smyth, GK (2005). «Лимма: линейные модели для данных микрочипов». Решения для биоинформатики и вычислительной биологии с использованием R и Bioconductor . Статистика для биологии и здоровья. Спрингер, Нью-Йорк, штат Нью-Йорк. С. 397–420. CiteSeerX 10.1.1.361.8519 . DOI : 10.1007 / 0-387-29362-0_23 . ISBN  9780387251462.
  95. Перейти ↑ Steve., Russell (2008). Технология микрочипов на практике . Медоуз, Лиза А. Берлингтон: Elsevier. ISBN 9780080919768. OCLC  437246554 .
  96. ^ a b Хаас Б.Дж., Папаниколау А., Яссур М., Грабхерр М., Блад П.Д., Боуден Дж., Кугер М.Б., Экклс Д., Ли Б., Либер М., МакМейнс, доктор медицины, Отт М., Орвис Дж., Почет Н., Строцци Ф., Уикс Н. , Вестерман Р., Уильям Т., Дьюи К.Н., Хеншель Р., Ледюк Р.Д., Фридман Н., Регев А. (август 2013 г.). «Реконструкция последовательности транскрипта de novo из RNA-seq с использованием платформы Trinity для создания и анализа ссылок» . Протоколы природы . 8 (8): 1494–512. DOI : 10.1038 / nprot.2013.084 . PMC 3875132 . PMID 23845962 .  
  97. ^ a b Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL (март 2015 г.). «StringTie обеспечивает улучшенную реконструкцию транскриптома из считываний RNA-seq» . Природа Биотехнологии . 33 (3): 290–5. DOI : 10.1038 / nbt.3122 . PMC 4643835 . PMID 25690850 .  
  98. ^ Кодама Y, Shumway M, Leinonen R (январь 2012). «Архив чтения последовательности: взрывной рост данных секвенирования» . Исследования нуклеиновых кислот . 40 (выпуск базы данных): D54–6. DOI : 10.1093 / NAR / gkr854 . PMC 3245110 . PMID 22009675 .  
  99. ^ a b Эдгар Р., Домрачев М., Лэш А.Е. (январь 2002 г.). «Омнибус экспрессии гена: экспрессия гена NCBI и репозиторий массива данных гибридизации» . Исследования нуклеиновых кислот . 30 (1): 207–10. DOI : 10.1093 / NAR / 30.1.207 . PMC 99122 . PMID 11752295 .  
  100. Перейти ↑ Petrov A, Shams S (2004-11-01). «Обработка изображений микрочипов и контроль качества». Журнал систем обработки сигналов СБИС для технологий сигналов, изображений и видео . 38 (3): 211–226. DOI : 10,1023 / Б: VLSI.0000042488.08307.ad . S2CID 31598448 . 
  101. Перейти ↑ Petrov A, Shams S (2004). «Обработка изображений микрочипов и контроль качества». Журнал систем обработки сигналов СБИС для технологий сигналов, изображений и видео . 38 (3): 211–226. DOI : 10,1023 / Б: VLSI.0000042488.08307.ad . S2CID 31598448 . 
  102. ^ Kwon YM, Рикке S (2011). Секвенирование следующего поколения с высокой пропускной способностью . Методы молекулярной биологии. 733 . SpringerLink. DOI : 10.1007 / 978-1-61779-089-8 . ISBN 978-1-61779-088-1. S2CID  3684245 .
  103. Накамура К., Осима Т., Моримото Т., Икеда С., Йошикава Н., Шива Ю., Исикава С., Линак М.С., Хираи А., Такахаши Н., Алтаф-Уль-Амин М., Огасавара Н., Каная С. (июль 2011 г.). «Профиль ошибок секвенсоров Illumina для конкретных последовательностей» . Исследования нуклеиновых кислот . 39 (13): e90. DOI : 10.1093 / NAR / gkr344 . PMC 3141275 . PMID 21576222 .  
  104. ^ Ван Verk MC, Hickman R, Pieterse CM, Van Wees SC (апрель 2013). «RNA-Seq: откровение вестников». Тенденции в растениеводстве . 18 (4): 175–9. DOI : 10.1016 / j.tplants.2013.02.001 . ЛВП : 1874/309456 . PMID 23481128 . 
  105. ^ Эндрюс S (2010). «FastQC: инструмент контроля качества для данных последовательности с высокой пропускной способностью» . Бабрахам Биоинформатика . Проверено 23 мая 2017 .
  106. Lo CC, Chain PS (ноябрь 2014 г.). «Быстрая оценка и контроль качества данных секвенирования следующего поколения с помощью FaQC» . BMC Bioinformatics . 15 : 366. DOI : 10,1186 / s12859-014-0366-2 . PMC 4246454 . PMID 25408143 .  
  107. ^ a b c Trapnell C, Hendrickson DG, Sauvageau M, Goff L, Rinn JL, Pachter L (январь 2013 г.). «Дифференциальный анализ регуляции генов при разрешении транскриптов с помощью RNA-seq» . Природа Биотехнологии . 31 (1): 46–53. DOI : 10.1038 / nbt.2450 . PMC 3869392 . PMID 23222703 .  
  108. ^ a b Xie Y, Wu G, Tang J, Luo R, Patterson J, Liu S, Huang W, He G, Gu S, Li S, Zhou X, Lam TW, Li Y, Xu X, Wong GK, Wang J (Июнь 2014 г.). «SOAPdenovo-Trans: сборка транскриптома de novo с короткими чтениями RNA-Seq». Биоинформатика . 30 (12): 1660–6. arXiv : 1305,6760 . DOI : 10.1093 / биоинформатики / btu077 . PMID 24532719 . S2CID 5152689 .  
  109. ^ Картографы HTS. http://www.ebi.ac.uk/~nf/hts_mappers/
  110. ^ Фонсека Н.А., Рунг Дж, Brazma А, Marioni JC (декабрь 2012). «Инструменты для отображения данных секвенирования с высокой пропускной способностью» . Биоинформатика . 28 (24): 3169–77. DOI : 10.1093 / биоинформатики / bts605 . PMID 23060614 . 
  111. ^ Trapnell C, Пэчтер L, Salzberg SL (май 2009). «TopHat: обнаружение сплайсинговых соединений с помощью RNA-Seq» . Биоинформатика . 25 (9): 1105–11. DOI : 10.1093 / биоинформатики / btp120 . PMC 2672628 . PMID 19289445 .  
  112. ^ a b Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (май 2010 г.). «Сборка и количественное определение транскриптов с помощью RNA-Seq выявляет неаннотированные транскрипты и переключение изоформ во время дифференцировки клеток» . Природа Биотехнологии . 28 (5): 511–5. DOI : 10.1038 / nbt.1621 . PMC 3146043 . PMID 20436464 .  
  113. ^ Миллер JR, Корен S, Sutton G (июнь 2010). «Алгоритмы сборки для данных секвенирования следующего поколения» . Геномика . 95 (6): 315–27. DOI : 10.1016 / j.ygeno.2010.03.001 . PMC 2874646 . PMID 20211242 .  
  114. ^ O'Neil ST, Emrich SJ (июль 2013). «Оценка метрик сборки транскриптома De Novo на предмет согласованности и полезности» . BMC Genomics . 14 : 465. DOI : 10.1186 / 1471-2164-14-465 . PMC 3733778 . PMID 23837739 .  
  115. ^ Смит-Унна R, Boursnell C, Patro R, Hibberd JM, Келли S (август 2016). «TransRate: безреференсная оценка качества сборок транскриптомов de novo» . Геномные исследования . 26 (8): 1134–44. DOI : 10.1101 / gr.196469.115 . PMC 4971766 . PMID 27252236 .  
  116. Перейти ↑ Li B, Fillmore N, Bai Y, Collins M, Thomson JA, Stewart R, Dewey CN (декабрь 2014 г.). «Оценка сборок транскриптомов de novo по данным RNA-Seq» . Геномная биология . 15 (12): 553. DOI : 10.1186 / s13059-014-0553-5 . PMC 4298084 . PMID 25608678 .  
  117. ^ Zerbino DR, Birney E (май 2008). "Velvet: алгоритмы сборки короткого чтения de novo с использованием графов де Брейна" . Геномные исследования . 18 (5): 821–9. DOI : 10.1101 / gr.074492.107 . PMC 2336801 . PMID 18349386 .  
  118. ^ Schulz MH, Zerbino DR, Vingron M, Birney E (апрель 2012). «Оазисы: надежная сборка de novo RNA-seq в динамическом диапазоне уровней экспрессии» . Биоинформатика . 28 (8): 1086–92. DOI : 10.1093 / биоинформатики / bts094 . PMC 3324515 . PMID 22368243 .  
  119. ^ Робертсон Дж., Шейн Дж., Чиу Р., Корбетт Р., Филд М, Джекман С.Д. и др. (Ноябрь 2010 г.). «De novo сборка и анализ данных RNA-seq». Методы природы . 7 (11): 909–12. DOI : 10.1038 / nmeth.1517 . ЛВП : 1885/51040 . PMID 20935650 . S2CID 1034682 .  
  120. ^ a b Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, Adiconis X, Fan L, Raychowdhury R, ​​Zeng Q, Chen Z, Mauceli E, Hacohen N, Gnirke A, Rhind N, di Palma F, Биррен Б.В., Нусбаум К., Линдблад-То К., Фридман Н., Регев А. (май 2011 г.). «Сборка транскриптома полной длины из данных RNA-Seq без эталонного генома» . Природа Биотехнологии . 29 (7): 644–52. DOI : 10.1038 / nbt.1883 . PMC 3571712 . PMID 21572440 .  
  121. ^ Chevreux В, Pfisterer Т, Дрешер В, Driesel AJ, Мюллер Мы, Веттер Т, Suhai S (июнь 2004 г.). «Использование ассемблера miraEST для надежной и автоматической сборки транскриптов мРНК и обнаружения SNP в секвенированных EST» . Геномные исследования . 14 (6): 1147–59. DOI : 10.1101 / gr.1917404 . PMC 419793 . PMID 15140833 .  
  122. ^ Маргулис М., Эгхолм М., Альтман В.Е., Аттия С., Бадер Дж. С., Бембен Л.А. и др. (Сентябрь 2005 г.). «Секвенирование генома в микроизготовленных пиколитровых реакторах высокой плотности» . Природа . 437 (7057): 376–80. Bibcode : 2005Natur.437..376M . DOI : 10,1038 / природа03959 . PMC 1464427 . PMID 16056220 .  
  123. ^ Kumar S, Blaxter ML (октябрь 2010). «Сравнение de novo ассемблеров для 454 транскриптомных данных» . BMC Genomics . 11 : 571. DOI : 10.1186 / 1471-2164-11-571 . PMC 3091720 . PMID 20950480 .  
  124. ^ Банкевич А, Нурк С, Антипов Д., Гуревич А.А., Дворкин М, Куликов А.С., Лесин В.М., Николенко С.И., Фам С., Пржибельский А.Д., Пышкин А.В., Сироткин А.В., Вяххи Н., Теслер Г, Алексеев М.А., Певзнер П.А. (май 2012). «SPAdes: новый алгоритм сборки генома и его приложения для секвенирования отдельных клеток» . Журнал вычислительной биологии . 19 (5): 455–77. DOI : 10,1089 / cmb.2012.0021 . PMC 3342519 . PMID 22506599 .  
  125. Перейти ↑ Li B, Dewey CN (август 2011). «RSEM: точная количественная оценка транскриптов из данных RNA-Seq с или без эталонного генома» . BMC Bioinformatics . 12 : 323. DOI : 10,1186 / 1471-2105-12-323 . PMC 3163565 . PMID 21816040 .  
  126. ^ Ковака, Сэм; Зимин, Алексей В .; Pertea, Geo M .; Разаги, Рохам; Зальцберг, Стивен Л .; Пертя, Михаэла (2019-07-08). «Сборка транскриптома из выравниваний длинных последовательностей РНК с StringTie2» . bioRxiv : 694554. дои : 10,1101 / 694554 . Проверено 27 августа 2019 .
  127. ^ Gehlenborg N, O'Donoghue С.И., Baliga Н.С., Goesmann A, Хиббс MA, Китано H, Kohlbacher O, Neuweger H, Schneider R, Тененбаум D, Gavin AC (март 2010). «Визуализация данных омики для системной биологии». Методы природы . 7 (3 доп.): S56–68. DOI : 10.1038 / nmeth.1436 . PMID 20195258 . S2CID 205419270 .  
  128. Anders S, Pyl PT, Huber W (январь 2015 г.). «HTSeq - среда Python для работы с высокопроизводительными данными секвенирования» . Биоинформатика . 31 (2): 166–9. DOI : 10.1093 / биоинформатики / btu638 . PMC 4287950 . PMID 25260700 .  
  129. ^ Bray Н.Л., Пиментел Н, Melsted Р, Пэчтер л (май 2016). «Почти оптимальная вероятностная количественная оценка последовательности РНК». Природа Биотехнологии . 34 (5): 525–7. DOI : 10.1038 / nbt.3519 . PMID 27043002 . S2CID 205282743 .  
  130. ^ Ли Н, Handsaker В, Wysoker А, Т Феннелл, Жуань Дж, Гомер N, Marth G, Abecasis G, R Дарбина (август 2009 г.). «Формат выравнивания / карты последовательностей и SAMtools» . Биоинформатика . 25 (16): 2078–9. DOI : 10.1093 / биоинформатики / btp352 . PMC 2723002 . PMID 19505943 .  
  131. Перейти ↑ Love MI, Huber W, Anders S (2014). «Умеренная оценка кратного изменения и дисперсии данных РНК-seq с помощью DESeq2» . Геномная биология . 15 (12): 550. DOI : 10.1186 / s13059-014-0550-8 . PMC 4302049 . PMID 25516281 .  
  132. ^ Frazee AC, Pertea G, Джаффе AE, Langmead B, Salzberg SL, порей JT (март 2015). «Ballgown устраняет разрыв между сборкой транскриптома и анализом экспрессии» . Природа Биотехнологии . 33 (3): 243–6. DOI : 10.1038 / nbt.3172 . PMC 4792117 . PMID 25748911 .  
  133. Fang Z, Cui X (май 2011 г.). «Вопросы дизайна и проверки в экспериментах с RNA-seq» . Брифинги по биоинформатике . 12 (3): 280–7. DOI : 10.1093 / нагрудник / bbr004 . PMID 21498551 . 
  134. ^ Ramsköld D, Ван ET, Burge CB, Сандберг R (декабрь 2009). «Обилие повсеместно экспрессируемых генов, выявленное с помощью данных о последовательности тканевого транскриптома» . PLOS Вычислительная биология . 5 (12): e1000598. Bibcode : 2009PLSCB ... 5E0598R . DOI : 10.1371 / journal.pcbi.1000598 . PMC 2781110 . PMID 20011106 .  
  135. ^ Vandesompele J, De Preter K, Pattyn F, Поппе B, Ван Рой N, Де Пап A, Speleman F (июнь 2002). «Точная нормализация количественных данных ОТ-ПЦР в реальном времени путем геометрического усреднения нескольких генов внутреннего контроля» . Геномная биология . 3 (7): ИССЛЕДОВАНИЕ0034. DOI : 10.1186 / GB-2002-3-7-research0034 . PMC 126239 . PMID 12184808 .  
  136. ^ Основные LJ, Водопад JJ, Lis JT (декабрь 2008). «Секвенирование зарождающейся РНК показывает широко распространенные паузы и дивергентную инициацию на промоторах человека» . Наука . 322 (5909): 1845–8. Bibcode : 2008Sci ... 322.1845C . DOI : 10.1126 / science.1162228 . PMC 2833333 . PMID 19056941 .  
  137. ^ Камарена л, Бруно V, Ойскирхена G, S Поджио, Снайдер М (апрель 2010 г.). «Молекулярные механизмы патогенеза, вызванного этанолом, выявленные с помощью РНК-секвенирования» . PLOS Патогены . 6 (4): e1000834. DOI : 10.1371 / journal.ppat.1000834 . PMC 2848557 . PMID 20368969 .  
  138. ^ a b Govind G, Harshavardhan VT, ThammeGowda HV, Patricia JK, Kalaiarasi PJ, Dhanalakshmi R, Iyer DR, Senthil Kumar M, Muthappa SK, Sreenivasulu N, Nese S, Udayakumar M, Makarla UK (июнь 2009 г.). «Идентификация и функциональная проверка уникального набора индуцированных засухой генов, преимущественно экспрессируемых в ответ на постепенный водный стресс в арахисе» . Молекулярная генетика и геномика . 281 (6): 591–605. DOI : 10.1007 / s00438-009-0432-Z . PMC 2757612 . PMID 19224247 .  
  139. ^ Тавассолы, Иман; Гольдфарб, Джозеф; Айенгар, Рави (2018-10-04). «Букварь по системной биологии: основные методы и подходы». Очерки биохимии . 62 (4): 487–500. DOI : 10.1042 / EBC20180003 . ISSN 0071-1365 . PMID 30287586 .  
  140. ^ Коста - В, Aprile М, Р Эспозито, Ciccodicola (февраль 2013 г. ). «RNA-Seq и комплексные заболевания человека: недавние достижения и перспективы на будущее» . Европейский журнал генетики человека . 21 (2): 134–42. DOI : 10.1038 / ejhg.2012.129 . PMC 3548270 . PMID 22739340 .  
  141. ^ Khurana E, Fu Y, Чакраварти D, F Демикелис, Рубин М. А., Герштейн М (февраль 2016). «Роль вариантов некодирующей последовательности при раке». Природа Обзоры Генетики . 17 (2): 93–108. DOI : 10.1038 / nrg.2015.17 . PMID 26781813 . S2CID 14433306 .  
  142. ^ Slotkin РК, Martienssen R (апрель 2007). «Мобильные элементы и эпигенетическая регуляция генома». Природа Обзоры Генетики . 8 (4): 272–85. DOI : 10.1038 / nrg2072 . PMID 17363976 . S2CID 9719784 .  
  143. ^ Прозерпио В, махата Б (февраль 2016). «Одноклеточные технологии для изучения иммунной системы» . Иммунология . 147 (2): 133–40. DOI : 10.1111 / imm.12553 . PMC 4717243 . PMID 26551575 .  
  144. ^ a b Байрон С.А., Ван Керен-Йенсен К.Р., Энгельталер Д.М., Карптен Д.Д., Крейг Д.В. (май 2016 г.). «Перевод секвенирования РНК в клиническую диагностику: возможности и проблемы» . Природа Обзоры Генетики . 17 (5): 257–71. DOI : 10.1038 / nrg.2016.10 . PMC 7097555 . PMID 26996076 .  
  145. ^ В HJ, Ван AH, Дженнингс MP (февраль 2008). «Открытие факторов вирулентности патогенных бактерий». Текущее мнение в химической биологии . 12 (1): 93–101. DOI : 10.1016 / j.cbpa.2008.01.023 . PMID 18284925 . 
  146. ^ Сузуки S, Horinouchi Т, Furusawa С (декабрь 2014). «Прогнозирование устойчивости к антибиотикам по профилям экспрессии генов» . Nature Communications . 5 : 5792. Bibcode : 2014NatCo ... 5.5792S . DOI : 10.1038 / ncomms6792 . PMC 4351646 . PMID 25517437 .  
  147. ^ Вестерманн AJ, Горский С.А., Vogel J (сентябрь 2012). «Двойная последовательность РНК патогена и хозяина» (PDF) . Обзоры природы. Микробиология . 10 (9): 618–30. DOI : 10.1038 / nrmicro2852 . PMID 22890146 . S2CID 205498287 .   
  148. ^ Durmuş S, Çakır Т, Эзгюр А, Guthke R (2015). «Обзор компьютерной системной биологии взаимодействий патоген-хозяин» . Границы микробиологии . 6 : 235. DOI : 10,3389 / fmicb.2015.00235 . PMC 4391036 . PMID 25914674 .  
  149. ^ а б Гарг Р., Шанкар Р., Таккар Б., Кудапа Х., Кришнамурти Л., Мантри Н., Варшней Р. К., Бхатия С., Джайн М. (январь 2016 г.). «Анализ транскриптомов выявляет молекулярные реакции, специфичные для генотипа и стадии развития, на стрессы от засухи и засоления нута» . Научные отчеты . 6 : 19228. Bibcode : 2016NatSR ... 619228G . DOI : 10.1038 / srep19228 . PMC 4725360 . PMID 26759178 .  
  150. ^ Гарсиа-Санчез S, Обер S, Iraqui I, Janbon G, Гиго JM, d'Enfert C (апрель 2004). «Биопленки Candida albicans: состояние развития, связанное со специфическими и стабильными паттернами экспрессии генов» . Эукариотическая клетка . 3 (2): 536–45. DOI : 10.1128 / EC.3.2.536-545.2004 . PMC 387656 . PMID 15075282 .  
  151. ^ Rich SM, Leendertz FH, Xu G, LeBreton M, Djoko CF, Aminake MN, Takang EE, Diffo JL, Pike BL, Rosenthal BM, Formenty P, Boesch C, Ayala FJ, Wolfe ND (сентябрь 2009 г.). «Происхождение злокачественной малярии» . Труды Национальной академии наук Соединенных Штатов Америки . 106 (35): 14902–7. Bibcode : 2009PNAS..10614902R . DOI : 10.1073 / pnas.0907740106 . PMC 2720412 . PMID 19666593 .  
  152. ^ Мок С., Эшли Э.А., Феррейра П.Е., Чжу Л., Лин З, Йео Т. и др. (Январь 2015 г.). «Лекарственная устойчивость. Популяционная транскриптомика малярийных паразитов человека раскрывает механизм устойчивости к артемизинину» . Наука . 347 (6220): 431–5. Bibcode : 2015Sci ... 347..431M . DOI : 10.1126 / science.1260403 . PMC 5642863 . PMID 25502316 .  
  153. ^ Verbruggen N, Германс C, Schat H (март 2009). «Молекулярные механизмы гипераккумуляции металлов в растениях». Новый фитолог . 181 (4): 759–76. DOI : 10.1111 / j.1469-8137.2008.02748.x . PMID 19192189 . 
  154. Li Z, Zhang Z, Yan P, Huang S, Fei Z, Lin K (ноябрь 2011 г.). «RNA-Seq улучшает аннотацию генов, кодирующих белок в геноме огурца» . BMC Genomics . 12 : 540. DOI : 10.1186 / 1471-2164-12-540 . PMC 3219749 . PMID 22047402 .  
  155. Hobbs M, Pavasovic A, King AG, Prentis PJ, Eldridge MD, Chen Z, Colgan DJ, Polkinghorne A, Wilkins MR, Flanagan C, Gillett A, Hanger J, Johnson RN, Timms P (сентябрь 2014 г.). «Ресурс транскриптома для коалы (Phascolarctos cinereus): понимание транскрипции ретровируса коалы и разнообразия последовательностей» . BMC Genomics . 15 : 786. DOI : 10.1186 / 1471-2164-15-786 . PMC 4247155 . PMID 25214207 .  
  156. ^ Хау GT, Ю. Дж, Кнаус В, Cronn R, S Колпак, Долан Р, Лоренц WW, Дин ДФ (февраль 2013 г. ). «Ресурс SNP для Douglas-fir: сборка транскриптомов de novo, обнаружение и проверка SNP» . BMC Genomics . 14 : 137. DOI : 10.1186 / 1471-2164-14-137 . PMC 3673906 . PMID 23445355 .  
  157. ^ МакГрат Л.Л., Фолльмер С.В., Kaluziak ST, Айерс J (январь 2016). «Сборка транскриптомов De novo для омара Homarus americanus и характеристика дифференциальной экспрессии генов в тканях нервной системы» . BMC Genomics . 17 : 63. DOI : 10,1186 / s12864-016-2373-3 . PMC 4715275 . PMID 26772543 .  
  158. ^ а б Мейер DH, Шумахер B (2020). «Возраст BiT: часы старения на основе транскриптома, близкие к теоретическому пределу точности» . Ячейка старения . 20 (3): e13320. DOI : 10.1111 / acel.13320 . PMC 7963339 . PMID 33656257 .  
  159. ^ Флейшер Ю.Г., Шульте R, Цай HH, Тиаги S, Ибарра А, Шохирев М.Н., Navlakha S (2018). «Прогнозирование возраста по транскриптому фибробластов кожи человека» . Геномная биология . 19 (1): 221. DOI : 10.1186 / s13059-018-1599-6 . PMC 6300908 . PMID 30567591 .  
  160. ^ Ноллер HF (1991). «Рибосомная РНК и трансляция». Ежегодный обзор биохимии . 60 : 191–227. DOI : 10.1146 / annurev.bi.60.070191.001203 . PMID 1883196 . 
  161. ^ Christov CP, Гардинер TJ, Szüts D, Krude T (сентябрь 2006). «Функциональная потребность в некодирующих Y РНК для репликации хромосомной ДНК человека» . Молекулярная и клеточная биология . 26 (18): 6993–7004. DOI : 10.1128 / MCB.01060-06 . PMC 1592862 . PMID 16943439 .  
  162. Перейти ↑ Kishore S, Stamm S (январь 2006 г.). «SnoRNA HBII-52 регулирует альтернативный сплайсинг серотонинового рецептора 2C». Наука . 311 (5758): 230–2. Bibcode : 2006Sci ... 311..230K . DOI : 10.1126 / science.1118265 . PMID 16357227 . S2CID 44527461 .  
  163. ^ Hüttenhofer A, Schattner P, Poláček N (май 2005). «Некодирующие РНК: надежда или шумиха?». Тенденции в генетике . 21 (5): 289–97. DOI : 10.1016 / j.tig.2005.03.007 . PMID 15851066 . 
  164. ^ Esteller M (ноябрь 2011). «Некодирующие РНК при заболеваниях человека». Природа Обзоры Генетики . 12 (12): 861–74. DOI : 10.1038 / nrg3074 . PMID 22094949 . S2CID 13036469 .  
  165. ^ "Омнибус экспрессии генов" . www.ncbi.nlm.nih.gov . Проверено 26 марта 2018 .
  166. ^ a b Brazma A, Hingamp P, Quackenbush J, Sherlock G, Spellman P, Stoeckert C, Aach J, Ansorge W, Ball CA, Causton HC, Gaasterland T, Glenisson P, Holstege FC, Kim IF, Markowitz V, Matese JC , Паркинсон Х., Робинсон А., Сарканс Ю., Шульце-Кремер С., Стюарт Дж., Тейлор Р., Вило Дж., Вингрон М. (декабрь 2001 г.). «Минимум информации об эксперименте с микрочипом (MIAME) - до стандартов для данных микрочипа» . Генетика природы . 29 (4): 365–71. DOI : 10.1038 / ng1201-365 . PMID 11726920 . S2CID 6994467 .  
  167. ^ a b Brazma A (май 2009 г.). «Минимум информации об эксперименте с микрочипом (MIAME) - успехи, неудачи, проблемы» . Журнал "Научный мир" . 9 : 420–3. DOI : 10.1100 / tsw.2009.57 . PMC 5823224 . PMID 19484163 .  
  168. Колесников Н., Гастингс Е., Кейс М., Мельничук О., Тан Я., Уильямс Е., Дилаг М., Курбатова Н., Брандизи М., Бурдетт Т., Меги К., Пиличева Е., Рустичи Г., Тихонов А., Паркинсон Н., Петришак Р. У, Бразма А. (январь 2015 г.). «Обновление ArrayExpress - упрощение представления данных» . Исследования нуклеиновых кислот . 43 (Выпуск базы данных): D1113–6. DOI : 10.1093 / NAR / gku1057 . PMC 4383899 . PMID 25361974 .  
  169. ^ Petryszak R, Keays М, Тан Ю.А., Фонсека Н.А., Баррера Е, Бардетт Т, Füllgrabe А, Фуэнтес А.М., Юпп S, Коскинен S, Мэннион О, Хуэрта л, Megy К, снег С, Williams Е, Barzine М, Гастингс E, Weisser H, Wright J, Jaiswal P, Huber W., Choudhary J, Parkinson HE, Brazma A (январь 2016 г.). «Обновление Атласа экспрессии - интегрированная база данных экспрессии генов и белков у людей, животных и растений» . Исследования нуклеиновых кислот . 44 (D1): D746–52. DOI : 10.1093 / NAR / gkv1045 . PMC 4702781 . PMID 26481351 .  
  170. ^ Hruz T, Laule O, Szabo G, Wessendorp F, Bleuler S, Oertle L, Widmayer P, Gruissem W, Zimmermann P (2008). «Genevestigator v3: эталонная база данных экспрессии для метаанализа транскриптомов» . Успехи биоинформатики . 2008 : 420747. дои : 10,1155 / 2008/420747 . PMC 2777001 . PMID 19956698 .  
  171. ^ Mitsuhashi Н, Fujieda К, Т Тамура, Кавамото S, Такаги Т, Окубо К (январь 2009 г.). «BodyParts3D: база данных трехмерных структур для анатомических концепций» . Исследования нуклеиновых кислот . 37 (выпуск базы данных): D782–5. DOI : 10.1093 / NAR / gkn613 . PMC 2686534 . PMID 18835852 .  
  172. Zhao Y, Li H, Fang S, Kang Y, Wu W, Hao Y, Li Z, Bu D, Sun N, Zhang MQ, Chen R (январь 2016). «NONCODE 2016: информативный и ценный источник данных о длинных некодирующих РНК» . Исследования нуклеиновых кислот . 44 (D1): D203–8. DOI : 10.1093 / NAR / gkv1252 . PMC 4702886 . PMID 26586799 .  

Заметки [ править ]

  1. ^ В молекулярной биологии  гибридизация - это явление, при котороммолекулыодноцепочечной дезоксирибонуклеиновой кислоты ( ДНК ) или рибонуклеиновой кислоты ( РНК )  отжигаются  с  комплементарной ДНК или РНК .
  2. ^ Один пиколитр примерно в 30 миллионов раз меньше капли воды.

Дальнейшее чтение [ править ]

  • Лоу Р., Ширли Н., Бликли М., Долан С., Шафи Т. (май 2017 г.). «Транскриптомические технологии» . PLOS Вычислительная биология . 13 (5): e1005457. Bibcode : 2017PLSCB..13E5457L . DOI : 10.1371 / journal.pcbi.1005457 . PMC  5436640 . PMID  28545146 .
  • Сравнительный анализ транскриптомики в справочном модуле наук о жизни
  • Программное обеспечение, используемое в транскриптомике:
    • запонки
    • Каллисто
    • шляпа