Эта статья - сирота , поскольку никакие другие статьи не ссылаются на нее . Пожалуйста , введите ссылки на эту страницу из связанных статей ; попробуйте инструмент "Найти ссылку ", чтобы получить предложения. ( Май 2019 г. ) |
Секвенирование цепочек матрицы одноклеточной ДНК , или Strand-seq , представляет собой метод селективного секвенирования цепей родительской матрицы дочерней клетки. [1] Этот метод предлагает широкий спектр приложений, включая идентификацию обменов сестринских хроматид в родительской клетке до сегрегации, оценку неслучайной сегрегации сестринских хроматид, идентификацию разориентированных контигов в сборках генома , геном de novo сборка обоих гаплотипов в диплоидных организмах, включая человека, гаплотипирование всей хромосомыи идентификация структурных вариаций зародышевой линии и соматических геномов , последняя из которых может быть надежно обнаружена даже в отдельных клетках.
Strand-seq (одноклеточное и одноцепочечное секвенирование) было одним из первых протоколов одноклеточного секвенирования, описанных в 2012 году. [1] Этот геномный метод выборочно секвенирует цепочки родительских матриц в библиотеках ДНК одиночных дочерних клеток . [1] В качестве доказательства концепции исследования авторы продемонстрировали способность получать информацию о последовательности из хромосомных цепей Уотсона и / или Крика в отдельной библиотеке ДНК, в зависимости от способа разделения хроматид; типичная библиотека ДНК всегда будет содержать ДНК обеих цепей. Авторы были особенно заинтересованы в демонстрации полезности strand-seq в обнаружении обменов сестринских хроматид .(SCE) в высоком разрешении. Они успешно идентифицировали восемь предполагаемых SCE в линии эмбриональных стволовых (meS) клеток мыши (мыши ) с разрешением до 23 п.н. Также было показано, что эта методология имеет большую полезность для распознавания паттернов неслучайной сегрегации хроматид, особенно в клонах стволовых клеток. Кроме того, SCE используются в качестве диагностических индикаторов стресса генома, информации, которая полезна в биологии рака. Большинство исследований по этой теме включает наблюдение за ассортиментом цепочек хромосомных матриц на протяжении многих циклов развития клеток и сопоставление неслучайного набора с судьбами конкретных клеток. Протоколы одноклеточного секвенирования были основополагающими при разработке этого метода, но они различаются по нескольким аспектам.
Прошлые методы использовались для отслеживания паттернов наследования хроматид для каждой нити и выяснения процесса неслучайной сегрегации:
Эксперименты по отслеживанию импульсов использовались для определения моделей сегрегации хромосом в дополнение к изучению других зависимых от времени клеточных процессов. [2] Вкратце, анализ с отслеживанием импульсов позволяет исследователям отслеживать радиоактивно меченые молекулы в клетке. В экспериментах, используемых для изучения неслучайного набора хромосом, стволовые клетки маркируются или «пульсируются» аналогом нуклеотида, который включен в реплицированные цепи ДНК. [3] Это позволяет отслеживать зарождающиеся насаждения через множество циклов репликации . К сожалению, этот метод имеет низкое разрешение, поскольку его можно наблюдать только на уровне хроматид.
CO-FISH, или специфическая для цепи флуоресценция in situ, облегчает специфическое для цепи нацеливание ДНК с помощью флуоресцентно-меченых зондов. [4] Он использует однородную ориентацию основных спутников относительно направления теломер , что позволяет однозначно обозначать нити как «Watson» или «Crick». Используя однонаправленные зонды, которые распознают основные сателлитные области, связанные с флуоресцентно меченными красителями, можно связать отдельные нити. [4] Чтобы гарантировать, что помечена только цепочка-матрица, вновь образованные цепочки должны быть разрушены за счет включения BrdU и фотолиза .. Этот протокол предлагает улучшенное цитогенетическое разрешение, позволяя исследователям наблюдать отдельные нити, а не целые хроматиды с помощью экспериментов с отслеживанием импульсов. Более того, неслучайная сегрегация хроматид может быть непосредственно проанализирована путем нацеливания на основные сателлитные маркеры.
Представляющие интерес клетки культивируют либо in vivo, либо in vitro. Во время S-фазы клетки обрабатываются бромдезоксиуридином (BrdU), который затем включается в их формирующуюся ДНК, действуя как заменитель тимидина. После того, как произошло хотя бы одно событие репликации, дочерние клетки синхронизируются в фазе G2 и индивидуально разделяются с помощью сортировки клеток, активируемой флуоресценцией (FACS) . Клетки напрямую сортируются в буфер для лизиса .и их ДНК извлекается. Будучи арестованными в определенном количестве поколений (обычно в одном), можно оценить паттерны наследования сестринских хроматид. Следующие ниже методы концентрируются на секвенировании ДНК одной дочерней клетки. На этом этапе хромосомы состоят из формирующихся цепей с BrdU вместо тимидина, а исходные цепочки матрицы примированы для подготовки библиотеки секвенирования ДНК. Поскольку этот протокол был опубликован в 2012 году [1] , каноническая методология хорошо описана только для Illumina .платформы для секвенирования; протокол может быть легко адаптирован для других платформ секвенирования в зависимости от приложения. Затем ДНК инкубируется со специальным красителем, так что когда комплекс BrdU-краситель возбуждается УФ-светом, возникающие цепи разрываются в результате фотолиза . Этот процесс подавляет амплификацию зарождающейся цепи полимеразной цепной реакцией (ПЦР), позволяя амплифицировать только родительские цепи матрицы. Создание библиотеки происходит как обычно для секвенирования парных концов Illumina. Затем мультиплексирующие праймеры ПЦР лигируют с ампликонами ПЦР с помощью штрих-кодов гексамеров, идентифицирующих, из каких клеток каждый фрагмент они получены. В отличие от протоколов секвенирования отдельных клеток , Strand-seq не использует многократную амплификацию смещения.или MALBAC для амплификации ДНК. Скорее, это зависит исключительно от ПЦР.
Большинство текущих приложений Strand-seq начинаются с выравнивания секвенированных чтений с эталонным геномом. Выравнивание можно выполнять с помощью различных выравнивателей с коротким считыванием , таких как BWA и Bowtie. [5] [6] Путем сопоставления считываний Strand-seq из одной клетки с эталонным геномом можно определить унаследованные цепочки матрицы. Если клетка была секвенирована после более чем одного поколения, образец хроматидного ассортимента может быть установлен для конкретной клеточной линии под рукой. Биоинформатический анализ унаследованных шаблонов (BAIT) был первым биоинформатическим программным обеспечением, предназначенным исключительно для анализа считываний, полученных с помощью методологии Strand-seq. [7]Он начинается с выравнивания считываний с эталонной последовательностью, разбиения генома на разделы и, наконец, подсчета количества считываний Уотсона и Крика, попадающих в каждую ячейку. Отсюда BAIT позволяет идентифицировать события SCE, неправильно ориентированные контиги в эталонном геноме, анеуплоидные хромосомы и способы сегрегации сестринских хроматид. Это также может помочь в сборке геномов на ранней стадии построения и назначении орфанных каркасов местам в геномах поздней сборки. Вслед за BAIT недавно были представлены многочисленные инструменты биоинформатики, которые используют данные Strand-seq для различных приложений (см., Например, следующие разделы о гаплотипировании, сборке генома de novo и обнаружении структурных вариаций в отдельных клетках, со ссылкой на соответствующие статьи по ссылкам).
Strand-seq требует, чтобы клетки подвергались делению для мечения BrdU, и, таким образом, не применимо к фиксированным формалином образцам или неделящимся клеткам. Но его можно применять к нормальным митотическим клеткам и тканям, органоидам, а также к образцам лейкемии и опухолей с использованием свежих или замороженных первичных образцов. Strand-seq использует секвенирование Illumina, а приложения, которым требуется информация о последовательности из различных технологий секвенирования, требуют новых протоколов или, альтернативно, интеграции данных, созданных с использованием различных платформ секвенирования, как недавно было показано. [8] [9]
Авторы первых статей, описывающих Strand-seq, показали, что они смогли достичь разрешения 23 п.н. для картирования SCE, и другие большие хромосомные аномалии, вероятно, будут разделять это разрешение отображения (если выполняется точное картирование точек останова). Однако разрешение зависит от комбинации используемой платформы для секвенирования, протоколов подготовки библиотеки и количества проанализированных клеток, а также от глубины секвенирования на клетку. Однако было бы разумно дополнительно повысить точность с помощью технологий секвенирования, которые не приводят к ошибкам в гомополимерных повторах.
Strand-seq был первоначально предложен как инструмент для идентификации обменов сестринских хроматид. [1] Будучи процессом, который локализован в отдельных клетках, секвенирование ДНК более чем одной клетки, естественно, рассеивает эти эффекты и предполагает отсутствие событий SCE. Более того, классические методы секвенирования одиночных клеток не могут показать эти события из-за смещений гетерогенной амплификации и информации о двухцепочечных последовательностях, что требует Strand-seq. Используя справочную информацию о выравнивании, исследователи могут идентифицировать SCE, если направленность унаследованной цепи матрицы изменяется.
Разориентированные контиги присутствуют в эталонных геномах в значительной степени (например, 1% в эталонном геноме мышей). [1] [10] Strand-seq, в отличие от традиционных методов секвенирования, может обнаруживать эти искажения. [1] Разориентированные контиги присутствуют там, где наследование цепи изменяется от одного гомозиготного состояния к другому (напр. WW на CC или CC на WW). Более того, это изменение состояния видно в каждой библиотеке Strand-seq, что усиливает присутствие неверно ориентированного контига. [7]
До 1960-х годов предполагалось, что сестринские хроматиды случайным образом разделяются на дочерние клетки. Однако с тех пор в клетках млекопитающих наблюдается неслучайная сегрегация сестринских хроматид. [11] [12] Было предложено несколько гипотез для объяснения неслучайной сегрегации, включая гипотезу бессмертия и гипотезу молчаливой сестры, одна из которых может быть проверена методами, включающими Strand-seq.
"Гипотеза бессмертного нити"
Мутации происходят каждый раз, когда клетка делится. Некоторые долгоживущие клетки (например, стволовые клетки) могут быть особенно затронуты этими мутациями. Гипотеза бессмертной цепи предполагает, что эти клетки избегают накопления мутаций, постоянно сохраняя родительские цепи матрицы [9]. Чтобы эта гипотеза была верной, сестринские хроматиды от каждой хромосомы должны расщепляться неслучайным образом. Кроме того, одна клетка будет сохранять точно такой же набор цепочек матрицы после каждого деления, отдавая остальное другим клеточным продуктам деления. [13]
"Гипотеза молчаливой сестры"
Эта гипотеза утверждает, что сестринские хроматиды имеют разные эпигенетические сигнатуры, тем самым также различающуюся регуляцию экспрессии. Когда происходит репликация, неслучайное разделение сестринских хроматид обеспечивает судьбы дочерних клеток. [14] Оценка обоснованности этой гипотезы потребует совместного анализа Strand-seq и профилей экспрессии генов для обеих дочерних клеток. [13]
Выходные данные BAIT показывают наследование цепочек родительских шаблонов вдоль генома. [7] Обычно для каждой аутосомы наследуются две цепи шаблона, и любое отклонение от этого числа указывает на случай анеуплоидии , которая может быть визуализирована в отдельных клетках.
Инверсии - это класс структурных вариаций , сбалансированных по количеству копий, которые приводят к изменению направленности цепи, легко визуализируемой Strand-seq. Следовательно, Strand-seq может использоваться для быстрого обнаружения полиморфных инверсий у людей и приматов, включая события размером с мегабазу, встроенные в большие сегментные дупликации, которые, как известно, недоступны для секвенирования Illumina . [15] [16]
Исследование, опубликованное в Интернете в 2019 году, также продемонстрировало, что с помощью Strand-seq все классы структурной вариации ≥200kb, включая делеции, дупликации, инверсии, инвертированные дупликации, сбалансированные транслокации, несбалансированные транслокации, цикл разрыва-слияния-моста опосредуют сложные перестройки ДНК и хромотрипсис. события чувствительно обнаруживаются в отдельных ячейках или субклонах с использованием трехканальной обработки отдельных ячеек (scTRIP). scTRIP работает через совместное моделирование ориентации чтения, глубины чтения и фазы гаплотипа для обнаружения SV в отдельных ячейках. [17] Используя scTRIP, структурные варианты разрешаются гаплотипом по длине хромосомы, который обеспечивает более высокую чувствительность и специфичность для вызова структурных вариантов одной клетки, чем другие современные технологии.[17] Поскольку scTRIP не требует чтения (или пар чтения), пересекающих границы (или точки останова) структурных вариантов в отдельных клетках для вызова варианта, он не страдает от известных артефактов одноклеточных методов, основанных на амплификации всего генома (т. Е. так называемые химеры чтения), которые, как правило, затрудняют анализ структурных вариаций в отдельных клетках. [17]
Геномы ранней сборки довольно фрагментированы, с неупорядоченными и неориентированными контигами. Использование Strand-seq предоставляет информацию о направленности для сопровождения последовательности, что в конечном итоге помогает разрешить размещение контигов. Контиги, присутствующие в одной хромосоме, будут демонстрировать одинаковую направленность при условии, что события SCE не произошли. Напротив, контиги, присутствующие в разных хромосомах, будут демонстрировать одинаковую направленность только в 50% библиотек Strand-seq. [7] Эшафоты, последовательные контиги, пересекаемые разрывом, могут быть локализованы таким же образом. [7]
Тот же принцип использования направления цепи для различения больших молекул ДНК позволяет использовать Strand-seq в качестве инструмента для конструирования целых хромосомных гаплотипов генетической изменчивости, от теломер до теломер. [18]
Недавние отчеты показали, что Strand-seq может быть вычислительно интегрирован с технологией долгого считывания секвенирования с уникальными преимуществами обеих технологий, позволяющих генерировать сильно смежные гаплотипические разрешенные de novo сборки генома человека. [8] Эти геномные сборки объединяют все формы генетических вариаций, включая однонуклеотидные варианты, инделки и структурные вариации даже в сложных геномных локусах, и недавно были применены для создания всеобъемлющих карт структурных вариаций с учетом гаплотипов в панели разнообразия людей из различных предки. [9]
Возможность того, что BrdU, заменяющий тимин в геномной ДНК, может вызывать двухцепочечные хромосомные разрывы и, в частности, приводить к SCE, ранее обсуждалась в литературе. [19] [20] Кроме того, предполагается, что включение BrdU мешает структуре сегрегации цепей. [13] Если это так, может возникнуть рост числа ложноположительных ОСП, которые могут быть аннотированы. Поэтому многие клетки следует анализировать с использованием протокола Strand-seq, чтобы убедиться, что SCE действительно присутствуют в популяции. Для структурных вариантов, обнаруженных в отдельных клетках, обнаружение одного и того же варианта (на одном и том же гаплотипе) в более чем одной клетке может исключить включение BrdU как возможную причину. [17]
Количество цепочек единичных клеток, которые необходимо секвенировать, чтобы аннотация была принята, еще не предложено и сильно зависит от задаваемых вопросов. Поскольку Strand-seq основан на методах секвенирования отдельных клеток, необходимо также учитывать проблемы, возникающие при секвенировании отдельных клеток. К ним относятся отсутствие стандартов для выделения и амплификации клеток. Несмотря на то, что предыдущие исследования Strand-seq изолировали клетки с помощью FACS, микрофлюидика также служит привлекательной альтернативой. Было показано, что ПЦР дает больше ошибочных продуктов амплификации по сравнению с методами на основе смещения цепи, такими как MDA и MALBAC, тогда как последние два метода генерируют химерные считывания как побочный продукт, что может привести к ошибочным вызовам структурных вариаций. [21] [17]MDA и MALBAC также генерируют больше выпадений, чем Strand-seq во время обнаружения SV, потому что они требуют чтения, которые пересекают точку останова SV, чтобы включить его обнаружение (это не требуется ни для одного из различных классов SV, которые может обнаруживать Strand-seq). [17] Амплификация смещения цепи также имеет тенденцию генерировать больше последовательностей и более длинные продукты, что может быть полезно для технологий секвенирования с длинным считыванием.
Ресурсы библиотеки о секвенировании цепи матрицы одноклеточной ДНК |
|
В Викиучебнике есть книга по теме: Секвенирование следующего поколения (NGS) . |