Секвенирование одной молекулы в реальном времени ( SMRT ) - это параллельный метод секвенирования одной молекулы ДНК . Секвенирование одной молекулы в реальном времени использует волновод с нулевой модой (ZMW). [1] Единственный фермент ДНК-полимераза прикреплен к основанию ZMW с единственной молекулой ДНК в качестве матрицы. ZMW - это структура, которая создает освещенный объем наблюдения, который достаточно мал, чтобы наблюдать только один нуклеотид ДНК, включенный ДНК-полимеразой.. Каждое из четырех оснований ДНК присоединено к одному из четырех различных флуоресцентных красителей. Когда нуклеотид включается ДНК-полимеразой, флуоресцентная метка отщепляется и диффундирует за пределы области наблюдения ZMW, где ее флуоресценция больше не наблюдается. Детектор обнаруживает флуоресцентный сигнал включения нуклеотида, и определение основания выполняется в соответствии с соответствующей флуоресценцией красителя. [2]
Технология
Секвенирование ДНК выполняется на чипе, который содержит много ZMW. Внутри каждого ZMW одна активная ДНК-полимераза с одной молекулой одноцепочечной ДНК-матрицы иммобилизована на дно, через которое свет может проникать и создавать камеру визуализации, которая позволяет контролировать активность ДНК-полимеразы на уровне одной молекулы. Сигнал от фосфо-связанного нуклеотида, включенного ДНК-полимеразой, детектируется в процессе синтеза ДНК, что приводит к секвенированию ДНК в реальном времени.
Фосфосвязанный нуклеотид
Для каждого нуклеотидного основания существует соответствующая молекула флуоресцентного красителя, которая позволяет детектору идентифицировать основание, включаемое ДНК-полимеразой, когда она выполняет синтез ДНК . Молекула флуоресцентного красителя присоединена к фосфатной цепи нуклеотида. Когда нуклеотид включается ДНК-полимеразой, флуоресцентный краситель отщепляется фосфатной цепью как часть естественного процесса синтеза ДНК, во время которого образуется фосфодиэфирная связь для удлинения цепи ДНК. Затем отщепленная молекула флуоресцентного красителя диффундирует из детектируемого объема, так что флуоресцентный сигнал больше не детектируется. [3]
Волновод с нулевым режимом
Волновод с нулевой модой (ZMW) представляет собой нанофотонную ограничивающую структуру, которая состоит из круглого отверстия в алюминиевой оболочке, нанесенной на прозрачную подложку из диоксида кремния. [4]
Отверстия ZMW имеют диаметр ~ 70 нм и глубину ~ 100 нм. Из-за поведения света при прохождении через маленькую апертуру оптическое поле экспоненциально затухает внутри камеры. [5]
Объем наблюдения в освещенном ZMW составляет ~ 20 зептолитров (20 X 10 -21 литр). В этом объеме можно легко обнаружить активность ДНК-полимеразы, включающей единственный нуклеотид. [3]
Производительность секвенирования
Производительность секвенирования можно измерить по длине считывания, точности и общей пропускной способности за эксперимент. Системы секвенирования PacBio, использующие ZMW, имеют преимущество в виде большой длины считывания, хотя частота ошибок составляет порядка 5-15%, а пропускная способность образцов ниже, чем у платформ секвенирования Illumina . [6]
19 сентября 2018 года Pacific Biosciences [PacBio] выпустила химическую версию Sequel 6.0, синхронизирующую версию химии с версией программного обеспечения. Производительность контрастирует для библиотек с большими вставками с ДНК с высокой молекулярной массой и для библиотек с более короткими вставками длиной менее ~ 15000 оснований. Для более крупных шаблонов средняя длина чтения составляет до 30 000 оснований. Для библиотек с более короткими вставками средняя длина считывания составляет до 100 000 оснований при считывании одной и той же молекулы в круге. Последние библиотеки с более короткими вставками затем дают до 50 миллиардов оснований из одной ячейки SMRT. [7]
История
Pacific Biosciences (PacBio) коммерциализировала секвенирование SMRT в 2011 году [8] после выпуска бета-версии своего инструмента RS в конце 2010 года [9].
RS и RS II
При коммерциализации длина чтения имела нормальное распределение со средним значением около 1100 оснований. Новый химический набор, выпущенный в начале 2012 года, увеличил длину чтения секвенатора; один из первых заказчиков химии назвал среднюю длину чтения от 2500 до 2900 оснований. [10]
Химический набор XL, выпущенный в конце 2012 года, увеличил среднюю длину чтения до более чем 4300 оснований. [11] [12]
21 августа 2013 г. компания PacBio выпустила новый набор для связывания ДНК-полимеразы P4. Этот фермент P4 имеет среднюю длину считывания более 4300 оснований в сочетании с химией секвенирования C2 и более 5000 оснований в сочетании с химией XL. [13] Точность фермента аналогична точности C2, достигая QV50 между 30X и 40X охватом. Полученные в результате атрибуты P4 обеспечили сборку более высокого качества с использованием меньшего количества ячеек SMRT и с улучшенным вызовом вариантов. [13] В сочетании с выбором размера входной ДНК (с использованием прибора для электрофореза, такого как BluePippin) дает среднюю длину считывания более 7 килобаз. [14]
3 октября 2013 г. PacBio выпустила новую комбинацию реагентов для PacBio RS II, ДНК-полимеразы P5 с химическим составом C3 (P5-C3). Вместе они увеличивают длину чтения при секвенировании в среднем примерно до 8 500 оснований, причем самые длинные чтения превышают 30 000 оснований. [15] Пропускная способность на одну клетку SMRT составляет около 500 миллионов оснований, что подтверждается результатами секвенирования клеточной линии CHM1. [16]
15 октября 2014 года PacBio объявила о выпуске нового химического вещества P6-C4 для системы RS II, которое представляет 6-е поколение полимеразы компании и 4-е поколение химии, дополнительно увеличивая среднюю длину считывания до 10 000-15 000 оснований, с самым длинным читает более 40 000 баз. Ожидается, что пропускная способность с новым химическим составом составит от 500 миллионов до 1 миллиарда оснований на одну ячейку SMRT, в зависимости от секвенируемого образца. [17] [18] Это была последняя версия химии, выпущенная для прибора RS.
На пропускную способность в эксперименте для технологии влияет как длина считывания секвенированных молекул ДНК, так и общий мультиплекс SMRT Cell. Прототип SMRT Cell содержал около 3000 лунок ZMW, которые позволяли распараллеливать секвенирование ДНК. При коммерциализации каждая SMRT-ячейка имела структуру из 150 000 лунок ZMW, которые считывались двумя наборами по 75 000. [19] В апреле 2013 года компания выпустила новую версию секвенсора под названием «PacBio RS II», который одновременно использует все 150 000 отверстий ZMW, удваивая пропускную способность за эксперимент. [20] [21] В режиме максимальной пропускной способности в ноябре 2013 года использовалось связывание P5, химия C3, выбор размера BluePippin, и PacBio RS II официально давал 350 миллионов оснований на одну ячейку SMRT, хотя набор данных de novo человека, выпущенных со средним химическим составом, составил 500 миллионов баз на ячейку SMRT. Производительность зависит от типа секвенируемого образца. [22] С введением химии P6-C4 типичная пропускная способность на одну ячейку SMRT увеличилась с 500 миллионов оснований до 1 миллиарда оснований.
C1 | C2 | P4-XL | P5-C3 | P6-C4 | |
---|---|---|---|---|---|
Базы средней длины чтения | 1100 | 2500–2900 | 4300–5000 | 8500 | 10 000–15 000 |
Пропускная способность на ячейку SMRT | 30–40 млн | 60–100 млн | 250–300 млн | 350–500 млн | 500M - 1B |
Продолжение
В сентябре 2015 года компания объявила о запуске нового инструмента для секвенирования, Sequel System, который увеличил емкость до 1 миллиона отверстий ZMW. [23] [24]
С прибором Sequel начальная длина считывания была сопоставима с RS, затем более поздние версии химического анализа увеличили длину считывания.
23 января 2017 года была выпущена химия V2. Это увеличило среднюю длину чтения до 10 000–18 000 оснований. [25]
8 марта 2018 года была выпущена химия 2.1. Это увеличило среднюю длину чтения до 20 000 оснований и половину всех чтений длиной более 30 000 оснований. Выход на одну ячейку SMRT увеличился до 10 или 20 миллиардов оснований либо для библиотек с большими вставками, либо для библиотек с более короткими вставками (например, ампликона ) соответственно. [26]
19 сентября 2018 года компания объявила о химии Sequel 6.0 со средней длиной чтения, увеличенной до 100 000 оснований для библиотек с более короткими вставками и 30 000 для библиотек с более длинными вставками. Выход ячеек SMRT увеличился до 50 миллиардов оснований для библиотек с более короткими вставками. [7]
V2 | 2.1 | 6.0 | |
---|---|---|---|
Базы средней длины чтения | 10 000–18 000 | 20 000–30 000 | 30 000–100 000 |
Пропускная способность на ячейку SMRT | 5Б - 8Б | 10Б - 20Б | 20B - 50B |
Чип 8M
В апреле 2019 года компания выпустила новую ячейку SMRT с восемью миллионами ZMW [27], увеличив ожидаемую пропускную способность каждой ячейки SMRT в восемь раз. [28] Клиенты с ранним доступом в марте 2019 года сообщили о пропускной способности более 58 пользовательских ячеек, 250 ГБ сырого урожая на ячейку с шаблонами длиной около 15 КБ и 67,4 ГБ на ячейку с шаблонами с молекулами более высокого веса. [29] Производительность системы теперь указывается либо в высокомолекулярном непрерывном долгом чтении, либо в предварительно скорректированном HiFi (также известном как Circular Consensus Sequence (CCS)). Для высокомолекулярных прочтений примерно половина всех прочтений имеет длину более 50 т.п.н.
Ранний доступ | 1.0 | 2.0 | |
---|---|---|---|
Пропускная способность на ячейку SMRT | ~ 67,4 ГБ | До 160 ГБ | До 200 ГБ |
Производительность HiFi включает исправленные базы с качеством выше Q20 по Phred с использованием повторных проходов ампликона для исправления. Они занимают ампликоны длиной до 20 КБ.
Ранний доступ | 1.0 | 2.0 | |
---|---|---|---|
Необработанные чтения на ячейку SMRT | ~ 250 ГБ | До 360 ГБ | До 500 ГБ |
Скорректированные чтения на ячейку SMRT (> Q20) | ~ 25 ГБ | До 36 ГБ | До 50 ГБ |
Заявление
Секвенирование одной молекулы в реальном времени может быть применимо для широкого спектра геномных исследований.
Для секвенирования генома de novo длины считывания из секвенирования одной молекулы в реальном времени сравнимы или больше, чем у метода секвенирования Сэнгера, основанного на терминации дидезоксинуклеотидной цепи. Более длинная длина чтения позволяет проводить секвенирование генома de novo и упростить сборку генома. [2] [30] [31] Ученые также используют одномолекулярное секвенирование в реальном времени в гибридных сборках для геномов de novo, чтобы комбинировать данные последовательности короткого чтения с данными последовательности длинного чтения. [32] [33] В 2012 году было выпущено несколько рецензируемых публикаций, демонстрирующих автоматическое завершение бактериальных геномов [34] [35], включая одну статью, в которой Celera Assembler обновляла конвейер для завершения генома с использованием длинных считываний секвенирования SMRT. [36] В 2013 году ученые подсчитали, что долгосрочное секвенирование можно использовать для полной сборки и завершения большинства геномов бактерий и архей. [37]
Та же самая молекула ДНК может быть независимо повторно секвенирована путем создания кольцевой ДНК-матрицы и использования фермента, замещающего цепь, который отделяет вновь синтезированную цепь ДНК от матрицы. [38] В августе 2012 года ученые из Института Броуда опубликовали оценку секвенирования SMRT для вызова SNP. [39]
Динамика полимеразы может указывать на метилирование основания . [40] Ученые продемонстрировали использование секвенирования одной молекулы в реальном времени для обнаружения метилирования и других модификаций оснований. [41] [42] [43] В 2012 году группа ученых использовала SMRT-секвенирование для создания полных метиломов шести бактерий. [44] В ноябре 2012 года ученые опубликовали отчет о метилировании вируса E. coli по всему геному. [45]
Длинные чтения позволяют секвенировать полные изоформы гена, включая 5 'и 3' концы. Этот тип секвенирования полезен для захвата изоформ и вариантов сплайсинга. [46] [47]
Секвенирование SMRT имеет несколько применений в исследованиях репродуктивной медицинской генетики при изучении семей с подозрением на родительский гонадный мозаицизм. Долговременные чтения позволяют проводить у пациентов фазирование гаплотипов для исследования происхождения мутаций. Глубокое секвенирование позволяет определять частоты аллелей в сперматозоидах, что важно для оценки риска рецидива для будущего пораженного потомства. [48] [49]
Рекомендации
- ^ Levene MJ, Korlach J, Turner SW, et al. (2003). «Волноводы с нулевой модой для анализа одиночных молекул при высоких концентрациях». Наука . 299 (5607): 682–6. Bibcode : 2003Sci ... 299..682L . DOI : 10.1126 / science.1079700 . PMID 12560545 . S2CID 6060239 .
- ^ а б Ид Дж., Фер А., Грей Дж. И др. (2009). «Секвенирование ДНК в режиме реального времени из одиночных молекул полимеразы». Наука . 323 (5910): 133–8. Bibcode : 2009Sci ... 323..133E . DOI : 10.1126 / science.1162986 . PMID 19023044 . S2CID 54488479 .
- ^ а б "Pacific Biosciences разрабатывает трансформирующую технологию секвенирования ДНК" (PDF) . Справочная информация о технологиях Pacific Biosciences . 2008 г.
- ^ Корлач Дж., Маркс П. Дж., Цицерон Р. Л. и др. (2008). «Селективная пассивация алюминием для направленной иммобилизации одиночных молекул ДНК-полимеразы в волноводных наноструктурах с нулевой модой» . PNAS . 105 (4): 1176–81. Bibcode : 2008PNAS..105.1176K . DOI : 10.1073 / pnas.0710982105 . PMC 2234111 . PMID 18216253 .
- ^ Foquet M, Samiee KT, Kong X и др. (2008). «Улучшенное производство волноводов с нулевой модой для обнаружения одиночных молекул» . J. Appl. Phys. 103 (3): 034301–034301–9. Bibcode : 2008JAP ... 103c4301F . DOI : 10.1063 / 1.2831366 . S2CID 38892226 .
- ^ Поллок, Джолинда; Глендиннинг, Лаура; Wisedchanwet, Trong; Уотсон, Мик (2018). «Безумие микробиома: попытка найти консенсус« Лучшая практика »для исследований микробиома 16S» . Прикладная и экологическая микробиология . 84 (7): e02627-17. DOI : 10,1128 / AEM.02627-17 . PMC 5861821 . PMID 29427429 .
- ^ а б "PacBio Post" . Twitter . 19 сен 2018.
- ^ Karow J (3 мая 2011 г.). «PacBio поставляет первые две коммерческие системы; количество заказов увеличилось до 44» . GenomeWeb .
- ^ Karow J (7 декабря 2010 г.). «PacBio раскрывает системные спецификации бета-версии для RS; говорится, что коммерческий релиз запланирован на первую половину 2011 года» . GenomeWeb .
- ^ Karow J (10 января 2012 г.). «После года тестирования два первых клиента PacBio ожидают более регулярного использования RS Sequencer в 2012 году» . GenomeWeb .
- ^ Heger M (13 ноября 2012 г.). «Пакет PacBio XL Chemistry увеличивает длину чтения и пропускную способность; CSHL тестирует технологию на геноме риса» . GenomeWeb .
- ^ Heger M (5 марта 2013 г.). «Пользователи PacBio сообщают о прогрессе в долгих чтениях для сборки генома растений, сложных областях генома человека» . GenomeWeb .
- ^ а б «Новая ДНК-полимераза P4 обеспечивает сборку более высокого качества с использованием меньшего количества клеток SMRT» . Блог PacBio . 21 августа 2013 г.
- ^ lexnederbragt (19 июня 2013 г.). «Тоска по самому длинному чтению: PacBio и BluePippin» . Между строк кода .
- ^ «Новая химия для PacBio RS II обеспечивает среднюю длину чтения 8,5 кб для сложных исследований генома» . Блог PacBio . 3 октября 2013 г.
- ^ Chaisson MJ, Huddleston J, Dennis MY, et al. (2014). «Разрешение сложности человеческого генома с помощью секвенирования одной молекулы» . Природа . 517 (7536): 608–11. Bibcode : 2015Natur.517..608C . DOI : 10,1038 / природа13907 . PMC 4317254 . PMID 25383537 .
- ^ «Pacific Biosciences выпускает новую химию секвенирования ДНК для увеличения длины чтения и точности для изучения человеческого и других сложных геномов» . Pacific Biosciences (пресс-релиз). 15 октября 2014 г.
- ^ «Новая химия увеличивает среднюю длину чтения до 10–15 кб для PacBio RS II» . Блог PacBio . 15 октября 2014 г.
- ^ «Ячейки SMRT, наборы реактивов для секвенирования и аксессуары для PacBio RS II» . Pacific Biosciences . 2020.
- ^ «PacBio запускает секвенсор PacBio RS II» . Поиск следующего поколения . 11 апреля 2013 г.
- ^ «Новые продукты: RS II от PacBio; запонки» . GenomeWeb . 16 апреля 2013 г.
- ^ "Пост секвенирования герцога" . Twitter . 30 августа 2013 г.
- ^ «PacBio объявляет о выпуске системы секвенирования» . Био-IT Мир . 30 сен 2015.
- ^ Heger M (1 октября 2015 г.). «PacBio запускает высокопроизводительную и недорогую систему секвенирования одной молекулы» . GenomeWeb .
- ^ «Новая химия и программное обеспечение для системы сиквелов увеличивают длину чтения, снижают стоимость проекта» . Блог PacBio . 9 января 2017.
- ^ «Новое программное обеспечение, полимераза для увеличения пропускной способности и доступности системы сиквелов» . Блог PacBio . 7 марта 2018.
- ^ «PacBio запускает систему сиквела II» . Био-IT Мир . 26 апреля 2019.
- ^ http://investor.pacificbiosciences.com/static-files/e53d5ef9-02cd-42ab-9d86-3037ad9deaec [ мертвая ссылка ]
- ^ Heger M (7 марта 2019 г.). «PacBio делится опытом клиентов с ранним доступом, новыми приложениями для продолжения II» . GenomeWeb .
- ^ Rasko DA, Webster DR, Sahl JW и др. (2011). «Происхождение штамма E. coli, вызвавшего вспышку гемолитико-уремического синдрома в Германии» . N. Engl. J. Med. 365 (8): 709–17. DOI : 10.1056 / NEJMoa1106920 . PMC 3168948 . PMID 21793740 .
- ^ Чин С.С., Соренсон Дж., Харрис Дж. Б. и др. (2011). "Происхождение штамма вспышки холеры в Гаити" . N. Engl. J. Med. 364 (1): 33–42. DOI : 10.1056 / NEJMoa1012928 . PMC 3030187 . PMID 21142692 .
- ^ Гао Х., Грин С.Дж., Джафари Н. и др. (2012). «Технические советы: секвенирование следующего поколения» . Новости генной инженерии и биотехнологии . 32 (8).
- ^ Schatz M (7 сентября 2011 г.). «Подходы SMRT-сборки» (PDF) . schatzlab.cshl.edu (собрание пользователей PacBio).
- ^ Ribeiro FJ, Przybylski D, Yin S, et al. (2012). «Готовые бактериальные геномы из данных о последовательности ружья» . Genome Res. 22 (11): 2270–7. DOI : 10.1101 / gr.141515.112 . PMC 3483556 . PMID 22829535 .
- ^ Башир А., Кламмер А., Робинс В.П. и др. (2012). «Гибридный подход для автоматизированной обработки бактериальных геномов» . Nat. Biotechnol. 30 (7): 701–7. DOI : 10.1038 / nbt.2288 . PMC 3731737 . PMID 22750883 .
- ^ Корен С., Шатц М.С., Валенц Б.П. и др. (2012). «Гибридная коррекция ошибок и сборка de novo одномолекулярного секвенирования читает» . Nat. Biotechnol. 30 (7): 693–700. DOI : 10.1038 / nbt.2280 . PMC 3707490 . PMID 22750884 .
- ^ Корен С., Хархай Г.П., Смит Т.П. и др. (2013). «Снижение сложности сборки микробных геномов с помощью секвенирования одной молекулы» . Genome Biol. 14 (9): R101. arXiv : 1304,3752 . Bibcode : 2013arXiv1304.3752K . DOI : 10.1186 / GB-2013-14-9-R101 . PMC 4053942 . PMID 24034426 .
- ^ Смит СС, Ван К., Чин С.С. и др. (2012). «Валидация мутаций ITD в FLT3 в качестве терапевтической мишени при остром миелоидном лейкозе человека» . Природа . 485 (7397): 260–3. Bibcode : 2012Natur.485..260S . DOI : 10.1038 / nature11016 . PMC 3390926 . PMID 22504184 .
- ^ Карнейро МО, Расс С., Росс М.Г. и др. (2012). «Технология секвенирования Pacific Biosciences для генотипирования и обнаружения вариаций в человеческих данных» . BMC Genom. 13 (1): 375. DOI : 10.1186 / 1471-2164-13-375 . PMC 3443046 . PMID 22863213 .
- ^ Флусберг Б.А., Вебстер Д.Р., Ли Дж. Х. и др. (2010). «Прямое обнаружение метилирования ДНК во время секвенирования одной молекулы в реальном времени» . Nat. Методы . 7 (6): 461–5. DOI : 10.1038 / nmeth.1459 . PMC 2879396 . PMID 20453866 .
- ^ Кларк Т.А., Мюррей И.А., Морган Р.Д. и др. (2012). «Характеристика специфичности ДНК-метилтрансферазы с использованием одномолекулярного секвенирования ДНК в реальном времени» . Nucleic Acids Res. 40 (4): e29. DOI : 10.1093 / NAR / gkr1146 . PMC 3287169 . PMID 22156058 .
- ^ Song CX, Clark TA, Lu XY и др. (2011). «Чувствительные и специфические одиночные молекулы секвенирования 5-гидроксиметилцитозина» . Нат методы . 9 (1): 75–7. DOI : 10.1038 / nmeth.1779 . PMC 3646335 . PMID 22101853 .
- ^ Кларк Т.А., Спиттл К.Э., Тернер С.В. и др. (2011). «Прямое обнаружение и секвенирование оснований поврежденной ДНК» . Genome Integr. 2 (1): 10. DOI : 10,1186 / 2041-9414-2-10 . PMC 3264494 . PMID 22185597 .
- ^ Мюррей И.А., Кларк Т.А., Морган Р.Д. и др. (2012). «Метиломы шести бактерий» . Nucleic Acids Res. 40 (22): 11450–62. DOI : 10.1093 / NAR / gks891 . PMC 3526280 . PMID 23034806 .
- ^ Фанг Г., Мунера Д., Фридман Д. И. и др. (2012). «Полногеномное картирование остатков метилированного аденина в патогенных Escherichia Coli с использованием одномолекулярного секвенирования в реальном времени» . Nat. Biotechnol. 30 (12): 1232–9. DOI : 10.1038 / nbt.2432 . PMC 3879109 . PMID 23138224 .
- ^ Шарон Д., Тилгнер Х., Груберт Ф. и др. (2013). "Одномолекулярное долгое чтение человеческого транскриптома" . Nat. Biotechnol. 31 (11): 1009–14. DOI : 10.1038 / nbt.2705 . PMC 4075632 . PMID 24108091 .
- ^ Au KF, Sebastiano V, Afshar PT и др. (2013). «Характеристика транскриптома ESC человека путем гибридного секвенирования» . PNAS . 110 (50): E4821–30. Bibcode : 2013PNAS..110E4821A . DOI : 10.1073 / pnas.1320101110 . PMC 3864310 . PMID 24282307 .
- ^ Ardui S, Ameur A, Vermeesch JR и др. (2018). «Секвенирование одиночных молекул в реальном времени (SMRT) достигает зрелости: приложения и утилиты для медицинской диагностики» . Nucleic Acids Res. 46 (5): 2159–68. DOI : 10.1093 / NAR / gky066 . PMC 5861413 . PMID 29401301 .
- ^ Уилбе М., Гудмундссон С., Йоханссон Дж. И др. (2017). «Новый подход с использованием секвенирования с длительным считыванием и ddPCR для исследования гонадного мозаицизма и оценки риска рецидива в двух семьях с нарушениями развития» . Пренатальная диагностика . 37 (11): 1146–54. DOI : 10.1002 / pd.5156 . PMC 5725701 . PMID 28921562 .
Внешние ссылки
- Репортаж с сайта BioIT World.com
- Репортаж из New York Times