SOAP (короткий олигонуклеотид анализ пакета) представляет собой набор биоинформатики программных средств от BGI отдела биоинформатики , позволяющего сборки, выравнивание и анализ секвенирования ДНК следующего поколения данных. Он особенно подходит для короткого чтения данных секвенирования .
Все программы в пакете SOAP можно использовать бесплатно и распространять по лицензии на программное обеспечение с открытым исходным кодом GPL .
Функциональность
Набор инструментов SOAP можно использовать для выполнения следующих задач сборки генома:
Выравнивание последовательности
SOAPaligner (SOAP2) специально разработан для быстрого выравнивания коротких чтений и выгодно отличается от аналогичных инструментов выравнивания, таких как Bowtie и MAQ. [1]
Сборка генома
SOAPdenovo - это ассемблер для краткого чтения de novo, использующий построение графов Де Брёйна . Он оптимизирован для коротких считываний, например, генерируемых Illumina, и способен собирать большие геномы, такие как геном человека. [2] SOAPdenovo был использован для сборки генома гигантской панды . [3] Он был обновлен до SOAPdenovo2, который был оптимизирован для больших геномов и включал широко используемый модуль GapCloser. [4]
Сборка транскриптома
SOAPdenovo-Trans - это сборщик транскриптомов de novo, разработанный специально для RNA-Seq, который был создан для проекта 1000 Plant Genomes . [5]
Indel Discovery
SOAPindel - это инструмент для поиска вставок и удалений из данных парного секвенирования следующего поколения, предоставляющий список возможных вставок с оценками качества. [6]
Обнаружение SNP
SOAPsnp - это построитель согласованной последовательности. Этот инструмент использует выходные данные SOAPaligner для создания согласованной последовательности, которая позволяет вызывать SNP для вновь секвенированного человека.
Открытие структурных вариаций
SOAPsv - это инструмент для поиска структурных вариаций с использованием сборки всего генома. [7]
Контроль качества и предварительная обработка
SOAPnuke - это инструмент для интегрированного контроля качества и предварительной обработки наборов данных из геномных, малых РНК , цифровых экспрессий генов и метагеномных экспериментов. [8]
История
SOAP v1
Первый выпуск SOAP состоял только из инструмента выравнивания последовательностей SOAPaligner . [9]
SOAP v2
SOAP v2 [1] расширен и улучшен по сравнению с SOAP v1 за счет значительного повышения производительности инструмента SOAPaligner . Время выравнивания было сокращено в 20-30 раз, а использование памяти уменьшено в 3 раза. Добавлена поддержка сжатых форматов файлов.
Затем набор SOAP был расширен за счет включения новых инструментов: SOAPdenovo 1 & 2, SOAPindel, SOAPsnp и SOAPsv.
SOAP v3
SOAP v3 расширил средство выравнивания, став первым средством выравнивания для кратковременного чтения, использующим процессоры графического процессора. [10] В результате этих улучшений SOAPalign значительно превзошел конкурирующие средства выравнивания Bowtie и BWA с точки зрения скорости.
Смотрите также
Внешние ссылки
Рекомендации
- ^ a b Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Ю, С.-М .; Kristiansen, K .; Ван, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для согласования краткого чтения» . Биоинформатика . 25 (15): 1966–1967. DOI : 10.1093 / биоинформатики / btp336 . ISSN 1367-4803 . PMID 19497933 .
- ^ Li, R .; Zhu, H .; Ruan, J .; Qian, W .; Fang, X .; Ши, З .; Li, Y .; Li, S .; Shan, G .; Kristiansen, K .; Li, S .; Ян, H .; Wang, J .; Ван, Дж. (2009). «Сборка de novo геномов человека с массовым параллельным секвенированием короткого чтения» . Геномные исследования . 20 (2): 265–272. DOI : 10.1101 / gr.097261.109 . ISSN 1088-9051 . PMC 2813482 . PMID 20019144 .
- ^ Ли, Жуйцян; Fan, Wei; Тиан, Гэн; Чжу, Хунмэй; Он, Линь; Цай, Цзин; Хуанг, Цюаньфэй; Цай, Цингл; Ли, Бо; Бай, Иньци; Чжан, Чжихэ; Чжан, Япин; Ван, Вэнь; Ли, Цзюнь; Вэй, Фувэн; Ли, Хэн; Цзянь, Мин; Ли, Цзяньвэнь; Чжан, Чжаолей; Нильсен, Расмус; Ли, Давэй; Гу, Ваньцзюнь; Ян, Чжентао; Сюань, Чжаолин; Райдер, Оливер А .; Люн, Фредерик Чи-Чинг; Чжоу, Ян; Цао, Цзяньцзюнь; Сунь, Сяо; и другие. (2009). «Последовательность и сборка de novo генома гигантской панды» . Природа . 463 (7279): 311–317. DOI : 10,1038 / природа08696 . ISSN 0028-0836 . PMC 3951497 . PMID 20010809 .
- ^ Ло, Руибанг; Лю, Бинхан; Се, Иньлун; Ли, Чжэньюй; Хуанг, Вэйхуа; Юань, Цзяньин; Он, Гуанчжу; Чен, Янсян; Пан, Ци; Лю, Юньцзе; Тан, Цзинбо (2012-12-01). «SOAPdenovo2: эмпирически улучшенный ассемблер для короткого чтения de novo с эффективным использованием памяти» . GigaScience . 1 (1): 18. DOI : 10,1186 / 2047-217X-1-18 . PMC 3626529 . PMID 23587118 .
- ^ Се, Иньлун; У, Gengxiong; Тан, Цзинбо; Ло, Руибанг; Паттерсон, Джордан; Лю, Шанлинь; Хуанг, Вэйхуа; Он, Гуанчжу; Гу, Шэнчан; Ли, Шэнкан; Чжоу, Синь (15.06.2014). «SOAPdenovo-Trans: сборка транскриптома de novo с короткими чтениями RNA-Seq» . Биоинформатика . 30 (12): 1660–1666. DOI : 10.1093 / биоинформатики / btu077 . ISSN 1367-4803 . PMID 24532719 .
- ^ Ли, Шэнтин; Ли, Жуйцян; Ли, Хэн; Лу, Цзяньлян; Ли, Инжруй; Болунд, Ларс; Schierup, Mikkel H .; Ван, июнь (1 января 2013 г.). «SOAPindel: эффективная идентификация вставок из коротких парных чтений» . Геномные исследования . 23 (1): 195–200. DOI : 10.1101 / gr.132480.111 . ISSN 1088-9051 . PMC 3530679 . PMID 22972939 .
- ^ Ли, Инжруй; Чжэн, Ханьчэн; Ло, Руибанг; Ву, Хунлун; Чжу, Хунмэй; Ли, Жуйцян; Цао, Хунчжи; Ву, Боксин; Хуанг, Шуцзя; Шао, Хаоцзин; Ма, Ханчжоу (август 2011 г.). «Структурные вариации в двух геномах человека, картированные при разрешении одного нуклеотида путем сборки всего генома de novo» . Природа Биотехнологии . 29 (8): 723–730. DOI : 10.1038 / nbt.1904 . ISSN 1546-1696 . PMID 21785424 .
- ^ Чен, Юсинь; Чен, Юншэн; Ши, Чуньмэй; Хуанг, Чжибо; Чжан, Юн; Ли, Шэнкан; Ли, Ян; Е, Цзя; Ю, Чанг; Ли, Чжо; Чжан, Сюцин (01.01.2018). «SOAPnuke: программное обеспечение с поддержкой ускорения MapReduce для интегрированного контроля качества и предварительной обработки высокопроизводительных данных секвенирования» . GigaScience . 7 (1): 1–6. DOI : 10,1093 / gigascience / gix120 . PMC 5788068 . PMID 29220494 .
- ^ Li, R .; Li, Y .; Kristiansen, K .; Ван, Дж. (2008). «SOAP: короткая программа выравнивания олигонуклеотидов» . Биоинформатика . 24 (5): 713–714. DOI : 10.1093 / биоинформатики / btn025 . ISSN 1367-4803 . PMID 18227114 .
- ^ Liu, C.-M .; Wong, T .; Wu, E .; Luo, R .; Ю, С.-М .; Li, Y .; Ван, Б .; Yu, C .; Чу, X .; Чжао, К .; Li, R .; Лам, Т.-В. (2012). «SOAP3: сверхбыстрый инструмент параллельного выравнивания на базе графического процессора для коротких чтений» . Биоинформатика . 28 (6): 878–879. DOI : 10.1093 / биоинформатики / bts061 . ISSN 1367-4803 . PMID 22285832 .