Этот список программного обеспечения для выравнивания последовательностей представляет собой компиляцию программных инструментов и веб-порталов, используемых для попарного выравнивания последовательностей и множественного выравнивания последовательностей . См. Программное обеспечение для структурного выравнивания для структурного выравнивания белков.
Только поиск по базе данных
Имя | Описание | Тип последовательности * | Авторы | Год |
---|---|---|---|---|
ВЗРЫВ | Локальный поиск с быстрой эвристикой k-tuple (инструмент Basic Local Alignment Search Tool) | Оба | Альтшул С.Ф. , Гиш В. , Миллер В. , Майерс Е. В. , Липман Д. Д. [1] | 1990 г. |
HPC-BLAST | NCBI-совместимая многоузловая и многоядерная оболочка BLAST. Распространяемая с последней версией BLAST, эта оболочка облегчает распараллеливание алгоритма на современных гибридных архитектурах с множеством узлов и множеством ядер в каждом узле. [2] | Протеин | Burdyshaw CE , Sawyer S , Horton MD , Brook RG , Rekapalli B | 2017 г. |
CS-BLAST | BLAST, зависящий от контекста последовательности, более чувствительный, чем BLAST, FASTA и SSEARCH. Позиционно-зависимая итеративная версия CSI-BLAST более чувствительна, чем PSI-BLAST | Протеин | Ангермюллер С., Бигерт А., Сёдинг Дж. [3] | 2013 |
CUDASW ++ | Алгоритм Смита Ватермана с ускорением на GPU для нескольких GPU с общим хостом | Протеин | Лю Й., Маскелл Д.Л. и Шмидт Б. | 2009/2010 |
АЛМАЗ | Выравниватель BLASTX и BLASTP на основе двойной индексации | Протеин | Бухфинк Б., Се Ц., Хусон Д.Х., Рейтер К., Дрост Х.Г. [4] [5] | 2015/2021 |
FASTA | Локальный поиск с быстрой эвристикой k -элементов, медленнее, но более чувствителен, чем BLAST | Оба | ||
GGSEARCH, GLSEARCH | Глобальный: Глобальный (GG), Глобальный: Локальный (GL) согласование со статистикой | Протеин | ||
Геном Мага | Программное обеспечение для сверхбыстрого поиска локальных мотивов последовательности ДНК и попарного выравнивания для данных NGS (FASTA, FASTQ). | ДНК | Hepperle D (www.sequentix.de) | 2020 г. |
Genoogle | Genoogle использует методы индексации и параллельной обработки для поиска последовательностей ДНК и белков. Он разработан на Java и с открытым исходным кодом. | Оба | Альбрехт Ф | 2015 г. |
HMMER | Локальный и глобальный поиск с профилем Скрытые марковские модели, более чувствительные, чем PSI-BLAST | Оба | Дурбин Р. , Эдди С. Р. , Крог А. , Митчисон Дж. [6] | 1998 г. |
HH-люкс | Попарное сравнение профильных скрытых марковских моделей; очень чувствительный | Протеин | Сёдинг Дж [7] [8] | 2005/2012 |
IDF | Частота обратного документа | Оба | ||
Адский | Профиль SCFG поиск | РНК | Эдди С | |
КЛАСТ | Высокопроизводительный инструмент поиска сходства последовательностей общего назначения | Оба | 2009/2014 | |
ЛЯМБДА | Высокопроизводительный локальный выравниватель, совместимый с BLAST, но намного быстрее; поддерживает SAM / BAM | Протеин | Ханнес Хаусведель, Йохен Зингер, Кнут Райнерт [9] | 2014 г. |
MMseqs2 | Программный пакет для поиска и кластеризации огромных наборов последовательностей. Аналогичная чувствительность к BLAST и PSI-BLAST, но на порядки быстрее | Протеин | Штайнеггер М., Мирдита М., Галиез С., Сёдинг Дж. [10] | 2017 г. |
ИСПОЛЬЗОВАТЬ | Сверхбыстрый инструмент анализа последовательности | Оба | Эдгар, RC (2010). «Поиск и кластеризация на порядки быстрее, чем BLAST» . Биоинформатика . 26 (19): 2460–2461. DOI : 10.1093 / биоинформатики / btq461 . PMID 20709691 . публикация | 2010 г. |
ОСВАЛЬД | OpenCL Smith-Waterman о FPGA Altera для больших баз данных белков | Протеин | Руччи Э., Гарсиа К., Ботелла Дж., Де Джусти А., Найуф М., Прието-Матиас М. [11] | 2016 г. |
парасейл | Быстрый поиск Смита-Уотермана с использованием распараллеливания SIMD | Оба | Daily J | 2015 г. |
ПСИ-ВЗРЫВ | Зависящий от позиции итеративный BLAST, локальный поиск с оценочными матрицами , зависящими от позиции , гораздо более чувствительный, чем BLAST | Протеин | Альтшул С.Ф. , Мэдден Т.Л., Шеффер А.А., Чжан Дж., Чжан З., Миллер В. , Липман Д.Д. [12] | 1997 г. |
PSI-поиск | Сочетание алгоритма поиска Смита-Уотермана со стратегией построения профиля PSI-BLAST для поиска отдаленно связанных белковых последовательностей и предотвращения ошибок гомологичного чрезмерного удлинения. | Протеин | Ли В., Маквильям Х., Гужон М., Коули А., Лопес Р., Пирсон В. Р. [13] | 2012 г. |
ScalaBLAST | Высокопараллельный масштабируемый BLAST | Оба | Oehmen et al. [14] | 2011 г. |
Sequilab | Связывание и профилирование данных выравнивания последовательностей из результатов NCBI-BLAST с серверами / службами анализа основных последовательностей | Нуклеотид, пептид | 2010 г. | |
СЭМ | Локальный и глобальный поиск с профилем Скрытые марковские модели, более чувствительные, чем PSI-BLAST | Оба | Карплюс К. , Крог А. [15] | 1999 г. |
Ssearch. | Поиск Смита-Уотермана, медленнее, но более чувствителен, чем FASTA | Оба | ||
СВАПИ | Первый параллельный алгоритм, использующий появляющийся Intel Xeon Phis для ускорения поиска в базе данных белков Смита-Ватермана. | Протеин | Лю Й. и Шмидт Б. | 2014 г. |
SWAPHI-LS | Первый параллельный алгоритм Смита-Ватермана, использующий кластеры Intel Xeon Phi для ускорения выравнивания длинных последовательностей ДНК. | ДНК | Лю Й., Тран Т.Т., Лауэнрот Ф., Шмидт Б. | 2014 г. |
ПЛАВАНИЕ | Реализация Смита-Уотермана для архитектур Intel Multicore и Manycore | Протеин | Руччи Э., Гарсия К., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [16] | 2015 г. |
SWIMM2.0 | Усовершенствованный Smith-Waterman на многоядерных и многоядерных архитектурах Intel на основе векторных расширений AVX-512 | Протеин | Руччи Э., Гарсиа К., Ботелла Дж., Де Джусти А., Найуф М. и Прието-Матиас М. [17] | 2018 г. |
SWIPE | Быстрый поиск Смита-Уотермана с использованием распараллеливания SIMD | Оба | Рогн Т | 2011 г. |
* Тип последовательности: белок или нуклеотид
Попарное выравнивание
Имя | Описание | Тип последовательности * | Тип расклада ** | Автор | Год |
---|---|---|---|---|---|
ACANA | Быстрое эвристическое попарное выравнивание на основе привязки | Оба | Оба | Хуанг, Умбах, Ли | 2005 г. |
AlignMe | Выравнивания последовательностей мембранных белков | Протеин | Оба | М. Штамм, К. Хафизов, Р. Старицбихлер, Л. Р. Форрест | 2013 |
ALLALIGN | Для молекул ДНК, РНК и белков размером до 32 МБ выравнивает все последовательности размером K или больше. Подобные сопоставления группируются для анализа. Автоматический фильтр повторяющейся последовательности. | Оба | Местный | Э. Вахтель | 2017 г. |
Bioconductor Biostrings :: pairwiseAlignment | Динамическое программирование | Оба | Оба + без концов | П. Абойн | 2008 г. |
BioPerl dpAlign | Динамическое программирование | Оба | Оба + без концов | Ю.М. Чан | 2003 г. |
BLASTZ, LASTZ | Посеянное сопоставление с образцом | Нуклеотид | Местный | Schwartz et al. [18] [19] | 2004,2009 |
CUDAlign | Выравнивание последовательностей ДНК неограниченного размера в одном или нескольких графических процессорах | Нуклеотид | Местный, полуглобальный, глобальный | Э. Сандес [20] [21] [22] | 2011-2015 гг. |
DNADot | Веб-инструмент для точечной печати | Нуклеотид | Глобальный | Р. Боуэн | 1998 г. |
Пакет молекулярной биологии DNASTAR Lasergene | Программное обеспечение для выравнивания последовательностей ДНК, РНК, белков или ДНК + белков с помощью алгоритмов попарного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ точек. | Оба | Оба | ДНАСТАР | 1993-2016 |
ДОТЛЕТ | Инструмент для точечной печати на основе Java | Оба | Глобальный | М. Паньи и Т. Джунье | 1998 г. |
ПРАЗДНИК | Локальное расширение на основе задних отделов с описательной моделью эволюции | Нуклеотид | Местный | А. К. Худек и Д. Г. Браун | 2010 г. |
Компилятор генома Компилятор генома | Совместите файлы хроматограмм (.ab1, .scf) с последовательностью шаблона, найдите ошибки и мгновенно исправьте их. | Нуклеотид | Местный | Genome Compiler Corporation | 2014 г. |
G-PAS | Динамическое программирование на базе графического процессора с возвратом | Оба | Местный, полуглобальный, глобальный | W. Frohmberg, M. Kierzynka et al. | 2011 г. |
GapMis | Выполняет попарное выравнивание последовательностей с одним разрывом | Оба | Полуглобальный | К. Фрусиос, Т. Флури, К. С. Илиопулос, К. Парк, С. П. Писсис, Г. Тишлер | 2012 г. |
Геном Мага | Программное обеспечение для сверхбыстрого поиска локальных мотивов последовательности ДНК и попарного выравнивания для данных NGS (FASTA, FASTQ). | ДНК | Местный, полуглобальный, глобальный | Hepperle D (www.sequentix.de) | 2020 г. |
GGSEARCH, GLSEARCH | Глобальный: Глобальный (GG), Глобальный: Локальный (GL) согласование со статистикой | Протеин | Глобальный запрос | У. Пирсон | 2007 г. |
JAligner | Реализация Smith-Waterman с открытым исходным кодом на Java | Оба | Местный | А. Мустафа | 2005 г. |
K * Синхронизация | Выравнивание последовательности белка и структуры, которое включает вторичную структуру, структурную консервативность, профили последовательностей, производных от структуры, и консенсусные баллы выравнивания | Протеин | Оба | Д. Чивиан и Д. Бейкер [23] | 2003 г. |
LALIGN | Множественное, неперекрывающееся, локальное сходство (тот же алгоритм, что и SIM) | Оба | Местное неперекрытие | У. Пирсон | 1991 (алгоритм) |
NW-align | Стандартный алгоритм динамического программирования Нидлмана-Вунша | Протеин | Глобальный | И Чжан | 2012 г. |
mAlign | модельное выравнивание; моделирует информационное наполнение последовательностей | Нуклеотид | Оба | Д. Пауэлл, Л. Эллисон и Т. И. Дикс | 2004 г. |
сопоставитель | Локальное выравнивание Ватермана-Эггерта (на основе LALIGN) | Оба | Местный | И. Лонгден (в редакции У. Пирсона) | 1999 г. |
MCALIGN2 | явные модели эволюции инделя | ДНК | Глобальный | J. Wang et al. | 2006 г. |
MUMmer | суффиксное дерево на основе | Нуклеотид | Глобальный | S. Kurtz et al. | 2004 г. |
иголка | Динамическое программирование Needleman-Wunsch | Оба | Полуглобальный | А. Близби | 1999 г. |
Нгила | логарифмические и аффинные затраты на разрыв и явные модели эволюции indel | Оба | Глобальный | Р. Картрайт | 2007 г. |
NW | Динамическое программирование Needleman-Wunsch | Оба | Глобальный | ACR Martin | 1990-2015 |
парасейл | Библиотека динамического программирования C / C ++ / Python / Java SIMD для SSE, AVX2 | Оба | Глобальный, Бесконечный, Локальный | J. Daily | 2015 г. |
Дорожка | Смит-Уотерман на белка обратно- перевода графа (Обнаруживает рамки считывания на уровне белка) | Протеин | Местный | M. Gîrdea et al. [24] | 2009 г. |
PatternHunter | Посеянное сопоставление с образцом | Нуклеотид | Местный | B. Ma et al. [25] [26] | 2002–2004 гг. |
ProbA (также propA) | Выборка стохастической статистической суммы с помощью динамического программирования | Оба | Глобальный | У. Мюкштайн | 2002 г. |
PyMOL | Команда "align" выравнивает последовательность и применяет ее к структуре | Протеин | Глобальный (по выбору) | WL DeLano | 2007 г. |
REPuter | суффиксное дерево на основе | Нуклеотид | Местный | S. Kurtz et al. | 2001 г. |
САБЕРТУТ | Выравнивание с использованием прогнозируемых профилей подключения | Протеин | Глобальный | Ф. Тайхерт, Дж. Миннинг, У. Бастолла и М. Порто | 2009 г. |
Сацума | Параллельное выравнивание синтении всего генома | ДНК | Местный | MG Grabherr et al. | 2010 г. |
SEQALN | Различное динамическое программирование | Оба | Местный или глобальный | М. С. Уотерман и П. Харди | 1996 г. |
SIM, GAP, NAP, LAP | Локальное сходство с различными методами лечения зазоров | Оба | Местный или глобальный | X. Хуанг и В. Миллер | 1990-6 |
SIM | Местное сходство | Оба | Местный | X. Хуанг и В. Миллер | 1991 г. |
SPA: суперпарное выравнивание | Быстрое попарное глобальное выравнивание | Нуклеотид | Глобальный | Шен, Ян, Яо, Хван | 2002 г. |
Ssearch. | Локальное ( Смит-Уотерман ) соответствие со статистикой | Протеин | Местный | У. Пирсон | 1981 (Алгоритм) |
Студия последовательностей | Java-апплет, демонстрирующий различные алгоритмы из [27] | Общая последовательность | Локальный и глобальный | А.Мескаускас | 1997 (справочник) |
SWIFOLD | Ускорение Смита-Ватермана на ПЛИС Intel с OpenCL для длинных последовательностей ДНК | Нуклеотид | Местный | Э. Руччи [28] [29] | 2017-2018 гг. |
SWIFT иск | Быстрый поиск локального выравнивания | ДНК | Местный | К. Расмуссен, [30] В. Герлах | 2005,2008 |
носилки | Оптимизированное для памяти динамическое программирование Needleman-Wunsch | Оба | Глобальный | И. Лонгден (по материалам Г. Майерса и В. Миллера) | 1999 г. |
транслировать | Выравнивает последовательности нуклеиновых кислот с учетом выравнивания белков | Нуклеотид | NA | Г. Уильямс (изменено из Б. Пирсона) | 2002 г. |
UGENE | Открытый исходный код Smith-Waterman для SSE / CUDA, поиск повторов и точечный график на основе массива суффиксов | Оба | Оба | UniPro | 2010 г. |
вода | Смит-Уотерман динамическое программирование | Оба | Местный | А. Близби | 1999 г. |
соответствие слов | k -элементное попарное совпадение | Оба | NA | И. Лонгден | 1998 г. |
ЯСС | Посеянное сопоставление с образцом | Нуклеотид | Местный | Л. Ной и Г. Кучеров [31] | 2004 г. |
* Тип последовательности: белок или нуклеотид ** Тип выравнивания: локальное или глобальное
Множественное выравнивание последовательностей
Имя | Описание | Тип последовательности * | Тип расклада ** | Автор | Год | Лицензия |
---|---|---|---|---|---|---|
ABA | Мировоззрение A-Bruijn | Протеин | Глобальный | B.Raphael et al. | 2004 г. | Фирменный , бесплатное программное обеспечение для образования, научные исследования, некоммерческих |
ALE | ручное выравнивание; некоторая помощь по программному обеспечению | Нуклеотиды | Местный | Дж. Бланди и К. Фогель | 1994 (последняя версия 2007) | Бесплатно, GPL 2 |
ALLALIGN | Для молекул ДНК, РНК и белков размером до 32 МБ выравнивает все последовательности размером K или больше, MSA или внутри одной молекулы. Подобные сопоставления группируются для анализа. Автоматический фильтр повторяющейся последовательности. | Оба | Местный | Э. Вахтель | 2017 г. | Бесплатно |
КАРТА | Последовательный отжиг | Оба | Глобальный | А. Шварц, Л. Пахтер | 2006 г. | |
анон. | быстрое и оптимальное выравнивание трех последовательностей с использованием стоимости линейных разрывов | Нуклеотиды | Глобальный | Д. Пауэлл, Л. Эллисон и Т. И. Дикс | 2000 г. | |
Бали-Фы | Дерево + мульти-расклад; вероятностно-байесовский; совместная оценка | Оба + кодоны | Глобальный | BD Redelings и М.А. Сушард | 2005 (последняя версия 2018) | Бесплатно, GPL |
По базам | Редактор множественного выравнивания последовательностей на основе Java со встроенными инструментами анализа | Оба | Местный или глобальный | R. Brodie et al. | 2004 г. | Проприетарное , бесплатное ПО , необходимо зарегистрироваться |
ХАОС, ДИАЙН | Итерационное выравнивание | Оба | Местный (предпочтительно) | М. Брудно и Б. Моргенштерн | 2003 г. | |
Clustal W | Прогрессивное выравнивание | Оба | Местный или глобальный | Томпсон и др. | 1994 г. | Бесплатно, LGPL |
CodonCode Aligner | Мульти-выравнивание; Поддержка ClustalW и Phrap | Нуклеотиды | Местный или глобальный | P. Richterich et al. | 2003 г. (последняя версия 2009 г.) | |
Компас | Сравнение множественных выравниваний последовательностей белков с оценкой статистической значимости | Протеин | Глобальный | Садреев Р.И. и др. | 2009 г. | |
РАСШИФРОВАТЕЛЬ | Прогрессивно-итеративное выравнивание | Оба | Глобальный | Эрик С. Райт | 2014 г. | Бесплатно, GPL |
DIALIGN-TX и DIALIGN-T | Сегментный метод | Оба | Местный (предпочтительно) или глобальный | ARSubramanian | 2005 г. (последняя версия 2008 г.) | |
Выравнивание ДНК | Сегментный метод для внутривидовых выравниваний | Оба | Местный (предпочтительно) или глобальный | А.Рель | 2005 г. (последняя версия 2008 г.) | |
Сборщик последовательностей ДНК-басера | Мульти-выравнивание; Полное автоматическое выравнивание последовательностей; Автоматическая коррекция неоднозначности; Внутренний базовый вызывающий абонент; Выравнивание последовательностей в командной строке | Нуклеотиды | Местный или глобальный | Heracle BioSoft SRL | 2006 (последняя версия 2018) | Коммерческий (некоторые модули распространяются бесплатно) |
ДНАДинамо | связанная ДНК с белком, множественное выравнивание с помощью MUSCLE , Clustal и Smith-Waterman | Оба | Местный или глобальный | ДНАДинамо | 2004 (последняя версия 2017) | |
Пакет молекулярной биологии DNASTAR Lasergene | Программное обеспечение для выравнивания последовательностей ДНК, РНК, белков или ДНК + белков с помощью алгоритмов попарного и множественного выравнивания последовательностей, включая MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson и анализ точек. | Оба | Местный или глобальный | ДНАСТАР | 1993-2016 | |
ЭДНА | Выравнивание множественных последовательностей на основе энергии для сайтов связывания ДНК | Нуклеотиды | Местный или глобальный | Салама, РА. и другие. | 2013 | |
FAMSA | Прогрессивное выравнивание для чрезвычайно больших семейств белков (сотни тысяч членов) | Протеин | Глобальный | Deorowicz et al. | 2016 г. | |
FSA | Последовательный отжиг | Оба | Глобальный | RK Bradley et al. | 2008 г. | |
Гениальный | Прогрессивно-итерационное выравнивание; Плагин ClustalW | Оба | Местный или глобальный | AJ Drummond et al. | 2005 (последняя версия 2017) | |
Калинь | Прогрессивное выравнивание | Оба | Глобальный | Т. Лассманн | 2005 г. | |
MAFFT | Прогрессивно-итеративное выравнивание | Оба | Местный или глобальный | K. Katoh et al. | 2005 г. | Бесплатно, BSD |
МАРНА | Множественное выравнивание РНК | РНК | Местный | S. Siebert et al. | 2005 г. | |
МАВИД | Прогрессивное выравнивание | Оба | Глобальный | Н. Брей и Л. Пахтер | 2004 г. | |
MSA | Динамическое программирование | Оба | Местный или глобальный | DJ Lipman et al. | 1989 (изменено в 1995 г.) | |
MSAProbs | Динамическое программирование | Протеин | Глобальный | Ю. Лю, Б. Шмидт, Д. Маскелл | 2010 г. | |
МУЛЬТАЛИН | Динамическое программирование-кластеризация | Оба | Местный или глобальный | Ф. Корпет | 1988 г. | |
Мульти-ЛАГАН | Согласование с прогрессивным динамическим программированием | Оба | Глобальный | M. Brudno et al. | 2003 г. | |
МЫШЦЫ | Прогрессивно-итеративное выравнивание | Оба | Местный или глобальный | Р. Эдгар | 2004 г. | |
Опал | Прогрессивно-итеративное выравнивание | Оба | Местный или глобальный | Т. Уиллер и Дж. Кечечиоглу | 2007 (последняя стабильная версия 2013 г., последняя бета-версия 2016 г.) | |
Пекан | Вероятностная согласованность | ДНК | Глобальный | B. Paten et al. | 2008 г. | |
Phylo | Человеческая вычислительная платформа для сравнительной геномики для решения множественного выравнивания | Нуклеотиды | Местный или глобальный | Макгилл Биоинформатика | 2010 г. | |
PMFastR | Выравнивание с учетом прогрессивной структуры | РНК | Глобальный | Д. ДеБласио, Дж. Браунд, С. Чжан | 2009 г. | |
Пралине | Выравнивание с прогрессивно-итеративным согласованием-гомологией с предварительным профилированием и прогнозированием вторичной структуры | Протеин | Глобальный | Дж. Геринга | 1999 г. (последняя версия 2009 г.) | |
PicXAA | Непрогрессивное выравнивание с максимальной ожидаемой точностью | Оба | Глобальный | SME Sahraeian и Би Джей Юн | 2010 г. | |
Доверенность | Частичный порядок / скрытая марковская модель | Протеин | Местный или глобальный | К. Ли | 2002 г. | |
Probalign | Вероятность / согласованность с вероятностями статистической суммы | Протеин | Глобальный | Рошан и Ливси | 2006 г. | Бесплатное, общественное достояние |
ProbCons | Вероятностный / согласованность | Протеин | Местный или глобальный | C. Do et al. | 2005 г. | Бесплатное, общественное достояние |
PROMALS3D | Прогрессивное выравнивание / скрытая марковская модель / вторичная структура / 3D-структура | Протеин | Глобальный | J. Pei et al. | 2008 г. | |
PRRN / PRRP | Итерационное выравнивание (особенно уточнение) | Протеин | Местный или глобальный | Ю. Тотоки (по мотивам О. Гото) | 1991 и позже | |
PSAlign | Выравнивание с сохранением неэвристики | Оба | Местный или глобальный | SH Sze, Y. Lu, Q. Yang. | 2006 г. | |
RevTrans | Объединяет выравнивание ДНК и белка путем обратного преобразования выравнивания белка в ДНК. | ДНК / белок (специальный) | Местный или глобальный | Вернерссон и Педерсен | 2003 (новейшая версия 2005) | |
САГА | Выравнивание последовательностей с помощью генетического алгоритма | Протеин | Местный или глобальный | C. Notredame et al. | 1996 г. (новая версия 1998 г.) | |
СЭМ | Скрытая марковская модель | Протеин | Местный или глобальный | A. Krogh et al. | 1994 (самая последняя версия 2002) | |
Тюлень | Ручное выравнивание | Оба | Местный | А. Рамбау | 2002 г. | |
StatAlign | Байесовская совместная оценка выравнивания и филогении (MCMC) | Оба | Глобальный | А. Новак и соавт. | 2008 г. | |
Stemloc | Прогнозирование множественного выравнивания и вторичной структуры | РНК | Местный или глобальный | И. Холмс | 2005 г. | Бесплатно, GPL 3 (часть DART ) |
Т-кофе | Более чувствительное прогрессивное выравнивание | Оба | Местный или глобальный | C. Notredame et al. | 2000 (новейшая версия 2008) | Бесплатно, GPL 2 |
UGENE | Поддерживает множественное выравнивание с помощью плагинов MUSCLE , KAlign, Clustal и MAFFT. | Оба | Местный или глобальный | Команда UGENE | 2010 (новейшая версия 2020) | Бесплатно, GPL 2 |
ВекторДрузья | VectorFriends Aligner, плагин MUSCLE и плагин Clustal W | Оба | Местный или глобальный | Команда BioFriends | 2013 | Фирменные , бесплатная для академического использования |
GLProbs | Подход на основе адаптивной парно-скрытой марковской модели | Протеин | Глобальный | Y. Ye et al. | 2013 |
* Тип последовательности: белок или нуклеотид. ** Тип выравнивания: локальное или глобальное
Геномный анализ
Имя | Описание | Тип последовательности * | |
---|---|---|---|
ОРЕЛ [32] | Сверхбыстрый инструмент для поиска относительных отсутствующих слов в геномных данных | Нуклеотид | |
ACT (инструмент сравнения Artemis) | Синтения и сравнительная геномика | Нуклеотид | |
AVID | Попарное глобальное выравнивание с целыми геномами | Нуклеотид | |
BLAT | Сопоставление последовательностей кДНК с геномом. | Нуклеотид | |
РАСШИФРОВАТЕЛЬ | Выравнивание реаранжированных геномов с использованием 6-кадровой трансляции | Нуклеотид | |
FLAK | Нечеткое выравнивание и анализ всего генома | Нуклеотид | |
GMAP | Сопоставление последовательностей кДНК с геномом. С высокой точностью определяет стыки в местах стыковки. | Нуклеотид | |
Splign | Сопоставление последовательностей кДНК с геномом. С высокой точностью определяет стыки в местах стыковки. Способен распознавать и разделять дупликации генов. | Нуклеотид | |
Лиловый | Множественное выравнивание перестроенных геномов | Нуклеотид | |
MGA | Множественный выравниватель генома | Нуклеотид | |
Мулан | Локальное множественное выравнивание последовательностей длины генома | Нуклеотид | |
Мультиз | Множественное выравнивание геномов | Нуклеотид | |
ПЛАСТ-нкРНК | Поиск нкРНК в геномах по локальному выравниванию функции распределения | Нуклеотид | |
Секвером | Профилирование данных о согласовании последовательностей с основными серверами / службами | Нуклеотид, пептид | |
Sequilab | Профилирование данных выравнивания последовательностей из результатов NCBI-BLAST с помощью основных серверов-сервисов | Нуклеотид, пептид | |
Shuffle-LAGAN | Попарное глокальное выравнивание завершенных участков генома | Нуклеотид | |
SIBsim4, Sim4 | Программа, предназначенная для выравнивания экспрессируемой последовательности ДНК с геномной последовательностью, позволяющая использовать интроны | Нуклеотид | |
SLAM | Поиск генов, выравнивание, аннотация (идентификация гомологии человека и мыши) | Нуклеотид | |
SRPRISM | Эффективный выравниватель для сборок с явными гарантиями, выравнивание чтений без стыков | Нуклеотид |
* Тип последовательности: белок или нуклеотид
Поиск мотива
Имя | Описание | Тип последовательности * |
---|---|---|
ПМС | Поиск и открытие мотивов | Оба |
FMM | Поиск и обнаружение мотивов (можно также получить положительные и отрицательные последовательности в качестве входных данных для расширенного поиска мотивов) | Нуклеотид |
БЛОКИ | Идентификация незаполненных мотивов из базы данных BLOCKS | Оба |
eMOTIF | Извлечение и идентификация более коротких мотивов | Оба |
Сэмплер мотивов Гиббса | Извлечение стохастических мотивов по статистическому правдоподобию | Оба |
HMMTOP | Прогнозирование трансмембранных спиралей и топологии белков | Протеин |
I-сайты | Библиотека мотивов локальной структуры | Протеин |
JCoils | Прогнозирование спиральной спирали и лейциновой молнии | Протеин |
ЦМем / мачта | Открытие и поиск мотивов | Оба |
CUDA-цМем | Алгоритм MEME (v4.4.0) с ускорением на GPU для кластеров GPU | Оба |
MERCI | Обнаружение и поиск дискриминационных мотивов | Оба |
PHI-Blast | Инструмент поиска и совмещения мотивов | Оба |
Филоскан | Инструмент поиска мотивов | Нуклеотид |
PRATT | Создание шаблонов для использования со ScanProsite | Протеин |
СканПросайт | Инструмент поиска по базе данных Motif | Протеин |
TEIRESIAS | Извлечение мотивов и поиск по базе данных | Оба |
БАЗАЛЬТ | Поиск по множественным мотивам и регулярным выражениям | Оба |
* Тип последовательности: белок или нуклеотид
Бенчмаркинг
Имя | Авторы |
---|---|
PFAM 30.0 (2016) | |
СМАРТ (2015) | Летуник, Копли, Шмидт, Чиккарелли, Доркс, Шульц, Понтинг, Борк |
BAliBASE 3 (2015) | Томпсон, Плевняк, Поч |
Oxbench (2011) | Рагхава, Сирл, Одли, Парикмахер, Бартон |
Сборник тестов (2009) | Эдгар |
ХОМСТРАД (2005) | Mizuguchi |
PREFAB 4.0 (2005) | Эдгар |
SABmark (2004 г.) | Ван Валле, Ластерс, Винс |
Наблюдатели, редакторы расклада
См. Список программного обеспечения для визуализации центровки .
Выравнивание последовательности короткого чтения
Имя | Описание | парный вариант | Используйте качество FASTQ | Пробел | Многопоточный | Лицензия | Справка | Год |
---|---|---|---|---|---|---|---|---|
Ариок | Вычисляет выравнивания Смита-Ватермана и качество отображения на одном или нескольких графических процессорах. Поддерживает выравнивание по BS-seq. Обрабатывает от 100 000 до 500 000 операций чтения в секунду (зависит от данных, оборудования и настроенной чувствительности). | да | Нет | да | да | Бесплатно, BSD | [33] | 2015 г. |
BarraCUDA | Ускоренная GPGPU программа выравнивания короткого чтения с преобразованием Барроуза-Уиллера (FM-индекс), основанная на BWA, поддерживает выравнивание вставок с отверстиями и расширениями зазоров. | да | Нет | да | Да, потоки POSIX и CUDA | Бесплатно, GPL | ||
BBMap | Использует короткие кмеры для быстрой индексации генома; нет ограничений по размеру или количеству строительных лесов. Более высокая чувствительность и специфичность, чем у капилляров Берроуза-Уиллера, с аналогичной или большей скоростью. Выполняет глобальное выравнивание, оптимизированное для аффинного преобразования, которое медленнее, но точнее, чем Смит-Уотерман. Обрабатывает данные Illumina, 454, PacBio, Sanger и Ion Torrent. С учетом стыковки; способен обрабатывать длинные индели и RNA-seq. Чистая Java; работает на любой платформе. Используется Объединенным институтом генома . | да | да | да | да | Бесплатно, BSD | 2010 г. | |
BFAST | Явный компромисс времени и точности с априорной оценкой точности, поддерживаемый индексированием эталонных последовательностей. Оптимально сжимает индексы. Может обрабатывать миллиарды коротких чтений. Может обрабатывать вставки, удаления, SNP и цветовые ошибки (может отображать чтение цветового пространства ABI SOLiD). Выполняет полное выравнивание по Смиту-Уотерману. | Да, потоки POSIX | Бесплатно, GPL | [34] | 2009 г. | |||
BigBWA | Запускает устройство Burrows-Wheeler Aligner -BWA в кластере Hadoop . Он поддерживает алгоритмы BWA-MEM, BWA-ALN и BWA-SW, работая с парными и одиночными чтениями. Это подразумевает значительное сокращение времени вычислений при работе в кластере Hadoop, добавляя масштабируемость и отказоустойчивость. | да | Некачественная обрезка оснований | да | да | Бесплатно, GPL 3 | [35] | 2015 г. |
BLASTN | Программа выравнивания нуклеотидов BLAST, медленная и неточная для коротких считываний, использует базу данных последовательностей (EST, последовательность Сэнгера), а не эталонный геном. | |||||||
BLAT | Сделано Джимом Кентом . Может справиться с одним несоответствием на начальном этапе выравнивания. | Да, клиент-сервер | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | [36] | 2002 г. | |||
Тетива | Использует преобразование Барроуза-Уиллера для создания постоянного многоразового индекса генома; Объем памяти 1,3 ГБ для генома человека. Выполняет более 25 миллионов операций чтения Illumina за 1 час ЦП. Поддерживает политики согласования типа Maq и SOAP | да | да | Нет | Да, потоки POSIX | Бесплатно, Художественный | [37] | 2009 г. |
BWA | Использует преобразование Барроуза-Уиллера для создания индекса генома. Он немного медленнее, чем Bowtie, но позволяет выравнивать отступы. | да | Некачественная обрезка оснований | да | да | Бесплатно, GPL | [38] | 2009 г. |
BWA-PSSM | Вероятностный выравниватель короткого чтения, основанный на использовании оценочных матриц, специфичных для позиции (PSSM). Выравниватель адаптируется в том смысле, что он может учитывать показатели качества считывания и модели смещений, специфичных для данных, например, наблюдаемых в Ancient DNA, данных PAR-CLIP или геномах со смещенными нуклеотидными составами. [39] | да | да | да | да | Бесплатно, GPL | [39] | 2014 г. |
НАЛИЧНЫЕ | Количественно оценивайте и управляйте большими объемами данных последовательности короткого чтения. CASHX pipeline содержит набор инструментов, которые можно использовать вместе или по отдельности как модули. Этот алгоритм очень точен для идеальных совпадений с эталонным геномом. | Нет | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | |||||
Ливень | Краткое сопоставление с использованием Hadoop MapReduce | Да, Hadoop MapReduce | Бесплатно, Художественный | |||||
CUDA-EC | Исправление ошибок выравнивания при кратковременном считывании с использованием графических процессоров. | Да, графический процессор включен | ||||||
CUSHAW | CUDA-совместимый выравниватель короткого чтения для больших геномов на основе преобразования Барроуза-Уиллера | да | да | Нет | Да (с включенным графическим процессором) | Бесплатно, GPL | [40] | 2012 г. |
CUSHAW2 | Согласование коротких и длинных считываний с пробелами на основе семян максимального точного совпадения. Этот выравниватель поддерживает выравнивание как по базовому пространству (например, от секвенсоров Illumina, 454, Ion Torrent и PacBio), так и по цветовому пространству ABI SOLiD. | да | Нет | да | да | Бесплатно, GPL | 2014 г. | |
CUSHAW2-GPU | Устройство выравнивания CUSHAW2 с ускорением на графическом процессоре. | да | Нет | да | да | Бесплатно, GPL | ||
CUSHAW3 | Чувствительное и точное выравнивание кратковременного чтения по базовому и цветовому пространству с гибридным посевом | да | Нет | да | да | Бесплатно, GPL | [41] | 2012 г. |
drFAST | Программное обеспечение для выравнивания сопоставления чтения, которое реализует игнорирование кеша для минимизации передачи основной / кэш-памяти, такое как mrFAST и mrsFAST, но разработанное для платформы секвенирования SOLiD (чтение цветового пространства). Он также возвращает все возможные местоположения на карте для более точного обнаружения структурных вариаций. | да | Да, для структурных вариаций | да | Нет | Бесплатно, BSD | ||
ELAND | Осуществляется компанией Illumina. Включает выравнивание без пропусков с конечной длиной чтения. | |||||||
ERNE | Расширенное рандомизированное числовое выравнивание для точного выравнивания показаний NGS. Он может отображать чтения, обработанные бисульфитом. | да | Некачественная обрезка оснований | да | Многопоточность и поддержка MPI | Бесплатно, GPL 3 | ||
ГАСССТ | Находит глобальное сопоставление коротких последовательностей ДНК с крупными банками ДНК. | Многопоточность | Лицензия CeCILL версии 2. | [42] | 2011 г. | |||
ДРАГОЦЕННЫЙ КАМЕНЬ | Качественный движок выравнивания (исчерпывающее отображение с заменами и отступами). Точнее и в несколько раз быстрее, чем BWA или Bowtie 1/2. Предусмотрено множество автономных биологических приложений (картограф, сплит-картограф, картографирование и другие). | да | да | да | да | Бесплатно, GPL 3 | [43] | 2012 г. |
Genalice КАРТА | Сверхбыстрый и универсальный выравниватель считывания NGS с высокой точностью и небольшим объемом памяти. | да | Некачественная обрезка оснований | да | да | Собственный , коммерческий | ||
Гениальный ассемблер | Быстрый и точный ассемблер перекрытия, способный обрабатывать любую комбинацию технологии секвенирования, длины считывания, любых ориентаций спаривания, с любым размером спейсера для спаривания, с эталонным геномом или без него. | да | Собственный , коммерческий | |||||
GensearchNGS | Полная структура с удобным графическим интерфейсом для анализа данных NGS. Он объединяет собственный высококачественный алгоритм выравнивания и возможность расширения для интеграции различных общедоступных выравнивателей в структуру, позволяющую импортировать короткие чтения, выравнивать их, обнаруживать варианты и создавать отчеты. Это сделано для переупорядочивания проектов, а именно в диагностической установке. | да | Нет | да | да | Собственный , коммерческий | ||
GMAP и GSNAP | Надежное и быстрое выравнивание по короткому чтению. GMAP: более длинные чтения с множественными вставками и сращиваниями (см. Запись выше в разделе «Анализ геномики»); GSNAP: более короткие чтения, с одной вставкой или до двух соединений за одно чтение. Полезно для цифровой экспрессии генов, SNP и indel-генотипирования. Разработано Томасом Ву из Genentech. Используется Национальным центром геномных ресурсов (NCGR) в Alpheus. | да | да | да | да | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||
GNUMAP | Точно выполняет выравнивание данных последовательностей, полученных с помощью секвенирующих машин нового поколения (в частности, Solexa-Illumina), с геномом любого размера. Включает подгонку адаптера, вызов SNP и анализ бисульфитной последовательности. | Да, также поддерживает файлы Illumina * _int.txt и * _prb.txt со всеми 4 показателями качества для каждой базы | Многопоточность и поддержка MPI | [44] | 2009 г. | |||
HIVE-шестиугольник | Использует хеш-таблицу и матрицу Блума для создания и фильтрации потенциальных позиций в геноме. Для более высокой эффективности используется перекрестное сходство между короткими считываниями и позволяет избежать повторного совмещения неуникальных избыточных последовательностей. Он быстрее, чем Bowtie и BWA, и позволяет проводить инсерции и дивергентные чувствительные выравнивания вирусов, бактерий и более консервативные выравнивания эукариот. | да | да | да | да | Фирменные , бесплатное программное обеспечение для академических и некоммерческих пользователей зарегистрированы в случае развертывания Улей | [45] | 2014 г. |
ИМОС | Улучшенный мета-выравниватель и Minimap2 On Spark. Распределенный выравниватель для длительного чтения на платформе Apache Spark с линейной масштабируемостью по отношению к выполнению на одном узле. | да | да | да | Бесплатно | |||
Исаак | Полностью использует всю вычислительную мощность, доступную на одном серверном узле; таким образом, он хорошо масштабируется в широком диапазоне аппаратных архитектур, а производительность согласования улучшается с увеличением возможностей оборудования. | да | да | да | да | Бесплатно, GPL | ||
ПОСЛЕДНИЙ | Использует адаптивные семена и более эффективно справляется с последовательностями, богатыми повторами (например, геномами). Например: он может выравнивать чтения по геномам без повторной маскировки, не перегружаясь повторяющимися попаданиями. | да | да | да | да | Бесплатно, GPL | [46] | 2011 г. |
MAQ | Выравнивание без пробелов, учитывающее показатели качества для каждой базы. | Бесплатно, GPL | ||||||
mrFAST, mrsFAST | Программное обеспечение для выравнивания с пропусками (mrFAST) и без пропусков (mrsFAST), которое реализует игнорирование кэша для минимизации передачи основной / кэш-памяти. Они разработаны для платформы секвенирования Illumina и могут возвращать все возможные местоположения на карте для более точного обнаружения структурных вариаций. | да | Да, для структурных вариаций | да | Нет | Бесплатно, BSD | ||
МАМА | MOM или максимальное отображение олигонуклеотидов - это инструмент сопоставления запросов, который фиксирует совпадение максимальной длины в коротком считывании. | да | ||||||
МОСАИК | Устройство для выравнивания с быстрым зазором и сборщик, ориентированный на образец. Выравнивает чтения с использованием ленточного алгоритма Смита-Уотермана , засеянного по результатам схемы хеширования k-mer. Поддерживает чтение размером от очень короткого до очень длинного. | да | ||||||
MPscan | Быстрое выравнивание на основе стратегии фильтрации (без индексации, использование q-граммов и обратного недетерминированного сопоставления DAWG ) | [47] | 2009 г. | |||||
Novoalign и NovoalignCS | Выравнивание одинарного и парного концов с зазором. Illumina GA I и II, цветовое пространство ABI и показания ION Torrent. Высокая чувствительность и специфичность, использование базовых качеств на всех этапах выравнивания. Включает подгонку адаптера, калибровку базового качества, выравнивание Bi-Seq и опции для отчета о нескольких выравниваниях за одно считывание. Использование неоднозначных кодов IUPAC для общих SNP может улучшить вспоминание SNP и устранить аллельное смещение. | да | да | да | Версии многопоточности и MPI доступны с платной лицензией | Проприетарная , бесплатная однопоточная версия для академического и некоммерческого использования | ||
NextGENe | Разработано для использования биологами, выполняющими анализ данных секвенирования следующего поколения с платформ Roche Genome Sequencer FLX, Illumina GA / HiSeq, SOLiD System, PacBio и Ion Torrent от Life Technologies Applied BioSystems. | да | да | да | да | Собственный , коммерческий | ||
NextGenMap | Гибкая и быстрая программа для картографирования (в два раза быстрее, чем BWA), обеспечивает чувствительность картографирования, сравнимую с Stampy. Внутренне использует эффективную с точки зрения памяти структуру индекса (хеш-таблицу) для хранения позиций всех 13-меров, присутствующих в эталонном геноме. Области отображения, где требуется попарное выравнивание, динамически определяются для каждого считывания. Использует быстрые инструкции SIMD (SSE) для ускорения вычислений выравнивания на ЦП. Если возможно, выравнивания вычисляются на GPU (с использованием OpenCL / CUDA), что дополнительно сокращает время выполнения на 20-50%. | да | Нет | да | Да, потоки POSIX , OpenCL / CUDA , SSE | Бесплатно | [48] | 2013 |
Набор инструментов Omixon Variant Toolkit | Включает высокочувствительные и высокоточные инструменты для обнаружения SNP и индексов. Он предлагает решение для картирования коротких чтений NGS на умеренном расстоянии (до 30% расхождения последовательностей) от эталонных геномов. Он не накладывает ограничений на размер эталона, что в сочетании с его высокой чувствительностью делает Variant Toolkit хорошо подходящим для целевых проектов секвенирования и диагностики. | да | да | да | да | Собственный , коммерческий | ||
PALMapper | Эффективно вычисляет совмещения со сращиванием и без сращивания с высокой точностью. Опираясь на стратегию машинного обучения в сочетании с быстрым отображением на основе ленточного алгоритма, подобного алгоритму Смита-Уотермана, он выравнивает около 7 миллионов операций чтения в час на одном процессоре. Он уточняет первоначально предложенный подход QPALMA. | да | Бесплатно, GPL | |||||
Partek Flow | Для использования биологами и биоинформатиками. Он поддерживает выравнивание без зазоров, зазоров и стыковочных соединений при чтении с одного и двух концов из необработанных данных Illumina, Life technologies Solid TM, Roche 454 и Ion Torrent (с информацией о качестве или без нее). Он объединяет мощный контроль качества на уровне FASTQ / Qual и согласованных данных. Дополнительные функции включают обрезку и фильтрацию необработанных считываний, обнаружение SNP и InDel, количественное определение мРНК и микроРНК и обнаружение гибридных генов. | да | да | да | Возможна многопроцессорная установка клиент-сервер | Собственная , коммерческая , бесплатная пробная версия | ||
ПРОХОДИТЬ | Индексирует геном, затем расширяет семена, используя предварительно вычисленное выравнивание слов. Работает с базовым пространством, цветовым пространством (SOLID) и может выравнивать геномные и сплайсированные чтения РНК-seq. | да | да | да | да | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||
Пермь | Индексирует геном с помощью периодических семян, чтобы быстро найти совпадения с полной чувствительностью до четырех несовпадений. Он может отображать показания Illumina и SOLiD. В отличие от большинства картографических программ скорость увеличивается с увеличением длины чтения. | да | Бесплатно, GPL | [49] | ||||
ПРИМЭКС | Индексирует геном с помощью таблицы поиска k-mer с полной чувствительностью до регулируемого количества несовпадений. Лучше всего для картирования последовательностей 15-60 п.н. в геном. | Нет | Нет | да | Нет, несколько процессов на поиск | [1] | 2003 г. | |
QPalma | Может использовать оценки качества, длину интронов и предсказания места склейки вычислений для выполнения и выполнения беспристрастного выравнивания. Может быть обучен специфике эксперимента по РНК-секвенированию и геному. Полезно для открытия сайтов сплайсинга / интронов и для построения генных моделей. (См. Более быструю версию в PALMapper). | Да, клиент-сервер | Бесплатно, GPL 2 | |||||
RazerS | Нет ограничения на длину чтения. Хемминга или редактирование карт расстояний с настраиваемой частотой ошибок. Настраиваемая и предсказуемая чувствительность (компромисс между временем выполнения и чувствительностью). Поддерживает отображение парного чтения. | Бесплатно, LGPL | ||||||
НАСТОЯЩИЙ, КРЕАЛЬНЫЙ | REAL - это эффективный, точный и чувствительный инструмент для согласования коротких считываний, полученных в результате секвенирования следующего поколения. Программа может обрабатывать огромное количество односторонних считываний, генерируемых анализатором генома Illumina / Solexa следующего поколения. cREAL - это простое расширение REAL для сопоставления коротких считываний, полученных в результате секвенирования следующего поколения, с геномом с круговой структурой. | да | да | Бесплатно, GPL | ||||
RMAP | Может сопоставлять считывания с информацией о вероятности ошибки (показатели качества) или без нее и поддерживает считывание с парного конца или сопоставление считывания, обработанного бисульфитом. Нет никаких ограничений на длину чтения или количество несовпадений. | да | да | да | Бесплатно, GPL 3 | |||
рНК | Рандомизированный числовой выравниватель для точного выравнивания NGS читает | да | Некачественная обрезка оснований | да | Многопоточность и поддержка MPI | Бесплатно, GPL 3 | ||
РИТЭГ следователь | Чрезвычайно быстрый, устойчивый к большому количеству отступов и замен. Включает полное выравнивание чтения. Продукт включает в себя комплексные конвейеры для обнаружения вариантов и метагеномного анализа с любой комбинацией данных Illumina, Complete Genomics и Roche 454. | да | Да, для варианта обзвона | да | да | Фирменные , бесплатная для индивидуального использования следователя | ||
Segemehl | Может обрабатывать вставки, удаления, несоответствия; использует расширенные массивы суффиксов | да | Нет | да | да | Фирменные , бесплатное программное обеспечение для некоммерческого использования | [50] | 2009 г. |
SeqMap | До 5 смешанных замен и вставок-делеций; различные параметры настройки и форматы ввода-вывода | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||||||
Шрек | Исправление ошибок короткого чтения с помощью структуры данных дерева суффиксов | Да, Java | ||||||
Креветка | Индексирует эталонный геном, начиная с версии 2. Использует маски для генерации возможных ключей. Может отображать чтение цветового пространства ABI SOLiD. | да | да | да | Да, OpenMP | Бесплатно, [[лицензии BSD | style = "background: #ddfd; color: black; vertical-align: middle; text-align: center;" class = "free table-free" | Бесплатно, BSD ]] производное | [51] [52] | 2009-2011 гг. |
Ползунок | Slider - это приложение для выходных данных анализатора последовательности Illumina, которое использует файлы «вероятности» вместо файлов последовательностей в качестве входных данных для выравнивания с эталонной последовательностью или набором эталонных последовательностей. | да | да | Нет | Нет | [53] [54] | 2009-2010 | |
МЫЛО, SOAP2, SOAP3, SOAP3-dp | SOAP: устойчивый с небольшим (1-3) количеством пробелов и несоответствий. Улучшение скорости по сравнению с BLAT, использует хеш-таблицу из 12 букв. SOAP2: использование двунаправленного BWT для построения индекса ссылок, и это намного быстрее, чем первая версия. SOAP3: версия с ускорением на графическом процессоре, которая может находить все выравнивания с четырьмя несоответствиями за десятки секунд на один миллион чтений. SOAP3-dp, также с ускорением на графическом процессоре, поддерживает произвольное количество несоответствий и пропусков в соответствии с оценками штрафа аффинных пробелов. | да | Нет | Да, SOAP3-dp | Да, потоки POSIX ; SOAP3, SOAP3-dp нужен графический процессор с поддержкой CUDA | Бесплатно, GPL | [55] [56] | |
SOCS | Для технологий ABI SOLiD. Значительное увеличение времени считывания карт с несоответствиями (или ошибками цвета). Использует итеративную версию алгоритма поиска строки Рабина-Карпа. | да | Бесплатно, GPL | |||||
SparkBWA | Интегрирует Aligner Burrows-Wheeler —BWA в инфраструктуру Apache Spark, работающую поверх Hadoop . Версия 0.2 от октября 2016 года, поддерживает алгоритмы BWA-MEM, BWA-backtrack и BWA-ALN. Все они работают с однократным и парным чтением. | да | Некачественная обрезка оснований | да | да | Бесплатно, GPL 3 | [57] | 2016 г. |
SSAHA, SSAHA2 | Быстро для небольшого количества вариантов | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||||||
Stampy | Ибо Иллюмина читает. Высокая специфичность и чувствительность к считыванию с индексами, структурными вариантами или множеством SNP. Медленно, но скорость резко увеличилась за счет использования BWA для первого прохода выравнивания. | да | да | да | Нет | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | [58] | 2010 г. |
Гроза | Для Illumina или ABI SOLiD читает с собственным выводом SAM . Высокая чувствительность к чтению с большим количеством ошибок, индексам (полное от 0 до 15, в противном случае расширенная поддержка). Использует разнесенные начальные числа (одиночное совпадение) и очень быстрый полосовой фильтр выравнивания SSE - SSE2 - AVX2 - AVX-512 . В противном случае авторы рекомендуют SHRiMP2 только для чтения с фиксированной длиной. | Нет | да | да | Да, OpenMP | Бесплатно | [59] | 2010 г. |
Subread, Subjunc | Сверхбыстрое и точное считывание выравнивателей. Subread может использоваться для картирования чтения как gDNA-seq, так и RNA-seq. Subjunc обнаруживает соединения экзон-экзон и отображает чтения РНК-seq. Они используют новую парадигму картографирования под названием « семя и голосование» . | да | да | да | да | Бесплатно, GPL 3 | ||
Тайпан | Ассемблер De-novo для Illumina читает | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||||||
UGENE | Визуальный интерфейс как для Bowtie, так и для BWA, а также встроенный выравниватель | да | да | да | да | Бесплатно, GPL | ||
VelociMapper | Ускоренный на ПЛИС инструмент сопоставления эталонных последовательностей от TimeLogic . Быстрее, чем алгоритмы на основе преобразования Барроуза-Уиллера , такие как BWA и Bowtie. Поддерживает до 7 несовпадений и / или несоответствий без потери производительности. Обеспечивает чувствительное выравнивание по Смиту-Ватерману с зазором. | да | да | да | да | Собственный , коммерческий | ||
XpressAlign | Средство выравнивания короткого считывания на основе скользящего окна на основе ПЛИС, которое использует неловко параллельное свойство выравнивания при коротком считывании. Производительность линейно масштабируется с количеством транзисторов на кристалле (т. Е. Производительность гарантированно удваивается с каждой итерацией закона Мура без модификации алгоритма). Низкое энергопотребление полезно для оборудования центра обработки данных. Прогнозируемое время выполнения. Лучшее соотношение цена / производительность, чем программные выравниватели с раздвижным окном на текущем оборудовании, но не лучше, чем программные выравниватели на основе BWT в настоящее время. Может управлять большим количеством (> 2) несоответствий. Найдет все позиции попадания для всех семян. Экспериментальная версия с одной ПЛИС, требуется доработка, чтобы превратить ее в производственную версию с несколькими ПЛИС. | Фирменный , бесплатное программное обеспечение для академического и некоммерческого использования | ||||||
МАСШТАБИРОВАТЬ | 100% чувствительность для считываний от 15 до 240 п.н. с практическими несоответствиями. Очень быстро. Поддержка вставок и удалений. Работает с инструментами Illumina и SOLiD, а не с 454. | Да (GUI), нет (CLI) | Собственный , коммерческий | [60] |
Смотрите также
- Список программного обеспечения для биоинформатики с открытым исходным кодом
Рекомендации
- ^ Альтшул С.Ф., Гиш В., Миллер В., Майерс Е. В., Липман Д. Д.; Гиш; Миллер; Майерс; Липман (октябрь 1990 г.). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–10. DOI : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Репозиторий кода HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
- ^ Angermüller, C .; Biegert, A .; Сёдинг, Дж. (Декабрь 2012 г.). «Дискриминационное моделирование вероятностей контекстно-зависимых аминокислотных замен» . Биоинформатика . 28 (24): 3240–7. DOI : 10.1093 / биоинформатики / bts622 . PMID 23080114 .
- ^ Букфинк, Се и Хусон (2015). «Быстрое и чувствительное выравнивание белков с помощью DIAMOND». Природные методы . 12 (1): 59–60. DOI : 10.1038 / nmeth.3176 . PMID 25402007 . S2CID 5346781 .
- ^ Б. Бухфинк, К. Рейтер и Х. Г. Дрост (2021 г.). «Выравнивание чувствительных белков в масштабе дерева жизни с использованием DIAMOND» . Природные методы . 18 (4): 366–368. DOI : 10.1038 / s41592-021-01101-х . PMC 8026399 . PMID 33828273 .
- ^ Дурбин, Ричард; Эдди, Шон Р .; Крог, Андерс ; Митчисон, Грэм, ред. (1998). Анализ биологической последовательности: вероятностные модели белков и нуклеиновых кислот . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-62971-3.[ требуется страница ]
- ^ Сёдинг Дж (апрель 2005 г.). «Определение гомологии белков путем сравнения HMM-HMM» . Биоинформатика . 21 (7): 951–60. DOI : 10.1093 / биоинформатики / bti125 . PMID 15531603 .
- ^ Реммерт, Майкл; Бигерт, Андреас; Хаузер, Андреас; Сёдинг, Йоханнес (25 декабря 2011 г.). «HHblits: молниеносный итеративный поиск белковой последовательности с помощью выравнивания HMM-HMM». Природные методы . 9 (2): 173–175. DOI : 10.1038 / nmeth.1818 . hdl : 11858 / 00-001M-0000-0015-8D56-A . ISSN 1548-7105 . PMID 22198341 . S2CID 205420247 .
- ^ Хаусведель Х, Певица Дж, Райнерт К. (2014-09-01). «Лямбда: локальный выравниватель для массивных биологических данных» . Биоинформатика . 30 (17): 349–355. DOI : 10.1093 / биоинформатики / btu439 . PMC 4147892 . PMID 25161219 .
- ^ Штейнеггер, Мартин; Сёдинг, Йоханнес (2017-10-16). «MMseqs2 позволяет искать чувствительные последовательности белков для анализа массивных наборов данных» . Природа Биотехнологии . 35 (11): 1026–1028. DOI : 10.1038 / nbt.3988 . hdl : 11858 / 00-001M-0000-002E-1967-3 . PMID 29035372 . S2CID 402352 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Джусти, Армандо Э. Де; Найуф, Марсело; Прието-Матиас, Мануэль (30.06.2016). "OSWALD: OpenCL Smith – Waterman о FPGA Altera для больших баз данных белков" . Международный журнал приложений высокопроизводительных вычислений . 32 (3): 337–350. DOI : 10.1177 / 1094342016654215 . ISSN 1094-3420 . S2CID 212680914 .
- ^ Альтшул С.Ф., Мэдден Т.Л., Шеффер А.А. и др. (Сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базам данных белков» . Исследования нуклеиновых кислот . 25 (17): 3389–402. DOI : 10.1093 / NAR / 25.17.3389 . PMC 146917 . PMID 9254694 .
- ^ Ли В., Маквильям Х., Гужон М. и др. (Июнь 2012 г.). «PSI-Search: итеративный поиск SSEARCH профиля с уменьшенным HOE» . Биоинформатика . 28 (12): 1650–1651. DOI : 10.1093 / биоинформатики / bts240 . PMC 3371869 . PMID 22539666 .
- ^ Oehmen, C .; Nieplocha, J. (август 2006 г.). «ScalaBLAST: масштабируемая реализация BLAST для высокопроизводительного биоинформатического анализа с большим объемом данных» . Транзакции IEEE в параллельных и распределенных системах . 17 (8): 740–749. DOI : 10.1109 / TPDS.2006.112 . S2CID 11122366 .
- ^ Hughey, R .; Karplus, K .; Крог, А. (2003). SAM: программная система для выравнивания и моделирования последовательностей. Технический отчет UCSC-CRL-99-11 (Отчет). Калифорнийский университет, Санта-Крус, Калифорния.
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Найуф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «Энергетический анализ производительности SWIMM: реализация Смита – Уотермана на многоядерных и многоядерных архитектурах Intel» . Параллелизм и вычисления: практика и опыт . 27 (18): 5517–5537. DOI : 10.1002 / cpe.3598 . ISSN 1532-0634 . S2CID 42945406 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Найуф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «SWIMM 2.0: усовершенствованный Smith-Waterman на многоядерных и многоядерных архитектурах Intel на основе векторных расширений AVX-512» . Международный журнал параллельного программирования . 47 (2): 296–317. DOI : 10.1007 / s10766-018-0585-7 . ISSN 1573-7640 . S2CID 49670113 .
- ^ Шварц С., Кент В. Дж., Смит А., Чжан З., Бэртч Р., Хардисон Р. К., Хаусслер Д., Миллер В.; Кент; Smit; Чжан; Бэрч; Хардисон; Хаусслер; Миллер (2003). «Сравнение человека и мыши с BLASTZ» . Геномные исследования . 13 (1): 103–107. DOI : 10.1101 / gr.809403 . PMC 430961 . PMID 12529312 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Харрис RS (2007). Улучшенное попарное выравнивание геномной ДНК (Тезис).
- ^ Sandes, Edans F. de O .; де Мело, Альба Кристина М.А. (май 2013 г.). «Получение сопоставлений Смита-Уотермана с оптимизацией для мегабазных биологических последовательностей с использованием графического процессора». Транзакции IEEE в параллельных и распределенных системах . 24 (5): 1009–1021. DOI : 10.1109 / TPDS.2012.194 .
- ^ Sandes, Edans F. de O .; Миранда, G .; Де Мело, ACMA; Марторелл, X .; Э. Айгуаде (май 2014 г.). CUDAlign 3.0: параллельное сравнение биологической последовательности в больших кластерах графических процессоров . Кластерные, облачные и сетевые вычисления (CCGrid), 14-й международный симпозиум IEEE / ACM 2014 г. п. 160. DOI : 10,1109 / CCGrid.2014.18 .
- ^ Sandes, Edans F. de O .; Миранда, G .; Де Мело, ACMA; Марторелл, X .; Э. Айгуаде (август 2014 г.). Подробное сравнение параллельных мегабазных последовательностей с несколькими гетерогенными графическими процессорами . Материалы 19-го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. С. 383–384. DOI : 10.1145 / 2555243.2555280 .
- ^ Chivian, D; Бейкер, Д. (2006). «Моделирование гомологии с использованием генерации ансамбля параметрического выравнивания с консенсусом и выбором модели на основе энергии» . Исследования нуклеиновых кислот . 34 (17): e112. DOI : 10.1093 / NAR / gkl480 . PMC 1635247 . PMID 16971460 .
- ^ Гирдеа, М; Ноэ, L; Кучеров, Г (январь 2010). «Обратный перевод для обнаружения отдаленных гомологий белков при наличии мутаций сдвига рамки считывания» . Алгоритмы молекулярной биологии . 5 (6): 6. DOI : 10,1186 / 1748-7188-5-6 . PMC 2821327 . PMID 20047662 .
- ^ Ma, B .; Tromp, J .; Ли, М. (2002). «PatternHunter: более быстрый и точный поиск гомологии» . Биоинформатика . 18 (3): 440–445. DOI : 10.1093 / биоинформатики / 18.3.440 . PMID 11934743 .
- ^ Li, M .; Ma, B .; Кисман, Д .; Тромп, Дж. (2004). «Patternhunter II: высокочувствительный и быстрый поиск гомологии». Журнал биоинформатики и компьютерной биологии . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . DOI : 10.1142 / S0219720004000661 . PMID 15359419 .
- ^ Гасфилд, Дэн (1997). Алгоритмы на строках, деревьях и последовательностях . Пресса Кембриджского университета. ISBN 978-0-521-58519-4.
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Найуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль (2018). «SWIFOLD: реализация Смита-Уотермана на FPGA с OpenCL для длинных последовательностей ДНК» . BMC Systems Biology . 12 (Suppl 5): 96. DOI : 10,1186 / s12918-018-0614-6 . PMC 6245597 . PMID 30458766 .
- ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Найуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль. Ускорение выравнивания длинных последовательностей ДНК по Смиту-Уотерману с помощью OpenCL на FPGA . 5-я Международная конференция по биоинформатике и биомедицинской инженерии. п. 500-511. DOI : 10.1007 / 978-3-319-56154-7_45 .
- ^ Расмуссен К., Стоу Дж., Майерс Е.В.; Stoye; Майерс (2006). «Эффективные фильтры q-грамма для поиска всех совпадений эпсилон по заданной длине». Журнал вычислительной биологии . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . DOI : 10,1089 / cmb.2006.13.296 . PMID 16597241 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Ной Л, Кучеров Г; Кучеров (2005). «ЯСС: повышение чувствительности поиска сходства ДНК» . Исследования нуклеиновых кислот . 33 (Suppl_2): W540 – W543. DOI : 10.1093 / NAR / gki478 . PMC 1160238 . PMID 15980530 .
- ^ Пратас, Диого; Сильва, Хорхе (2020). «Стойкие минимальные последовательности SARS-CoV-2» . Биоинформатика . 36 (21): 5129–5132. DOI : 10.1093 / биоинформатики / btaa686 . PMC 7559010 . PMID 32730589 .
- ^ Уилтон, Ричард; Будавари, Тамас; Лэнгмид, Бен; Уилан, Сара Дж .; Зальцберг, Стивен Л .; Салай, Александр С. (2015). «Arioc: согласование высокопроизводительного чтения с изучением пространства поиска с ускорением на GPU» . PeerJ . 3 : e808. DOI : 10,7717 / peerj.808 . PMC 4358639 . PMID 25780763 .
- ^ Гомер, Нильс; Мерриман, Барри; Нельсон, Стэнли Ф. (2009). «BFAST: инструмент выравнивания для крупномасштабного ресеквенирования генома» . PLOS ONE . 4 (11): e7767. Bibcode : 2009PLoSO ... 4.7767H . DOI : 10.1371 / journal.pone.0007767 . PMC 2770639 . PMID 19907642 .
- ^ Abuín, JM; Pichel, JC; Pena, TF; Амиго, Дж. (2015). «BigBWA: приближение к выравниванию Барроуза – Уиллера для технологий больших данных» . Биоинформатика . 31 (24): 4003–5. DOI : 10.1093 / биоинформатики / btv506 . PMID 26323715 .
- ^ Кент, WJ (2002). «BLAT --- Инструмент для выравнивания типа BLAST» . Геномные исследования . 12 (4): 656–664. DOI : 10.1101 / gr.229202 . ISSN 1088-9051 . PMC 187518 . PMID 11932250 .
- ^ Лэнгмид, Бен; Трапнелл, Коул; Поп, Михай; Зальцберг, Стивен Л. (2009). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с геномом человека» . Геномная биология . 10 (3): R25. DOI : 10.1186 / GB-2009-10-3-r25 . ISSN 1465-6906 . PMC 2690996 . PMID 19261174 .
- ^ Li, H .; Дурбин, Р. (2009). «Быстрое и точное согласование короткого чтения с преобразованием Барроуза-Уиллера» . Биоинформатика . 25 (14): 1754–1760. DOI : 10.1093 / биоинформатики / btp324 . ISSN 1367-4803 . PMC 2705234 . PMID 19451168 .
- ^ а б Керпеджиев, Петр; Frellsen, Jes; Линдгрин, Стинус; Крог, Андерс (2014). «Адаптивное вероятностное отображение коротких чтений с использованием матриц оценки для конкретных позиций» . BMC Bioinformatics . 15 (1): 100. DOI : 10,1186 / 1471-2105-15-100 . ISSN 1471-2105 . PMC 4021105 . PMID 24717095 .
- ^ Liu, Y .; Schmidt, B .; Маскелл, Д.Л. (2012). «CUSHAW: совместимый с CUDA выравниватель короткого чтения для больших геномов на основе преобразования Барроуза-Уиллера» . Биоинформатика . 28 (14): 1830–1837. DOI : 10.1093 / биоинформатики / bts276 . ISSN 1367-4803 . PMID 22576173 .
- ^ Liu, Y .; Шмидт, Б. (2012). «Выравнивание при долгом чтении на основе семян максимального точного совпадения» . Биоинформатика . 28 (18): i318 – i324. DOI : 10.1093 / биоинформатики / bts414 . ISSN 1367-4803 . PMC 3436841 . PMID 22962447 .
- ^ Ризк, Гийом; Лавенье, Доминик (2010). «GASSST: инструмент поиска короткой последовательности глобального выравнивания» . Биоинформатика . 26 (20): 2534–2540. DOI : 10.1093 / биоинформатики / btq485 . PMC 2951093 . PMID 20739310 .
- ^ Марко-Сола, Сантьяго; Саммет, Майкл; Гиго, Родерик; Рибека, Паоло (2012). «Картограф GEM: быстрое, точное и универсальное выравнивание с помощью фильтрации». Природные методы . 9 (12): 1185–1188. DOI : 10.1038 / nmeth.2221 . ISSN 1548-7091 . PMID 23103880 . S2CID 2004416 .
- ^ Клемент, Нидерланды; Snell, Q .; Клемент, MJ; Холленхорст, ПК; Purwar, J .; Graves, BJ; Кэрнс, Бразилия; Джонсон, WE (2009). «Алгоритм GNUMAP: объективное вероятностное картирование олигонуклеотидов из секвенирования следующего поколения» . Биоинформатика . 26 (1): 38–45. DOI : 10.1093 / биоинформатики / btp614 . ISSN 1367-4803 . PMC 6276904 . PMID 19861355 .
- ^ Сантана-Кинтеро, Луис; Дингердиссен, Хейли; Тьерри-Миег, Жан; Мазумдер, Раджа; Симонян, Ваан (2014). «HIVE-Hexagon: высокопроизводительное параллельное выравнивание последовательностей для анализа данных секвенирования нового поколения» . PLOS ONE . 9 (6): 1754–1760. Bibcode : 2014PLoSO ... 999033S . DOI : 10.1371 / journal.pone.0099033 . PMC 4053384 . PMID 24918764 .
- ^ Kielbasa, SM; Wan, R .; Sato, K .; Horton, P .; Фрит, MC (2011). «Адаптивное сравнение геномной последовательности прирученных семян» . Геномные исследования . 21 (3): 487–493. DOI : 10.1101 / gr.113985.110 . PMC 3044862 . PMID 21209072 .
- ^ Соперники, Эрик; Салмела, Лина; Киискинен, Петтери; Калси, Петри; Тархио, Йорма (2009). mpscan: быстрая локализация множественных чтений в геномах . Алгоритмы в биоинформатике . Конспект лекций по информатике. 5724 . С. 246–260. Bibcode : 2009LNCS.5724..246R . CiteSeerX 10.1.1.156.928 . DOI : 10.1007 / 978-3-642-04241-6_21 . ISBN 978-3-642-04240-9.
- ^ Sedlazeck, Fritz J .; Решенедер, Филипп; фон Хезелер, Арндт (2013). «NextGenMap: быстрое и точное отображение считывания в высокополиморфных геномах» . Биоинформатика . 29 (21): 2790–2791. DOI : 10.1093 / биоинформатики / btt468 . PMID 23975764 .
- ^ Чен, Янго; Суаяйя, Таде; Чен, Тинг (2009). «PerM: эффективное сопоставление считываний коротких секвенирований с периодическими полностью чувствительными разнесенными затравками» . Биоинформатика . 25 (19): 2514–2521. DOI : 10.1093 / биоинформатики / btp486 . PMC 2752623 . PMID 19675096 .
- ^ Searls, Дэвид Б .; Хоффманн, Стив; Отто, Кристиан; Курц, Стефан; Шарма, Синтия М .; Хаитович, Филипп; Фогель, Йорг; Стадлер, Питер Ф .; Хаккермюллер, Йорг (2009). «Быстрое отображение коротких последовательностей с несоответствиями, вставками и удалениями с использованием структур индекса» . PLOS вычислительная биология . 5 (9): e1000502. Bibcode : 2009PLSCB ... 5E0502H . DOI : 10.1371 / journal.pcbi.1000502 . ISSN 1553-7358 . PMC 2730575 . PMID 19750212 .
- ^ Рамбл, Стивен М .; Лакрут, Фил; Далка, Адриан В .; Фиуме, Марк; Сидоу, Аренд; Брудно, Майкл (2009). «SHRiMP: точное отображение коротких чтений в цветовом пространстве» . PLOS вычислительная биология . 5 (5): e1000386. Bibcode : 2009PLSCB ... 5E0386R . DOI : 10.1371 / journal.pcbi.1000386 . PMC 2678294 . PMID 19461883 .
- ^ Давид, Матей; Дзамба, Миско; Листер, Дэн; Илие, Люциан; Брудно, Майкл (2011). «SHRiMP2: деликатное, но практичное отображение краткого чтения» . Биоинформатика . 27 (7): 1011–1012. DOI : 10.1093 / биоинформатики / btr046 . PMID 21278192 .
- ^ Малхис, Навар; Баттерфилд, Ярон С.Н.; Эстер, Мартин; Джонс, Стивен Дж. М. (2009). «Ползунок - максимальное использование вероятностной информации для выравнивания считывания коротких последовательностей и обнаружения SNP» . Биоинформатика . 25 (1): 6–13. DOI : 10.1093 / биоинформатики / btn565 . PMC 2638935 . PMID 18974170 .
- ^ Малхис, Навар; Джонс, Стивен Дж. М. (2010). «Высококачественные вызовы по протоколу SNP с использованием данных Illumina при неглубоком покрытии» . Биоинформатика . 26 (8): 1029–1035. DOI : 10.1093 / биоинформатики / btq092 . PMID 20190250 .
- ^ Li, R .; Li, Y .; Kristiansen, K .; Ван, Дж. (2008). «SOAP: короткая программа выравнивания олигонуклеотидов» . Биоинформатика . 24 (5): 713–714. DOI : 10.1093 / биоинформатики / btn025 . ISSN 1367-4803 . PMID 18227114 .
- ^ Li, R .; Yu, C .; Li, Y .; Lam, T.-W .; Ю, С.-М .; Kristiansen, K .; Ван, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для согласования краткого чтения» . Биоинформатика . 25 (15): 1966–1967. DOI : 10.1093 / биоинформатики / btp336 . ISSN 1367-4803 . PMID 19497933 .
- ^ Abuín, José M .; Pichel, Juan C .; Pena, Tomás F .; Амиго, Хорхе (2016-05-16). «SparkBWA: ускорение согласования данных высокопроизводительного секвенирования ДНК» . PLOS ONE . 11 (5): e0155461. Bibcode : 2016PLoSO..1155461A . DOI : 10.1371 / journal.pone.0155461 . ISSN 1932-6203 . PMC 4868289 . PMID 27182962 .
- ^ Lunter, G .; Гудсон, М. (2010). «Stampy: статистический алгоритм для чувствительного и быстрого картирования чтения последовательности Illumina» . Геномные исследования . 21 (6): 936–939. DOI : 10.1101 / gr.111120.110 . ISSN 1088-9051 . PMC 3106326 . PMID 20980556 .
- ^ Noe, L .; Girdea, M .; Кучеров, Г. (2010). «Разработка эффективных разнесенных начальных чисел для чтения карт SOLiD» . Успехи биоинформатики . 2010 : 708501. дои : 10,1155 / 2010/708501 . PMC 2945724 . PMID 20936175 .
- ^ Lin, H .; Zhang, Z .; Чжан, MQ; Ma, B .; Ли, М. (2008). «МАСШТАБ! На карте нанесены миллионы олиго» . Биоинформатика . 24 (21): 2431–2437. DOI : 10.1093 / биоинформатики / btn416 . PMC 2732274 . PMID 18684737 .