ProbCons - это метод множественного выравнивания аминокислотных последовательностей на основе вероятностной согласованности с открытым исходным кодом . Это одна из наиболее эффективных программ выравнивания множественных последовательностей белков , поскольку она неоднократно демонстрировала статистически значимое преимущество в точности по сравнению с аналогичными инструментами, включая Clustal и MAFFT . [1] [2]
Алгоритм [ править ]
Ниже описана основная схема алгоритма ProbCons. [3]
Шаг 1. Надежность выравнивающей кромки [ править ]
Для каждой пары последовательностей вычислите вероятность того, что буквы и попадают в пары в выравнивании, которое генерируется моделью.
(Где равно 1, если и находятся в выравнивании, и 0 в противном случае.)
Шаг 2. Максимально ожидаемая точность [ править ]
Точность выравнивания по отношению к другому выравниванию определяется как количество общих выровненных пар, деленное на длину более короткой последовательности.
Рассчитайте ожидаемую точность каждой последовательности:
Это дает выравнивание с максимальной ожидаемой точностью (MEA):
Шаг 3. Преобразование вероятностной согласованности [ править ]
Все пары последовательностей x, y из набора всех последовательностей теперь повторно оцениваются с использованием всех промежуточных последовательностей z:
Этот шаг можно повторить.
Шаг 4: Расчет дерева направляющих [ править ]
Постройте направляющее дерево путем иерархической кластеризации, используя оценку MEA в качестве оценки сходства последовательностей. Сходство кластера определяется с использованием средневзвешенного значения попарного сходства последовательностей.
Шаг 5. Вычислить MSA [ править ]
Наконец, вычислите MSA, используя прогрессивное или итеративное выравнивание.
См. Также [ править ]
Ссылки [ править ]
- ^ Do CB, Mahabhashyam MS, Брудно M, Batzoglou S (2005). «PROBCONS: вероятностное согласование множественных последовательностей на основе согласованности» . Геномные исследования . 15 (2): 330–340. DOI : 10.1101 / gr.2821705 . PMC 546535 . PMID 15687296 .
- ^ Рошан, Усман (2014-01-01). «Выравнивание множественных последовательностей с использованием Probcons и Probalign». В Рассел, Дэвид Дж (ред.). Методы совмещения множественных последовательностей . Методы молекулярной биологии. 1079 . Humana Press. С. 147–153. DOI : 10.1007 / 978-1-62703-646-7_9 . ISBN 9781627036450. PMID 24170400 .
- ^ Лекция "Биоинформатика II" в Университете Фрайбурга
Внешние ссылки [ править ]
- Официальный веб-сайт