Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

ProbCons - это метод множественного выравнивания аминокислотных последовательностей на основе вероятностной согласованности с открытым исходным кодом . Это одна из наиболее эффективных программ выравнивания множественных последовательностей белков , поскольку она неоднократно демонстрировала статистически значимое преимущество в точности по сравнению с аналогичными инструментами, включая Clustal и MAFFT . [1] [2]

Алгоритм [ править ]

Ниже описана основная схема алгоритма ProbCons. [3]

Шаг 1. Надежность выравнивающей кромки [ править ]

Для каждой пары последовательностей вычислите вероятность того, что буквы и попадают в пары в выравнивании, которое генерируется моделью.

(Где равно 1, если и находятся в выравнивании, и 0 в противном случае.)

Шаг 2. Максимально ожидаемая точность [ править ]

Точность выравнивания по отношению к другому выравниванию определяется как количество общих выровненных пар, деленное на длину более короткой последовательности.

Рассчитайте ожидаемую точность каждой последовательности:

Это дает выравнивание с максимальной ожидаемой точностью (MEA):

Шаг 3. Преобразование вероятностной согласованности [ править ]

Все пары последовательностей x, y из набора всех последовательностей теперь повторно оцениваются с использованием всех промежуточных последовательностей z:

Этот шаг можно повторить.

Шаг 4: Расчет дерева направляющих [ править ]

Постройте направляющее дерево путем иерархической кластеризации, используя оценку MEA в качестве оценки сходства последовательностей. Сходство кластера определяется с использованием средневзвешенного значения попарного сходства последовательностей.

Шаг 5. Вычислить MSA [ править ]

Наконец, вычислите MSA, используя прогрессивное или итеративное выравнивание.

См. Также [ править ]

Ссылки [ править ]

  1. ^ Do CB, Mahabhashyam MS, Брудно M, Batzoglou S (2005). «PROBCONS: вероятностное согласование множественных последовательностей на основе согласованности» . Геномные исследования . 15 (2): 330–340. DOI : 10.1101 / gr.2821705 . PMC  546535 . PMID  15687296 .
  2. ^ Рошан, Усман (2014-01-01). «Выравнивание множественных последовательностей с использованием Probcons и Probalign». В Рассел, Дэвид Дж (ред.). Методы совмещения множественных последовательностей . Методы молекулярной биологии. 1079 . Humana Press. С. 147–153. DOI : 10.1007 / 978-1-62703-646-7_9 . ISBN 9781627036450. PMID  24170400 .
  3. ^ Лекция "Биоинформатика II" в Университете Фрайбурга

Внешние ссылки [ править ]

  • Официальный веб-сайт