Автор (ы) оригинала | Йозеф Фельзенштейн |
---|---|
Разработчики) | Вашингтонский университет |
Первый выпуск | Октябрь 1980 г . |
Стабильный выпуск | 3.697 / 2 ноября 2014 г . |
Репозиторий | |
Написано в | C |
Операционная система | Windows , Mac OS X , Linux |
Платформа | x86 , x86-64 |
Доступно в | английский |
Тип | Филогенетика |
Лицензия | => v3.697: open-source = <v3.695: проприетарное бесплатное ПО |
Веб-сайт | evolution |
Пакет PHYLogeny Inference ( PHYLIP ) - это бесплатный пакет программ для компьютерной филогенетики для вывода эволюционных деревьев ( филогении ). [1] Он состоит из 35 портативных программ, т.е. исходный код записывается на языке программирования C . Начиная с версии 3.696, это программное обеспечение с открытым исходным кодом ; версии 3.695 и более ранние были проприетарным бесплатным программным обеспечением . Релизы происходят в виде исходного кода и предварительно скомпилированных исполняемых файлов для многих операционных систем, включая Windows.(95, 98, ME, NT, 2000, XP, Vista), Mac OS 8 , Mac OS 9 , OS X , Linux ( Debian , Red Hat ); и FreeBSD с FreeBSD.org. [2] Полная документация написана для всех программ в пакете и включена в него. Автор пакета - профессор Джозеф Фельзенштейн из Департамента геномных наук и Департамента биологии Вашингтонского университета в Сиэтле. [3]
Методы (реализованные каждой программой), доступные в пакете, включают экономию , матрицу расстояний и методы правдоподобия , включая бутстрапирование и деревья консенсуса. Типы данных, с которыми можно работать, включают молекулярные последовательности , частоты генов, сайты и фрагменты рестрикции , матрицы расстояний и дискретные символы. [2]
Каждая программа управляется через меню, которое спрашивает пользователей, какие параметры они хотят установить, и позволяет им начать вычисления. Данные считываются в программу из текстового файла, который пользователь может подготовить с помощью любого текстового редактора или текстового редактора (но этот текстовый файл не может быть в специальном формате этого текстового процессора, вместо этого он должен быть в простом ASCII или только текстовом формате. формат). Некоторые программы анализа последовательностей, такие как программа выравнивания Clustal W, могут записывать файлы данных в формате PHYLIP. Большинство программ ищут данные в файле с именем infile . Если они не находят этот файл, они затем просят пользователя ввести имя файла данных. [2]
Вывод записывается в файлы с такими именами, как outfile
и outtree
. Деревья написаны outtree
в формате Ньюика , неофициальном стандарте, согласованном в 1986 году авторами семи основных пакетов филогении.
Компонентные программы [ править ]
Название программы | Описание |
---|---|
протпарс | Оценивает филогенез пептидных последовательностей с помощью метода экономии. |
днапарс | Оценивает филогенез последовательностей ДНК, используя метод экономии. |
днапенный | Метод экономии ветвей и связей ДНК, находит все наиболее экономные филогении для последовательностей нуклеиновых кислот с помощью поиска по ветвям и связям. |
dnamove | Интерактивное построение филогений из последовательностей нуклеиновых кислот с их оценкой методом экономии ДНК, с совместимостью и отображением реконструированных оснований предков |
dnacomp | Оценивает филогении по данным последовательностей нуклеиновых кислот с использованием критерия совместимости. |
днамл | Оценивает филогении по нуклеотидным последовательностям с использованием метода максимального правдоподобия. |
dnamlk | Метод максимального правдоподобия ДНК с молекулярными часами; совместное использование dnaml и dnamlk позволяет провести проверку отношения правдоподобия для гипотезы молекулярных часов. |
промл | Оценивает филогении по аминокислотным последовательностям белков с использованием метода максимального правдоподобия. |
промлк | Метод максимального правдоподобия белковой последовательности с молекулярными часами |
restml | Оценка филогенеза по максимальной вероятности с использованием данных рестрикционных сайтов; не по рестрикционным фрагментам, а по наличию или отсутствию отдельных сайтов |
днаинвар | Для данных о последовательностях нуклеиновых кислот по четырем видам вычисляет филогенетические инварианты Лейка и Кавендера , которые проверяют альтернативные топологии деревьев. |
dnadist | Метод расстояния ДНК, который вычисляет четыре различных расстояния между видами по последовательностям нуклеиновых кислот; расстояния могут затем использоваться в программах матрицы расстояний |
протдист | Метод расстояния между последовательностями белков, который вычисляет меру расстояния для последовательностей с использованием оценок максимального правдоподобия на основе матрицы Дейхоффа PAM , приближения к ней Кимуры 1983 года или модели, основанной на генетическом коде плюс ограничение на переход на другую категорию аминокислот. |
рестдист | Расстояния, рассчитанные на основе данных сайтов ограничения или данных фрагментов ограничения |
seqboot | Программа начальной загрузки; читает набор данных и генерирует из него несколько наборов данных путем повторной выборки при начальной загрузке |
фитч | Метод матрицы расстояний Фитча-Марголиаша ; оценивает филогении на основе данных матрицы расстояний в рамках модели аддитивного дерева, согласно которой расстояния, как ожидается, будут равны сумме длин ветвей между видами |
китч | Метод матрицы расстояний Фитча-Марголиаша с молекулярными часами; оценивает филогении на основе данных матрицы расстояний в рамках ультраметрической модели, которая аналогична модели аддитивного дерева, за исключением того, что предполагается наличие эволюционных часов |
сосед | Реализация методов объединения соседей и UPGMA |
contml | Максимальное правдоподобие непрерывных символов и частот генов; оценивает филогении на основе данных о частоте генов по максимальной вероятности в рамках модели, в которой все расхождения обусловлены генетическим дрейфом в отсутствие новых мутаций; также проводится анализ максимального правдоподобия непрерывных персонажей, которые развиваются с помощью модели броуновского движения, предполагая, что персонажи развиваются с одинаковой скоростью и некоррелированным образом; не учитывает корреляции персонажей |
контраст | Считывает дерево из файла дерева и набор данных с данными о непрерывных символах и генерирует независимые контрасты для этих символов для использования в любом пакете многомерной статистики. |
гендер | Программа генетической дистанции, которая вычисляет одну из трех различных формул генетической дистанции на основе данных частоты генов. |
парсы | Неупорядоченный метод экономии дискретных символов с несколькими состояниями |
смешивание | Оценивает филогении с помощью некоторых методов экономии для дискретных символьных данных с двумя состояниями (0, 1); позволяет использовать методы: Вагнера, Камин-Сокаля или произвольные смеси |
пенни | Смешанный метод ветвей и границ, который находит все самые экономные филогении для дискретно-символьных данных с двумя состояниями, для критериев Вагнера, Камина-Сокаля и смешанной экономии с использованием метода точного поиска по ветвям и границам. |
двигаться | Интерактивное построение филогении из дискретных символьных данных с двумя состояниями (0, 1); оценивает критерии экономии и совместимости для этих филогений и отображает реконструированные состояния по всему дереву |
ложка | Оценивает филогении с помощью критериев экономии Долло или полиморфизма для дискретных символьных данных с двумя состояниями (0, 1) |
долпенный | Находит все или наиболее экономные филогении для дискретных данных с двумя состояниями, для критериев экономии Долло или полиморфизма с использованием метода точного поиска по ветвям и границам |
долман | Интерактивное построение филогении из дискретных символьных данных с двумя состояниями (0, 1) с использованием критериев экономии Долло или полиморфизма; оценивает критерии экономичности и совместимости для этих филогений; отображает реконструированные состояния по всему дереву |
клика | Находит наибольшую группу взаимно совместимых символов и рекомендуемую ими филогению для дискретных символьных данных с двумя состояниями (0, 1); самая большая клика (или все клики в пределах заданного диапазона размеров самой большой) обнаруживаются с помощью метода быстрого поиска по ветвям и границам |
фактор | Программа перекодирования символов, которая принимает дискретные данные с несколькими состояниями с деревьями состояний символов и выдает соответствующий набор данных с двумя состояниями (0, 1) |
Drawgram | Программа для рисования корневого дерева, которая отображает корневые филогении, кладограммы и фенограммы в большом количестве контролируемых пользователем форматов. Программа является интерактивной и позволяет просматривать дерево на графических экранах ПК или Macintosh, а также на графических терминалах Tektronix или Digital. |
дерево | Программа для рисования деревьев без корней похожа на DRAWGRAM, но отображает филогении. |
согласие | Программа дерева консенсуса, которая вычисляет деревья методом дерева большинства правил, что также позволяет легко находить дерево строгого консенсуса; невозможно вычислить дерево консенсуса Адамса |
лесник | Вычисляет симметричное разностное расстояние Робинсона – Фулдса между деревьями, которое допускает различия в топологии дерева. |
отступать | Программа интерактивной перестановки дерева, которая считывает дерево (с указанием длины ветвей, если необходимо) и позволяет изменять корень дерева, переворачивать ветви, изменять названия видов и длину ветвей, а затем записывать результат; может использоваться для преобразования между корневыми и некорневыми деревьями |
Преобразование формата файла [ править ]
Преобразование между форматом множественного выравнивания последовательностей PHYLIP и форматом Multi- FASTA можно выполнить с помощью Genozip [5], используя genocat --fasta или genocat --phylip.
Ссылки [ править ]
- ^ Фельзенштейн, J. (1981). «Эволюционные деревья из последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Bibcode : 1981JMolE..17..368F . DOI : 10.1007 / BF01734359 . PMID 7288891 . S2CID 8024924 .
- ^ a b c "Страница общей информации PHYLIP" . Проверено 14 февраля 2010 .
- ↑ Джозеф Фельзенштейн (август 2003 г.). Вывод филогении . Sinauer Associates. ISBN 0-87893-177-5. Архивировано из оригинала на 2011-10-22 . Проверено 24 марта 2006 .
- ^ "Сайт-зеркало документации пакета PHYLIP" . Архивировано из оригинала на 2005-10-19 . Проверено 24 марта 2006 .
- ^ Лан, Д. и другие. (2021) Genozip: универсальный расширяемый компрессор геномных данных, Bioinformatics
Внешние ссылки [ править ]
- Официальный веб-сайт
- Список программ филогении : большой список программ филогении с подробным описанием каждого из них. Текущее число - [Обновить]366.