Эта статья была опубликована в рецензируемом журнале PLOS Computational Biology (2016). Щелкните, чтобы просмотреть опубликованную версию.
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Реконструкция предков (также известная как отображение персонажей или оптимизация персонажей ) - это экстраполяция назад во времени от измеренных характеристик людей (или популяций) к их общим предкам . Это важное приложение филогенетики , реконструкция и изучение эволюционных отношений между людьми, популяциями или видами с их предками. В контексте эволюционной биологии реконструкцию предков можно использовать для восстановления различных типов состояний предков организмов, которые жили миллионы лет назад. [1] Эти состояния включают генетическую последовательность( Реконструкция родового последовательность ), то аминокислотная последовательность из белка , композиция из генома (например, ген порядка), измеримая характеристика организма ( фенотип ), а также географическое распространение из родовой популяции или вида (реконструкция родового диапазон ). Это желательно, потому что это позволяет нам исследовать части филогенетических деревьев, соответствующие далекому прошлому, проясняя эволюционную историю видов на дереве. Поскольку современные генетические последовательностипо существу являются вариациями древних, доступ к древним последовательностям может идентифицировать другие варианты и организмы, которые могли возникнуть из этих последовательностей. [2] Помимо генетических последовательностей, можно попытаться отследить изменение одной черты характера на другую, например, превращение плавников в ноги.

Non-биологические приложения включают в себя реконструкцию лексикона или фонем древних языков , [3] и культурные особенности древних обществ , такие как устные традиции [4] или практики брака. [5]

Реконструкция предков опирается на достаточно реалистичную статистическую модель эволюции, позволяющую точно восстановить состояния предков. Эти модели используют генетическую информацию, уже полученную с помощью таких методов, как филогенетика, для определения пути, по которому пошла эволюция , и когда произошли эволюционные события. [6]Однако независимо от того, насколько хорошо модель приближается к реальной эволюционной истории, способность точно реконструировать предка ухудшается с увеличением времени эволюции между этим предком и его наблюдаемыми потомками. Кроме того, более реалистичные модели эволюции неизбежно становятся более сложными и трудными для расчета. Прогресс в области реконструкции предков в значительной степени зависит от экспоненциального роста вычислительной мощности и сопутствующего развития эффективных вычислительных алгоритмов (например, алгоритма динамического программирования для совместной реконструкции предковых последовательностей методом максимального правдоподобия ). [7] Методы реконструкции предков часто применяются к даннойфилогенетическое дерево , которое уже было выведено из тех же данных. Этот подход удобен, но имеет тот недостаток, что его результаты зависят от точности одного филогенетического дерева. Напротив, некоторые исследователи [8] отстаивают байесовский подход с большей вычислительной мощностью, который учитывает неопределенность в реконструкции дерева путем оценки наследственных реконструкций по многим деревьям.

История [ править ]

Идею реконструкции предков часто приписывают Эмилю Цукеркандлю и Линусу Полингу . Мотивированные разработкой методов определения первичной (аминокислотной) последовательности белков Фредериком Сэнгером в 1955 г. [9] Цукеркандл и Полинг постулировали [10], что такие последовательности можно использовать для вывода не только филогении, относящегося к наблюдаемым последовательностям белков. , но также и предковую белковую последовательность в самой ранней точке (корне) этого дерева. Однако идея реконструкции предков по измеряемым биологическим характеристикам уже развивалась в области кладистики., один из предшественников современной филогенетики. Кладистические методы, появившиеся еще в 1901 году, делают вывод об эволюционных отношениях видов на основе распределения общих характеристик, некоторые из которых, как предполагается, произошли от общих предков. Кроме того, Теодосей Добжанский и Альфред Стертевант сформулировали принципы реконструкции предков в филогенетическом контексте в 1938 году, когда они сделали вывод об эволюционной истории хромосомных инверсий у Drosophila pseudoobscura . [11]

Таким образом, реконструкция предков имеет свои корни в нескольких дисциплинах. Сегодня вычислительные методы реконструкции предков продолжают расширяться и применяться в самых разных условиях, так что предковые состояния выводятся не только по биологическим характеристикам и молекулярным последовательностям, но также по структуре [12] [13] или каталитическим свойствам. [14] древних белков по сравнению с современными , географическое положение популяций и видов ( филогеография ) [15] [16] и структура геномов более высокого порядка. [17]

Методы и алгоритмы [ править ]

Любая попытка реконструкции предков начинается с филогении . В общем, филогения - это древовидная гипотеза о порядке, в котором популяции (называемые таксонами ) связаны по происхождению от общих предков. Наблюдаемые таксоны представлены кончиками или конечными узлами дерева, которые постепенно соединяются ветвями со своими общими предками, которые представлены точками ветвления дерева, которые обычно называют предковыми или внутренними узлами . В конце концов, все родословные сводятся к самому последнему общему предку.от всей выборки таксонов. В контексте реконструкции предков филогения часто рассматривается как известная величина (за исключением байесовских подходов). Поскольку может существовать огромное количество филогений, которые почти одинаково эффективны при объяснении данных, сокращение подмножества филогений, поддерживаемых данными, до одной репрезентативной или точечной оценки может быть удобным, а иногда и необходимым упрощающим допущением.

Реконструкция предков может рассматриваться как прямой результат применения гипотетической модели эволюции к данной филогении. Когда модель содержит один или несколько свободных параметров, общая цель состоит в том, чтобы оценить эти параметры на основе измеренных характеристик среди наблюдаемых таксонов (последовательностей), которые произошли от общих предков. Экономия - важное исключение из этой парадигмы: хотя было показано, что существуют обстоятельства, при которых она является оценкой максимального правдоподобия, [18] по своей сути, она просто основана на эвристике, что изменения в состоянии символа случаются редко, без пытаясь количественно оценить эту редкость.

Существует три различных класса методов реконструкции предков. В хронологическом порядке открытия это максимальная экономия , максимальная вероятность и байесовский вывод . Максимальная экономия считает все эволюционные события одинаково вероятными; максимальная вероятность объясняет различную вероятность определенных классов событий; и Байейзановский вывод связывает условную вероятность события с вероятностью дерева, а также степень неопределенности, которая связана с этим деревом. Максимальная экономия и максимальная вероятность дают единственный наиболее вероятный результат, тогда как байесовский вывод учитывает неопределенности в данных и дает выборку возможных деревьев.

Максимальная экономия [ править ]

Экономия, известная в просторечии как « бритва Оккама », относится к принципу выбора простейшей из конкурирующих гипотез. В контексте реконструкции предков, экономия стремится найти распределение состояний предков в пределах данного дерева, которое минимизирует общее количество изменений состояния персонажа, которые были бы необходимы для объяснения состояний, наблюдаемых на концах дерева. Этот метод максимальной экономии [19] является одним из самых ранних формализованных алгоритмов восстановления состояний предков, а также одним из самых простых. [13]

Максимальную экономию можно реализовать одним из нескольких алгоритмов. Одним из наиболее ранних примеров является методом Fitch по , [20] , которая присваивает родовые состояния символов с помощью скупости с помощью двух прохождений из корневого двоичного дерева . Первый этап - это обход после порядка, который переходит от кончиков к корню дерева, посещая дочерние (дочерние) узлы раньше их родителей. Первоначально мы определяем набор возможных состояний символа S i для i -го предка на основе наблюдаемых состояний символа его потомков. Каждое задание - это заданное пересечениесостояний характера потомков предка; если пересечение - пустое множество, то это объединение множеств . В последнем случае подразумевается, что между предком и одним из двух его непосредственных потомков произошло изменение состояния символа. Каждое такое событие засчитывается в функцию стоимости алгоритма, которая может использоваться для различения альтернативных деревьев на основе максимальной экономии. Далее предварительный обходдерева выполняется, начиная от корня к кончикам. Затем состояния персонажа назначаются каждому потомку на основе состояний символа, которые он разделяет со своим родителем. Поскольку у корня нет родительского узла, может потребоваться произвольно выбрать состояние символа, особенно когда в корне реконструировано более одного возможного состояния.

Филогения гипотетического рода растений со состояниями опыления «пчелы», «колибри» или «ветер», обозначенные картинками на кончиках. Узлы состояния опыления в филогенетическом дереве, предполагаемые при максимальной экономичности, окрашены на ветвях, ведущих в них (желтый цвет представляет опыление пчелами, красный цвет представляет опыление «колибри», а черный - опыление «ветром», двухцветные ветви одинаково экономны для растений. два состояния раскрашены). Назначение «колибри» в качестве корневого состояния (из-за предшествующих знаний из летописи окаменелостей) приводит к паттерну предковых состояний, представленному символами в узлах филогении, состоянию, требующему наименьшего количества изменений, чтобы вызвать паттерн, наблюдаемый в наконечники обведены кружками в каждом узле.

Например, рассмотрим филогению, полученную для рода растений, содержащего 6 видов A - F, где каждое растение опыляется «пчелой», «колибри» или «ветром». Возникает очевидный вопрос: какие опылители в более глубоких узлах были в филогении этого рода растений. При максимальной экономии реконструкция предкового состояния для этой клады показывает, что «колибри» является наиболее экономным предковым состоянием для нижней клады (растения D, E, F), которое в предках указано для узлов в верхней кладе (растения A, B, C) двусмысленны и что опылители "колибри" и "пчелы" одинаково правдоподобны для состояния опыления в корне филогении. Предположим, что у нас есть веские доказательства из летописи окаменелостей, что корневое состояние - «колибри».Преобразование корня в «колибри» даст образец реконструкции предкового состояния, изображенный символами в узлах, при этом состояние, требующее наименьшего количества изменений, обведено кружком.

Методы экономии интуитивно привлекательны и очень эффективны, так что они все еще используются в некоторых случаях для засеивания алгоритмов оптимизации максимального правдоподобия исходной филогении. [21] Однако лежащее в основе предположение, что эволюция достигла определенного конечного результата как можно быстрее, неточно. Естественный отбор и эволюция не работают для достижения цели, они просто выбирают за или против случайно происходящих генетических изменений. Методы экономии предполагают шесть общих допущений: что филогенетическое дерево, которое вы используете, является правильным, что у вас есть все соответствующие данные, в которых не было сделано ошибок при кодировании, что все ветви филогенетического дерева с одинаковой вероятностью изменятся, что скорость эволюции низкая, и вероятность потери или приобретения характеристики одинакова. [1] В действительности предположения часто нарушаются, что приводит к нескольким проблемам:

  1. Различия в темпах эволюции. Метод Fitch предполагает, что изменения между всеми состояниями персонажа имеют одинаковую вероятность; таким образом, любое изменение требует одинаковых затрат для данного дерева. Это предположение часто нереалистично и может ограничивать точность таких методов. [8] Например, в эволюции нуклеиновых кислот переходы имеют тенденцию происходить чаще, чем трансверсии . Это предположение можно ослабить, назначив разную стоимость изменениям состояния конкретного символа, что приведет к взвешенному алгоритму экономии. [22]
  2. Быстрая эволюция. Результатом эвристики «минимальной эволюции», лежащей в основе таких методов, является то, что такие методы предполагают, что изменения редки , и поэтому не подходят в случаях, когда изменение является нормой, а не исключением. [23] [24]
  3. Различия во времени между родословными. Методы экономии неявно предполагают, что вдоль каждой ветви дерева прошло одинаковое количество эволюционного времени. Таким образом, они не учитывают различия в длине ветвей на дереве, которые часто используются для количественной оценки эволюционного или хронологического времени. Из-за этого ограничения метод может сделать вывод, что одно изменение произошло на очень короткой ветви, а не несколько изменений, например, на очень длинной ветви. [25] Кроме того, возможно, что некоторые ветви дерева могут подвергаться более высокому выбору и скорости изменения, чем другие, возможно, из-за изменения факторов окружающей среды. Некоторые периоды времени могут представлять более быструю эволюцию, чем другие, когда это происходит, экономия становится неточной. [26]Этот недостаток устраняется методами, основанными на моделях (как методом максимального правдоподобия, так и байесовскими методами), которые выводят стохастический процесс эволюции по мере его развертывания вдоль каждой ветви дерева. [27]
  4. Статистическое обоснование. Без статистической модели, лежащей в основе метода, его оценки не имеют четко определенных неопределенностей. [23] [25] [28]
  5. Конвергентная эволюция. При рассмотрении состояния одного персонажа экономия автоматически предполагает, что два организма, которые имеют эту характеристику, будут более тесно связаны между собой, чем те, у которых ее нет. Например, то, что у собак и обезьян есть мех, не означает, что они более тесно связаны с людьми, чем обезьяны.

Максимальная вероятность [ править ]

Методы максимального правдоподобия (ML) реконструкции предкового состояния обрабатывают состояния символов во внутренних узлах дерева как параметры и пытаются найти значения параметров, которые максимизируют вероятность данных (наблюдаемые состояния символов) с учетом гипотезы (модели эволюция и филогения, связывающие наблюдаемые последовательности или таксоны). Другими словами, этот метод предполагает, что предковые состояния являются наиболее вероятными статистически с учетом наблюдаемых фенотипов. Некоторые из самых ранних подходов ML к реконструкции предков были разработаны в контексте эволюции генетической последовательности ; [29] [30] аналогичные модели были разработаны и для аналогичного случая эволюции дискретного характера. [31]

Использование модели эволюции объясняет тот факт, что не все события могут произойти с одинаковой вероятностью. Например, переход , который представляет собой тип точечной мутации от одного пурина к другому или от одного пиримидина к другому, гораздо более вероятен, чем трансверсия., который представляет собой вероятность того, что пурин будет переключен на пиримидин, или наоборот. Эти различия не улавливаются максимальной экономией. Однако то, что одни события более вероятны, чем другие, не означает, что они всегда происходят. Мы знаем, что на протяжении истории эволюции были времена, когда существовал большой разрыв между тем, что могло произойти с наибольшей вероятностью, и тем, что произошло на самом деле. В этом случае максимальная экономия может быть более точной, поскольку она более склонна к большим, маловероятным прыжкам, чем максимальная вероятность. Максимальное правдоподобие оказалось достаточно надежным при восстановлении состояний характера, но оно не дает точных оценок стабильности белков. Максимальная вероятность всегда переоценивает стабильность белков,что имеет смысл, поскольку предполагает, что произведенные и использованные белки были наиболее стабильными и оптимальными.[13] Достоинства максимальной вероятности были предметом споров, и некоторые пришли к выводу, что тест максимального правдоподобия представляет собой хорошее средство между точностью и скоростью. [32] Однако другие исследования жаловались, что максимальная вероятность требует слишком много времени и вычислительной мощности, чтобы быть полезной в некоторых сценариях. [33]

Эти подходы используют те же вероятностные рамки, что и для построения филогенетического дерева. [34] Вкратце, эволюция генетической последовательности моделируется обратимым во времени непрерывным марковским процессом . В простейшем из них все символы претерпевают независимые переходы между состояниями (например, нуклеотидные замены) с постоянной скоростью во времени. Эта базовая модель часто расширяется, чтобы разрешить разные ставки для каждой ветви дерева. В действительности частота мутаций также может меняться со временем (например, из-за изменений окружающей среды); это можно смоделировать, позволяя параметрам скорости развиваться по дереву за счет увеличения количества параметров. Модель определяет вероятности перехода из состояний i в j.вдоль ветви длины t (в единицах эволюционного времени). Вероятность филогении вычисляется из вложенной суммы вероятностей перехода, которая соответствует иерархической структуре предлагаемого дерева. В каждом узле вероятность его потомков суммируется по всем возможным состояниям предкового символа в этом узле:

где мы вычисляем вероятность того, что поддерево, имеющее корень в узле x с прямыми потомками y и z , обозначает состояние символа i -го узла, является длиной ветви (время эволюции) между узлами i и j , а также является набором все возможные состояния символов (например, нуклеотиды A, C, G и T). [34] Таким образом, цель реконструкции предков - найти назначение для всех x внутренних узлов, которое максимизирует вероятность наблюдаемых данных для данного дерева.

Предельная и совместная вероятность [ править ]

Вместо того, чтобы вычислять общую вероятность для альтернативных деревьев, задача реконструкции предков состоит в том, чтобы найти комбинацию состояний символов в каждом предковом узле с наивысшим предельным максимальным правдоподобием. Вообще говоря, есть два подхода к этой проблеме. Во-первых, можно назначить наиболее вероятное состояние характера каждому предку независимо от реконструкции всех других состояний предков. Этот подход называется маргинальной реконструкцией.. Это похоже на суммирование по всем комбинациям предковых состояний на всех других узлах дерева (включая корневой узел), кроме тех, для которых доступны данные. Маргинальная реконструкция - это нахождение состояния в текущем узле, которое максимизирует вероятность интеграции по всем другим состояниям во всех узлах пропорционально их вероятности. Во-вторых, вместо этого можно попытаться найти совместную комбинацию состояний наследственных символов по всему дереву, что в совокупности максимизирует вероятность всего набора данных. Таким образом, такой подход называется совместной реконструкцией. [29] Неудивительно, что реконструкция суставов более сложна в вычислительном отношении.чем маргинальная реконструкция. Тем не менее, эффективные алгоритмы совместной реконструкции были разработаны с временной сложностью, которая обычно линейна с количеством наблюдаемых таксонов или последовательностей. [7]

Методы реконструкции предков на основе ML имеют тенденцию обеспечивать большую точность, чем методы MP, при наличии вариаций в скорости эволюции между персонажами (или между участками генома). [35] [36] Однако эти методы еще не в состоянии учесть изменение скорости эволюции во времени, иначе известное как гетеротахия . Если скорость эволюции определенного персонажа увеличивается на ветви филогении, то степень эволюции, которая произошла на этой ветви, будет недооценена для данной длины ветви и при условии постоянной скорости эволюции этого персонажа. Вдобавок к этому трудно отличить гетеротахию от различий в скорости эволюции персонажей. [37]

Поскольку ML (в отличие от максимальной экономичности) требует от исследователя определения модели эволюции, на ее точность может повлиять использование совершенно неверной модели (неправильная спецификация модели). Кроме того, ML может обеспечить только однократную реконструкцию состояний символа (что часто называют «точечной оценкой») - когда поверхность правдоподобия сильно невыпуклая, содержащая несколько пиков (локальные оптимумы), то одноточечная оценка не может обеспечить адекватное представление, и байесовский подход может быть более подходящим.

Байесовский вывод [ править ]

Байесовский вывод использует вероятность наблюдаемых данных для обновления убеждений исследователя или предварительного распределения , чтобы получить апостериорное распределение . В контексте реконструкции предков цель состоит в том, чтобы вывести апостериорные вероятности состояний предковых персонажей в каждом внутреннем узле данного дерева. Более того, можно интегрировать эти вероятности по апостериорным распределениям по параметрам эволюционной модели и пространству всех возможных деревьев. Это можно выразить как приложение теоремы Байеса :

где S представляет собой предковые состояния, D соответствует наблюдаемым данным и представляет собой как эволюционную модель, так и филогенетическое древо. - вероятность наблюдаемых данных, которые могут быть вычислены с помощью алгоритма отсечения Фельзенштейна, как указано выше. - априорная вероятность наследственных состояний для данной модели и дерева. Наконец, это вероятность данных для данной модели и дерева, интегрированных по всем возможным наследственным состояниям.

Байесовский вывод - это метод, который, по мнению многих, является наиболее точным. [8] В целом, байесовские статистические методы позволяют исследователям комбинировать ранее существовавшую информацию с новой гипотезой. В случае эволюции он сочетает в себе вероятность наблюдаемых данных с вероятностью того, что события произошли в том порядке, в котором они произошли, при этом признается возможность ошибки и неопределенности. В целом, это наиболее точный метод восстановления наследственных генетических последовательностей, а также стабильности белков. [25] В отличие от двух других методов, байесовский вывод дает распределение возможных деревьев, что позволяет получить более точные и легко интерпретируемые оценки дисперсии возможных результатов. [38]

Выше мы привели две формулировки, чтобы подчеркнуть два различных приложения теоремы Байеса, которые мы обсудим в следующем разделе.

Эмпирический и иерархический Байес [ править ]

Одна из первых реализаций байесовского подхода к реконструкции наследственной последовательности была разработана Янгом и его коллегами [29], где оценки максимального правдоподобия эволюционной модели и дерева, соответственно, использовались для определения априорных распределений. Таким образом, их подход является примером эмпирического метода Байеса для вычисления апостериорных вероятностей состояний предков; Впервые этот метод был реализован в программном пакете PAML. [39] С точки зрения приведенной выше формулировки правила Байеса, эмпирический метод Байеса фиксирует эмпирические оценки модели и дерева, полученные из данных, эффективно отбрасывая апостериорную вероятность и предшествующие члены формулы. Более того, Ян и его коллеги[29] использовал эмпирическое распределение шаблонов сайта (т.е. присвоение нуклеотидов до кончиков дерева) в их выравнивания наблюдаемых нуклеотидных последовательностей в знаменателе в месте исчерпывающе вычисленияпо всем возможным значениям S данных. С вычислительной точки зрения, эмпирический метод Байеса сродни восстановлению предковых состояний с максимальной вероятностью, за исключением того, что вместо поиска присвоения состояний ML на основе их соответствующих распределений вероятностей в каждом внутреннем узле, сами распределения вероятностей сообщаются напрямую.

Эмпирические байесовские методы реконструкции предков требуют от исследователя допустить, что параметры эволюционной модели и дерево известны без ошибок. Когда размер или сложность данных делает это предположение нереалистичным, может быть более благоразумным принять полностью иерархический байесовский подход и вывести совместное апостериорное распределение по состояниям предков, модели и дереву. [40] Huelsenbeck и Bollback впервые предложили [40] иерархический байесовский метод реконструкции предков с использованием методов Монте-Карло с цепью Маркова (MCMC) для выборки наследственных последовательностей из этого совместного апостериорного распределения. Подобный подход был также использован для реконструкции эволюции симбиоза с водорослями у видов грибов (лихенизация ). [41] Например, алгоритм Метрополиса-Гастингса для MCMC исследует совместное апостериорное распределение, принимая или отклоняя назначения параметров на основе отношения апостериорных вероятностей.

Проще говоря, эмпирический байесовский подход вычисляет вероятности различных наследственных состояний для конкретного дерева и модели эволюции. Выражая реконструкцию предковых состояний как набор вероятностей, можно напрямую количественно оценить неопределенность для присвоения какого-либо конкретного состояния предку. С другой стороны, иерархический байесовский подход усредняет эти вероятности по всем возможным деревьям и моделям эволюции пропорционально тому, насколько вероятны эти деревья и модели с учетом наблюдаемых данных.

Однако вопрос о том, дает ли иерархический байесовский метод существенное преимущество на практике, остается спорным. [42] Более того, этот полностью байесовский подход ограничен анализом относительно небольшого количества последовательностей или таксонов, потому что пространство всех возможных деревьев быстро становится слишком обширным, что делает невозможным с вычислительной точки зрения сходимость выборок цепочек за разумный промежуток времени.

Калибровка [ править ]

Реконструкция предков может быть основана на наблюдаемых состояниях в исторических образцах известного возраста, таких как окаменелости или архивные образцы. Поскольку точность реконструкции предков обычно снижается с увеличением времени, использование таких образцов дает данные, которые ближе к реконструируемым предкам, и, скорее всего, улучшит анализ, особенно когда скорость изменения характера меняется со временем. Эта концепция была подтверждена экспериментальным эволюционным исследованием, в котором реплики популяций бактериофага Т7 были размножены для создания искусственной филогении. [43] Пересматривая эти экспериментальные данные, Окли и Каннингем [44]обнаружили, что методы максимальной экономии не могут точно реконструировать известное наследственное состояние непрерывного символа ( размер бляшки ); эти результаты были подтверждены компьютерным моделированием. Этот провал реконструкции предков был приписан направленному смещению в эволюции размера бляшки (от большого к малому диаметру бляшки), что потребовало включения «окаменелых» образцов для устранения.

Исследования плотоядных животных [45] и рыб [46] показали, что без включения данных по окаменелостям реконструированные оценки размеров тела предков нереально велики. Более того, Грэхем Слейтер и его коллеги показали [47], что использование псовых плотоядных животных , включение данных окаменелостей в предыдущие распределения улучшило как байесовский вывод о состояниях предков, так и выбор эволюционной модели по сравнению с анализом, использующим только современные данные.

Модели [ править ]

Было разработано множество моделей для оценки предков дискретных и непрерывных признаков от существующих потомков. [48] Такие модели предполагают, что эволюция признака во времени может быть смоделирована как случайный процесс. Для признаков с дискретными значениями (таких как «тип опылителя») этот процесс обычно рассматривается как цепь Маркова ; для непрерывно-значимых черт (таких как « размер мозга ») этот процесс часто рассматривается как броуновское движение или процесс Орнштейна-Уленбека . Используя эту модель в качестве основы для статистического вывода, теперь можно использовать методы максимального правдоподобия или байесовский вывод для оценки наследственных состояний.

Модели с дискретным состоянием [ править ]

Предположим, что рассматриваемый признак может попасть в одно из состояний с меткой . Типичным средством моделирования эволюции этого признака является цепь Маркова с непрерывным временем, которую можно кратко описать следующим образом. С каждым состоянием связаны скорости перехода ко всем другим состояниям. Признак моделируется как переход между состояниями; когда он достигает заданного состояния, он запускает экспоненциальные «часы» для каждого из других состояний, в которые он может перейти. Затем он «гоняет» часы друг против друга и делает шаг к тому состоянию, часы которого звонят первыми. В такой модели параметрами являются скорости перехода, который может быть оценен с использованием, например, методов максимального правдоподобия, где один максимизирует набор всех возможных конфигураций состояний предковых узлов.

Общая марковская цепь с двумя состояниями, представляющая частоту скачков от аллеля А к аллелю А. Разным типам скачков разрешается иметь разную скорость.

Для того , чтобы восстановить состояние данного наследственного узла в филогенезе (назовем этот узел ) путем максимального правдоподобия, процедура: найти оценку максимального правдоподобия из ; затем вычислить вероятность каждого возможного состояния для кондиционирования ; наконец, выберите родовое государство, которое максимизирует это. [23] Можно также использовать эту модель замещения в качестве основы для процедуры байесовского вывода, которая будет учитывать апостериорную веру в состояние предкового узла с учетом некоторого предварительного выбора пользователем.

Поскольку у таких моделей может быть столько же параметров, переобучение может быть проблемой. Вот некоторые распространенные варианты, которые сокращают пространство параметров:

  • Модель с одним параметром марковского состояния : эта модель является обратным во времени аналогом модели Джукса-Кантора . В этой модели все переходы имеют одинаковую скорость , независимо от их начального и конечного состояний. Некоторые переходы могут быть запрещены, если их скорость просто равна 0; это может иметь место, например, если определенные состояния не могут быть достигнуты из других состояний за один переход.
    Пример модели 1-параметрической цепи Маркова с четырьмя состояниями. Обратите внимание, что на этой диаграмме переходы между состояниями A и D запрещены; обычно стрелку не рисуют, а рисуют со скоростью 0.
  • Асимметричная марковская модель с двумя параметрами : в этой модели пространство состояний упорядочено (так, что, например, состояние 1 меньше, чем состояние 2, которое меньше состояния 3), и переходы могут происходить только между соседними состояниями. Эта модель содержит два параметра и : один для скорости увеличения состояния (например , от 0 до 1, от 1 до 2, и т.д.), и один для скорости снижения состояния (например , от 2 до 1, от 1 до 0, и т.д. .).
    Графическое представление асимметричной модели двухпараметрической цепи Маркова с пятью состояниями.

Пример: бинарная модель видообразования и исчезновения [ править ]

Модель видообразования и экстинкции бинарных состояний [49] (BiSSE) представляет собой модель дискретного пространства, которая напрямую не следует рамкам упомянутых выше. Это позволяет оценивать наследственные состояния двоичных символов вместе с коэффициентами диверсификации, связанными с различными состояниями символов; его также можно напрямую расширить до более общей модели с несколькими дискретными состояниями. В своей основной форме эта модель включает шесть параметров: две скорости видообразования (по одной для линий в состояниях 0 и 1); аналогично, два уровня вымирания; и две скорости смены характера. Эта модель позволяет проверять гипотезы о темпах видообразования / исчезновения / изменения характера за счет увеличения количества параметров.

Модели с непрерывным состоянием [ править ]

В случае, когда признак принимает недискретные значения, нужно вместо этого обратиться к модели, в которой признак развивается как некоторый непрерывный процесс. Вывод предковых состояний с помощью максимальной вероятности (или байесовских методов) будет происходить, как указано выше, но с вероятностями переходов в состоянии между соседними узлами, заданными некоторым другим непрерывным распределением вероятностей.

Графики по 200 траекторий каждой из: броуновского движения со сносом и (черные); Орнштейн-Уленбек с и (зеленый); и Орнштейн-Уленбек с и (оранжевый).
  • Броуновское движение : в этом случае, если узлы и являются смежными в филогенезе (скажем, являются предком ) и разделены ветвью длины , вероятность перехода от состояния к состоянию определяется плотностью Гаусса с среднее и дисперсия В этом случае есть только один параметр ( ), и модель предполагает, что признак свободно развивается без предвзятости в сторону увеличения или уменьшения, и что скорость изменения постоянна во всех ветвях филогенетического дерева. [50]
  • Процесс Орнштейна-Уленбека : короче говоря, процесс Орнштейна-Уленбека - это непрерывный случайный процесс, который ведет себя как броуновское движение, но притягивается к некоторому центральному значению, где сила притяжения увеличивается с удалением от этого значения. [51] [52] [53] Это полезно для моделирования сценариев, в которых признак подлежит стабилизирующему отбору около определенного значения (скажем ). Согласно этой модели, описанным выше переход , находясь в состоянии , чтобы быть в состоянии будет иметь определенную вероятность перехода плотность процесса Орнштейна-Уленбек с двумя параметрами: , который описывает дисперсию приводного броуновского движения, и, который описывает силу его притяжения к . Как правило , процесс все меньше и меньше ограничивается своим притяжением, и процесс становится броуновским движением. Из-за этого модели могут быть вложенными, и могут быть выполнены тесты отношения логарифмического правдоподобия, позволяющие определить, какая из двух моделей является подходящей. [50]
  • Стабильные модели непрерывной эволюции характера: [54] хотя броуновское движение привлекательно и поддается рассмотрению в качестве модели непрерывной эволюции, оно не допускает ненейтральность в его основной форме и не предусматривает каких-либо изменений скорости эволюции во времени. . Вместо этого можно использовать стабильный процесс , значения которого в фиксированные моменты времени распределяются как стабильные распределения, чтобы смоделировать эволюцию черт. Устойчивые процессы, грубо говоря, ведут себя как броуновские движения, которые также содержат разрывные скачки. Это позволяет соответствующим образом моделировать сценарии, в которых ожидаются короткие всплески быстрой эволюции признаков. В этой ситуации методы максимального правдоподобия плохо подходят из-за неровной поверхности правдоподобия и из-за того, что правдоподобие может быть произвольно большим, поэтому байесовские методы более подходят. [54]

Приложения [ править ]

Эволюция персонажа [ править ]

Реконструкция предков широко используется для вывода экологических, фенотипических или биогеографических признаков, связанных с предковыми узлами на филогенетическом дереве. У всех методов реконструкции наследственных черт есть подводные камни, поскольку они используют математические модели для прогнозирования того, как черты изменились при большом количестве недостающих данных. Эти недостающие данные включают в себя состояние вымерших видов, относительную скорость эволюционных изменений, знание начальных состояний признаков и точность филогенетических деревьев. Во всех случаях, когда используется реконструкция наследственных признаков, результаты должны быть подтверждены анализом биологических данных, которые подтверждают выводы, основанные на модели. Гриффит О.В. и др. [55]

Реконструкция предков позволяет изучать пути эволюции, адаптивный отбор , экспрессию генов развития [56] [57] и функциональную дивергенцию эволюционного прошлого. Обзор биологических и вычислительных методов реконструкции предков см. В Chang et al. . [58] Критику методов вычисления реконструкции предков см. В Williams PD et al. . [13]

Поведение и эволюция истории жизни [ править ]

У рогатых ящериц (род Phrynosoma ) живорождение (живорождение) эволюционировало несколько раз на основе методов реконструкции предков. [59]

Реконструкция диеты галапагосских вьюрков [ править ]

Имеются как филогенетические, так и характерные данные о радиации зябликов, населяющих Галапагосские острова . Эти данные позволяют проверить гипотезы относительно времени и порядка изменений состояния персонажа во времени посредством реконструкции предкового состояния. Во время засушливого сезона рацион 13 видов галапагосских вьюрков можно разделить на три широкие категории рациона: сначала те, которые потребляют зерновые продукты, считаются « зерноядными », те, которые глотают членистоногих, называются « насекомоядными », а те, которые потребляют растительность классифицируется как « листовидные ». [23]Реконструкция диетического предкового состояния с использованием максимальной экономии восстанавливает 2 основных перехода от состояния насекомоядных: один - к зернистости, а другой - к фоливору. Реконструкция предкового состояния с максимальной вероятностью дает в целом аналогичные результаты с одним существенным отличием: общий предок клад древесных вьюрков ( Camarhynchus ) и наземных вьюрков ( Geospiza ), скорее всего, является зерноядным, а не насекомоядным (судя по бережливости). В этом случае эта разница между предковыми состояниями, возвращаемыми максимальной экономностью и максимальной вероятностью, вероятно, происходит в результате того факта, что оценки ML учитывают длину ветвей филогенетического дерева. [23]

Эволюция морфологических и физиологических признаков [ править ]

Фриносоматидные ящерицы демонстрируют замечательное морфологическое разнообразие, в том числе относительный тип мышечных волокон в мышцах задних конечностей . Реконструкция предков, основанная на скупости изменения квадрата (эквивалент максимальной вероятности при эволюции характера броуновского движения [60] ), указывает на то, что рогатые ящерицы , одна из трех основных субкладов линии передачи, претерпели значительное эволюционное увеличение доли быстроокисляющих гликолитические волокна в их подвздошно-фибулярных мышцах. [61]

Масса тела млекопитающих [ править ]

При анализе массы тела 1679 видов плацентарных млекопитающих, сравнивая стабильные модели непрерывной эволюции характера с моделями броуновского движения , Эллиот и Мурс [54] показали, что эволюционный процесс, описывающий эволюцию массы тела млекопитающих, лучше всего описывается стабильной моделью.непрерывной эволюции характера, которая допускает редкие изменения большой величины. Согласно стабильной модели, предковые млекопитающие сохранили низкую массу тела за счет ранней диверсификации, при этом значительное увеличение массы тела совпало с происхождением нескольких отрядов крупных видов с массой тела (например, копытных). Напротив, моделирование в рамках модели броуновского движения восстановило менее реалистичную, на порядок большую массу тела у предковых млекопитающих, что потребовало значительного уменьшения размера тела до эволюции Орденов, демонстрирующих небольшой размер тела (например, Rodentia ). Таким образом, стабильные модели восстанавливают более реалистичную картину эволюции массы тела млекопитающих, допуская большие преобразования в небольшом подмножестве ветвей. [54]

Коррелированная эволюция персонажей [ править ]

Филогенетические сравнительные методы (выводы, сделанные путем сравнения родственных таксонов) часто используются для выявления биологических характеристик, которые не развиваются независимо, что может выявить лежащую в основе зависимость. Например, эволюция формы клюва зяблика может быть связана с его поведением в поисках пищи. Однако не рекомендуется искать эти ассоциации путем прямого сравнения измерений или генетических последовательностей, потому что эти наблюдения не являются независимыми из-за их происхождения от общих предков. Для дискретных символов эта проблема была сначала решена в рамках максимальной экономии путем оценки того, имеют ли два символа тенденцию к изменению на одних и тех же ветвях дерева. [62] [63] Фельзенштейнопределили эту проблему для непрерывной эволюции характера и предложили решение, подобное реконструкции предков, в котором филогенетическая структура данных была приспособлена статистически, направляя анализ через вычисление «независимых контрастов» между узлами дерева, связанными неперекрывающимися ветвями. [28]

Молекулярная эволюция [ править ]

На молекулярном уровне аминокислотные остатки в разных местах белка могут развиваться независимо, потому что они имеют прямое физико-химическое взаимодействие, или косвенно, за счет их взаимодействий с общим субстратом или через дальнодействующие взаимодействия в структуре белка. Напротив, сложенная структура белка потенциально может быть выведена из распределения взаимодействий остатков. [64] Одно из первых применений предковой реконструкции для предсказания трехмерной структуры белка через контакты остатков было опубликовано Шиндяловым и его коллегами. [65] Филогении, относящиеся к 67 различным семействам белков, были созданы с помощью метода кластеризации на основе расстояний (невзвешенный парно-групповой метод со средним арифметическим , UPGMA), и предковые последовательности были реконструированы методом экономии. Авт. Сообщили о слабой, но значительной тенденции коэволюционирующих пар остатков совмещаться в известной трехмерной структуре белков.

Реконструкция древних белков и последовательностей ДНК только недавно стала важной научной задачей. Развитие обширных баз данных геномных последовательностей в сочетании с достижениями в области биотехнологии и методов филогенетического вывода сделало реконструкцию предков дешевой, быстрой и практичной с научной точки зрения. Эта концепция была применена для идентификации коэволюционирующих остатков в белковых последовательностях с использованием более совершенных методов реконструкции филогении и предковых последовательностей. Например, реконструкция предков использовалась для идентификации совместно эволюционирующих остатков в белках, кодируемых геномами РНК-вирусов, особенно в ВИЧ. [66] [67] [68]

Реконструкция родовых белков и ДНК позволяет воссоздать эволюцию белков и ДНК в лаборатории, чтобы их можно было изучать напрямую. [58] Что касается белков, это позволяет исследовать эволюцию современной молекулярной структуры и функции. Кроме того, реконструкция предкового белка может привести к открытию новых биохимических функций, которые утрачены в современных белках. [69] [70] Это также позволяет понять биологию и экологию вымерших организмов. [71] Хотя большинство реконструкций предков касалось белков, они также использовались для проверки эволюционных механизмов на уровне бактериальных геномов [72]и последовательности генов приматов. [73]

Дизайн вакцины [ править ]

РНК-вирусы, такие как вирус иммунодефицита человека (ВИЧ), развиваются чрезвычайно быстро, на несколько порядков быстрее, чем млекопитающие или птицы. Для этих организмов реконструкцию предков можно применить в гораздо более коротком временном масштабе; например, чтобы реконструировать глобального или регионального предшественника эпидемии , которая длилась десятилетия, а не миллионы лет. Команда вокруг Брайана Гашена предложила [74], чтобы такие реконструированные штаммы использовались в качестве мишеней для вакцины.усилия по разработке, в отличие от последовательностей, изолированных от пациентов в настоящее время. Поскольку ВИЧ чрезвычайно разнообразен, вакцина, разработанная для работы с вирусной популяцией одного пациента, может не работать для другого пациента, потому что эволюционное расстояние между этими двумя вирусами может быть большим. Однако их самый недавний общий предок ближе к каждому из двух вирусов, чем друг к другу. Таким образом, вакцина, разработанная для общего предка, могла иметь больше шансов быть эффективной для большей части циркулирующих штаммов. Другая команда пошла дальше этой идеи, разработав метод реконструкции центра дерева для создания последовательности, общее эволюционное расстояние которой до современных штаммов как можно меньше. [75] Строго говоря, этот метод не был наследственнымреконструкция, поскольку последовательность центра дерева (COT) не обязательно представляет собой последовательность, которая когда-либо существовала в эволюционной истории вируса. Однако Роллан и его коллеги обнаружили, что в случае ВИЧ вирус COT был функциональным при синтезе. Подобные эксперименты с синтетическими предковыми последовательностями, полученными с помощью реконструкции максимального правдоподобия, также показали, что эти предки являются функциональными и иммуногенными, [76] [77]придавая некоторое доверие к этим методам. Кроме того, реконструкция предков может потенциально использоваться для вывода генетической последовательности переданных вариантов ВИЧ, которые привели к возникновению следующей инфекции, с целью определения отличительных характеристик этих вариантов (как неслучайный выбор переданной популяции вирусы), которые могут стать мишенью для разработки вакцины. [78]

Перестройки генома [ править ]

Вместо того, чтобы делать вывод о последовательности ДНК предков, можно интересоваться крупномасштабной молекулярной структурой и содержанием генома предков. К этой проблеме часто подходят в комбинаторной структуре, моделируя геномы как перестановки генов или гомологичных регионов. С этими перестановками разрешены различные операции, такие как инверсия (сегмент перестановки переворачивается на месте), удаление (сегмент удаляется), транспозиция (сегмент удаляется из одной части перестановки и вставляется где-то еще. ), или получение генетического содержимого за счет рекомбинации , дупликации или горизонтального переноса генов.. «Проблема перестройки генома», впервые поставленная Уоттерсоном и его коллегами [17] , ставит вопрос: учитывая два генома (перестановки) и набор допустимых операций, какова кратчайшая последовательность операций, которая преобразует один геном в другой? Обобщением этой проблемы, применимым к реконструкции предков, является «проблема множественной перестройки генома»: [79]учитывая набор геномов и набор допустимых операций, найдите (i) бинарное дерево с заданными геномами в качестве его листьев и (ii) назначение геномов внутренним узлам дерева, так что общее количество операций по всему дереву сведена к минимуму. Этот подход похож на экономию, за исключением того, что дерево выводится вместе с наследственными последовательностями. К сожалению, даже единственная проблема генома перегруппировка NP-трудной , [80] , хотя он получил много внимания в области математики и информатики (обзор см Fertin и его коллеги [81] ).

Реконструкция наследственных геномов также называется реконструкцией кариотипа . Хромосомная роспись в настоящее время является основной экспериментальной техникой. [82] [83] Недавно исследователи разработали вычислительные методы для реконструкции наследственного кариотипа, используя преимущества сравнительной геномики . [84] [85] Кроме того, сравнительная геномика и реконструкция наследственного генома были применены для идентификации древних событий горизонтального переноса генов у последнего общего предка линии (например, Candidatus Accumulibacter phosphatis [86] ) для определения эволюционной основы приобретения признаков.

Пространственные приложения [ править ]

Миграция [ править ]

Реконструкция предков не ограничивается биологическими признаками. Пространственное расположение также является признаком, и методы реконструкции предков позволяют сделать вывод о местонахождении предков рассматриваемых индивидов. Такие методы были использованы Lemey и его коллегами [16] для географического отслеживания предков 192 штаммов птичьего гриппа A-H5N1 , взятых из двадцати мест в Европе и Азии, и 101 последовательности вируса бешенства , взятых из двенадцати африканских стран.

Рассмотрение местоположений как дискретных состояний (страны, города и т. Д.) Позволяет применять модели дискретных состояний, описанные выше. Однако, в отличие от модели, где пространство состояний для признака невелико, мест может быть много, и переходы между определенными парами состояний могут происходить редко или никогда не происходить; например, миграция между удаленными регионами может никогда не произойти напрямую, если воздушное сообщение между этими двумя местами не существует, поэтому такие миграции должны сначала проходить через промежуточные регионы. Это означает, что в модели может быть много параметров, равных нулю или близких к нулю. С этой целью Леми и его коллеги использовали байесовскую процедуру не только для оценки параметров и предковых состояний, но и для выбора того, какие параметры миграции не равны нулю; их работа показывает, что эта процедура действительно приводит к более эффективному использованию данных.Они также исследуют использование предшествующих распределений, которые включают географическую структуру или гипотезы о динамике миграции, обнаруживая, что те, которые они рассматривали, мало повлияли на результаты.

Используя этот анализ, команда Леми обнаружила, что наиболее вероятным центром распространения A-H5N1 является Гуандун , при этом Гонконг также получает дополнительную поддержку. Кроме того, их результаты подтверждают гипотезу о давнем присутствии африканского бешенства в Западной Африке .

Ареалы видов [ править ]

Вывод исторических биогеографических закономерностей часто требует реконструкции ареалов предков видов на филогенетических деревьях. [87] Например, хорошо разрешенная филогения видов растений в роде Cyrtandra [87] была использована вместе с информацией об их географических ареалах для сравнения четырех методов реконструкции предковых ареалов. Команда Fitch сравнила экономичность [20] (FP; экономия) стохастического картирования [88] (SM; максимальная вероятность), анализ дисперсии-викариации [89] (DIVA; экономия) и рассредоточение-вымирание-кладогенез [15] [90 ]. ](DEC; максимальная вероятность). Результаты показали, что оба метода экономии работают плохо, что, вероятно, связано с тем, что методы экономии не учитывают длину ветвей. Оба метода максимального правдоподобия работают лучше; тем не менее, анализ DEC, который дополнительно позволяет включить геологические априорные значения, дал более реалистичные выводы об эволюции ареала в Киртандре по сравнению с другими методами. [87]

Другой метод максимального правдоподобия восстанавливает филогеографическую историю гена [91] путем реконструкции местонахождения предков отобранных таксонов. Этот метод предполагает пространственно явную модель случайного блуждания миграции, чтобы восстановить местонахождение предков с учетом географических координат людей, представленных кончиками филогенетического дерева. Применительно к филогенетическому дереву хористых лягушек Pseudacris feriarum этот метод позволил восстановить недавнюю экспансию на север, более высокое расстояние расселения на поколение в недавно колонизированном регионе, нецентральное предковое местоположение и направленную миграцию. [91]

Филогения 7 региональных штаммов Drosophila pseudoobscura, по мнению Стуртеванта и Добжанского . [92] Отображаемые последовательности не соответствуют исходной статье, но были получены из обозначений в сопроводительной статье авторов [11] следующим образом: A (63A-65B), B (65C-68D), C (69A-70A ), D (70B-70D), E (71A-71B), F (71A-73C), G (74A-74C), H (75A-75C), I (76A-76B), J (76C-77B) , К (78A-79D), L (80A-81D). Сделанные авторами инверсии выделены синим цветом вдоль ветвей.

Первое рассмотрение проблемы множественной перестройки генома задолго до ее формализации в терминах перестановок было представлено Стуртевантом и Добжанским в 1936 году. [92] Они исследовали геномы нескольких штаммов плодовой мухи из разных географических регионов и обнаружили, что одна конфигурация , который они назвали «стандартным», был наиболее распространенным во всех исследуемых областях. Примечательно, что они также заметили, что четыре разных штамма могут быть получены из стандартной последовательности с помощью одной инверсии, а два других могут быть связаны с помощью второй инверсии. Это позволило им выдвинуть гипотезу о филогенезе последовательностей и сделать вывод, что стандартная последовательность, вероятно, также была предковой.

Лингвистическая эволюция [ править ]

Реконструкции слов и явлений древних протоязыков, таких как протоиндоевропейский , были выполнены на основе наблюдаемых аналогов в современных языках. Обычно эти анализы проводят вручную с использованием «сравнительного метода». [93] Во-первых, слова из разных языков с общей этимологией ( родственные слова ) идентифицируются в современных изучаемых языках, аналогично идентификации ортологичных биологических последовательностей. Во-вторых, идентифицируются соответствия между отдельными звуками в родственных связях, что аналогично выравниванию биологической последовательности., хотя выполняется вручную. Наконец, вероятные наследственные звуки предполагаются путем ручного исследования и различных эвристических методов (например, тот факт, что в большинстве языков есть как носовые, так и неназальные гласные ). [93]

Программное обеспечение [ править ]

Доступно множество программных пакетов, которые могут выполнять реконструкцию состояния предков. Как правило, эти программные пакеты были разработаны и поддерживаются усилиями ученых в смежных областях и выпущены под лицензиями свободных программ . Следующая таблица не предназначена для исчерпывающего перечисления всех доступных пакетов, но представляет собой репрезентативную выборку обширного разнообразия пакетов, которые реализуют методы реконструкции предков с различными преимуществами и функциями.

Описания пакетов [ править ]

Молекулярная эволюция [ править ]

Большинство этих программных пакетов предназначены для анализа данных генетической последовательности. Например, PAML [94] представляет собой набор программ для филогенетического анализа ДНК и выравнивания последовательностей белков по максимальной вероятности. Реконструкция предков может быть выполнена с помощью программы codeml . Кроме того, LAZARUS - это набор скриптов Python, которые включают в себя функции реконструкции предков PAML для пакетной обработки и большей простоты использования. [95] Программные пакеты, такие как MEGA , HyPhy и Mesquite, также выполняют филогенетический анализ данных о последовательностях, но они разработаны так, чтобы быть более модульными и настраиваемыми. HyPhy [96]реализует совместный метод максимального правдоподобия реконструкции наследственной последовательности [7], который может быть легко адаптирован для реконструкции более обобщенного диапазона дискретных состояний наследственных символов, таких как географические местоположения, путем указания индивидуализированной модели на языке пакетной обработки. Мескит [97] предоставляет методы реконструкции состояния предков как для дискретных, так и для непрерывных символов, используя как методы максимальной экономии, так и методы максимального правдоподобия. Он также предоставляет несколько инструментов визуализации для интерпретации результатов реконструкции предков. МЕГА [98]также является модульной системой, но в ней больше внимания уделяется простоте использования, чем настройке анализов. Начиная с версии 5, MEGA позволяет пользователю реконструировать родовые состояния, используя методы максимальной экономии, максимального правдоподобия и эмпирические байесовские методы. [98]

Байесовский анализ генетических последовательностей может придать большую надежность ошибочной спецификации модели. MrBayes [99] позволяет делать выводы о предковых состояниях в предковых узлах, используя полный иерархический байесовский подход. Программа PREQUEL, распространяемая в пакете PHAST [100], выполняет сравнительную эволюционную геномику с использованием реконструкции предковой последовательности. SIMMAP [101] стохастически отображает мутации по филогенезам. BayesTraits [31] анализирует дискретные или непрерывные признаки в байесовской структуре, чтобы оценить модели эволюции, реконструировать наследственные состояния и обнаружить коррелированную эволюцию между парами признаков.

Другие типы персонажей [ править ]

Другие программные пакеты больше ориентированы на анализ качественных и количественных признаков ( фенотипов ). Например, пакет ape [102] в среде статистических вычислений R также предоставляет методы для реконструкции предкового состояния как для дискретных, так и для непрерывных символов с помощью функции « ace », включая максимальное правдоподобие. Phyrex реализует алгоритм на основе максимальной экономии для восстановления профилей экспрессии предковых генов в дополнение к методу максимального правдоподобия для восстановления наследственных генетических последовательностей (путем обертывания функции baseml в PAML). [103]

Некоторые программные пакеты также восстанавливают филогеографию . BEAST (Байесовский эволюционный анализ по деревьям выборки) [104] предоставляет инструменты для реконструкции географических местоположений предков из наблюдаемых последовательностей, аннотированных данными местоположения, с использованием методов байесовской выборки MCMC . Diversitree [105] представляет собой пакет R, предоставляющий методы для реконструкции наследственного состояния в рамках Mk2 ( марковская модель непрерывного времени эволюции двоичных символов). [106] и модели BiSSE (Binary State Specification and Extinction). Лагранж проводит анализ реконструкции эволюции географического ареала на филогенетических деревьях. [15] Phylomapper [91]представляет собой статистическую основу для оценки исторических закономерностей потока генов и географических местонахождений предков. RASP [107] выводит наследственные состояния, используя статистический анализ дисперсии-викариантности, методы Лагранжа, Байеса-Лагранжа, BayArea и BBM. VIP [108] делает выводы об исторической биогеографии, исследуя разрозненные географические распределения.

Перестройки генома предоставляют ценную информацию в сравнительной геномике между видами. ANGES [109] сравнивает существующие родственные геномы посредством наследственной реконструкции генетических маркеров. BADGER [110] использует байесовский подход к изучению истории перестройки генов. Count [111] реконструирует эволюцию размера семейств генов. EREM [112] анализирует усиление и утрату генетических особенностей, кодируемых двоичными символами. PARANA [113] делает вывод о наследственных биологических сетях, которые представляют потерю и дупликацию генов, на основе экономичности .

Веб-приложения [ править ]

Наконец, существует несколько приложений на основе веб-сервера, которые позволяют исследователям использовать методы максимального правдоподобия для реконструкции предков различных типов персонажей без установки какого-либо программного обеспечения. Например, Ancestors [114] представляет собой веб-сервер для реконструкции генома предков путем идентификации и расположения синтенных областей. FastML [115] - это веб-сервер для вероятностной реконструкции наследственных последовательностей по максимальному правдоподобию, который использует модель символа пробела для восстановления изменяемой вариации. MLGO [116] - это веб-сервер для анализа порядка генов максимального правдоподобия.

Будущие направления [ править ]

Разработка и применение вычислительных алгоритмов для реконструкции предков продолжает оставаться активной областью исследований в различных дисциплинах. Например, реконструкция вставок и удалений последовательностей (инделек) отставала от более простого применения моделей замен. Бушар-Коте и Джордан недавно описали новую модель (процесс Пуассона-Инделя) [117], которая представляет собой важный шаг вперед по сравнению с архетипической моделью индель-эволюции Торна-Кишино-Фельзенштейна. [118] Кроме того, эта область развивается благодаря быстрому прогрессу в области секвенирования следующего поколения.технология, в которой последовательности генерируются из миллионов матриц нуклеиновых кислот путем обширного распараллеливания реакций секвенирования в специализированном устройстве. Эти достижения позволили создать «глубокий» снимок генетического состава быстро развивающейся популяции, такой как РНК-вирусы [119] или опухолевые клетки [120], за относительно короткий промежуток времени. В то же время огромное количество данных и профилей ошибок секвенирования для конкретных платформ создали новые биоинформатические проблемы для обработки этих данных для реконструкции предковой последовательности.

См. Также [ править ]

  • Эволюционная биология
  • Происхождение жизни
  • Ферментная распущенность

Ссылки [ править ]

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 ( 2015 ) ( отчеты рецензента ): «Ancestral Reconstruction» . PLOS Вычислительная биология . 12 (7): e1004763. 12 июля 2016 г. doi : 10.1371 / JOURNAL.PCBI.1004763 . ISSN  1553-734X . PMC  4942178 . PMID  27404731 . Викиданные  Q28596371 .

  1. ^ a b Омланд, Кевин Э. (1999). «Предположения и проблемы реконструкции родового государства» . Систематическая биология . 48 (3): 604–611. DOI : 10.1080 / 106351599260175 . ISSN 1063-5157 . 
  2. ^ Цай, Вэй; Пей, Чимин; Гришин, Ник V (2004). «Реконструкция предковых белковых последовательностей и ее применения» . BMC Evolutionary Biology . 4 (1): 33. DOI : 10.1186 / 1471-2148-4-33 . ISSN 1471-2148 . PMC 522809 . PMID 15377393 .   
  3. ^ Платник, Норман I .; Кэмерон, Х. Дон (1977). «Кладистические методы текстового, лингвистического и филогенетического анализа». Систематическая зоология . 26 (4): 380. DOI : 10,2307 / 2412794 . ISSN 0039-7989 . JSTOR 2412794 .  
  4. ^ Бентли, Р. Александр; Тегерани, Джамшид Дж. (2013). «Филогения Красной Шапочки» . PLOS ONE . 8 (11): e78871. Bibcode : 2013PLoSO ... 878871T . DOI : 10.1371 / journal.pone.0078871 . ISSN 1932-6203 . PMC 3827309 . PMID 24236061 .   
  5. ^ Михалак, Павел; Уокер, Роберт С .; Hill, Kim R .; Флинн, Марк V .; Эллсуорт, Райан М. (2011). "Эволюционная история практики брака охотников-собирателей" . PLOS ONE . 6 (4): e19066. Bibcode : 2011PLoSO ... 619066W . DOI : 10.1371 / journal.pone.0019066 . ISSN 1932-6203 . PMC 3083418 . PMID 21556360 .   
  6. Перейти ↑ Brooks, Daniel R (1999). «Филогении и сравнительный метод поведения животных, под редакцией Эмиджи П. Мартинс, Oxford University Press, 1996. X + 415 стр.». Поведенческие процессы . 47 (2): 135–136. DOI : 10.1016 / S0376-6357 (99) 00038-8 . ISBN 978-0-19-509210-3. ISSN  0376-6357 . PMID  24896936 . S2CID  9872907 .
  7. ^ a b c Пупко, Т .; Pe, I .; Шамир, Р .; Граур, Д. (2000). «Быстрый алгоритм совместной реконструкции аминокислотных последовательностей предков». Молекулярная биология и эволюция . 17 (6): 890–896. DOI : 10.1093 / oxfordjournals.molbev.a026369 . ISSN 0737-4038 . PMID 10833195 .  
  8. ^ a b c Пейджел, Марк; Мид, Эндрю; Баркер, Дэниел (2004). "Байесовская оценка состояний предков по филогении" . Систематическая биология . 53 (5): 673–684. DOI : 10.1080 / 10635150490522232 . ISSN 1063-5157 . PMID 15545248 .  
  9. ^ Sanger, F .; Томпсон, EOP; Китаи, Рут (1955). «Амидные группы инсулина» . Биохимический журнал . 59 (3): 509–518. DOI : 10.1042 / bj0590509 . ISSN 0264-6021 . PMC 1216278 . PMID 14363129 .   
  10. ^ Полинг, Линус; Цукеркандль, Эмиль; Хенриксен, Тормод; Левстад, Рольф (1963). "Химическая палеогенетика. Молекулярные" исследования восстановления "вымерших форм жизни" . Acta Chemica Scandinavica . 17 прилож .: 9–16. DOI : 10.3891 / acta.chem.scand.17s-0009 . ISSN 0904-213X . 
  11. ^ а б Добжанский, Феодосий; Стертевант, Альфред (1938). «Инверсии хромосом Drosophila pseudoobscura» . Генетика . 23 (1): 28–64. PMC 1209001 . PMID 17246876 .  
  12. ^ Хармс, Майкл Дж; Торнтон, Джозеф В. (2010). «Анализ структуры и функции белков с использованием реконструкции предковых генов» . Текущее мнение в структурной биологии . 20 (3): 360–366. DOI : 10.1016 / j.sbi.2010.03.005 . ISSN 0959-440X . PMC 2916957 . PMID 20413295 .   
  13. ^ a b c d Уильямс, Пол Д .; Поллок, Дэвид Д.; Блэкберн, Бенджамин П .; Гольдштейн, Ричард А. (2006). «Оценка точности методов реконструкции белков предков» . PLOS Вычислительная биология . 2 (6): e69. Bibcode : 2006PLSCB ... 2 ... 69W . DOI : 10.1371 / journal.pcbi.0020069 . ISSN 1553-734X . PMC 1480538 . PMID 16789817 .   
  14. ^ Ronquist, F (2004). «Байесовский вывод эволюции характера». Тенденции в экологии и эволюции . 19 (9): 475–481. DOI : 10.1016 / j.tree.2004.07.002 . ISSN 0169-5347 . PMID 16701310 .  
  15. ^ a b c Ри, RH; Смит, С.А. (2008). "Вывод максимальной правдоподобности эволюции географического ареала путем рассредоточения, местного вымирания и кладогенеза" . Систематическая биология . 57 (1): 4–14. DOI : 10.1080 / 10635150701883881 . ISSN 1063-5157 . PMID 18253896 .  
  16. ^ a b Фрейзер, Кристоф; Лемей, Филипп; Рамбаут, Андрей; Драммонд, Алексей Дж .; Сушард, Марк А. (2009). «Байесовская филогеография находит свои корни» . PLOS Вычислительная биология . 5 (9): e1000520. Bibcode : 2009PLSCB ... 5E0520L . DOI : 10.1371 / journal.pcbi.1000520 . ISSN 1553-7358 . PMC 2740835 . PMID 19779555 .   
  17. ^ a b Уоттерсон, Джорджия; Юэнс, WJ; Холл, TE; Морган, А. (1982). «Проблема инверсии хромосом». Журнал теоретической биологии . 99 (1): 1–7. DOI : 10.1016 / 0022-5193 (82) 90384-8 . ISSN 0022-5193 . 
  18. ^ Таффли, Крис; Сталь, Майк (1997). «Связи между максимальной вероятностью и максимальной экономией при простой модели подмены сайта». Вестник математической биологии . 59 (3): 581–607. DOI : 10.1007 / BF02459467 . ISSN 0092-8240 . PMID 9172826 . S2CID 189885872 .   
  19. ^ Swofford, Дэвид L .; Мэддисон, Уэйн П. (1987). «Реконструкция наследственных состояний характера при экономичности Вагнера». Математические биологические науки . 87 (2): 199–229. DOI : 10.1016 / 0025-5564 (87) 90074-5 . ISSN 0025-5564 . 
  20. ^ a b Fitch, Уолтер М. (1971). «На пути к определению хода эволюции: минимальные изменения для конкретной топологии дерева». Систематическая зоология . 20 (4): 406–416. DOI : 10.2307 / 2412116 . ISSN 0039-7989 . JSTOR 2412116 .  
  21. ^ Stamatakis, A. (2006). «RAxML-VI-HPC: филогенетический анализ на основе максимального правдоподобия с тысячами таксонов и смешанных моделей» (PDF) . Биоинформатика . 22 (21): 2688–2690. DOI : 10.1093 / биоинформатики / btl446 . ISSN 1367-4803 . PMID 16928733 .   
  22. ^ Санкофф, Дэвид (1975). «Деревья минимальных мутаций последовательностей». Журнал СИАМ по прикладной математике . 28 (1): 35–42. CiteSeerX 10.1.1.665.9596 . DOI : 10.1137 / 0128004 . ISSN 0036-1399 .  
  23. ^ a b c d e Шлютер, Дольф; Прайс, Тревор; Mooers, Arne O .; Людвиг, Дональд (1997). «Вероятность предковых состояний в адаптивной радиации». Эволюция . 51 (6): 1699–1711. DOI : 10.2307 / 2410994 . ISSN 0014-3820 . JSTOR 2410994 . PMID 28565128 .   
  24. ^ Фельзенштейн, Джозеф (1973). «Методы максимального правдоподобия и минимальных шагов для оценки эволюционных деревьев по данным о дискретных символах». Систематическая зоология . 22 (3): 240–249. DOI : 10.2307 / 2412304 . ISSN 0039-7989 . JSTOR 2412304 .  
  25. ^ a b c Cunningham, Clifford W .; Омланд, Кевин Э .; Окли, Тодд Х. (1998). «Реконструкция наследственных состояний характера: критическая переоценка». Тенденции в экологии и эволюции . 13 (9): 361–366. DOI : 10.1016 / S0169-5347 (98) 01382-2 . ISSN 0169-5347 . PMID 21238344 .  
  26. Перейти ↑ Schluter, Arne O. Mooers, Dolph (1999). «Реконструкция состояний предков с максимальной вероятностью: поддержка одно- и двухскоростных моделей». Систематическая биология . 48 (3): 623–633. CiteSeerX 10.1.1.594.175 . DOI : 10.1080 / 106351599260193 . ISSN 1063-5157 .  
  27. ^ Ли, Гуолян; Сталь, Майк; Чжан, Лусинь (2008). «Больше таксонов не обязательно лучше для реконструкции состояний предков». Систематическая биология . 57 (4): 647–653. arXiv : 0803.0195 . DOI : 10.1080 / 10635150802203898 . ISSN 1063-5157 . PMID 18709600 . S2CID 1373201 .   
  28. ^ a b Фельзенштейн, Джозеф (1985). «Филогении и сравнительный метод». Американский натуралист . 125 (1): 1–15. DOI : 10.1086 / 284325 . ISSN 0003-0147 . S2CID 9731499 .  
  29. ^ а б в г Ян, Цзихэн; Кумар, Судхир; Неи, Масатоши (1995). «Новый метод вывода наследственных нуклеотидных и аминокислотных последовательностей» . Генетика . 141 (4): 1641–50. PMC 1206894 . PMID 8601501 .  
  30. ^ Коши, Джеффри М .; Гольдштейн, Ричард А. (1996). «Вероятностная реконструкция предковых белковых последовательностей». Журнал молекулярной эволюции . 42 (2): 313–320. Bibcode : 1996JMolE..42..313K . CiteSeerX 10.1.1.1031.2646 . DOI : 10.1007 / BF02198858 . ISSN 0022-2844 . PMID 8919883 . S2CID 15997589 .    
  31. ^ a b Пейджел, Марк (1999). "Подход максимального правдоподобия к восстановлению предковых состояний характера дискретных персонажей на филогении" . Систематическая биология . 48 (3): 612–622. DOI : 10.1080 / 106351599260184 . ISSN 1063-5157 . 
  32. ^ Гуиндон, Стефан; Гаскуэль, Оливье (2003). «Простой, быстрый и точный алгоритм для оценки больших филогений по максимальному правдоподобию» . Систематическая биология . 52 (5): 696–704. DOI : 10.1080 / 10635150390235520 . ISSN 1063-5157 . PMID 14530136 .  
  33. ^ Doornik, Юрген А .; Оомс, Мариус (2003). «Вычислительные аспекты оценки максимального правдоподобия авторегрессионных частично интегрированных моделей скользящего среднего» . Вычислительная статистика и анализ данных . 42 (3): 333–348. DOI : 10.1016 / S0167-9473 (02) 00212-8 . ISSN 0167-9473 . 
  34. ^ a b Фельзенштейн, Джозеф (1981). «Эволюционные деревья из последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Bibcode : 1981JMolE..17..368F . DOI : 10.1007 / BF01734359 . ISSN 0022-2844 . PMID 7288891 . S2CID 8024924 .   
  35. ^ Эйр-Уокер, Адам (1998). «Проблемы экономии в последовательностях необъективного базового состава». Журнал молекулярной эволюции . 47 (6): 686–690. Bibcode : 1998JMolE..47..686E . DOI : 10.1007 / PL00006427 . ISSN 0022-2844 . PMID 9847410 . S2CID 26128712 .   
  36. ^ Пупко, Т .; Pe'er, I .; Hasegawa, M .; Graur, D .; Фридман, Н. (2002). «Алгоритм ветвления и привязки для вывода наследственных аминокислотных последовательностей, когда скорость замены варьируется между сайтами: приложение к эволюции пяти семейств генов» . Биоинформатика . 18 (8): 1116–1123. DOI : 10.1093 / биоинформатики / 18.8.1116 . ISSN 1367-4803 . PMID 12176835 .  
  37. ^ Gruenheit, N .; Локхарт, П.Дж.; Сталь, М .; Мартин, В. (2008). «Трудности в тестировании коварионоподобных свойств последовательностей при смешивающем влиянии изменения пропорций переменных сайтов» (PDF) . Молекулярная биология и эволюция . 25 (7): 1512–1520. DOI : 10.1093 / molbev / msn098 . ISSN 0737-4038 . PMID 18424773 .   
  38. ^ Huelsenbeck, JP; Ронквист, Ф. (2001). "MRBAYES: Байесовский вывод филогенетических деревьев" . Биоинформатика . 17 (8): 754–755. DOI : 10.1093 / биоинформатики / 17.8.754 . ISSN 1367-4803 . PMID 11524383 .  
  39. ^ Ян, Ziheng (1997). «PAML: программный комплекс для филогенетического анализа максимального правдоподобия» . Биоинформатика . 13 (5): 555–556. DOI : 10.1093 / биоинформатики / 13.5.555 . ISSN 1367-4803 . PMID 9367129 .  
  40. ^ a b Huelsenbeck, Джон П .; Боллбэк, Джонатан П. (2001). «Эмпирическая и иерархическая байесовская оценка родовых состояний». Систематическая биология . 50 (3): 351–366. CiteSeerX 10.1.1.319.4271 . DOI : 10.1080 / 106351501300317978 . ISSN 1076-836X . PMID 12116580 .   
  41. ^ Лутцони, Франсуа; Пагель, Марк; Риб, Валери (2001). «Основные грибковые линии происходят от симбиотических предков лишайников». Природа . 411 (6840): 937–940. Bibcode : 2001Natur.411..937L . DOI : 10.1038 / 35082053 . ISSN 0028-0836 . PMID 11418855 . S2CID 4414913 .   
  42. ^ Hanson-Smith, V .; Kolaczkowski, B .; Торнтон, Дж. В. (2010). «Устойчивость реконструкции наследственной последовательности к филогенетической неопределенности» . Молекулярная биология и эволюция . 27 (9): 1988–1999. DOI : 10.1093 / molbev / msq081 . ISSN 0737-4038 . PMC 2922618 . PMID 20368266 .   
  43. ^ Hillis, D .; Bull, J .; Белый, М .; Badgett, M ​​.; Molineux, I. (1992). «Экспериментальная филогенетика: порождение известной филогении». Наука . 255 (5044): 589–592. Bibcode : 1992Sci ... 255..589H . DOI : 10.1126 / science.1736360 . ISSN 0036-8075 . PMID 1736360 .  
  44. ^ Окли, Тодд Х .; Каннингем, Клиффорд В. (2000). «Независимые контрасты успешны там, где реконструкция предка терпит неудачу в известной филогении бактериофага». Эволюция . 54 (2): 397–405. DOI : 10.1554 / 0014-3820 (2000) 054 [0397: ICSWAR] 2.0.CO; 2 . ISSN 0014-3820 . PMID 10937216 .  
  45. ^ Finarelli, Джон А .; Флинн, Джон Дж. (2006). «Реконструкция состояния предков размеров тела у Caniformia (Carnivora, Mammalia): влияние включения данных из летописи окаменелостей». Систематическая биология . 55 (2): 301–313. DOI : 10.1080 / 10635150500541698 . ISSN 1063-5157 . PMID 16611601 .  
  46. ^ Альберт, Джеймс С .; Джонсон, Дерек М .; Knouft, Джейсон Х. (2009). «Окаменелости позволяют лучше оценить размер тела предков, чем существующие таксоны рыб». Acta Zoologica . 90 : 357–384. DOI : 10.1111 / j.1463-6395.2008.00364.x . ISSN 0001-7272 . 
  47. ^ Слейтер, Грэм Дж .; Хармон, Люк Дж .; Альфаро, Майкл Э. (2012). «Объединение окаменелостей с молекулярной филогенезом улучшает вывод об эволюции признака» . Эволюция . 66 (12): 3931–3944. DOI : 10.1111 / j.1558-5646.2012.01723.x . ISSN 0014-3820 . PMID 23206147 . S2CID 24390146 .   
  48. ^ Вебстер, AJ; Первис, А. (2002). «Проверка точности методов восстановления наследственных состояний непрерывных персонажей» . Труды Королевского общества B: биологические науки . 269 (1487): 143–149. DOI : 10.1098 / rspb.2001.1873 . ISSN 0962-8452 . PMC 1690869 . PMID 11798429 .   
  49. ^ Мэддисон, Уэйн; Мидфорд, Питер; Отто, Сара (2007). «Оценка влияния двоичного символа на видообразование и исчезновение» . Систематическая биология . 56 (5): 701–710. DOI : 10.1080 / 10635150701607033 . ISSN 1063-5157 . PMID 17849325 .  
  50. ^ a b Мартинс, Эмилия П. (1994). « ' Оценка скорости фенотипической эволюции по сравнительным данным». Американский натуралист . 144 (2): 193–209. DOI : 10.1086 / 285670 . S2CID 85300707 . 
  51. ^ Фельзенштейн, J (1988). «Филогении и количественные признаки». Ежегодный обзор экологии и систематики . 19 : 445–471. DOI : 10.1146 / annurev.ecolsys.19.1.445 .
  52. ^ Гарланд, Т. младший; Дикерман, AW; Янис, CM; Джонс, Дж. А. (1993). «Филогенетический анализ ковариации с помощью компьютерного моделирования». Систематическая биология . 42 (3): 265–292. DOI : 10.1093 / sysbio / 42.3.265 .
  53. ^ Купер, Н., Г. Х. Томас, К. Вендитти, А. Мид и Р. П. Фреклтон. 2015. Предупреждение об использовании моделей Орнштейна Уленбека в макроэволюционных исследованиях. Биологический журнал Линнеевского общества.
  54. ^ а б в г Эллиот, Майкл Дж; Муерс, Арне Ø (2014). «Вывод наследственных состояний без принятия нейтралитета или градуализма с использованием стабильной модели непрерывной эволюции характера» . BMC Evolutionary Biology . 14 (1): 226. DOI : 10,1186 / s12862-014-0226-8 . ISSN 1471-2148 . PMC 4266906 . PMID 25427971 .   
  55. ^ Гриффит, Оливер В .; Блэкберн, Дэниел Дж .; Брэндли, Мэтью С .; Ван Дайк, Джеймс У .; Уиттингтон, Камилла М .; Томпсон, Майкл Б. (2015). «Реконструкции состояния предков требуют биологических доказательств для проверки эволюционных гипотез: тематическое исследование, изучающее эволюцию репродуктивного режима у чешуекрылых рептилий». Журнал экспериментальной зоологии, часть B: Молекулярная эволюция и эволюция развития . 324 (6): 493–503. DOI : 10.1002 / jez.b.22614 . ISSN 1552-5007 . PMID 25732809 .  
  56. ^ Erkenbrack, EM; Ako-Asare, K .; Miller, E .; Текеленбург, С .; Томпсон, младший; Романо, Л. (2016). «Реконструкция предкового состояния путем сравнительного анализа ядра GRN, действующего у иглокожих». Гены развития и эволюция . 226 (1): 37–45. DOI : 10.1007 / s00427-015-0527-у . ISSN 0949-944X . PMID 26781941 . S2CID 6067524 .   
  57. ^ Erkenbrack, EM; Томпсон, младший (2019). «Филогенетика клеточного типа информирует об эволюционном происхождении личинок иглокожих скелетогенных клеток» . Биология коммуникации . 2 : 160. DOI : 10.1038 / s42003-019-0417-3 . ISSN 2399-3642 . PMC 6499829 . PMID 31069269 .   
  58. ^ а б Чанг, Белинда SW; Ugalde, Juan A .; Мац, Михаил В. (2005). «Приложения реконструкции предкового белка в понимании функции белка: GFP-подобные белки» . Методы в энзимологии . 395 : 652–670 . DOI : 10.1016 / S0076-6879 (05) 95034-9 . ISBN 9780121828004. ISSN  0076-6879 . PMID  15865989 .
  59. ^ Ходжес, WL (2004). «Эволюция живородства у рогатых ящериц ( Phrynosoma ): проверка гипотезы холодного климата» . Журнал эволюционной биологии . 17 (6): 1230–1237. DOI : 10.1111 / j.1420-9101.2004.00770.x . PMID 15525408 . S2CID 25069395 .  
  60. ^ Мэддисон, WP (1991). «Квадрат-изменение экономичных реконструкций предковых состояний для непрерывных знаков на филогенетическом дереве». Систематическая биология . 40 (3): 304–314. DOI : 10.1093 / sysbio / 40.3.304 .
  61. ^ Бонин, KE (2005). «Вариации мышечных волокон у ящериц (Squamata) и филогенетическая реконструкция предполагаемых предковых состояний» . Журнал экспериментальной биологии . 208 (23): 4529–4547. DOI : 10,1242 / jeb.01903 . PMID 16339872 . 
  62. ^ Ридли, Марк (1983). Объяснение органического разнообразия: сравнительный метод и приспособления для спаривания . Оксфорд: Clarendon Press.
  63. ^ Мэддисон, Уэйн П. (1990). «Метод проверки коррелированной эволюции двух бинарных символов: прибыль или убыток сосредоточены на определенных ветвях филогенетического дерева?». Эволюция . 44 (3): 539–557. DOI : 10.2307 / 2409434 . ISSN 0014-3820 . JSTOR 2409434 . PMID 28567979 .   
  64. ^ Гебель, Ульрике; Сандер, Крис; Шнайдер, Рейнхард; Валенсия, Альфонсо (1994). «Коррелированные мутации и контакты остатков в белках». Белки: структура, функции и генетика . 18 (4): 309–317. DOI : 10.1002 / prot.340180402 . ISSN 0887-3585 . PMID 8208723 . S2CID 14978727 .   
  65. ^ Шиндялов И.Н.; Колчанов Н.А.; Сандер, К. (1994). «Можно ли предсказать трехмерные контакты в белковых структурах с помощью анализа коррелированных мутаций?». Белковая инженерия, дизайн и селекция . 7 (3): 349–358. DOI : 10,1093 / белок / 7.3.349 . ISSN 1741-0126 . PMID 8177884 .  
  66. ^ Корбер, БТ; Фарбер, РМ; Wolpert, DH; Лаапедес, А.С. (1993). «Ковариация мутаций в петле V3 белка оболочки вируса иммунодефицита человека типа 1: теоретико-информационный анализ» . Труды Национальной академии наук . 90 (15): 7176–7180. Bibcode : 1993PNAS ... 90.7176K . DOI : 10.1073 / pnas.90.15.7176 . ISSN 0027-8424 . PMC 47099 . PMID 8346232 .   
  67. ^ Шапиро, Б. (2006). «Филогенетический метод обнаружения положительного эпистаза в генных последовательностях и его применение к эволюции РНК-вируса» . Молекулярная биология и эволюция . 23 (9): 1724–1730. DOI : 10.1093 / molbev / msl037 . ISSN 0737-4038 . PMID 16774976 .  
  68. ^ Пун, Искусство FY; Льюис, Фрейзер I .; Пруд, С. Л. Косаковский; Мороз, Саймон DW (2007). «Модель эволюционной сети выявляет стратифицированные взаимодействия в петле V3 оболочки ВИЧ-1» . PLOS Вычислительная биология . 3 (11): e231. Bibcode : 2007PLSCB ... 3..231P . DOI : 10.1371 / journal.pcbi.0030231 . ISSN 1553-734X . PMC 2082504 . PMID 18039027 .   
  69. ^ Джерманн, Томас М .; Opitz, Jochen G .; Стакхаус, Джозеф; Беннер, Стивен А. (1995). «Реконструкция эволюционной истории надсемейства парнокопытных рибонуклеаз». Природа . 374 (6517): 57–59. Bibcode : 1995Natur.374 ... 57J . DOI : 10.1038 / 374057a0 . ISSN 0028-0836 . PMID 7532788 . S2CID 4315312 .   
  70. ^ Садки, М .; de Alba, E .; Perez-Jimenez, R .; Санчес-Руис, JM; Муньос, В. (2009). «Разработанный белок как экспериментальная модель первичного сворачивания» . Труды Национальной академии наук . 106 (11): 4127–4132. Bibcode : 2009PNAS..106.4127S . DOI : 10.1073 / pnas.0812108106 . ISSN 0027-8424 . PMC 2647338 . PMID 19240216 .   
  71. ^ Чанг, BSW; Jonsson, K .; Казми, Массачусетс; Донохью, MJ; Сакмар, Т.П. (2002). «Воссоздание функционального визуального пигмента архозавра предков». Молекулярная биология и эволюция . 19 (9): 1483–1489. DOI : 10.1093 / oxfordjournals.molbev.a004211 . ISSN 0737-4038 . PMID 12200476 .  
  72. ^ Чжан, C .; Чжан, М .; Ju, J .; Nietfeldt, J .; Wise, J .; Терри, PM; Олсон, М .; Качман С.Д .; Wiedmann, M .; Самадпур, М .; Бенсон, АК (2003). «Диверсификация генома в филогенетических линиях I и II Listeria monocytogenes: идентификация сегментов, уникальных для популяций линии II» . Журнал бактериологии . 185 (18): 5573–5584. DOI : 10.1128 / JB.185.18.5573-5584.2003 . ISSN 0021-9193 . PMC 193770 . PMID 12949110 .   
  73. Перейти ↑ Krishnan, NM (2004). «Реконструкция предковой последовательности в митохондриальной ДНК приматов: смещение состава и влияние на функциональный вывод» . Молекулярная биология и эволюция . 21 (10): 1871–1883. DOI : 10.1093 / molbev / msh198 . ISSN 0737-4038 . PMID 15229290 .  
  74. ^ Гашен, Б. (2002). «Разнообразие соображений при выборе вакцины против ВИЧ-1». Наука . 296 (5577): 2354–2360. Bibcode : 2002Sci ... 296.2354G . DOI : 10.1126 / science.1070441 . ISSN 0036-8075 . PMID 12089434 . S2CID 39452987 .   
  75. ^ Rolland, M .; Дженсен, Массачусетс; Никль, округ Колумбия; Ян, Дж .; Узнай, GH; Heath, L .; Weiner, D .; Маллинз, JI (2007). «Реконструкция и функция древних белков вируса иммунодефицита человека типа 1» . Журнал вирусологии . 81 (16): 8507–8514. DOI : 10,1128 / JVI.02683-06 . ISSN 0022-538X . PMC 1951385 . PMID 17537854 .   
  76. ^ Кот, Дениз Л .; Ли, Иньин; Декер, Джули М .; Bibollet-Ruche, Фредерик; Zammit, Kenneth P .; Салазар, Мария Г .; Чен, Ялу; Вен, Чжипин; Уивер, Эрик А .; Гао, Фэн; Haynes, Barton F .; Шоу, Джордж М .; Корбер, Бетт ТМ; Хан, Беатрис Х. (2006). «Предковые и консенсусные иммуногены оболочки для ВИЧ-1 подтипа C» . Вирусология . 352 (2): 438–449. DOI : 10.1016 / j.virol.2006.05.011 . ISSN 0042-6822 . PMID 16780913 .  
  77. ^ Mullins, JI; Хейгвуд, Нидерланды ; Barnett, SW; Монтефиори, Д .; Эдмонсон, П.Ф .; McLaughlin, S .; Hensel, MT; Mahalanabis, M .; Ли, Ф. (1 сентября 2005 г.). «Белок предковой оболочки вируса иммунодефицита человека типа 1, подтипа B, является функциональным и вызывает нейтрализующие антитела у кроликов, аналогичные тем, которые вызываются циркулирующей оболочкой подтипа B» . Журнал вирусологии . 79 (17): 11214–11224. DOI : 10,1128 / JVI.79.17.11214-11224.2005 . ISSN 0022-538X . PMC 1193599 . PMID 16103173 .   
  78. ^ Макклоски, RM; Лян, Р.Х .; Харриган, PR; Brumme, ZL; Пун, AFY (2014). «Оценка филогенетических методов реконструкции переданных вариантов ВИЧ с использованием данных продольной клональной последовательности ВИЧ» . Журнал вирусологии . 88 (11): 6181–6194. DOI : 10,1128 / JVI.00483-14 . ISSN 0022-538X . PMC 4093844 . PMID 24648453 .   
  79. ^ Borque, Гийом; Певзнер, Павел А. (2012). «Эволюция в масштабе генома: реконструкция порядков генов у предков» . Геномные исследования . 12 (1): 26–36. PMC 155248 . PMID 11779828 .  
  80. ^ Даже, S; Goldreich, O (1981). «Задача последовательности генератора минимальной длины является NP-сложной». Журнал алгоритмов . 2 (3): 311–313. DOI : 10.1016 / 0196-6774 (81) 90029-8 . ISSN 0196-6774 . 
  81. ^ Фертин, Гийом; Лабарр, Энтони; Русу, Ирена; Танье, Эрик; Виалетт, Стефан (2009). Комбинаторика перестроек генома . MIT Press. DOI : 10.7551 / mitpress / 9780262062824.001.0001 . ISBN 9780262258753.
  82. ^ Винберг, Йоханнес (2004). «Эволюция человеческих хромосом». Текущее мнение в области генетики и развития . 14 (6): 657–666. DOI : 10.1016 / j.gde.2004.10.001 . ISSN 0959-437X . PMID 15531161 .  
  83. ^ Froenicke, Lutz; Гарсиа Кальдес, Монтсеррат; Графодацкий Александр; Мюллер, Стефан; Лайонс, Лесли; Робинсон, Теренс; Воллет, Марианна; Ян, Фэнтан; Винберг, Йоханнес (2006). «Предлагают ли молекулярная цитогенетика и биоинформатика расходящиеся модели геномов предковых млекопитающих?» . Геномные исследования . 16 (3): 306–310. DOI : 10.1101 / gr.3955206 . ISSN 1088-9051 . PMC 1415215 . PMID 16510895 .   
  84. ^ Мерфи, WJ (2005). «Динамика эволюции хромосом млекопитающих по данным сравнительных карт разных видов». Наука . 309 (5734): 613–617. Bibcode : 2005Sci ... 309..613M . DOI : 10.1126 / science.1111387 . ISSN 0036-8075 . PMID 16040707 . S2CID 32314883 .   
  85. ^ Ma, J .; Zhang, L .; Suh, BB; Рэйни, Б.Дж.; Burhans, RC; Кент, WJ; Blanchette, M .; Haussler, D .; Миллер, В. (2006). «Реконструкция смежных областей наследственного генома» . Геномные исследования . 16 (12): 1557–1565. DOI : 10.1101 / gr.5383506 . ISSN 1088-9051 . PMC 1665639 . PMID 16983148 .   
  86. ^ Oyserman, Бен О .; Мойя, Франсиско; Лоусон, Кристофер Э .; Гарсия, Антонио Л .; Фогт, Марк; Хеффернен, Митчелл; Noguera, Daniel R .; МакМахон, Кэтрин Д. (29 апреля 2016 г.). «Реконструкция генома предков определяет эволюционную основу приобретения признаков у бактерий, накапливающих полифосфаты» . Журнал ISME . 10 (12): 2931–2945. DOI : 10.1038 / ismej.2016.67 . ISSN 1751-7370 . PMC 5148189 . PMID 27128993 .   
  87. ^ a b c Кларк, Джон; Ри, Ричард; Альфаро, Майкл; Кинг, Мэтью; Вагнер, Уоррен; Роалсон, Эрик (2008). «Сравнительное исследование методов реконструкции ареала предков: ретроспективное изучение неопределенных историй островных родословных» . Систематическая биология . 57 (5): 693–707. DOI : 10.1080 / 10635150802426473 . ISSN 1063-5157 . PMID 18853357 .  
  88. ^ Huelsenbeck, Джон П .; Нильсен, Расмус; Боллбэк, Джонатан П. (2003). «Стохастическое отображение морфологических признаков» . Систематическая биология . 52 (2): 131–158. DOI : 10.1080 / 10635150390192780 . ISSN 1063-5157 . PMID 12746144 .  
  89. ^ Ронквист, Фредрик (1996). «DIVA версии 1.1» . Компьютерная программа и руководство доступны по анонимному FTP из Уппсальского университета[ постоянная мертвая ссылка ]
  90. ^ Ри, Ричард Х .; Мур, Брайан Р .; Уэбб, Кэмпбелл O .; Донохью, Майкл Дж. (2005). «Вероятностная структура для вывода эволюции географического ареала на филогенетических деревьях» . Эволюция . 59 (11): 2299–2311. DOI : 10.1111 / j.0014-3820.2005.tb00940.x . ISSN 0014-3820 . PMID 16396171 . S2CID 23245573 .   
  91. ^ a b c Леммон, Алан; Леммон, Эмили Мориарти (2008). «Схема правдоподобия для оценки филогеографической истории на сплошном ландшафте» . Систематическая биология . 57 (4): 544–561. DOI : 10.1080 / 10635150802304761 . ISSN 1063-5157 . PMID 18686193 .  
  92. ^ а б Стертевант, AH; Добжанский, Т. (1936). «Инверсии в третьей хромосоме диких рас Drosophila Pseudoobscura и их использование в изучении истории видов» (PDF) . Труды Национальной академии наук . 22 (7): 448–450. Полномочный код : 1936PNAS ... 22..448S . DOI : 10.1073 / pnas.22.7.448 . ISSN 0027-8424 . PMC 1076803 . PMID 16577723 .    
  93. ^ а б Кэмпбелл, Лайл (1998). Историческая лингвистика: введение . Эдинбург: Издательство Эдинбургского университета.
  94. Перейти ↑ Yang, Z. (2007). «PAML 4: Филогенетический анализ по максимальному правдоподобию». Молекулярная биология и эволюция . 24 (8): 1586–1591. CiteSeerX 10.1.1.322.1650 . DOI : 10.1093 / molbev / msm088 . ISSN 0737-4038 . PMID 17483113 .   
  95. ^ «Lazarus: программный инструмент для реконструкции наследственных белковых последовательностей» . markov.uoregon.edu . Архивировано из оригинала на 2015-03-07 . Проверено 7 марта 2019 .
  96. ^ Пруд, SLK; Мороз, SDW; Муза, SV (2004). «HyPhy: проверка гипотез с использованием филогении» . Биоинформатика . 21 (5): 676–679. DOI : 10.1093 / биоинформатики / bti079 . ISSN 1367-4803 . PMID 15509596 .  
  97. ^ Мэддисон, WP; Мэддисон, Д.Р. (2015). «Мескит: модульная система для эволюционного анализа. Версия 2.75» .
  98. ^ а б Тамура, К .; Stecher, G .; Peterson, D .; Филипски, А .; Кумар, С. (2013). "MEGA6: молекулярно-эволюционный генетический анализ, версия 6.0" . Молекулярная биология и эволюция . 30 (12): 2725–2729. DOI : 10.1093 / molbev / mst197 . ISSN 0737-4038 . PMC 3840312 . PMID 24132122 .   
  99. ^ Ронквист, Ф .; Huelsenbeck, JP (2003). «MrBayes 3: байесовский филогенетический вывод в смешанных моделях» . Биоинформатика . 19 (12): 1572–1574. DOI : 10.1093 / биоинформатики / btg180 . ISSN 1367-4803 . PMID 12912839 .  
  100. ^ Hubisz, MJ; Поллард, Канзас; Зипель, А. (2010). «PHAST и RPHAST: филогенетический анализ с пространственно-временными моделями» . Брифинги по биоинформатике . 12 (1): 41–51. DOI : 10.1093 / нагрудник / bbq072 . ISSN 1467-5463 . PMC 3030812 . PMID 21278375 .   
  101. ^ Bollback, JonathanP (2006). «SIMMAP: стохастическое отображение отдельных признаков на филогении» . BMC Bioinformatics . 7 (1): 88. DOI : 10,1186 / 1471-2105-7-88 . ISSN 1471-2105 . PMC 1403802 . PMID 16504105 .   
  102. Перейти ↑ Paradis, Emmanuel (2012). Анализ Филогенетика и эволюции с R . Нью-Йорк: Springer-Verlag.
  103. ^ Росснес, Роальд; Эйдхаммер, Ингвар; Либерлес, Дэвид А (2005). «Филогенетическая реконструкция предковых состояний признаков для экспрессии генов и данных сплайсинга мРНК» . BMC Bioinformatics . 6 (1): 127. DOI : 10,1186 / 1471-2105-6-127 . ISSN 1471-2105 . PMC 1166541 . PMID 15921519 .   
  104. ^ Драммонд, AJ; Сушард, Массачусетс; Xie, D .; Рамбаут, А. (2012). «Байесовская филогенетика с BEAUti and the BEAST 1.7» . Молекулярная биология и эволюция . 29 (8): 1969–1973. DOI : 10.1093 / molbev / mss075 . ISSN 0737-4038 . PMC 3408070 . PMID 22367748 .   
  105. ^ ФитцДжон, Ричард Г. (2012). «Диверситри: сравнительный филогенетический анализ диверсификации в R» . Методы экологии и эволюции . 3 (6): 1084–1092. DOI : 10.1111 / j.2041-210X.2012.00234.x . ISSN 2041-210X . 
  106. ^ Пейджел, М. (1994). «Обнаружение коррелированной эволюции по филогенезам: общий метод сравнительного анализа дискретных признаков». Труды Королевского общества B: биологические науки . 255 (1342): 37–45. Bibcode : 1994RSPSB.255 ... 37P . DOI : 10,1098 / rspb.1994.0006 . ISSN 0962-8452 . S2CID 85903564 .  
  107. ^ Ю, Ян; Харрис, AJ; Он, Xingjin (2010). «S-DIVA (Статистический анализ дисперсии-викариантности): инструмент для вывода биогеографических историй». Молекулярная филогенетика и эволюция . 56 (2): 848–850. DOI : 10.1016 / j.ympev.2010.04.011 . ISSN 1055-7903 . PMID 20399277 .  
  108. ^ Ариас, Дж. Сальвадор; Szumik, Claudia A .; Голобов, Пабло А. (2011). «Пространственный анализ наместничества: метод использования прямой географической информации в исторической биогеографии». Кладистика . 27 (6): 617–628. DOI : 10.1111 / j.1096-0031.2011.00353.x . ISSN 0748-3007 . S2CID 85747431 .  
  109. ^ Джонс, BR; Rajaraman, A .; Tannier, E .; Чов, К. (2012). «УГЛЫ: реконструкция карт АНЦЕСТРАЛЬНЫХ ГЕНОМОВ» . Биоинформатика . 28 (18): 2388–2390. DOI : 10.1093 / биоинформатики / bts457 . ISSN 1367-4803 . PMID 22820205 .  
  110. ^ Ларджет, Брет; Кадане, Джозеф Б .; Саймон, Дональд Л. (2005). «Байесовский подход к оценке предков генома». Молекулярная филогенетика и эволюция . 36 (2): 214–223. DOI : 10.1016 / j.ympev.2005.03.026 . ISSN 1055-7903 . PMID 15893477 .  
  111. ^ Csuos, М. (2010). «Граф: эволюционный анализ филогенетических профилей с экономией и правдоподобием». Биоинформатика . 26 (15): 1910–1912. DOI : 10.1093 / биоинформатики / btq315 . ISSN 1367-4803 . PMID 20551134 .  
  112. ^ Кармель, Лиран; Волк, Юрий I .; Рогозин, Игорь Б .; Кунин, Евгений В. (2010). "EREM: Оценка параметров и реконструкция предков с помощью алгоритма максимизации ожидания для вероятностной модели эволюции геномных двоичных символов" . Успехи биоинформатики . 2010 : 1–4. DOI : 10.1155 / 2010/167408 . ISSN 1687-8027 . PMC 2866244 . PMID 20467467 .   
  113. ^ Патро, Роб; Сефер, Эмре; Малин, Джастин; Марсе, Гийом; Навлаха, Сакет; Кингсфорд, Карл (2012). «Экономная реконструкция эволюции сети» . Алгоритмы молекулярной биологии . 7 (1): 25. DOI : 10,1186 / 1748-7188-7-25 . ISSN 1748-7188 . PMC 3492119 . PMID 22992218 .   
  114. ^ Diallo, AB; Макаренков, В .; Бланшетт, М. (2009). «Ancestors 1.0: веб-сервер для реконструкции наследственной последовательности» . Биоинформатика . 26 (1): 130–131. DOI : 10.1093 / биоинформатики / btp600 . ISSN 1367-4803 . PMID 19850756 .  
  115. ^ Ашкенази, H .; Penn, O .; Дорон-Файгенбойм, А .; Cohen, O .; Cannarozzi, G .; Зомер, О .; Пупко Т. (2012). «FastML: веб-сервер для вероятностной реконструкции наследственных последовательностей» . Исследования нуклеиновых кислот . 40 (W1): W580 – W584. DOI : 10.1093 / NAR / gks498 . ISSN 0305-1048 . PMC 3394241 . PMID 22661579 .   
  116. ^ Ху, Фэй; Лин, Ю; Тан, Цзицзюнь (2014). «MLGO: реконструкция филогении и вывод о предках из данных о порядке генов» . BMC Bioinformatics . 15 (1): 354. DOI : 10,1186 / s12859-014-0354-6 . ISSN 1471-2105 . PMC 4236499 . PMID 25376663 .   
  117. ^ Бушар-Кот, А .; Иордания, Мичиган (2012). «Эволюционный вывод через процесс Инделя Пуассона» . Труды Национальной академии наук . 110 (4): 1160–1166. arXiv : 1207,6327 . Bibcode : 2013PNAS..110.1160B . DOI : 10.1073 / pnas.1220450110 . ISSN 0027-8424 . PMC 3557041 . PMID 23275296 .   
  118. ^ Торн, Джеффри Л .; Кишино, Хирохиса; Фельзенштейн, Джозеф (1991). «Эволюционная модель максимального правдоподобия выравнивания последовательностей ДНК». Журнал молекулярной эволюции . 33 (2): 114–124. Bibcode : 1991JMolE..33..114T . DOI : 10.1007 / BF02193625 . ISSN 0022-2844 . PMID 1920447 . S2CID 13333056 .   
  119. ^ Фрейзер, Кристоф; Пун, Art FY; Свенсон, Люк С .; Bunnik, Evelien M .; Эдо-Матас, Диана; Шуйтемакер, Ханнеке ; van 't Wout, Angélique B .; Харриган, П. Ричард (2012). «Реконструкция динамики развития ВИЧ внутри хостов из последовательных данных глубокой последовательности» . PLOS Вычислительная биология . 8 (11): e1002753. Bibcode : 2012PLSCB ... 8E2753P . DOI : 10.1371 / journal.pcbi.1002753 . ISSN 1553-7358 . PMC 3486858 . PMID 23133358 .   
  120. ^ Beerenwinkel, Niko ; Schwarz, Roland F .; Трин, Энн; Сипос, Ботонд; Брентон, Джеймс Д .; Гольдман, Ник; Марковец, Флориан (2014). «Филогенетическая количественная оценка внутриопухолевой неоднородности» . PLOS Вычислительная биология . 10 (4): e1003535. arXiv : 1306.1685 . Bibcode : 2014PLSCB..10E3535S . DOI : 10.1371 / journal.pcbi.1003535 . ISSN 1553-7358 . PMC 3990475 . PMID 24743184 .