Унифрак


UniFrac — это метрика расстояния , используемая для сравнения биологических сообществ . Он отличается от показателей несходства, таких как несходство Брея-Кертиса , тем, что он включает информацию об относительном родстве членов сообщества путем включения в вычисления филогенетических расстояний между наблюдаемыми организмами.

Как взвешенный (количественный), так и невзвешенный (качественный) варианты UniFrac [1] широко используются в микробной экологии , где первый учитывает обилие наблюдаемых организмов, а второй учитывает только их присутствие или отсутствие. Метод был разработан Кэтрин Лозупоне , когда она работала с Робом Найтом [2] из Университета Колорадо в Боулдере в 2005 году. [3] [4]

Расстояние рассчитывается между парами образцов (каждый образец представляет сообщество организмов). Все таксоны, обнаруженные в одной или обеих выборках, размещены на филогенетическом дереве . Ветвь, ведущая к таксонам из обеих выборок, помечается как «общая», а ветви, ведущие к таксонам, встречающимся только в одной выборке, помечаются как «неразделенные». Затем расстояние между двумя образцами рассчитывается как:


Это определение удовлетворяет требованиям метрики расстояния , будучи неотрицательной, равной нулю только тогда, когда объекты идентичны, транзитивны и соответствуют неравенству треугольника .

Если имеется несколько разных образцов, можно создать матрицу расстояний, создав дерево для каждой пары образцов и рассчитав их меру UniFrac. Впоследствии можно использовать стандартные многомерные статистические методы, такие как кластеризация данных и анализ основных координат .

Можно определить статистическую значимость расстояния UniFrac между двумя образцами с помощью моделирования методом Монте-Карло . Путем рандомизации выборочной классификации каждого таксона на дереве (оставляя структуру ветвей неизменной) и создания распределения значений расстояния UniFrac можно получить распределение значений UniFrac. Исходя из этого, фактическому расстоянию между образцами можно присвоить p-значение.


Три примера неравенства треугольника для треугольников со сторонами длины x , y , z . В верхнем примере показан случай, когда z намного меньше, чем сумма x + y двух других сторон, а в нижнем примере показан случай, когда сторона z лишь немного меньше, чем x + y .