Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Индекс фиксации ( F ST ) - это показатель дифференциации популяции по генетической структуре . Его часто оценивают на основе данных генетического полиморфизма , таких как однонуклеотидный полиморфизм (SNP) или микросателлиты . Разработанный как частный случай F-статистики Райта , это одна из наиболее часто используемых статистических данных в популяционной генетике .

Определение [ править ]

Два наиболее часто используемых определения F ST в данном локусе основаны на дисперсии частот аллелей между популяциями и на вероятности идентичности по происхождению .

Если - средняя частота аллеля в общей популяции, - это дисперсия частоты аллеля между различными субпопуляциями, взвешенная по размерам субпопуляций, и - дисперсия аллельного состояния в общей популяции, F ST - это определяется как [1]

Определение Райта показывает, что F ST измеряет степень генетической изменчивости, которая может быть объяснена структурой популяции. Это также можно рассматривать как долю от общего разнообразия, которая не является следствием среднего разнообразия внутри субпопуляций, где разнообразие измеряется вероятностью того, что два случайно выбранных аллеля различны, а именно . Если частота аллеля в th популяции равна, а относительный размер популяции th равен , то

В качестве альтернативы, [2]

где - вероятность идентичности по происхождению двух особей при условии, что эти две особи принадлежат к одной и той же субпопуляции, и - вероятность того, что два человека из общей популяции идентичны по происхождению. Используя это определение, F ST можно интерпретировать как измерение того, насколько близко находятся два человека из одной и той же субпопуляции по сравнению со всей популяцией. Если частота мутаций мала, эту интерпретацию можно сделать более явной, связав вероятность идентичности по происхождению со временем слияния : пусть T 0 и T обозначают среднее время слияния для особей из одной и той же субпопуляции и всей популяции, соответственно. Потом,

Эта формулировка имеет то преимущество, что ожидаемое время коалесценции можно легко оценить на основе генетических данных, что привело к разработке различных оценок для F ST .

Оценка [ править ]

На практике ни одна из величин, используемых в определениях, не может быть легко измерена. Как следствие, были предложены различные оценки. Особенно простой метод оценки, применимый к данным о последовательности ДНК: [3]

где и представляют собой среднее количество попарных различий между двумя индивидуумами, отобранными из разных субпопуляций ( ) или из одной и той же субпопуляции ( ). Среднюю попарную разницу в популяции можно рассчитать как сумму парных различий, деленную на количество пар. Однако эта оценка оказывается необъективной, если размеры выборки малы или различаются между популяциями. Поэтому на практике для вычисления F ST используются более сложные методы . Двумя наиболее широко используемыми процедурами являются оценка Weir & Cockerham (1984), [4] или выполнение анализа молекулярной дисперсии . Список реализаций доступен в конце этой статьи.

Интерпретация [ править ]

Это сравнение генетической изменчивости внутри популяций и между ними часто используется в прикладной популяционной генетике . Диапазон значений от 0 до 1. Нулевое значение означает полный панмиксис ; это означает, что две популяции свободно скрещиваются. Значение единицы означает, что все генетические вариации объясняются структурой популяции и что эти две популяции не имеют общего генетического разнообразия.

Для идеализированных моделей, таких как модель конечных островов Райта , F ST может использоваться для оценки скорости миграции. Согласно этой модели, скорость миграции составляет

,

где m - скорость миграции на поколение, а - скорость мутаций на поколение. [5]

Интерпретация F ST может быть затруднена, если анализируемые данные сильно полиморфны. В этом случае вероятность идентичности по происхождению очень мала, и F ST может иметь произвольно низкую верхнюю границу, что может привести к неправильной интерпретации данных. Кроме того, строго говоря, F ST не является расстоянием в математическом смысле, поскольку не удовлетворяет неравенству треугольника .

Для популяций растений, которые явно принадлежат к одному виду , значения F ST более 15% считаются «большой» или «значительной» дифференциацией, тогда как значения ниже 5% считаются «небольшой» или «незначительной» дифференциацией. [6] Значения для популяций млекопитающих между подвидами или близкородственными видами, типичные значения составляют порядка от 5% до 20%. F ST между евразийской и североамериканской популяциями серого волка составляла 9,9%, а между популяциями красного волка и серого волка - от 17% до 18%. ВВосточный волк , недавно признанный сильно смешанный «волкоподобный вид», имеет значения F ST ниже 10% по сравнению как с евразийскими (7,6%), так и с североамериканскими серыми волками (5,7%), с красным волком (8,5%), и даже еще более низкое значение в паре с Койотом (4,5%). [7]

F ST у людей [ править ]

Значения F ST сильно зависят от выбора популяций. Близкородственные этнические группы, такие как датчане против голландцев или французы против испанцев, показывают значения значительно ниже 1%, неотличимые от панмиксии. Было обнаружено, что в Европе самые разные этнические группы имеют значения порядка 7% ( саамы против сардинцев ).

Более высокие значения обнаруживаются при сравнении сильно расходящихся однородных групп: наибольшее обнаруженное значение было около 46%, между мбути и папуасами . [8]

Аутосомные генетические дистанции на основе классических маркеров [ править ]

В своем исследовании «История и география генов человека» (1994) Кавалли-Сфорца, Меноцци и Пьяцца предоставляют некоторые из наиболее подробных и всеобъемлющих оценок генетических расстояний между человеческими популяциями внутри и между континентами. Их исходная база данных содержит 76 676 частот генов (с использованием 120 полиморфизмов крови), что соответствует 6 633 образцам в разных местах. Отбирая и объединяя такие образцы, они ограничивают свой анализ 491 популяцией. Они сосредотачиваются на аборигенном населении, которое находилось на своем нынешнем месте в конце 15 века, когда начались великие европейские миграции. [9]При изучении генетических различий на мировом уровне число сокращается до 42 репрезентативных популяций, объединяющих субпопуляции, характеризующиеся высоким уровнем генетического сходства. Для этих 42 популяций Кавалли-Сфорца и соавторы сообщают о двусторонних расстояниях, рассчитанных на основе 120 аллелей. Среди этого набора из 42 мировых популяций наибольшее генетическое расстояние наблюдается между пигмеями мбути и жителями Папуа-Новой Гвинеи, где расстояние Fst составляет 0,4573, а наименьшее генетическое расстояние (0,0021) - между датчанами и англичанами. При рассмотрении более дезагрегированных данных по 26 европейским популяциям наименьшее генетическое расстояние (0,0009) находится между голландцами и датчанами, а наибольшее (0,0667) - между саамами и сардинцами.Среднее генетическое расстояние между 861 доступной парой 42 выбранных популяций оказалось равным 0,1338.[ необходима страница ] . Генетическое расстояние 0,1338 означает, что родство между неродственными особями одного и того же происхождения относительно мирового населения эквивалентно родству между полукровными братьями и сестрами в случайно спаривающейся популяции. Это также подразумевает, что если человек из данной предковой популяции имеет смешанного сводного брата, этот человек генетически ближе к неродственной особи их предковой популяции, чем к их смешанному сводному брату. [10]

Аутосомные генетические дистанции на основе SNP [ править ]

Исследование 2012 года, основанное на данных Международного проекта HapMap, оценило F ST между тремя основными «континентальными» популяциями европейцев (в сочетании с жителями Юты северного и западноевропейского происхождения из коллекции CEPH и итальянцами из Тосканы) и выходцами из Восточной Азии (объединяя китайцев хань из Пекин, китайцы из столичного Денвера и японцы из Токио, Япония) и африканцы к югу от Сахары ( включая Лухья из Вебуйе, Кения, масаи из Киньявы, Кения и йоруба из Ибадана, Нигерия). Он сообщил о значении, близком к 12% между континентальными популяциями, и значениях, близких к панмиксии.(менее 1%) среди континентальных популяций. [11]

Программы для расчета F ST [ править ]

  • Арлекин
  • Fstat
  • СМОГД [14]
  • diveRsity (пакет R)
  • hierfstat (пакет R)
  • FinePop [15] (пакет R)
  • Микросателлитный анализатор (МСА)
  • VCFtools
  • ДнаСП

Модули для расчета F ST [ править ]

  • BioPerl
  • Биопайтон

Ссылки [ править ]

  1. ^ Holsinger, Kent E .; Брюс С. Вейр (2009). «Генетика в географически структурированных популяциях: определение, оценка и интерпретация FST» . Nat Rev Genet . 10 (9): 639–650. DOI : 10.1038 / nrg2611 . ISSN  1471-0056 . PMC  4687486 . PMID  19687804 .
  2. ^ Ричард Durrett (12 августа 2008). Вероятностные модели эволюции последовательности ДНК . Springer. ISBN 978-0-387-78168-6. Проверено 25 октября 2012 года .
  3. ^ Хадсон, RR .; Слаткин, М .; Мэддисон, WP. (Октябрь 1992 г.). «Оценка уровней потока генов по данным последовательности ДНК» . Генетика . 132 (2): 583–9. PMC 1205159 . PMID 1427045 .  
  4. ^ Weir, BS; Кокерхэм, К. Кларк (1984). «Оценка F-статистики для анализа структуры населения». Эволюция . 38 (6): 1358–1370. DOI : 10.2307 / 2408641 . ISSN 0014-3820 . JSTOR 2408641 . PMID 28563791 .   
  5. ^ Питер Бирли, Оценка скорости миграции и размеров населения в географически структурированных популяциях (1998), Достижения в молекулярной экологии (под ред. Дж. Карвалью). Наука НАТО A: Науки о жизни, IOS Press, Амстердам, 39–53.
  6. ^ Frankham, Р., Балл, JD, Бриско, Д. А., 2002. Введение в Conservation Genetics. Издательство Кембриджского университета, Кембридж. Хартл Д.Л., Кларк А.Г. (1997) Принципы популяционной генетики, 3-е изд. Sinauer Associates, Inc, Сандерленд, Массачусетс.
  7. ^ BM фон Холдт и др., «Анализ последовательности всего генома показывает, что два эндемичных вида североамериканских волков представляют собой смесь койота и серого волка», Science Advances 27 июля 2016 г .: Vol. 2, вып. 7, e1501714, DOI: 10.1126 / sciadv.1501714.
  8. ^ Кавалли-Сфорца и др. (1994), цитируется по В. Гинзбургу, С. Веберу, Справочник по экономике и языку Палгрейва , Springer (2016), стр. 182 .
  9. Кавалли-Сфорца и др., 1994, стр. 24
  10. ^ Харпендинг, Генри (2002). «Родство и деление населения». Население и окружающая среда . 24 (2): 141–147. DOI : 10,1023 / A: 1020815420693 . S2CID 15208802 . 
  11. ^ Elhaik, Эран (2012). «Эмпирические распределения FST из крупномасштабных данных о полиморфизме человека» . PLOS ONE . 7 (11): e49837. Bibcode : 2012PLoSO ... 749837E . DOI : 10.1371 / journal.pone.0049837 . PMC 3504095 . PMID 23185452 .  
  12. ^ a b Нелис, Мари; и другие. (2009-05-08). Флейшер, Роберт С. (ред.). «Генетическая структура европейцев: взгляд с северо-востока» . PLOS ONE . 4 (5): e5472. Bibcode : 2009PLoSO ... 4.5472N . DOI : 10.1371 / journal.pone.0005472 . PMC 2675054 . PMID 19424496 .  , Смотрите таблицу
  13. ^ Тянь, Чао; и другие. (Ноябрь 2009 г.). «Генетическая субструктура европейского населения: дальнейшее определение информативных маркеров предков для различения различных европейских этнических групп» . Молекулярная медицина . 15 (11–12): 371–383. DOI : 10,2119 / molmed.2009.00094 . ISSN 1076-1551 . PMC 2730349 . PMID 19707526 .   , Смотрите таблицу
  14. ^ Кроуфорд, Николас Г. (2010). « смог : программа для измерения генетического разнообразия». Ресурсы молекулярной экологии . 10 (3): 556–557. DOI : 10.1111 / j.1755-0998.2009.02801.x . PMID 21565057 . 
  15. ^ Kitada S, Kitakado Т, Kishino Н (2007). «Эмпирический Байесовский вывод о попарном F (ST) и его распределении в геноме» . Генетика . 177 (2): 861–73. DOI : 10.1534 / genetics.107.077263 . PMC 2034649 . PMID 17660541 .  

Дальнейшее чтение [ править ]

  • Эволюция и генетика популяций Том 2: теория частот генов, стр. 294–295, S. Wright, Univ. из Chicago Press, Чикаго, 1969 г.
  • Карта гаплотипов генома человека, Международный консорциум HapMap, Nature 2005

См. Также [ править ]

  • Генетическая дистанция

Внешние ссылки [ править ]

  • BioPerl - Bio :: PopGen :: PopStats