Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Теория слияния - это модель того, как варианты генов, отобранные из популяции, могли происходить от общего предка. В простейшем случае теория слияния предполагает отсутствие рекомбинации , естественного отбора , потока генов или популяционной структуры, а это означает, что каждый вариант с одинаковой вероятностью передавался от одного поколения к другому. Модель смотрит назад во времени, объединяя аллели в единую предковую копию в соответствии со случайным процессом в событиях слияния. В соответствии с этой моделью ожидаемое время между последовательными событиями слияния увеличивается почти экспоненциально назад во времени (с большим разбросом).). Различия в модели возникают как из-за случайной передачи аллелей от одного поколения к другому, так и из-за случайного появления мутаций в этих аллелях.

Математическая теория слияния была разработана независимо несколькими группами в начале 1980-х годов как естественное расширение классической теории и моделей популяционной генетики [1] [2] [3] [4], но в первую очередь может быть приписана Джону Кингману . [5] Достижения в теории слияния включают рекомбинацию, отбор, перекрывающиеся поколения и практически любую произвольно сложную эволюционную или демографическую модель в популяционном генетическом анализе.

Модель может использоваться для создания множества теоретических генеалогий, а затем сравнения наблюдаемых данных с этими симуляциями, чтобы проверить предположения о демографической истории населения. Теория слияния может использоваться, чтобы делать выводы о генетических параметрах популяции, таких как миграция, размер популяции и рекомбинация .

Теория [ править ]

Время слиться [ править ]

Рассмотрим локус одного гена, взятый у двух гаплоидных особей в популяции. Происхождение этого образца прослеживается назад во времени до момента, когда эти две линии сливаются в их самом последнем общем предке (MRCA). Теория слияния пытается оценить ожидания этого периода времени и его отклонения.

Вероятность слияния двух клонов в непосредственно предшествующем поколении - это вероятность того, что они разделяют родительскую последовательность ДНК . В популяции с постоянным эффективным размером популяции с 2 N e копиями каждого локуса имеется 2 N e «потенциальных родителей» в предыдущем поколении. При модели случайного скрещивания вероятность того, что два аллеля происходят от одной и той же родительской копии, составляет, таким образом, 1 / (2 N e ) и, соответственно, вероятность того, что они не сливаются, составляет 1 - 1 / (2 N e ).

В каждом последующем предшествующем поколении вероятность слияния распределяется геометрически, то есть это вероятность отсутствия слияния в t  - 1 предыдущих поколений, умноженная на вероятность слияния в интересующем поколении:

Для достаточно больших значений N e это распределение хорошо аппроксимируется непрерывно определенным экспоненциальным распределением

Это удобно с математической точки зрения, поскольку стандартное экспоненциальное распределение имеет как математическое ожидание, так и стандартное отклонение, равное 2 N e . Следовательно, хотя ожидаемое время коалесценции составляет 2 N e , фактическое время коалесценции может варьироваться в широком диапазоне. Обратите внимание, что время слияния - это количество предыдущих поколений, в которых произошло слияние, а не календарное время, хотя оценку последнего можно произвести, умножив 2 N e на среднее время между поколениями. Вышеприведенные вычисления в равной степени применимы к диплоидной популяции эффективного размера N e(другими словами, для нерекомбинирующего сегмента ДНК каждую хромосому можно рассматривать как эквивалент независимого гаплоидного индивида; в отсутствие инбридинга сестринские хромосомы у одного индивида не более тесно связаны, чем две хромосомы, случайно выбранные из население). Однако некоторые эффективно гаплоидные элементы ДНК, такие как митохондриальная ДНК , передаются только одним полом и, следовательно, имеют четверть эффективного размера эквивалентной диплоидной популяции ( N e / 2).

Нейтральный вариант [ править ]

Теория слияния также может быть использована для моделирования количества вариаций в последовательностях ДНК , ожидаемых в результате генетического дрейфа и мутации. Это значение называется средней гетерозиготностью и обозначается как . Средняя гетерозиготность рассчитывается как вероятность мутации, происходящей в данном поколении, деленная на вероятность любого «события» в этом поколении (либо мутации, либо слияния). Вероятность того, что событие является мутацией вероятность мутации в одном из двух линий: . Таким образом, средняя гетерозиготность равна

Ведь подавляющее большинство пар аллелей имеют по крайней мере одно различие в нуклеотидной последовательности.

Графическое представление [ править ]

Коалесценты можно визуализировать с помощью дендрограмм, которые показывают отношения ветвей популяции друг к другу. Точка, где встречаются две ветви, указывает на слияние.

Приложения [ править ]

Картирование гена болезни [ править ]

Полезность объединенной теории в картировании болезней постепенно получает все большее признание; Хотя применение теории все еще находится в зачаточном состоянии, ряд исследователей активно разрабатывают алгоритмы анализа генетических данных человека, основанные на теории объединения. [6] [7] [8]

Значительное количество человеческих болезней может быть связано с генетикой, от простых менделевских болезней, таких как серповидно-клеточная анемия и муковисцидоз , до более сложных заболеваний, таких как рак и психические заболевания. Последние представляют собой полигенные заболевания, контролируемые множеством генов, которые могут возникать на разных хромосомах, но заболевания, вызванные одной аномалией, относительно просто определить и отследить, хотя и не так просто, чтобы это было достигнуто для всех болезней. Для понимания этих болезней и их процессов чрезвычайно полезно знать, где они расположены на хромосомах и как они передаются по наследству из поколения в поколение, что может быть достигнуто с помощью коалесцентного анализа.[1]

Генетические заболевания передаются от одного поколения к другому, как и другие гены. Хотя любой ген может быть перетасован с одной хромосомы на другую во время гомологичной рекомбинации , маловероятно, что будет сдвинут только один ген. Таким образом, другие гены, которые достаточно близки к гену болезни, чтобы быть с ним связаны, могут быть использованы для его отслеживания. [1]

Полигенные заболевания имеют генетическую основу, даже если они не соответствуют менделевским моделям наследования, и они могут иметь относительно высокую частоту в популяциях и иметь серьезные последствия для здоровья. Такие заболевания могут иметь неполную пенетрантность и иметь тенденцию быть полигенными , что затрудняет их изучение. Эти черты могут возникать из-за множества мелких мутаций, которые вместе оказывают серьезное и пагубное влияние на здоровье человека. [2]

Методы картирования сцепления, включая теорию коалесценции, могут быть использованы для работы с этими заболеваниями, поскольку они используют семейные родословные, чтобы выяснить, какие маркеры сопровождают заболевание и как оно передается. По крайней мере, этот метод помогает сузить часть или части генома, в которых могут возникнуть вредные мутации. Осложнения этих подходов включают эпистатические эффекты, полигенную природу мутаций и факторы окружающей среды. Тем не менее, гены, эффекты которых являются аддитивными, несут фиксированный риск развития болезни, и когда они существуют в генотипе болезни, их можно использовать для прогнозирования риска и картирования гена. [2]Как регулярное слияние, так и разрушенное слияние (что позволяет предположить, что в исходном событии могли произойти множественные мутации и что болезнь может иногда быть вызвана факторами окружающей среды) были задействованы в понимании генов болезни. [1]

Были проведены исследования корреляции возникновения заболеваний у разнояйцевых и однояйцевых близнецов, и результаты этих исследований могут использоваться для информационного моделирования коалесцентного моделирования. Поскольку у однояйцевых близнецов общий геном, а у разнояйцевых близнецов - только половина генома, разницу в корреляции между однояйцевыми и разнояйцевыми близнецами можно использовать для определения того, передается ли болезнь по наследству, и если да, то насколько сильно. [2]

Геномное распределение гетерозиготности [ править ]

Карта однонуклеотидного полиморфизма (SNP) человека выявила большие региональные вариации в гетерозиготности, больше, чем можно объяснить на основе случайного шанса ( распределенного по Пуассону ). [9] Частично эти вариации можно объяснить на основе методов оценки, наличия геномных последовательностей и, возможно, стандартной генетической модели слияния популяций. Популяционные генетические влияния могут иметь большое влияние на эту вариацию: некоторые локусы предположительно имели сравнительно недавних общих предков, другие могли иметь гораздо более старые генеалогии, и поэтому региональное накопление SNP с течением времени могло быть совершенно другим. Локальная плотность SNP вдоль хромосом, по-видимому, группируется в соответствии сдисперсия должна означать степенной закон и подчиняться составному распределению Пуассона Твиди . [10] В этой модели региональные вариации в карте SNP будут объяснены накоплением множества небольших геномных сегментов посредством рекомбинации, где среднее количество SNP на сегмент будет гамма-распределением пропорционально гамма-распределению времени до самого последнего общий предок для каждого сегмента. [11]

История [ править ]

Теория слияния является естественным продолжением более классической концепции популяционной генетики о нейтральной эволюции и является приближением к модели Фишера – Райта (или Райта – Фишера) для больших популяций. Он был независимо открыт несколькими исследователями в 1980-х годах. [12] [13] [14] [15]

Программное обеспечение [ править ]

Существует большой объем программного обеспечения как для моделирования наборов данных в процессе объединения, так и для определения таких параметров, как размер популяции и скорость миграции, на основе генетических данных.

  • BEAST - пакет байесовского вывода через MCMC с широким спектром сливающихся моделей, включая использование последовательностей с временной выборкой. [16]
  • BPP - программный пакет для определения времени филогении и дивергенции популяций в процессе многовидового слияния.
  • CoaSim - программа для моделирования генетических данных в рамках модели слияния.
  • DIYABC - удобный подход к ABC для вывода истории популяции с использованием молекулярных маркеров. [17]
  • DendroPy - библиотека Python для филогенетических вычислений с классами и методами для моделирования чистых (неограниченных) сливающихся деревьев, а также ограниченных сливающихся деревьев в рамках модели слияния нескольких видов (т. Е. «Деревья генов в деревьях видов»).
  • GeneRecon - программное обеспечение для мелкомасштабного картирования неравновесного сцепления, картирования генов болезней с использованием теории объединения, основанной на байесовской структуре MCMC .
  • Программное обеспечение genetree для оценки параметров популяционной генетики с использованием теории объединения и моделирования ( пакет R popgen). См. Также Oxford Mathematical Genetics and Bioinformatics Group
  • GENOME - быстрое моделирование всего генома на основе слияния [18]
  • IBDSim - компьютерный пакет для моделирования генотипических данных в условиях общей изоляции с помощью дистанционных моделей. [19]
  • IMa - IMa реализует ту же модель изоляции с миграцией, но делает это с использованием нового метода, который обеспечивает оценки совместной апостериорной плотности вероятности параметров модели. IMa также позволяет регистрировать тесты отношения правдоподобия вложенных демографических моделей. IMa основан на методе, описанном в Hey and Nielsen (2007 PNAS 104: 2785–2790). IMa быстрее и лучше, чем IM (то есть за счет предоставления доступа к совместной апостериорной функции плотности), и его можно использовать для большинства (но не для всех) ситуаций и вариантов, для которых может использоваться IM.
  • Lamarc - программа для оценки темпов роста, миграции и рекомбинации населения.
  • Мигрень - программа, реализующая объединяющие алгоритмы для анализа максимального правдоподобия (с использованием алгоритмов выборки по важности ) генетических данных с упором на пространственно структурированные популяции. [20]
  • Migrate - максимальная вероятность и байесовский вывод скоростей миграции при n- сращивании. Логический вывод реализован с использованием MCMC.
  • MaCS - Markovian Coalescent Simulator - моделирует генеалогию в пространстве по хромосомам как марковский процесс. Подобен алгоритму SMC Маквина и Кардина и поддерживает все демографические сценарии, найденные в MS.
  • ms & msHOT - оригинальная программа Ричарда Хадсона для генерации выборок по нейтральным моделям [21] и расширение, позволяющее использовать горячие точки рекомбинации . [22]
  • msms - расширенная версия ms, включающая выборочную развертку. [23]
  • msprime - быстрый и масштабируемый MS -совместимый симулятор, позволяющий демографическое моделирование, создавая компактные выходные файлы для тысяч или миллионов геномов.
  • Recodon и NetRecodon - программное обеспечение для моделирования кодирующих последовательностей с меж- и интракодоновой рекомбинацией, миграцией, скоростью роста и продольной выборкой. [24] [25]
  • CoalEvol и SGWE - программное обеспечение для моделирования нуклеотидных, кодирующих и аминокислотных последовательностей при объединении с демографическими данными , рекомбинацией, популяционной структурой с миграцией и продольной выборкой. [26]
  • SARG - структура графа рекомбинации предков Магнуса Нордборга
  • simcoal2 - программное обеспечение для моделирования генетических данных в рамках модели слияния со сложной демографией и рекомбинацией
  • TreesimJ - программное обеспечение для прямого моделирования, позволяющее производить выборку генеалогий и наборов данных в рамках различных выборочных и демографических моделей.

Ссылки [ править ]

  1. ^ a b c Моррис А., Уиттакер Дж. и Болдинг Д. (2002). Картирование очагов болезни в мелкомасштабном масштабе с помощью моделирования генеалогий с разрушенным слиянием. Американский журнал генетики человека, 70 (3), 686–707. DOI: 10.1086 / 339271
  2. ^ a b c Раннала, Б. (2001). Поиск генов, влияющих на предрасположенность к сложным заболеваниям в постгеномную эру. Американский журнал фармакогеномики , 1 (3), 203–221.

Источники [ править ]

Статьи [ править ]

  • ^ Аренас, М. и Посада, Д. (2014) Моделирование эволюции в масштабах всего генома в рамках моделей гетерогенного замещения и сложных многовидовых объединяющихся историй. Молекулярная биология и эволюция 31 (5) : 1295–1301
  • ^ Аренас, М. и Посада, Д. (2007) Рекодон: объединенное моделирование кодирующих последовательностей ДНК с рекомбинацией, миграцией и демографией. BMC Биоинформатика 8 : 458
  • ^ Аренас, М. и Посада, Д. (2010) Коалесцентное моделирование рекомбинации внутрикодонов. Генетика 184 (2) : 429–437.
  • ^ Browning, SR (2006) Мультилокусное сопоставление ассоциаций с использованием цепей Маркова переменной длины. Американский журнал генетики человека 78 : 903–913
  • ^ Cornuet Ж.-М., Pudlo П., Veyssier J., Dehne-Гарсиа А., Готье М., Леблуа Р., Марин Ж.-М., Estoup A. (2014) DIYABC v2.0: программное обеспечение сделать выводы о приближенных байесовских вычислениях об истории популяции с использованием однонуклеотидного полиморфизма, последовательностей ДНК и микросателлитных данных. Биоинформатика « 30» : 1187–1189.
  • ^ Дегнан, Дж. Х. и Л. А. Солтер. 2005. Распределение генного дерева в процессе слияния. Эволюция 59 (1): 24–37. pdf с сайта Coaltree.net/
  • ^ Доннелли, П., Таваре, С. (1995) Объединения и генеалогическая структура при нейтралитете. Ежегодный обзор генетики 29: 401–421
  • ^ Drummond A, Suchard MA, Се D, Rambaut A (2012). «Байесовская филогенетика с BEAUti and the BEAST 1.7» . Молекулярная биология и эволюция . 29 (8): 1969–1973. DOI : 10.1093 / molbev / mss075 . PMC  3408070 . PMID  22367748 .
  • ^ Юинг, Г. и Hermisson Дж (2010), MSMS: программа коалесцента моделированиявключая рекомбинации, демографическую структуру и выбор в одном локусе, биоинформатики 26 : 15
  • ^ Hellenthal, G., Stephens M. (2006) msHOT: модификация симулятора MS Хадсона для включения горячих точек кроссовера и преобразования генов Биоинформатика АОП
  • ^ Хадсон, Ричард Р. (1983a). «Тестирование модели нейтральных аллелей с постоянной скоростью с данными о последовательности белков». Эволюция . 37 (1): 203–17. DOI : 10.2307 / 2408186 . ISSN 1558-5646 . JSTOR 2408186 . PMID 28568026 .   
  • ^ Hudson RR (1983b) Свойства модели нейтрального аллеля с внутригенной рекомбинацией. Теоретическая популяционная биология 23: 183–201.
  • ^ Хадсон Р. Р. (1991)Генеалогии и процесс слияния. Оксфордские исследования по эволюционной биологии 7: 1–44
  • ^ Hudson RR (2002) Создание выборок в соответствии с нейтральной моделью Райта-Фишера. Биоинформатика 18 : 337–338
  • ^ Кендал WS (2003) Модель экспоненциальной дисперсии для распределения человеческих полиморфизмов одиночных нуклеотидов. Mol Biol Evol 20: 579–590.
  • Хайн, Дж., Скируп, М., Виуф К. (2004) Генеалогия, вариация и эволюция: учебник по теории слияния Oxford University Press ISBN 978-0-19-852996-5 
  • ^ Каплан, Н.Л., Дарден, Т., Хадсон, Р.Р. (1988) Процесс объединения в моделях с отбором. Генетика 120: 819–829
  • ^ Кингмана, JFC (1982). «О генеалогии больших популяций». Журнал прикладной теории вероятностей . 19 : 27–43. CiteSeerX 10.1.1.552.1429 . DOI : 10.2307 / 3213548 . ISSN 0021-9002 . JSTOR 3213548 .   
  • ^ Кингмана, JFC (2000) Происхождение коалесцента 1974-1982 годы. Генетика 156 : 1461–1463
  • ^ Леблуа Р., Estoup А. и Руссе F. (2009) IBDSim: компьютерная программа для имитации генотипических данных под изоляцией расстояния Molecular Ecology ресурсов 9 : 107-109
  • ^ Лян Л., Zöllner С., Abecasis GR (2007) ГЕНОМОВ: быстрое коалесцент основы всего генома имитатор. Биоинформатика 23 : 1565–1567
  • ^ Mailund, Т., Schierup, МН, Педерсен, ЦНС, Mechlenborg, PJM, Madsen, Ю.Н., Schauser, Л. (2005) CoaSim: Гибкая среда для моделирования генетических данных под коалесцент Модель BMC биоинформатика 6 : 252
  • ^ Möhle, М., Сагитов, S. (2001) Классификация слитых процессов гаплоидных заменяемых моделей популяцийлетописях вероятности 29: 1547-1562
  • Morris, AP, Whittaker, JC, Balding, DJ (2002). Мелкомасштабное картирование локусов болезни через разрушенное коалесцентное моделирование генеалогий American Journal of Human Genetics 70 : 686–707
  • ^ Neuhauser, C., Krone, SM (1997) Генеалогия образцов в моделях сотборной генетикой 145 519–534
  • Перейти ↑ Pitman, J. (1999) Coalescents with multiple collationsThe Annals of Probability 27: 1870–1902
  • ^ Хардинг, Розалинд, М. 1998. Новые филогении: вводный взгляд на слияние. стр. 15–22, в Harvey, PH, Brown, AJL, Smith, JM, Nee, S. Новые способы использования новых филогений. Oxford University Press (ISBN0198549849) 
  • ^ Розенберг, Н.А., Нордборг, М. (2002) Генеалогические деревья, теория слияния и анализ генетических полиморфизмов. Nature Reviews Genetics 3: 380–390
  • ^ Сагитов, С. (1999) Общее слияние с асинхронным слиянием родовых линийЖурнал прикладной вероятности 36: 1116–1125
  • ^ Швайнсберг, Дж. (2000) Коалесценты при одновременных множественных столкновенияхЭлектронный журнал вероятностей 5: 1–50
  • ^ Слаткин М. (2001) Моделирование генеалогий выбранных аллелей в популяциях переменного размера.Генетические исследования 145: 519–534.
  • ^ Таджима, Ф. (1983) Эволюционная взаимосвязь последовательностей ДНК в конечных популяциях. Генетика 105: 437–460
  • ^ Tavare S, Balding DJ, Гриффитс RC & Доннелли P. 1997. Выведение раз сросшиеся из данных последовательностей ДНК. Генетика 145: 505–518.
  • ^ Международная рабочая группа карты SNP. 2001. Карта вариаций генома человека, содержащая 1,42 миллиона однонуклеотидных полиморфизмов. Nature 409: 928–933.
  • ^ Zöllner S. иPritchard JK(2005) Основанное на объединении ассоциативное картирование и точное картирование сложных локусов признаков Генетика 169 : 1071–1092
  • ^ Руссе Ф. и Леблуа Р. (2007) правдоподобие и приблизительный правдоподобие Анализ генетической структуры в линейной Habitat: производительность и надежность в модели Mis-спецификации молекулярной биологии и эволюции 24 : 2730-2745

Книги [ править ]

  • Hein, J; Скируп, М. Х., и Виуф, К. Генеалогия, вариация и эволюция - учебник по теории слияния . Oxford University Press , 2005. ISBN 0-19-852996-1 . 
  • Нордборг, М. (2001) Введение в теорию слияния
  • Глава 7 у Болдинга, Д., Бишопа, М., Каннингса, К., редакторов, Справочник по статистической генетике . Wiley ISBN 978-0-471-86094-5 
  • Wakeley J. (2006) Введение в теорию слияния Roberts & Co ISBN 0-9747077-5-9 Сопровождающий веб-сайт с примерами глав 
  • ^ Рис Ш. (2004). Эволюционная теория: математические и концептуальные основы. Sinauer Associates: Сандерленд, Массачусетс. См. Особенно гл. 3 для подробных выводов.
  • Берестыцкий Н. "Последние достижения в теории коалесценции" 2009 ENSAIOS Matematicos vol.16
  • Бертуан Дж. «Случайные процессы фрагментации и коагуляции»., 2006. Кембриджские исследования в области высшей математики, 102. Cambridge University Press , Кембридж, 2006. ISBN 978-0-521-86728-3 ; 
  • Питман Дж. "Комбинаторные случайные процессы" Springer (2003)

Внешние ссылки [ править ]

  • EvoMath 3: Genetic Drift and Coalescence, Briefly - обзор, с уравнениями вероятности для генетического дрейфа и графами моделирования