Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В популяционной генетике , неравновесие по сцеплению ( LD ) является неслучайной ассоциацией аллелей при различных локусах в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом. [1]

На неравновесие сцепления влияют многие факторы, включая отбор , скорость генетической рекомбинации , скорость мутаций , генетический дрейф , систему спаривания , структуру популяции и генетическое сцепление . В результате картина неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.

Несмотря на название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем). [1] Кроме того, нарушение равновесия по сцеплению иногда называют нарушением равновесия в гаметической фазе ; [2] однако эта концепция также применима к бесполым организмам и, следовательно, не зависит от наличия гамет .

Формальное определение [ править ]

Предположим, что среди гамет, которые образуются в популяции, воспроизводящейся половым путем, аллель A встречается с частотой в одном локусе (то есть представляет собой долю гамет с A в этом локусе), тогда как в другом локусе аллель B встречается с частотой . Аналогично, пусть будет частотой, с которой оба A и B встречаются вместе в одной и той же гамете (то есть это частота гаплотипа AB ).

Ассоциация между аллелями А и В можно рассматривать как совершенно случайно-который известен в статистике как независимость -когда возникновение одного не влияет на возникновение другого, и в этом случае вероятность того, что оба и B происходят вместе дается произведением вероятностей. Говорят, что существует неравновесное сцепление между двумя аллелями, когда оно отличается от по какой-либо причине.

Уровень неравновесия по сцеплению между A и B можно количественно оценить с помощью коэффициента неравновесия по сцеплению , который определяется как

при условии, что оба и больше нуля. Нарушение равновесия по сцеплению соответствует . В случае мы имеем и аллели и Б , как говорят, в рычажном равновесии . Нижний индекс «AB» подчеркивает, что неравновесие по сцеплению является свойством пары аллелей { A , B }, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.

Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В этом случае . Их отношения можно охарактеризовать следующим образом. [3]

Знак D в этом случае выбран произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению. [4] Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.

Нарушение равновесия по сцеплению в бесполых популяциях можно определить аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также возможно определить неравновесие по сцеплению между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике. [1]

Меры, полученные из [ править ]

Коэффициент неравновесия по сцеплению не всегда является удобной мерой неравновесия по сцеплению, поскольку диапазон его возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.

Левонтин [5] предложил нормировать D , разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:

куда

Альтернативой является коэффициент корреляции между парами локусов, выраженный как

Пример: два локуса и два аллеля [ править ]

Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:

Обратите внимание, что это относительные частоты . Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:

Если два локуса и аллели независимы друг от друга, то наблюдение можно выразить как « найдено и найдено». В приведенной выше таблице перечислены частоты для , и для , следовательно, частота равна и в соответствии с правилами элементарной статистики .

Отклонение наблюдаемой частоты гаплотипа от ожидаемой - это величина [6], называемая неравновесием по сцеплению [7], и обычно обозначается заглавной буквой  D :

Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.

Роль рекомбинации [ править ]

В отсутствие эволюционных сил, отличных от случайного спаривания , менделевской сегрегации , случайного хромосомного ассортимента и хромосомного кроссовера (то есть при отсутствии естественного отбора , инбридинга и генетического дрейфа ), мера неравновесия сцепления сходится к нулю по оси времени с скорость в зависимости от величины скорости рекомбинации между двумя локусами.

Используя обозначения выше, мы можем продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении частота гаплотипа станет

Это следует из-за того, что часть гаплотипов в потомстве не рекомбинировала и, таким образом, является копиями случайного гаплотипа у своих родителей. Часть из них . Некоторые фракции рекомбинировали эти два локуса. Если родители являются результатом случайного спаривания, вероятность того, что копия в локусе имеет аллель равна, а вероятность копии в локусе, имеющей аллель, равна , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, они независимы события, так что вероятности можно умножить.

Эту формулу можно переписать как

так что

где у -го поколения обозначено как . Таким образом, мы имеем

Если , то так, что сходится к нулю.

Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость сходимости к нулю.

Пример: аллели лейкоцитарного антигена человека (HLA) [ править ]

HLA составляет группу антигенов клеточной поверхности, также известную как MHC человека. Поскольку гены HLA расположены в соседних локусах в конкретной области хромосомы и предположительно проявляют эпистаз друг с другом или с другими генами, значительная часть аллелей находится в неравновесном сцеплении.

Примером такого неравновесного сцепления является аллели HLA-A1 и B8 у неродственных датчан [8], на которые ссылаются Vogel и Motulsky (1997). [9]

Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа. [9] [10] [11] [12]

экспрессия ( ) частота антигена  :

экспрессия ( ) частота антигена  :

частота гена , учитывая, что люди с генотипами '+/-', '+ / +' и '- / +' все положительны на антиген :

и

Обозначая '-' аллели у антигена i как x , а у антигена j как y , наблюдаемая частота гаплотипа xy равна

а оценочная частота гаплотипа xy равна

Тогда мера LD выражается как

Стандартные ошибки получаются следующим образом:

Тогда, если

превышает 2 по абсолютной величине, величина статистически значимо велика. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.

В таблице 2 показаны некоторые комбинации аллелей HLA-A и B, при которых значительная LD наблюдалась среди панъевропейцев. [12]

Vogel и Motulsky (1997) [9] утверждали, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы рассуждаем аналогично Фогелю и Мотульскому. В случае, если показатель LD составлял 0,003 у панъевропейцев в списке Mittal [12], это в основном несущественно. Если бы снизилось с 0,07 до 0,003 под действием рекомбинации, как показано , то . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие сцепления между локусами HLA-A и B может указывать на своего рода интерактивный отбор. [9]

Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном предрасположенности к заболеванию соответствует любому из следующих явлений:

  • Относительный риск для человека, имеющего конкретный аллель HLA, заболеть определенным заболеванием больше 1. [13]
  • Частота встречаемости антигена HLA среди пациентов превышает таковую среди здорового населения. По значению [14] это значение превышает 0.
  • Таблица ассоциации 2 × 2 пациентов и здоровых людей из контрольной группы с аллелями HLA показывает значительное отклонение от состояния равновесия, выведенного из предельных частот.

(1) Относительный риск

Относительный риск аллеля HLA для заболевания приблизительно равен отношению шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения. [15] Относительный риск этого аллеля приблизительно равен

Для проверки наличия статистической значимости применяется метод Вулфа [16] . Позволять

и

потом

следует распределению хи-квадрат с . По данным таблицы 3 значимая связь существует на уровне 0,1%. Модификация Холдейна [17] применима к случаю, когда любое из равно нулю, где и заменяются на

и

соответственно.

В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями. [13]

(1a) Превышение частоты аллелей среди пациентов над контрольной группой

Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, только величина относительного риска не могла определить силу ассоциации. [14] значение выражается

где и - частоты аллелей HLA среди пациентов и здоровых популяций соответственно. [14] В таблице 4 к этой цитате добавлен столбец. Помимо 2 заболеваний с высоким относительным риском, оба из которых также имеют высокие значения, среди других болезней ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4 даже при низком относительном риске .

(2) Расхождения с ожидаемыми значениями из предельных частот в таблице ассоциаций 2 × 2 аллелей HLA и заболевания

Это можно подтвердить тестовым расчетом.

где . Для данных с небольшим размером выборки, например, когда предельная сумма не превышает 15 (и, следовательно, ), следует использовать поправку Йейтса на непрерывность или точный критерий Фишера . [18]

Ресурсы [ править ]

Сравнение различных показателей LD осуществляется Devlin & Risch [19].

Международный проект HapMap позволяет изучать LD в популяциях человека онлайн . Проект Ensembl объединяет данные HapMap с другой генетической информацией из dbSNP .

Программное обеспечение для анализа [ править ]

  • PLINK - набор инструментов для анализа ассоциации всего генома, который, помимо прочего, может рассчитывать LD
  • LDHat
  • Haploview
  • LdCompare [20] - программа с открытым исходным кодом для расчета LD.
  • SNP и Variation Suite - коммерческое программное обеспечение с интерактивным графиком LD.
  • ЗОЛОТО - Графический обзор неравновесия сцепления
  • TASSEL - программа для оценки неравновесия по сцеплению, ассоциаций черт и закономерностей эволюции
  • rAggr - находит прокси-маркеры (SNP и инделки), которые находятся в неравновесном сцеплении с набором запрашиваемых маркеров, используя базы данных генотипов 1000 Genomes Project и HapMap .
  • SNeP - быстрое вычисление LD и Ne для больших наборов данных генотипа в формате PLINK.
  • LDlink - набор веб-приложений для простого и эффективного изучения неравновесия по связям в подгруппах населения. Все данные о генотипах популяции взяты из фазы 3 проекта 1000 Genomes Project, а номера вариантов RS индексируются на основе сборки 151 dbSNP.

Программное обеспечение для моделирования [ править ]

  • Haploid - C- библиотека для популяционного генетического моделирования ( GPL )

См. Также [ править ]

  • Haploview
  • Принцип Харди – Вайнберга
  • Генетическая связь
  • Коадаптация
  • Генеалогический ДНК-тест
  • Тег SNP
  • Сопоставление ассоциаций
  • Отображение QTL на основе семейства

Ссылки [ править ]

  1. ^ a b c Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего» . Природа Обзоры Генетики . 9 (6): 477–485. DOI : 10.1038 / nrg2361 . PMC  5124487 . PMID  18427557 .
  2. ^ Фальконер, DS; Маккей, TFC (1996). Введение в количественную генетику (4-е изд.). Харлоу, Эссекс, Великобритания: Эддисон Уэсли Лонгман. ISBN 978-0-582-24302-6.
  3. ^ Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего» . Природа Обзоры Генетики . 9 (6): 477–485. DOI : 10.1038 / nrg2361 . ISSN 1471-0056 . PMC 5124487 . PMID 18427557 .   
  4. ^ Калабрезе, Барбара (2019-01-01), Ранганатан, Шоба; Грибсков Михаил; Накаи, Кента; Schönbach, Кристиан (ред.), "Неравновесное сцепление" , Энциклопедия биоинформатики и вычислительной биологии , Оксфорд:. Academic Press, стр 763-765, DOI : 10.1016 / b978-0-12-809633-8.20234-3 , ISBN 978-0-12-811432-2, получено 21.10.2020
  5. ^ Левонтин, RC (1964). «Взаимодействие отбора и сцепления. I. Общие соображения; гетеротические модели» . Генетика . 49 (1): 49–67. PMC 1210557 . PMID 17248194 .  
  6. Роббинс, РБ (1 июля 1918 г.). «Некоторые приложения математики к проблемам разведения III» . Генетика . 3 (4): 375–389. PMC 1200443 . PMID 17245911 .  
  7. ^ RC Левонтин и К. Kojima (1960). «Эволюционная динамика сложных полиморфизмов». Эволюция . 14 (4): 458–472. DOI : 10.2307 / 2405995 . ISSN 0014-3820 . JSTOR 2405995 .  
  8. ^ a b Свейгаард А., Хауге М., Джерсилд С., Плаз П., Райдер Л.П., Стауб Нильсен Л., Томсен М. (1979). Система HLA: вводный обзор, 2-е изд. Базель; Лондон; Чичестер: Каргер; Распространяется Wiley, ISBN 3805530498 (pbk). 
  9. ^ a b c d Фогель Ф, Мотульский А.Г. (1997). Генетика человека: проблемы и подходы, 3-е изд. Берлин; Лондон: Springer, ISBN 3-540-60290-9 . 
  10. Перейти ↑ Mittal KK, Hasegawa T, Ting A, Mickey MR, Terasaki PI (1973). «Генетические вариации в системе HL-A у айнов, японцев и кавказцев», In Dausset J, Colombani J, eds. Тестирование гистосовместимости, 1972, стр. 187–195, Копенгаген: Munksgaard, ISBN 87-16-01101-5 . 
  11. ^ Ясуда, N; Цудзи, К. (июнь 1975 г.). «Метод подсчета максимальной вероятности для оценки частоты гаплотипов в системе HL-A». Jinrui Idengaku Zasshi . 20 (1): 1–15. PMID 1237691 . 
  12. ^ а б в г Миттал, К.К. (1976). «Полиморфизм HLA и подверженность заболеваниям». Vox Sang . 31? -73 (3): 161–73. DOI : 10.1111 / j.1423-0410.1976.tb02206.x . PMID 969389 . 
  13. ^ a b c Грегерсен П.К. (2009). «Генетика ревматических заболеваний», в Firestein GS, Budd RC, Harris ED Jr, McInnes IB, Ruddy S, Sergent JS, eds. (2009). Учебник ревматологии Келли, стр. 305-321, Филадельфия, Пенсильвания: Saunders / Elsevier, ISBN 978-1-4160-3285-4 . 
  14. ^ a b c Bengtsson, BO; Томсон, Г. (ноябрь 1981 г.). «Измерение силы ассоциаций между антигенами HLA и заболеваниями». Тканевые антигены . 18 (5): 356–63. DOI : 10.1111 / j.1399-0039.1981.tb01404.x . PMID 7344182 . 
  15. ^ a b Nijenhuis, LE (сентябрь 1977 г.). «Генетические соображения о связи между HLA и заболеванием». Гм. Genet . 38 (2): 175–82. DOI : 10.1007 / bf00527400 . PMID 908564 . 
  16. Вульф, B (июнь 1955 г.). «Об оценке связи между группой крови и заболеванием». Анна. Гм. Genet . 19 (4): 251–3. DOI : 10.1111 / j.1469-1809.1955.tb01348.x . PMID 14388528 . 
  17. Перейти ↑ Haldane, JB (май 1956). «Оценка и значение логарифма отношения частот». Анна. Гм. Genet . 20 (4): 309–11. DOI : 10.1111 / j.1469-1809.1955.tb01285.x . PMID 13314400 . 
  18. ^ Сокаль RR, Rohlf FJ (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: WH Freeman, ISBN 0-7167-1254-7 . 
  19. ^ Devlin B .; Риш Н. (1995). «Сравнение показателей неравновесия сцепления для мелкомасштабного картирования» (PDF) . Геномика . 29 (2): 311–322. CiteSeerX 10.1.1.319.9349 . DOI : 10.1006 / geno.1995.9003 . PMID 8666377 .   
  20. ^ Хао К .; Di X .; Коули С. (2007). «LdCompare: быстрое вычисление одно- и множественных маркеров r2 и генетического покрытия» . Биоинформатика . 23 (2): 252–254. DOI : 10.1093 / биоинформатики / btl574 . PMID 17148510 . 

Дальнейшее чтение [ править ]

  • Хедрик, Филип В. (2005). Генетика популяций (3-е изд.). Садбери, Бостон, Торонто, Лондон, Сингапур: издательство «Джонс и Бартлетт». ISBN 978-0-7637-4772-5.
  • Библиография: Анализ  неравновесия по сцеплению: библиография из более чем тысячи статей о неравновесии по сцеплению, опубликованных с 1918 года.