В популяционной генетике , неравновесие по сцеплению ( LD ) является неслучайной ассоциацией аллелей при различных локусах в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом. [1]
На неравновесие сцепления влияют многие факторы, включая отбор , скорость генетической рекомбинации , скорость мутаций , генетический дрейф , систему спаривания , структуру популяции и генетическое сцепление . В результате картина неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.
Несмотря на название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем). [1] Кроме того, нарушение равновесия по сцеплению иногда называют нарушением равновесия в гаметической фазе ; [2] однако эта концепция также применима к бесполым организмам и, следовательно, не зависит от наличия гамет .
Формальное определение [ править ]
Предположим, что среди гамет, которые образуются в популяции, воспроизводящейся половым путем, аллель A встречается с частотой в одном локусе (то есть представляет собой долю гамет с A в этом локусе), тогда как в другом локусе аллель B встречается с частотой . Аналогично, пусть будет частотой, с которой оба A и B встречаются вместе в одной и той же гамете (то есть это частота гаплотипа AB ).
Ассоциация между аллелями А и В можно рассматривать как совершенно случайно-который известен в статистике как независимость -когда возникновение одного не влияет на возникновение другого, и в этом случае вероятность того, что оба и B происходят вместе дается произведением вероятностей. Говорят, что существует неравновесное сцепление между двумя аллелями, когда оно отличается от по какой-либо причине.
Уровень неравновесия по сцеплению между A и B можно количественно оценить с помощью коэффициента неравновесия по сцеплению , который определяется как
при условии, что оба и больше нуля. Нарушение равновесия по сцеплению соответствует . В случае мы имеем и аллели и Б , как говорят, в рычажном равновесии . Нижний индекс «AB» подчеркивает, что неравновесие по сцеплению является свойством пары аллелей { A , B }, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.
Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В этом случае . Их отношения можно охарактеризовать следующим образом. [3]
Знак D в этом случае выбран произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению. [4] Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.
Нарушение равновесия по сцеплению в бесполых популяциях можно определить аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также возможно определить неравновесие по сцеплению между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике. [1]
Меры, полученные из [ править ]
Коэффициент неравновесия по сцеплению не всегда является удобной мерой неравновесия по сцеплению, поскольку диапазон его возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.
Левонтин [5] предложил нормировать D , разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:
куда
Альтернативой является коэффициент корреляции между парами локусов, выраженный как
Пример: два локуса и два аллеля [ править ]
Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:
Гаплотип | Частота |
Обратите внимание, что это относительные частоты . Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:
Аллель | Частота |
Если два локуса и аллели независимы друг от друга, то наблюдение можно выразить как « найдено и найдено». В приведенной выше таблице перечислены частоты для , и для , следовательно, частота равна и в соответствии с правилами элементарной статистики .
Отклонение наблюдаемой частоты гаплотипа от ожидаемой - это величина [6], называемая неравновесием по сцеплению [7], и обычно обозначается заглавной буквой D :
Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.
Общий | |||
Общий |
Роль рекомбинации [ править ]
В отсутствие эволюционных сил, отличных от случайного спаривания , менделевской сегрегации , случайного хромосомного ассортимента и хромосомного кроссовера (то есть при отсутствии естественного отбора , инбридинга и генетического дрейфа ), мера неравновесия сцепления сходится к нулю по оси времени с скорость в зависимости от величины скорости рекомбинации между двумя локусами.
Используя обозначения выше, мы можем продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении частота гаплотипа станет
Это следует из-за того, что часть гаплотипов в потомстве не рекомбинировала и, таким образом, является копиями случайного гаплотипа у своих родителей. Часть из них . Некоторые фракции рекомбинировали эти два локуса. Если родители являются результатом случайного спаривания, вероятность того, что копия в локусе имеет аллель равна, а вероятность копии в локусе, имеющей аллель, равна , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, они независимы события, так что вероятности можно умножить.
Эту формулу можно переписать как
так что
где у -го поколения обозначено как . Таким образом, мы имеем
Если , то так, что сходится к нулю.
Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость сходимости к нулю.
Пример: аллели лейкоцитарного антигена человека (HLA) [ править ]
HLA составляет группу антигенов клеточной поверхности, также известную как MHC человека. Поскольку гены HLA расположены в соседних локусах в конкретной области хромосомы и предположительно проявляют эпистаз друг с другом или с другими генами, значительная часть аллелей находится в неравновесном сцеплении.
Примером такого неравновесного сцепления является аллели HLA-A1 и B8 у неродственных датчан [8], на которые ссылаются Vogel и Motulsky (1997). [9]
Антиген j | Общий | ||||
---|---|---|---|---|---|
Антиген i | |||||
Общий | |||||
Кол-во лиц |
Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа. [9] [10] [11] [12]
экспрессия ( ) частота антигена :
экспрессия ( ) частота антигена :
частота гена , учитывая, что люди с генотипами '+/-', '+ / +' и '- / +' все положительны на антиген :
и
Обозначая '-' аллели у антигена i как x , а у антигена j как y , наблюдаемая частота гаплотипа xy равна
а оценочная частота гаплотипа xy равна
Тогда мера LD выражается как
Стандартные ошибки получаются следующим образом:
Тогда, если
превышает 2 по абсолютной величине, величина статистически значимо велика. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.
Аллели HLA-A i | Аллели HLA-B j | ||
---|---|---|---|
A1 | B8 | 0,065 | 16.0 |
A3 | B7 | 0,039 | 10,3 |
A2 | Bw40 | 0,013 | 4.4 |
A2 | Bw15 | 0,01 | 3,4 |
A1 | Bw17 | 0,014 | 5,4 |
A2 | B18 | 0,006 | 2.2 |
A2 | Bw35 | -0,009 | −2,3 |
A29 | B12 | 0,013 | 6.0 |
A10 | Bw16 | 0,013 | 5.9 |
В таблице 2 показаны некоторые комбинации аллелей HLA-A и B, при которых значительная LD наблюдалась среди панъевропейцев. [12]
Vogel и Motulsky (1997) [9] утверждали, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы рассуждаем аналогично Фогелю и Мотульскому. В случае, если показатель LD составлял 0,003 у панъевропейцев в списке Mittal [12], это в основном несущественно. Если бы снизилось с 0,07 до 0,003 под действием рекомбинации, как показано , то . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие сцепления между локусами HLA-A и B может указывать на своего рода интерактивный отбор. [9]
Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном предрасположенности к заболеванию соответствует любому из следующих явлений:
- Относительный риск для человека, имеющего конкретный аллель HLA, заболеть определенным заболеванием больше 1. [13]
- Частота встречаемости антигена HLA среди пациентов превышает таковую среди здорового населения. По значению [14] это значение превышает 0.
Анкилозирующий спондилоартрит | Общий | |||
---|---|---|---|---|
Пациенты | Здоровый контроль | |||
Аллели HLA | ||||
Общий |
- Таблица ассоциации 2 × 2 пациентов и здоровых людей из контрольной группы с аллелями HLA показывает значительное отклонение от состояния равновесия, выведенного из предельных частот.
(1) Относительный риск
Относительный риск аллеля HLA для заболевания приблизительно равен отношению шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения. [15] Относительный риск этого аллеля приблизительно равен
Для проверки наличия статистической значимости применяется метод Вулфа [16] . Позволять
и
потом
следует распределению хи-квадрат с . По данным таблицы 3 значимая связь существует на уровне 0,1%. Модификация Холдейна [17] применима к случаю, когда любое из равно нулю, где и заменяются на
и
соответственно.
Болезнь | Аллель HLA | Относительный риск (%) | FAD (%) | ФАП (%) | |
---|---|---|---|---|---|
Анкилозирующий спондилоартрит | B27 | 90 | 90 | 8 | 0,89 |
Реактивный артрит | B27 | 40 | 70 | 8 | 0,67 |
Спондилит при воспалительном заболевании кишечника | B27 | 10 | 50 | 8 | 0,46 |
Ревматоидный артрит | DR4 | 6 | 70 | 30 | 0,57 |
Системная красная волчанка | DR3 | 3 | 45 | 20 | 0,31 |
Рассеянный склероз | DR2 | 4 | 60 | 20 | 0,5 |
Сахарный диабет 1 типа | DR4 | 6 | 75 | 30 | 0,64 |
В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями. [13]
(1a) Превышение частоты аллелей среди пациентов над контрольной группой
Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, только величина относительного риска не могла определить силу ассоциации. [14] значение выражается
где и - частоты аллелей HLA среди пациентов и здоровых популяций соответственно. [14] В таблице 4 к этой цитате добавлен столбец. Помимо 2 заболеваний с высоким относительным риском, оба из которых также имеют высокие значения, среди других болезней ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4 даже при низком относительном риске .
(2) Расхождения с ожидаемыми значениями из предельных частот в таблице ассоциаций 2 × 2 аллелей HLA и заболевания
Это можно подтвердить тестовым расчетом.
где . Для данных с небольшим размером выборки, например, когда предельная сумма не превышает 15 (и, следовательно, ), следует использовать поправку Йейтса на непрерывность или точный критерий Фишера . [18]
Ресурсы [ править ]
Сравнение различных показателей LD осуществляется Devlin & Risch [19].
Международный проект HapMap позволяет изучать LD в популяциях человека онлайн . Проект Ensembl объединяет данные HapMap с другой генетической информацией из dbSNP .
Программное обеспечение для анализа [ править ]
- PLINK - набор инструментов для анализа ассоциации всего генома, который, помимо прочего, может рассчитывать LD
- LDHat
- Haploview
- LdCompare [20] - программа с открытым исходным кодом для расчета LD.
- SNP и Variation Suite - коммерческое программное обеспечение с интерактивным графиком LD.
- ЗОЛОТО - Графический обзор неравновесия сцепления
- TASSEL - программа для оценки неравновесия по сцеплению, ассоциаций черт и закономерностей эволюции
- rAggr - находит прокси-маркеры (SNP и инделки), которые находятся в неравновесном сцеплении с набором запрашиваемых маркеров, используя базы данных генотипов 1000 Genomes Project и HapMap .
- SNeP - быстрое вычисление LD и Ne для больших наборов данных генотипа в формате PLINK.
- LDlink - набор веб-приложений для простого и эффективного изучения неравновесия по связям в подгруппах населения. Все данные о генотипах популяции взяты из фазы 3 проекта 1000 Genomes Project, а номера вариантов RS индексируются на основе сборки 151 dbSNP.
Программное обеспечение для моделирования [ править ]
- Haploid - C- библиотека для популяционного генетического моделирования ( GPL )
См. Также [ править ]
- Haploview
- Принцип Харди – Вайнберга
- Генетическая связь
- Коадаптация
- Генеалогический ДНК-тест
- Тег SNP
- Сопоставление ассоциаций
- Отображение QTL на основе семейства
Ссылки [ править ]
- ^ a b c Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего» . Природа Обзоры Генетики . 9 (6): 477–485. DOI : 10.1038 / nrg2361 . PMC 5124487 . PMID 18427557 .
- ^ Фальконер, DS; Маккей, TFC (1996). Введение в количественную генетику (4-е изд.). Харлоу, Эссекс, Великобритания: Эддисон Уэсли Лонгман. ISBN 978-0-582-24302-6.
- ^ Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего» . Природа Обзоры Генетики . 9 (6): 477–485. DOI : 10.1038 / nrg2361 . ISSN 1471-0056 . PMC 5124487 . PMID 18427557 .
- ^ Калабрезе, Барбара (2019-01-01), Ранганатан, Шоба; Грибсков Михаил; Накаи, Кента; Schönbach, Кристиан (ред.), "Неравновесное сцепление" , Энциклопедия биоинформатики и вычислительной биологии , Оксфорд:. Academic Press, стр 763-765, DOI : 10.1016 / b978-0-12-809633-8.20234-3 , ISBN 978-0-12-811432-2, получено 21.10.2020
- ^ Левонтин, RC (1964). «Взаимодействие отбора и сцепления. I. Общие соображения; гетеротические модели» . Генетика . 49 (1): 49–67. PMC 1210557 . PMID 17248194 .
- ↑ Роббинс, РБ (1 июля 1918 г.). «Некоторые приложения математики к проблемам разведения III» . Генетика . 3 (4): 375–389. PMC 1200443 . PMID 17245911 .
- ^ RC Левонтин и К. Kojima (1960). «Эволюционная динамика сложных полиморфизмов». Эволюция . 14 (4): 458–472. DOI : 10.2307 / 2405995 . ISSN 0014-3820 . JSTOR 2405995 .
- ^ a b Свейгаард А., Хауге М., Джерсилд С., Плаз П., Райдер Л.П., Стауб Нильсен Л., Томсен М. (1979). Система HLA: вводный обзор, 2-е изд. Базель; Лондон; Чичестер: Каргер; Распространяется Wiley, ISBN 3805530498 (pbk).
- ^ a b c d Фогель Ф, Мотульский А.Г. (1997). Генетика человека: проблемы и подходы, 3-е изд. Берлин; Лондон: Springer, ISBN 3-540-60290-9 .
- Перейти ↑ Mittal KK, Hasegawa T, Ting A, Mickey MR, Terasaki PI (1973). «Генетические вариации в системе HL-A у айнов, японцев и кавказцев», In Dausset J, Colombani J, eds. Тестирование гистосовместимости, 1972, стр. 187–195, Копенгаген: Munksgaard, ISBN 87-16-01101-5 .
- ^ Ясуда, N; Цудзи, К. (июнь 1975 г.). «Метод подсчета максимальной вероятности для оценки частоты гаплотипов в системе HL-A». Jinrui Idengaku Zasshi . 20 (1): 1–15. PMID 1237691 .
- ^ а б в г Миттал, К.К. (1976). «Полиморфизм HLA и подверженность заболеваниям». Vox Sang . 31? -73 (3): 161–73. DOI : 10.1111 / j.1423-0410.1976.tb02206.x . PMID 969389 .
- ^ a b c Грегерсен П.К. (2009). «Генетика ревматических заболеваний», в Firestein GS, Budd RC, Harris ED Jr, McInnes IB, Ruddy S, Sergent JS, eds. (2009). Учебник ревматологии Келли, стр. 305-321, Филадельфия, Пенсильвания: Saunders / Elsevier, ISBN 978-1-4160-3285-4 .
- ^ a b c Bengtsson, BO; Томсон, Г. (ноябрь 1981 г.). «Измерение силы ассоциаций между антигенами HLA и заболеваниями». Тканевые антигены . 18 (5): 356–63. DOI : 10.1111 / j.1399-0039.1981.tb01404.x . PMID 7344182 .
- ^ a b Nijenhuis, LE (сентябрь 1977 г.). «Генетические соображения о связи между HLA и заболеванием». Гм. Genet . 38 (2): 175–82. DOI : 10.1007 / bf00527400 . PMID 908564 .
- ↑ Вульф, B (июнь 1955 г.). «Об оценке связи между группой крови и заболеванием». Анна. Гм. Genet . 19 (4): 251–3. DOI : 10.1111 / j.1469-1809.1955.tb01348.x . PMID 14388528 .
- Перейти ↑ Haldane, JB (май 1956). «Оценка и значение логарифма отношения частот». Анна. Гм. Genet . 20 (4): 309–11. DOI : 10.1111 / j.1469-1809.1955.tb01285.x . PMID 13314400 .
- ^ Сокаль RR, Rohlf FJ (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: WH Freeman, ISBN 0-7167-1254-7 .
- ^ Devlin B .; Риш Н. (1995). «Сравнение показателей неравновесия сцепления для мелкомасштабного картирования» (PDF) . Геномика . 29 (2): 311–322. CiteSeerX 10.1.1.319.9349 . DOI : 10.1006 / geno.1995.9003 . PMID 8666377 .
- ^ Хао К .; Di X .; Коули С. (2007). «LdCompare: быстрое вычисление одно- и множественных маркеров r2 и генетического покрытия» . Биоинформатика . 23 (2): 252–254. DOI : 10.1093 / биоинформатики / btl574 . PMID 17148510 .
Дальнейшее чтение [ править ]
- Хедрик, Филип В. (2005). Генетика популяций (3-е изд.). Садбери, Бостон, Торонто, Лондон, Сингапур: издательство «Джонс и Бартлетт». ISBN 978-0-7637-4772-5.
- Библиография: Анализ неравновесия по сцеплению: библиография из более чем тысячи статей о неравновесии по сцеплению, опубликованных с 1918 года.