Проект « 1000 геномов» (сокращенно 1KGP ), запущенный в январе 2008 года, представлял собой международное исследовательское усилие по созданию наиболее подробного каталога генетических вариаций человека . Ученые планировали последовательности в геном , по меньшей мере , одной тысячи анонимных участников из числа различных этнических групп в течение следующих трех лет, с использованием недавно разработанные технологий , которые были быстрее и дешевле. В 2010 году проект завершил пилотную фазу, о которой подробно рассказано в публикации в журнале Nature . [1] В 2012 году в журнале Nature было объявлено о секвенировании 1092 геномов.публикация. [2] В 2015 году в двух статьях в журнале « Nature» сообщалось о результатах, завершении проекта и возможностях для будущих исследований. [3] [4]
Было идентифицировано много редких вариаций, ограниченных близкородственными группами, и проанализировано восемь структурно-вариационных классов. [5]
Проект объединяет мультидисциплинарные исследовательские группы из институтов со всего мира, включая Китай , Италию , Японию , Кению , Нигерию , Перу , Великобританию и США . Каждый из них внесет свой вклад в огромный набор данных о последовательностях и уточненную карту генома человека , которая будет доступна через общедоступные базы данных как для научного сообщества, так и для широкой публики. [2]
Предоставляя обзор всех генетических вариаций человека, консорциум создаст ценный инструмент для всех областей биологической науки, особенно в областях генетики , медицины , фармакологии , биохимии и биоинформатики . [6]
Задний план
После завершения проекта « Геном человека» достижения в области популяционной генетики человека и сравнительной геномики позволили лучше понять природу генетического разнообразия. [7] Однако мы только начинаем понимать, как такие процессы, как случайная выборка гамет , структурные вариации (вставки / делеции ( инделки ), вариации числа копий (CNV), ретроэлементы ), однонуклеотидные полиморфизмы (SNP) и естественные отбор сформировал уровень и характер изменчивости внутри видов, а также между видами. [8] [9] [10] [11]
Генетическая изменчивость человека
Случайная выборка гамет во время полового размножения приводит к генетическому дрейфу - случайным колебаниям популяционной частоты признака - в последующих поколениях и может привести к потере всех вариаций в отсутствие внешнего влияния. Постулируется, что скорость генетического дрейфа обратно пропорциональна размеру популяции и что она может быть ускорена в определенных ситуациях, таких как узкие места , когда размер популяции сокращается на определенный период времени, и за счет эффекта основателя (особи в популяция восходит к небольшому числу основателей). [8]
Анзай и др. продемонстрировали, что индели составляют 90,4% всех наблюдаемых вариаций в последовательности главного локуса гистосовместимости (MHC) между людьми и шимпанзе . После учета нескольких инделей высокая степень геномного сходства между двумя видами (98,6% идентичности нуклеотидных последовательностей ) снижается до 86,7%. Например, большое удаление 95 т.п.н. (кб) между локусами человеческого MICA и MICB генов , приводит к шимпанзе одиночной гибридной MIC гена, связывающие этот регион обработки нескольких видовой специфики ретровирусных инфекций , и полученную в результате восприимчивости к различные аутоиммунные заболевания . Авторы заключают, что вместо более тонких SNP, индели были движущим механизмом в видообразовании приматов. [9]
Помимо мутаций , SNP и другие структурные варианты, такие как варианты числа копий (CNV), вносят вклад в генетическое разнообразие в человеческих популяциях. Используя микроматрицы , в коллекции образцов HapMap было идентифицировано почти 1500 вариабельных областей с числом копий, покрывающих около 12% генома и содержащих сотни генов, болезненных локусов, функциональных элементов и сегментарных дупликаций . Хотя специфическая функция CNVs остается неуловимой, тот факт, что CNVs охватывают большее количество нуклеотидов на геном, чем SNP, подчеркивает важность CNVs в генетическом разнообразии и эволюции. [10]
Изучение вариаций генома человека имеет большой потенциал для выявления генов, которые могут лежать в основе различий в устойчивости к болезням (например, в области MHC ) или метаболизме лекарств . [12]
Естественный отбор
Естественный отбор в эволюции признака можно разделить на три класса. Направленный или положительный отбор относится к ситуации, когда определенный аллель имеет большую пригодность, чем другие аллели , что, следовательно, увеличивает его популяционную частоту (например, устойчивость бактерий к антибиотикам ). Напротив, стабилизирующий или отрицательный отбор (также известный как очищающий отбор) снижает частоту или даже удаляет аллели из популяции из-за связанных с ним недостатков по сравнению с другими аллелями. Наконец, существует ряд форм уравновешивающего отбора ; они увеличивают генетическую изменчивость внутри вида за счет чрезмерного доминирования ( гетерозиготные особи более приспособлены, чем гомозиготные , например, G6PD , ген, который участвует как в гемолитической анемии, так и в устойчивости к малярии ) или могут пространственно различаться в пределах одного вида, который обитает в разных нишах, таким образом отдавая предпочтение разным нишам. аллели. [13] Некоторые геномные различия могут не влиять на физическую форму. Нейтральная изменчивость, ранее считавшаяся «мусорной» ДНК, не подвержена влиянию естественного отбора, что приводит к более высокой генетической изменчивости на таких участках по сравнению с участками, где вариации действительно влияют на приспособленность. [14]
Не совсем ясно, как естественный отбор сформировал популяционные различия; однако генетические области-кандидаты в процессе отбора были идентифицированы недавно. [11] Паттерны полиморфизма ДНК могут использоваться для надежного обнаружения признаков отбора и могут помочь идентифицировать гены, которые могут лежать в основе вариабельности устойчивости к болезням или метаболизма лекарств. [13] [14] Barreiro et al. обнаружили доказательства того, что отрицательный отбор снизил дифференциацию популяции на уровне изменения аминокислот (особенно в генах, связанных с заболеванием), тогда как положительный отбор обеспечил региональную адаптацию популяций человека за счет увеличения дифференциации популяций в областях генов (в основном несинонимичных и 5'- варианты нетранслируемой области ). [11]
Считается, что наиболее сложные и менделевские заболевания (за исключением болезней с поздним началом, если предположить, что пожилые люди больше не влияют на пригодность их потомства) будут влиять на выживание и / или воспроизводство, поэтому генетические факторы, лежащие в основе этих заболеваний, должны быть под влиянием естественного отбора. Хотя заболевания, которые сегодня проявились поздно, могли быть детскими болезнями в прошлом, поскольку гены, замедляющие прогрессирование болезни, могли пройти отбор. Болезнь Гоше (мутации в GBA гена), болезнь Крона (мутация NOD2 ) и семейной гипертрофической кардиомиопатии (мутации в MYH7 , TNNT2 , TPM1 и MYBPC3 ) являются примерами негативной селекции. Эти болезненные мутации в основном рецессивны и сегрегируют, как и ожидалось, с низкой частотой, что подтверждает гипотезу об отрицательном отборе. Есть свидетельства того, что генетическая основа диабета 1 типа могла пройти положительный отбор. [15] Сообщалось о нескольких случаях, когда вызывающие заболевание мутации проявлялись с высокой частотой, поддерживаемой сбалансированным отбором. Наиболее ярким примером являются мутации локуса G6PD , когда гомозиготный дефицит фермента G6PD и, следовательно, приводит к гемолитической анемии , но в гетерозиготном состоянии частично защищают от малярии . Другие возможные объяснения сегрегации аллелей болезней с умеренной или высокой частотой включают генетический дрейф и недавние изменения в сторону положительного отбора из-за изменений окружающей среды, таких как диета или генетический автостоп . [12]
Полногеномный сравнительный анализ различных популяций человека, а также между видами (например, человек по сравнению с шимпанзе) помогает нам понять взаимосвязь между болезнями и отбором и предоставляет доказательства мутаций в ограниченных генах, которые непропорционально связаны с наследственными фенотипами болезней . Гены, вовлеченные в сложные расстройства, обычно подвергаются менее негативному отбору, чем гены менделевской болезни или гены, не являющиеся болезнями. [12]
Описание Проекта
Цели
Есть два вида генетических вариантов, связанных с заболеванием. Первые - это редкие генетические варианты, которые оказывают серьезное влияние преимущественно на простые признаки (например, муковисцидоз , болезнь Хантингтона ). Вторые, более распространенные, генетические варианты обладают мягким эффектом и, как считается, связаны со сложными признаками (например, когнитивными способностями , диабетом , сердечными заболеваниями ). Между этими двумя типами генетических вариантов лежит значительный пробел в знаниях, который призван устранить проект «1000 геномов». [6]
Основная цель этого проекта - создать полный и подробный каталог генетических вариаций человека , который, в свою очередь, может быть использован для ассоциативных исследований, связывающих генетические вариации с болезнями. Таким образом, консорциум стремится обнаружить> 95% вариантов (например, SNP, CNV, indels) с частотами минорных аллелей всего 1% по геному и 0,1-0,5% в областях генов, а также оценить популяцию. частоты, фон гаплотипов и паттерны неравновесия сцепления вариантных аллелей. [16]
Вторичные цели будут включать поддержку лучшего выбора SNP и зондов для платформ генотипирования в будущих исследованиях, а также улучшение эталонной последовательности человека . Кроме того, завершенная база данных будет полезным инструментом для изучения регионов, находящихся в процессе отбора, изменчивости в нескольких популяциях и понимания основных процессов мутации и рекомбинации . [16]
Контур
Геном человека состоит из приблизительно 3 миллиарда пар оснований ДНК и, по оценкам перевозить около 20000 белковых кодирующих генов . При разработке исследования консорциуму необходимо было решить несколько критических вопросов, касающихся показателей проекта, таких как технологические проблемы, стандарты качества данных и охват последовательности. [16]
В течение следующих трех лет [ необходимы разъяснения ] ученые из Института Сэнгера , BGI Shenzhen и крупномасштабной сети секвенирования Национального института генома человека планируют секвенировать минимум 1000 геномов человека. Из-за большого количества данных о последовательности, которые необходимо сгенерировать и проанализировать, возможно, что со временем могут быть привлечены другие участники. [6]
Ежедневно в течение двухлетнего периода производства будет обрабатываться почти 10 миллиардов баз. Это соответствует более чем двум человеческим геномам каждые 24 часа; новаторский потенциал. Бросая вызов ведущим специалистам в области биоинформатики и статистической генетики, набор данных последовательностей будет включать 6 триллионов оснований ДНК, что в 60 раз больше данных о последовательностях, чем то, что было опубликовано в базах данных ДНК за последние 25 лет. [6]
Для определения окончательного дизайна всего проекта были разработаны три пилотных исследования, которые будут проведены в течение первого года реализации проекта. Первый пилотный проект предполагает генотипирование 180 человек из 3 основных географических групп при низком охвате (2x). Для второго пилотного исследования геномы двух ядерных семей (обоих родителей и взрослого ребенка) будут секвенированы с глубоким охватом (20x на геном). Третье пилотное исследование включает секвенирование кодирующих областей (экзонов) 1000 генов у 1000 человек с глубоким охватом (20x). [6] [16]
Было подсчитано, что проект, вероятно, будет стоить более 500 миллионов долларов, если будут использоваться стандартные технологии секвенирования ДНК. Поэтому будет применено несколько новых технологий (например, Solexa , 454 , SOLiD ), что снизит ожидаемые затраты до 30-50 миллионов долларов. Основная поддержка будет предоставлена Институтом Сэнгера Wellcome Trust в Хинкстоне, Англия; Genomics институт Пекин , Шэньчжэнь (BGI Shenzhen), Китай; и NHGRI , часть Национального института здоровья (NIH). [6]
В соответствии с принципами Форт-Лодердейла. Архивировано 28 декабря 2013 г. на Wayback Machine. Все данные о последовательности генома (включая вызовы вариантов) находятся в свободном доступе по мере развития проекта и могут быть загружены по ftp с веб-страницы проекта « 1000 геномов» .
Образцы генома человека
Основываясь на общих целях проекта, образцы будут отобраны, чтобы предоставить данные о группах населения , в которых проводятся ассоциативные исследования распространенных заболеваний. Кроме того, в образцах не обязательно должна быть медицинская информация или информация о фенотипе, поскольку предлагаемый каталог будет основным источником информации о человеческих вариациях. [16]
Для пилотных исследований будут секвенированы образцы генома человека из коллекции HapMap . Будет полезно сосредоточиться на образцах, которые имеют дополнительные данные (такие как последовательность ENCODE , генотипы по всему геному, последовательность фосмидных концов, анализы структурных вариаций и экспрессия генов ), чтобы иметь возможность сравнивать результаты с результатами других проектов. [16]
Затем, соблюдая обширные этические процедуры, в рамках проекта «1000 геномов» будут использоваться образцы, полученные от добровольных доноров. В исследование будут включены следующие группы населения: йоруба в Ибадане (YRI), Нигерия ; Японский в Токио (JPT); Китайский в Пекине (CHB); Жители штата Юта, происходящие из Северной и Западной Европы (CEU); Лухья в Вебуе , Кения (LWK); Масаи в Киньяве , Кения (MKK); Тоскани в Италии (TSI); Перуанцы в Лиме , Перу (PEL); Индейцы гуджарати в Хьюстоне (GIH); Китайский в столичном Денвере (CHD); люди мексиканского происхождения в Лос-Анджелесе (MXL); и люди африканского происхождения на юго-западе Соединенных Штатов (ASW). [6]
Я БЫ | Место | Население | Деталь |
---|---|---|---|
ASW | * | Африканское происхождение на юго-западе США | Деталь |
ACB | * | Африканский Карибский бассейн на Барбадосе | Деталь |
BEB | Бенгальский в Бангладеш | Деталь | |
GBR | Британцы из Англии и Шотландии | Деталь | |
CDX | Китайский Дай в Сишуанбаньна , Китай | Деталь | |
CLM | Колумбийский в Медельине , Колумбия | Деталь | |
ESN | Эсан в Нигерии | Деталь | |
ПЛАВНИК | Финский в Финляндии | Деталь | |
GWD | Гамбиец в Западном дивизионе - Мандинка | Деталь | |
GIH | * | Индейцы гуджарати в Хьюстоне , Техас , США | Деталь |
CHB | Китайский хань в Пекине , Китай | Деталь | |
CHS | Хань китайский юг , Китай | Деталь | |
СРК | Иберийское население Испании | Деталь | |
ITU | * | Индийский телугу в Великобритании | Деталь |
JPT | Японский в Токио , Япония | Деталь | |
KHV | Кин в Хошимине , Вьетнам | Деталь | |
LWK | Лухья в Вебуе , Кения | Деталь | |
MSL | Mende в Сьерра-Леоне | Деталь | |
MXL | * | Мексиканское происхождение в Лос-Анджелесе, Калифорния, США | Деталь |
PEL | Перуанский в Лиме , Перу | Деталь | |
Полиуретан | Пуэрториканец в Пуэрто-Рико | Деталь | |
PJL | Пенджаби в Лахоре , Пакистан | Деталь | |
СТЮ | * | Шри-ланкийские тамилы в Великобритании | Деталь |
TSI | Тоскани в Италии | Деталь | |
YRI | Йоруба в Ибадане , Нигерия | Деталь | |
CEU | * | Жители Юты северного и западноевропейского происхождения из коллекции CEPH | Деталь |
* Население, которое было собрано в диаспоре
Встреча сообщества
Данные, полученные в рамках проекта «1000 геномов», широко используются генетическим сообществом, что делает первый проект «1000 геномов» одной из самых цитируемых статей в области биологии. [18] Чтобы поддержать это сообщество пользователей, в июле 2012 года в рамках проекта было проведено совещание по анализу сообщества, на котором обсуждались ключевые открытия проекта, их влияние на популяционную генетику и исследования болезней человека, а также краткие сведения о других крупномасштабных исследованиях секвенирования. [19]
Выводы проекта
Пилотный этап
Пилотный этап состоял из трех проектов:
- полногеномное секвенирование с низким уровнем охвата 179 человек из 4 популяций
- секвенирование с высоким охватом 2 трио (мать-отец-ребенок)
- экзон-целевое секвенирование 697 человек из 7 популяций
Было обнаружено, что в среднем каждый человек несет около 250–300 вариантов потери функции в аннотированных генах и 50–100 вариантов, ранее участвовавших в наследственных заболеваниях. Основываясь на двух трио, подсчитано, что частота мутаций зародышевой линии de novo составляет приблизительно 10-8 на основание на поколение. [1]
Смотрите также
- Проект "Геном человека"
- Проект HapMap
- Персональная геномика
- Группы населения в биомедицине
- Проект "1000 геномов растений"
- Список биологических баз данных
Рекомендации
- ^ а б Абекасис Г. Р. , Альтшулер Д. , Аутон А., Брукс Л. Д., Дурбин Р. М., Гиббс Р. А. и др. (Октябрь 2010 г.). «Карта вариаций генома человека от секвенирования в масштабе популяции» . Природа . 467 (7319): 1061–73. Bibcode : 2010Natur.467.1061T . DOI : 10,1038 / природа09534 . PMC 3042601 . PMID 20981092 .
- ^ а б Абекасис Г.Р., Аутон А., Брукс Л.Д., ДеПристо М.А., Дурбин Р.М., Хандакер Р.Э. и др. (Ноябрь 2012 г.). «Интегрированная карта генетических вариаций из 1092 геномов человека» . Природа . 491 (7422): 56–65. Bibcode : 2012Natur.491 ... 56T . DOI : 10.1038 / nature11632 . PMC 3498066 . PMID 23128226 .
- ^ Аутон А., Брукс Л.Д., Дурбин Р.М., Гаррисон Е.П., Кан Х.М., Корбел Дж.О. и др. (Октябрь 2015 г.). «Глобальный справочник по генетической изменчивости человека» . Природа . 526 (7571): 68–74. Bibcode : 2015Natur.526 ... 68T . DOI : 10.1038 / nature15393 . PMC 4750478 . PMID 26432245 .
- ^ Sudmant PH, Rausch T., Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, et al. (Октябрь 2015 г.). «Интегрированная карта структурных вариаций в 2 504 геномах человека» . Природа . 526 (7571): 75–81. Bibcode : 2015Natur.526 ... 75. . DOI : 10.1038 / nature15394 . PMC 4617611 . PMID 26432246 .
- ^ «Разнообразие жизни» . Новости природы и комментарии . 2015-09-30 . Проверено 15 октября 2015 .
- ^ a b c d e f g Г. Спенсер, Международный консорциум объявляет о проекте «1000 геномов», EMBARGOED (2008) http://www.nih.gov/news/health/jan2008/nhgri-22.htm
- ^ Нильсен Р. (октябрь 2010 г.). «Геномика: в поисках редких вариантов человека» . Природа . 467 (7319): 1050–1. Bibcode : 2010Natur.467.1050N . DOI : 10.1038 / 4671050a . PMID 20981085 .
- ^ a b Дж. К. Лонг, Генетическая изменчивость человека: механизмы и результаты микроэволюции, Американская антропологическая ассоциация (2004).
- ^ а б Анзай Т., Шиина Т., Кимура Н., Янагия К., Кохара С., Шигенари А. и др. (Июнь 2003 г.). «Сравнительное секвенирование участков MHC класса I человека и шимпанзе показывает, что вставки / делеции являются основным путем к геномной дивергенции» . Труды Национальной академии наук Соединенных Штатов Америки . 100 (13): 7708–13. Bibcode : 2003PNAS..100.7708A . DOI : 10.1073 / pnas.1230533100 . PMC 164652 . PMID 12799463 .
- ^ а б Редон Р., Исикава С., Fitch KR, Феук Л., Перри Г. Х., Эндрюс Т. Д. и др. (Ноябрь 2006 г.). «Глобальные вариации числа копий в геноме человека» . Природа . 444 (7118): 444–54. Bibcode : 2006Natur.444..444R . DOI : 10,1038 / природа05329 . PMC 2669898 . PMID 17122850 .
- ^ а б в Barreiro LB, Laval G, Quach H, Patin E, Quintana-Murci L (март 2008 г.). «Естественный отбор привел к дифференциации популяций современных людей». Генетика природы . 40 (3): 340–5. DOI : 10.1038 / ng.78 . PMID 18246066 . S2CID 205357396 .
- ^ а б в Нильсен Р., Хеллманн I, Хубиш М., Бустаманте С., Кларк АГ (ноябрь 2007 г.). «Недавний и продолжающийся отбор в геноме человека» . Обзоры природы. Генетика . 8 (11): 857–68. DOI : 10.1038 / nrg2187 . PMC 2933187 . PMID 17943193 .
- ^ a b EE Harris et al., Молекулярная подпись отбора, лежащая в основе адаптации человека, Ежегодник физической антропологии 49: 89-130 (2006)
- ^ а б Бамшад М., Вудинг С.П. (февраль 2003 г.). «Сигнатуры естественного отбора в геноме человека». Обзоры природы. Генетика . 4 (2): 99–111. DOI : 10.1038 / nrg999 . PMID 12560807 . S2CID 13722452 .
- ^ Корона Е., Дадли Дж. Т., Бьютт А. Дж. (Август 2010 г.). Ястребы Дж. (Ред.). «Крайние эволюционные различия, наблюдаемые при положительном отборе по семи сложным заболеваниям» . PLOS ONE . 5 (8): e12236. Bibcode : 2010PLoSO ... 512236C . DOI : 10.1371 / journal.pone.0012236 . PMC 2923198 . PMID 20808933 .
- ^ a b c d e f Отчет о встрече: семинар по планированию глубокого каталога генетических вариаций человека, (2007) http://www.1000genomes.org/sites/1000genomes.org/files/docs/1000Genomes-MeetingReport.pdf
- ^ Олексик Т.К., Брюхин В, О'Брайен С.Дж. (2015). «Проект« Геном Россия »: устранение крупнейшего упущения на карте генома мира» . GigaScience . 4 : 53. DOI : 10,1186 / s13742-015-0095-0 . PMC 4644275 . PMID 26568821 .
- ^ К. Кинг (2012) Самое горячее исследование 2011 года. Science Watch http://archive.sciencewatch.com/newsletter/2012/201203/hottest_research_2012/
- ^ Встреча сообщества по анализу проекта 1000 Genomes http://1000gconference.sph.umich.edu/
Внешние ссылки
- 1000 геномов - глубокий каталог генетических вариаций человека - официальная веб-страница
- Международный проект HapMap - официальная веб-страница
- Информация о проекте "Геном человека"