Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Геном человека представляет собой полный набор кислотных последовательностей нуклеиновых для человека , закодированных в ДНК в течение 23 хромосомных пар в ядрах клеток и в небольших молекулах ДНК найден в пределах отдельных митохондрий . Обычно они рассматриваются отдельно как ядерный геном и митохондриальный геном . [2] Геномы человека включают как гены ДНК, кодирующие белок, так и некодирующие гены . Гаплоидные геномы человека, содержащиеся в половых клетках ( яйцеклетке и гамете сперматозоидов). клетки, созданные в фазе мейоза полового размножения до того, как оплодотворение создает зиготу ) состоят из трех миллиардов пар оснований ДНК , в то время как диплоидные геномы (обнаруженные в соматических клетках ) содержат вдвое больше ДНК. Хотя существуют значительные различия между геномами людей (порядка 0,1% из -за однонуклеотидных вариантов [3] и 0,6% при рассмотрении инделей ) [4], они значительно меньше, чем различия между людьми и их ближайшими родственниками. живые родственники, бонобо и шимпанзе(~ 1,1% фиксированных однонуклеотидных вариантов [5] и 4% при включении инделей). [6]

Первые последовательности генома человека были опубликованы в почти полной форме в феврале 2001 года Human Genome Project [7] и Celera Corporation . [8] О завершении проекта по секвенированию генома человека было объявлено в 2004 г., когда был опубликован черновой вариант последовательности генома, в котором остался только 341 пробел в последовательности, представляющий сильно повторяющуюся и другую ДНК, которую невозможно секвенировать с помощью технологии, доступной время. [9] Геном человека был первым из всех позвоночных, который был секвенирован до такого почти полного завершения, и по состоянию на 2018 год диплоидные геномы более миллиона отдельных людей были определены с помощью секвенирования следующего поколения . [10]Эти данные используются во всем мире в биомедицине , антропологии , судебной медицине и других областях науки. Такие геномные исследования привели к успехам в диагностике и лечении заболеваний, а также к новым открытиям во многих областях биологии, включая эволюцию человека .

Хотя последовательность генома человека была (почти) полностью определена путем секвенирования ДНК, она еще не полностью изучена. Большинство (хотя, вероятно, не все) генов были идентифицированы с помощью комбинации высокопроизводительных экспериментальных и биоинформатических подходов, но еще предстоит проделать большую работу для дальнейшего выяснения биологических функций их белков и продуктов РНК . Недавние результаты предполагают, что большая часть огромных количеств некодирующей ДНК в геноме связана с биохимической активностью, включая регуляцию экспрессии генов , организацию архитектуры хромосом и сигналы, контролирующие эпигенетическое наследование .

До получения полной последовательности генома оценки количества генов человека варьировались от 50 000 до 140 000 (иногда неясно, включали ли эти оценки гены, не кодирующие белки). [11] По мере улучшения качества последовательности генома и методов идентификации генов, кодирующих белок, [9] количество распознаваемых генов, кодирующих белок, упало до 19 000-20 000. [12] Однако более полное понимание роли, которую играют последовательности, которые не кодируют белки, а вместо этого экспрессируют регуляторную РНК, увеличило общее количество генов как минимум до 46 831 [13] плюс еще 2300 генов микро-РНК . [14]К 2012 году не было обнаружено функциональных элементов ДНК, не кодирующих ни РНК, ни белков. [15], и еще 10% -ный эквивалент человеческого генома был обнаружен в недавнем (2018 г.) опросе населения. [16] Белок счета -coding последовательности лишь очень малую часть генома (приблизительно 1,5%), а остальное связано с некодирующих РНК генов, регуляторных последовательностей ДНК , линий , SINEs , интроны и последовательности , для которых в качестве еще ни одна функция не определена. [17]

В июне 2016 года ученые официально объявили о HGP-Write , плане по синтезу генома человека. [18] [19]

Полнота последовательности генома человека [ править ]

Хотя о «завершении» проекта генома человека было объявлено в 2001 году [17], оставались сотни пробелов, причем около 5–10% от общей последовательности оставались неопределенными. Недостающая генетическая информация была в основном в повторяющихся гетерохроматических регионах и около центромер и теломер , но также и в некоторых эухроматических областях, кодирующих ген . [20] В 2015 году оставалось 160 эухроматических пробелов, когда были определены последовательности, охватывающие еще 50 ранее не секвенированных регионов. [21] Только в 2020 году была определена первая по-настоящему полная последовательность между теломерами хромосомы человека, а именно Х-хромосома . [22]

Молекулярная организация и содержание генов [ править ]

Общая длина эталонного генома человека , который не представляет последовательность какого-либо конкретного человека, составляет более 3 миллиардов пар оснований. Геном состоит из 22 парных хромосом, называемых аутосомами , плюс 23-я пара половых хромосом (XX) у женщин и (XY) у мужчин. Все это большие линейные молекулы ДНК, содержащиеся в ядре клетки. Геном также включает митохондриальную ДНК , сравнительно небольшую кольцевую молекулу, присутствующую в нескольких копиях в каждой митохондрии .

Оригинальный анализ опубликован в базе данных Ensembl Европейского института биоинформатики (EBI) и Wellcome Trust Sanger Institute . Длину хромосом оценивали путем умножения количества пар оснований на 0,34 нанометра (расстояние между парами оснований в наиболее распространенной структуре двойной спирали ДНК ; недавняя оценка длины хромосом человека на основе обновленных данных сообщает о 205,00 см для диплоидного мужского генома и 208,23 см). см для самок, что соответствует весу 6,41 и 6,51 пикограмма (пг) соответственно [24] ). Количество белков зависит от количества исходных транскриптов мРНК-предшественников и не включает продукты альтернативного сплайсинга пре-мРНК., или модификации структуры белка, которые происходят после трансляции .

Вариации - это уникальные различия в последовательностях ДНК, которые были идентифицированы в отдельных последовательностях генома человека, проанализированных Ensembl по состоянию на декабрь 2016 года. Ожидается, что количество выявленных вариаций будет увеличиваться по мере того, как будут секвенироваться и анализироваться дальнейшие личные геномы . Помимо содержания гена, показанного в этой таблице, в геноме человека было идентифицировано большое количество неэкспрессированных функциональных последовательностей (см. Ниже). Ссылки открывают окна со ссылочными последовательностями хромосом в браузере генома EBI.

Малые некодирующие РНК - это РНК, состоящие из 200 оснований, которые не обладают потенциалом кодирования белков. К ним относятся: микроРНК или миРНК (посттранскрипционные регуляторы экспрессии генов), малые ядерные РНК или мяРНК (компоненты РНК сплайсосом ) и малые ядрышковые РНК или мяРНК (участвующие в химических модификациях других молекул РНК). Длинные некодирующие РНК представляют собой молекулы РНК длиной более 200 оснований, которые не обладают потенциалом кодирования белков. К ним относятся: рибосомные РНК или рРНК (компоненты РНК рибосом ) и множество других длинных РНК, которые участвуют в регуляции экспрессии генов., эпигенетические модификации нуклеотидов ДНК и гистоновых белков и регуляция активности генов, кодирующих белок. Небольшие расхождения между числами total-small-ncRNA и числами конкретных типов малых ncNRAs возникают в результате того, что первые значения получены из Ensembl выпуска 87, а последние - из Ensembl выпуска 68.

Число генов в геноме человека не совсем понятно, поскольку функция многочисленных транскриптов остается неясной. Это особенно верно для некодирующей РНК . Число генов, кодирующих белок, известно лучше, но все еще существует порядка 1400 сомнительных генов, которые могут или не могут кодировать функциональные белки, обычно кодируемые короткими открытыми рамками считывания .

Количество генов (оранжевый) и пар оснований (зеленый, в миллионах) на каждой хромосоме.

Информационное содержание [ править ]

Гаплоидный геном человека (23 хромосом ) имеет длину около 3 миллиардов пар оснований и содержит около 30 000 генов. [30] Поскольку каждую базовую пару можно закодировать двумя битами, это около 750 мегабайт данных. Отдельная соматическая ( диплоидная ) клетка содержит вдвое больше, то есть около 6 миллиардов пар оснований. У мужчин их меньше, чем у женщин, потому что Y-хромосома составляет около 57 миллионов пар оснований, тогда как X составляет около 156 миллионов. Поскольку отдельные геномы различаются по последовательности менее чем на 1% друг от друга, вариации генома данного человека от общего эталона могут быть сжаты без потерь примерно до 4 мегабайт. [31]

Скорость энтропии генома значительно различается между кодирующими и некодирующими последовательностями. Это близко к максимуму 2 бита на пару оснований для кодирующих последовательностей (около 45 миллионов пар оснований), но меньше для некодирующих частей. Он находится в диапазоне от 1,5 до 1,9 бит на пару оснований для отдельной хромосомы, за исключением Y-хромосомы, у которой коэффициент энтропии ниже 0,9 бит на пару оснований. [32]

Кодирующая и некодирующая ДНК [ править ]

Содержание генома человека обычно делится на кодирующие и некодирующие последовательности ДНК. Кодирующая ДНК определяется как те последовательности, которые могут транскрибироваться в мРНК и транслироваться в белки в течение жизненного цикла человека; эти последовательности занимают лишь небольшую часть генома (<2%). Некодирующая ДНК состоит из всех тех последовательностей (около 98% генома), которые не используются для кодирования белков.

Некодирующая ДНК содержит гены молекул РНК с важными биологическими функциями ( некодирующая РНК , например рибосомная РНК и транспортная РНК ). Изучение функции и эволюционного происхождения некодирующей ДНК является важной целью современных исследований генома, в том числе проекта ENCODE (Энциклопедия элементов ДНК), который направлен на изучение всего генома человека с использованием различных экспериментальных инструментов, результаты которых являются показательными. молекулярной активности.

Поскольку некодирующая ДНК значительно превосходит кодирующую ДНК, концепция секвенированного генома стала более сфокусированной аналитической концепцией, чем классическая концепция ДНК-кодирующего гена. [33] [34]

Кодирующие последовательности (гены, кодирующие белок) [ редактировать ]

Человеческие гены классифицируются по функциям транскрибируемых белков, учитывая как количество кодирующих генов, так и процентное соотношение всех генов. [35]

Последовательности, кодирующие белок, представляют собой наиболее широко изученный и наиболее изученный компонент генома человека. Эти последовательности в конечном итоге приводят к продукции всех белков человека , хотя несколько биологических процессов (например, перестройка ДНК и альтернативный сплайсинг пре-мРНК ) могут привести к продукции гораздо большего количества уникальных белков, чем количество генов, кодирующих белок. Полная модульная способность генома кодировать белок содержится в экзоме и состоит из последовательностей ДНК, кодируемых экзонами.которые могут быть переведены в белки. Из-за его биологической важности и того факта, что он составляет менее 2% генома, секвенирование экзома стало первой важной вехой проекта «Геном человека».

Количество генов, кодирующих белок . В таких базах данных, как Uniprot, аннотировано около 20 000 белков человека . [36] Исторически оценки количества белковых генов широко варьировались, достигая 2000000 в конце 1960-х [37], но несколько исследователей отметили в начале 1970-х, что оценочная мутационная нагрузка от вредных мутаций устанавливает верхний предел приблизительно 40 000 для общего числа функциональных локусов (включая гены, кодирующие белок, и гены, не кодирующие функциональные группы). [38] Количество генов, кодирующих человеческий белок, ненамного больше, чем у многих менее сложных организмов, таких как аскариды и плодовая муха.. Это различие может быть результатом широкого использования альтернативного сплайсинга пре-мРНК у людей, который обеспечивает способность создавать очень большое количество модульных белков за счет избирательного включения экзонов.

Способность кодирования белков на хромосому . Гены, кодирующие белок, неравномерно распределены по хромосомам, от нескольких десятков до более 2000, с особенно высокой плотностью генов в хромосомах 1, 11 и 19. Каждая хромосома содержит различные богатые генами и бедные генами области, которые может коррелировать с полосами хромосом и GC-содержанием . [39] Значение этих неслучайных паттернов плотности генов до конца не изучено. [40]

Размер генов, кодирующих белок . Размер генов, кодирующих белок, в геноме человека очень разнообразен. Например, ген гистона H1a (HIST1HIA) относительно мал и прост, лишен интронов и кодирует мРНК длиной 781 нуклеотид, которая продуцирует белок из 215 аминокислот из своей открытой рамки считывания из 648 нуклеотидов . Дистрофин (DMD) был крупнейшим кодирующим белок геном в эталонном геноме человека 2001 года, охватывая в общей сложности 2,2 миллиона нуклеотидов [41], в то время как более поздний систематический метаанализ обновленных данных генома человека выявил еще более крупный ген, кодирующий белок, RBFOX1 (РНК-связывающий белок, гомолог 1 fox-1), охватывающий в общей сложности 2,47 миллиона нуклеотидов. [42] Титин (TTN) имеет самую длинную кодирующую последовательность (114 414 нуклеотидов), наибольшее количество экзонов (363), [41] и самый длинный одиночный экзон (17 106 нуклеотидов). По оценке на основе тщательно подобранного набора генов, кодирующих белок по всему геному, средний размер составляет 26 288 нуклеотидов (среднее значение = 66 577), средний размер экзона - 133 нуклеотида (среднее значение = 309), среднее количество экзонов - 8 ( среднее значение = 11), а средняя длина кодируемого белка составляет 425 аминокислот (среднее значение = 553). [42]

Некодирующая ДНК (нкДНК) [ править ]

Некодирующая ДНК определяется как все последовательности ДНК в геноме, которые не обнаруживаются в экзонах, кодирующих белок, и поэтому никогда не представлены в аминокислотной последовательности экспрессируемых белков. Согласно этому определению, более 98% геномов человека состоит из нкДНК.

Были идентифицированы многочисленные классы некодирующей ДНК, включая гены некодирующей РНК (например, тРНК и рРНК), псевдогены, интроны, нетранслируемые области мРНК, регуляторные последовательности ДНК, повторяющиеся последовательности ДНК и последовательности, относящиеся к мобильным генетическим элементам.

Многочисленные последовательности, включенные в гены, также определяются как некодирующие ДНК. К ним относятся гены некодирующей РНК (например, тРНК, рРНК) и нетранслируемые компоненты генов, кодирующих белок (например, интроны и 5 'и 3' нетранслируемые области мРНК).

Последовательности, кодирующие белки (в частности, кодирующие экзоны ), составляют менее 1,5% генома человека. [17] Кроме того, около 26% генома человека составляют интроны . [44] Помимо генов (экзонов и интронов) и известных регуляторных последовательностей (8–20%), геном человека содержит участки некодирующей ДНК. Точное количество некодирующей ДНК, которая играет роль в физиологии клетки, является предметом горячих споров. Недавний анализ проекта ENCODE показывает, что 80% всего генома человека либо транскрибируется, либо связывается с регуляторными белками, либо связано с какой-либо другой биохимической активностью. [15]

Однако остается спорным вопрос, вносит ли вся эта биохимическая активность вклад в физиологию клетки или значительная ее часть является результатом транскрипционного и биохимического шума, который должен активно отфильтровываться организмом. [45] За исключением кодирующих белки последовательностей, интронов и регуляторных областей, большая часть некодирующей ДНК состоит из: Многие последовательности ДНК, которые не играют роли в экспрессии генов, выполняют важные биологические функции. Сравнительные исследования геномики показывают, что около 5% генома содержит последовательности некодирующей ДНК, которые являются высококонсервативными , иногда во временных масштабах, представляющих сотни миллионов лет, что подразумевает, что эти некодирующие области находятся под сильным воздействием.эволюционное давление и положительный отбор . [46]

Многие из этих последовательностей регулируют структуру хромосом, ограничивая области образования гетерохроматина и регулируя структурные особенности хромосом, такие как теломеры и центромеры . Другие некодирующие области служат источниками репликации ДНК . Наконец, несколько участков транскрибируются в функциональную некодирующую РНК, которая регулирует экспрессию генов, кодирующих белок (например, [47] ), трансляцию и стабильность мРНК (см. MiRNA ), структуру хроматина (включая модификации гистонов , например, [48] ), ДНК. метилирование (например [49] ), рекомбинация ДНК (например [50]) и перекрестно регулируют другие некодирующие РНК (например, [51] ). Также вероятно, что многие транскрибируемые некодирующие области не играют никакой роли и что эта транскрипция является продуктом неспецифической активности РНК-полимеразы . [45]

Псевдогены [ править ]

Псевдогены - это неактивные копии генов, кодирующих белок, часто возникающие в результате дупликации генов , которые перестали функционировать из-за накопления инактивирующих мутаций. Число псевдогенов в геноме человека составляет порядка 13 000, [52] а в некоторых хромосомах почти такое же, как количество функциональных генов, кодирующих белок. Дупликация генов - главный механизм, с помощью которого в ходе молекулярной эволюции генерируется новый генетический материал .

Например, семейство генов обонятельных рецепторов является одним из наиболее хорошо задокументированных примеров псевдогенов в геноме человека. Более 60 процентов генов этого семейства являются нефункциональными псевдогенами у людей. Для сравнения, только 20 процентов генов в семействе генов обонятельных рецепторов мышей являются псевдогенами. Исследования показывают, что это видоспецифическая характеристика, поскольку все наиболее близкие приматы имеют пропорционально меньше псевдогенов. Это генетическое открытие помогает объяснить менее острое обоняние у людей по сравнению с другими млекопитающими. [53]

Гены некодирующей РНК (нкРНК) [ править ]

Некодирующие молекулы РНК играют в клетках множество важных ролей, особенно во многих реакциях синтеза белка и процессинга РНК . Некодирующая РНК включает тРНК , рибосомную РНК, микроРНК , мяРНК и другие гены некодирующей РНК, включая около 60000 длинных некодирующих РНК (днРНК). [15] [54] [55] [56] Хотя количество зарегистрированных генов днРНК продолжает расти, а точное количество генов человека еще не определено, многие из них считаются нефункциональными. [57]

Многие нкРНК являются критическими элементами в регуляции и экспрессии генов. Некодирующая РНК также участвует в эпигенетике, транскрипции, сплайсинге РНК и трансляционном аппарате. Роль РНК в генетической регуляции и болезни предлагает новый потенциальный уровень неизученной геномной сложности. [58]

Интроны и нетранслируемые участки мРНК [ править ]

В дополнение к молекулам нкРНК, которые кодируются дискретными генами, исходные транскрипты генов, кодирующих белок, обычно содержат обширные некодирующие последовательности в виде интронов , 5'-нетранслируемых областей (5'-UTR) и 3'-нетранслируемых областей. (3'-UTR). В большинстве кодирующих белок генов человеческого генома длина последовательностей интронов в 10–100 раз превышает длину последовательностей экзонов.

Регуляторные последовательности ДНК [ править ]

Геном человека имеет множество различных регуляторных последовательностей, которые имеют решающее значение для контроля экспрессии генов . Консервативные оценки показывают, что эти последовательности составляют 8% генома [59], однако экстраполяция из проекта ENCODE дает, что 20 [60] -40% [61] генома составляет регуляторную последовательность гена. Некоторые типы некодирующей ДНК являются генетическими «переключателями», которые не кодируют белки, но регулируют, когда и где экспрессируются гены (называемые энхансерами ). [62]

Регуляторные последовательности известны с конца 1960-х годов. [63] Первая идентификация регуляторных последовательностей в геноме человека была основана на технологии рекомбинантных ДНК. [64] Позже, с появлением геномного секвенирования, идентификация этих последовательностей могла быть выведена путем эволюционной консервации. Эволюционная ветвь между приматами и мышами , например, произошла 70–90 миллионов лет назад. [65] Таким образом, компьютерные сравнения последовательностей генов, которые идентифицируют консервативные некодирующие последовательности, будут показателем их важности для таких функций, как регуляция генов. [66]

Другие геномы были секвенированы с тем же намерением, чтобы помочь методам, ориентированным на сохранение, например, геном иглобрюха . [67] Однако регуляторные последовательности исчезают и повторно эволюционируют во время эволюции с высокой скоростью. [68] [69] [70]

По состоянию на 2012 год усилия переместились в сторону поиска взаимодействий между ДНК и регуляторными белками с помощью метода ChIP-Seq или пробелов, в которых ДНК не упакована гистонами ( сайты гиперчувствительности к ДНКазам ), оба из которых говорят о том, где находятся активные регуляторные последовательности в исследуемый тип клеток. [59]

Повторяющиеся последовательности ДНК [ править ]

Повторяющиеся последовательности ДНК составляют примерно 50% генома человека. [71]

Около 8% генома человека состоит из тандемных массивов ДНК или тандемных повторов, повторяющихся последовательностей низкой сложности, которые имеют несколько смежных копий (например, «CAGCAGCAG ...»). [72] Тандемные последовательности могут иметь разную длину от двух нуклеотидов до десятков нуклеотидов. Эти последовательности очень изменчивы, даже среди близкородственных людей, и поэтому используются для генеалогического тестирования ДНК и судебно-медицинского анализа ДНК . [73]

Повторяющиеся последовательности менее десяти нуклеотидов (например, динуклеотидный повтор (AC) n ) называются микросателлитными последовательностями. Среди микросателлитных последовательностей особое значение имеют тринуклеотидные повторы, которые иногда встречаются в кодирующих областях генов белков и могут приводить к генетическим нарушениям. Например, болезнь Хантингтона является результатом экспансии тринуклеотидного повтора (CAG) n в гене Хантингтина на хромосоме 4 человека. Теломеры (концы линейных хромосом) заканчиваются микросателлитным гексануклеотидным повтором последовательности (TTAGGG) n .

Тандемные повторы более длинных последовательностей (массивы повторяющихся последовательностей длиной от 10 до 60 нуклеотидов) называются минисателлитами .

Мобильные генетические элементы (транспозоны) и их реликвии [ править ]

Мобильные генетические элементы , последовательности ДНК, которые могут реплицироваться и вставлять свои копии в другие места в геноме хозяина, являются обильным компонентом генома человека. Самая распространенная линия транспозонов, Alu , имеет около 50 000 активных копий [74] и может быть вставлена ​​во внутригенные и межгенные области. [75] Еще одна линия, LINE-1, имеет около 100 активных копий на геном (количество варьируется в зависимости от человека). [76] Вместе с нефункциональными остатками старых транспозонов они составляют более половины всей ДНК человека. [77] Иногда их называют «прыгающими генами», транспозоны сыграли важную роль в формировании генома человека. Некоторые из этих последовательностей представляютэндогенные ретровирусы , копии ДНК вирусных последовательностей, которые навсегда интегрировались в геном и теперь передаются последующим поколениям.

Мобильные элементы в геноме человека можно разделить на ретротранспозоны LTR (8,3% от общего генома), SINE (13,1% от общего генома), включая элементы Alu , LINE (20,4% от общего генома), SVA и транспозоны ДНК класса II (2,9%). всего генома).

Геномная изменчивость у людей [ править ]

Контрольный геном человека [ править ]

За исключением однояйцевых близнецов, все люди демонстрируют значительные вариации в последовательностях геномной ДНК. Человек референсный геном (HRG) используется в качестве стандартной эталонной последовательности.

Есть несколько важных моментов, касающихся эталонного генома человека:

  • HRG представляет собой гаплоидную последовательность. Каждая хромосома представлена ​​один раз.
  • HRG представляет собой сложную последовательность и не соответствует никакому реальному человеку.
  • HRG периодически обновляется для исправления ошибок, двусмысленностей и неизвестных «пробелов».
  • HRG никоим образом не представляет собой «идеального» или «идеального» человека. Это просто стандартизованное представление или модель, которая используется для сравнительных целей.

Reference Консорциум Геном отвечает за обновление HRG. Версия 38 была выпущена в декабре 2013 года. [78]

Измерение генетической изменчивости человека [ править ]

Большинство исследований генетической изменчивости человека сосредоточено на однонуклеотидных полиморфизмах (SNP), которые представляют собой замены в отдельных основаниях вдоль хромосомы. По оценкам большинства анализов, SNP встречаются в среднем 1 из 1000 пар оснований в эухроматическом геноме человека, хотя они не встречаются с однородной плотностью. Отсюда следует популярное утверждение, что «все мы, независимо от расы , генетически на 99,9% одинаковы» [79], хотя большинство генетиков в некоторой степени это опровергнет. Например, теперь считается, что гораздо большая часть генома участвует в вариации числа копий . [80]Крупномасштабные совместные усилия по каталогизации вариаций SNP в геноме человека предпринимаются в рамках Международного проекта HapMap .

Геномные локусы и длина определенных типов небольших повторяющихся последовательностей сильно различаются от человека к человеку, что является основой технологий ДНК-фингерпринта и ДНК-тестирования отцовства . В гетерохроматиновые части человеческого генома, который общей сложности несколько сотен миллионов пар оснований, также считается весьма непостоянны человеческой популяции (они настолько повторяющимся и так долго , что они не могут быть точно секвенировали с учетом современных технологий). Эти области содержат мало генов, и неясно, является ли какой-либо значительный фенотипический эффект результатом типичной вариации повторов или гетерохроматина.

Большинство грубых геномных мутаций в половых клетках гамет, вероятно, приводят к появлению нездоровых эмбрионов; однако ряд заболеваний человека связан с крупномасштабными геномными аномалиями. Синдром Дауна , Тернера синдром , а также ряд других заболеваний , в результате нерасхождения целых хромосом. Раковые клетки часто имеют анеуплоидию хромосом и хромосомных плеч, хотя причинно-следственная связь между анеуплоидией и раком не установлена.

Картирование геномных вариаций человека [ править ]

В то время как последовательность генома перечисляет порядок каждой основы ДНК в геноме, карта генома определяет ориентиры. Карта генома менее подробна, чем последовательность генома, и помогает ориентироваться в геноме. [81] [82]

Примером карты вариантов является HapMap, разрабатываемый Международным проектом HapMap . HapMap - это карта гаплотипов генома человека, «которая будет описывать общие закономерности изменения последовательности ДНК человека». [83] Он каталогизирует образцы мелкомасштабных вариаций в геноме, которые включают отдельные буквы или основания ДНК.

Исследователи опубликовали первую основанную на последовательностях карту крупномасштабных структурных вариаций в геноме человека в журнале Nature в мае 2008 года. [84] [85] Крупномасштабные структурные вариации - это различия в геноме между людьми, которые варьируются от нескольких тысяч до нескольких миллионов оснований ДНК; некоторые из них представляют собой прирост или потерю участков последовательности генома, а другие проявляются как изменение расположения участков последовательности. Эти вариации включают различия в количестве копий конкретного гена, делеции, транслокации и инверсии.

Частота SNP в геноме человека [ править ]

Однонуклеотидные полиморфизмы (SNP) неоднородны в геноме человека. Фактически, существует огромное разнообразие в частоте SNP между генами, что отражает различное избирательное давление на каждый ген, а также различную скорость мутаций и рекомбинации в геноме. Однако исследования SNP смещены в сторону кодирующих областей, данные, полученные из них, вряд ли отражают общее распределение SNP по геному. Таким образом, протокол Консорциума SNP был разработан для идентификации SNP без предвзятости в отношении кодирующих областей, а 100 000 SNP Консорциума обычно отражают разнообразие последовательностей в хромосомах человека. Консорциум SNPстремится увеличить количество SNP, идентифицированных в геноме, до 300 000 к концу первого квартала 2001 года [86].

Распределение SNP TSC вдоль длинного плеча хромосомы 22 (из https://web.archive.org/web/20130903043223/http://snp.cshl.org/ ). Каждый столбец представляет интервал в 1 Мбайт; приблизительное цитогенетическое положение дано по оси абсцисс. Видны четкие пики и спады плотности SNP, возможно, отражающие разные скорости мутации, рекомбинации и отбора.

Изменения в некодирующей последовательности и синонимичные изменения в кодирующей последовательности обычно более распространены, чем несинонимичные изменения, что отражает большее селективное давление, снижающее разнообразие в положениях, определяющих аминокислотную идентичность. Переходные изменения встречаются чаще, чем трансверсии, при этом динуклеотиды CpG показывают самую высокую частоту мутаций, предположительно из-за дезаминирования.

Личные геномы [ править ]

Последовательность личного генома - это (почти) полная последовательность пар химических оснований, составляющих ДНК одного человека. Поскольку медицинские процедуры по-разному влияют на разных людей из-за генетических вариаций, таких как однонуклеотидные полиморфизмы (SNP), анализ личных геномов может привести к индивидуальному лечению на основе индивидуальных генотипов. [87]

Первой личной геномной последовательностью, которая должна была быть определена, была последовательность Крейга Вентера в 2007 году. Персональные геномы не были секвенированы в рамках общественного проекта «Геном человека» для защиты личности добровольцев, предоставивших образцы ДНК. Эта последовательность была получена из ДНК нескольких добровольцев из разной популяции. [88] Однако в начале работы по секвенированию генома Celera Genomics под руководством Вентера было принято решение перейти от секвенирования составного образца к использованию ДНК от одного человека, который, как позже выяснилось, был сам Вентер. Таким образом, последовательность генома человека Celera, выпущенная в 2000 году, в основном принадлежала одному человеку. Последующая замена ранних составных данных и определение диплоидной последовательности, представляющей оба наборахромосомы , а не первоначально сообщенная гаплоидная последовательность, позволили высвободить первый личный геном. [89] В апреле 2008 года работа Джеймса Уотсона также была завершена. В 2009 году Стивен Квейк опубликовал свою собственную последовательность генома, полученную с помощью разработанного им секвенатора Heliscope. [90] Команда из Стэнфорда во главе с Юаном Эшли опубликовала схему медицинской интерпретации геномов человека, реализованную в геноме Дрожи, и впервые приняла медицинские решения, основанные на полном геноме. [91] Эта группа расширила подход к семье Веста, первой семье, секвенированной в рамках программы персонального секвенирования генома Illumina. [92] С тех пор были выпущены сотни личных геномных последовательностей [93], включая последовательности Десмонда Туту , [94] [95] и палеоэскимоса . [96] В 2012 году были обнародованы полные геномные последовательности двух семейных трио среди 1092 геномов. [3] В ноябре 2013 года испанская семья сделала четыре персональных набора данных экзома (около 1% генома) общедоступными по лицензии Creative Commons, являющейся общественным достоянием . [97] [98] Проект « Персональный геном» (начат в 2005 г.) является одним из немногих, которые сделали общедоступными как последовательности генома, так и соответствующие медицинские фенотипы. [99][100]

Секвенирование отдельных геномов еще раз выявило уровни генетической сложности, которые ранее не оценивались. Персональная геномика помогла выявить значительный уровень разнообразия в геноме человека, связанный не только с SNP, но также и с структурными вариациями. Однако применение этих знаний в лечении болезней и в медицине находится только в самом начале. [101] Секвенирование экзома становится все более популярным как инструмент, помогающий в диагностике генетических заболеваний, поскольку экзом вносит только 1% геномной последовательности, но на него приходится примерно 85% мутаций, которые вносят значительный вклад в заболевание. [102]

Человеческие нокауты [ править ]

У людей нокауты генов в природе происходят как гетерозиготные или гомозиготные нокауты генов с потерей функции . Эти нокауты часто трудно отличить, особенно в пределах гетерогенного генетического фона. Их также трудно найти, поскольку они встречаются на низких частотах.

Популяции с высоким уровнем родительского родства приводят к большему количеству гомозиготных нокаутов генов по сравнению с аутбредными популяциями. [103]

В популяциях с высоким уровнем кровного родства , например в странах с высоким уровнем браков двоюродных братьев и сестер, наблюдается самая высокая частота нокаутов гомозиготных генов. К таким группам населения относятся Пакистан, Исландия и амиши. Эти популяции с высоким уровнем родительского родства были предметом нокаут-исследований на людях, которые помогли определить функцию определенных генов у людей. Выявляя определенные нокауты, исследователи могут использовать фенотипический анализ этих людей, чтобы помочь охарактеризовать нокаутный ген.

Родословная, показывающая спаривание двоюродного брата (оба носителя несут гетерозиготные нокауты, спаривания отмечены двойной линией), приводящая к потомству, обладающему гомозиготным нокаутом гена.

Нокауты в определенных генах могут вызывать генетические заболевания, потенциально иметь положительные эффекты или даже не приводить к фенотипическому эффекту. Однако определение фенотипического эффекта нокаута и у людей может быть сложной задачей. Проблемы, связанные с характеристикой и клинической интерпретацией нокаутов, включают трудность вызова вариантов ДНК, определение нарушения функции белка (аннотации) и рассмотрение степени влияния мозаицизма на фенотип. [103]

Одним из крупных исследований, посвященных изучению нокаутов у людей, является исследование риска инфаркта миокарда в Пакистане. Было обнаружено, что люди, обладающие гетерозиготным нокаутом гена потери функции для гена APOC3 , имели более низкие триглицериды в крови после употребления пищи с высоким содержанием жира по сравнению с людьми без мутации. Однако люди, обладающие гомозиготными нокаутами гена потери функции гена APOC3, показали самый низкий уровень триглицеридов в крови после теста с жировой нагрузкой, поскольку они не продуцируют функциональный белок APOC3. [104]

Генетические расстройства человека [ править ]

Большинство аспектов биологии человека включают как генетические (наследственные), так и негенетические (экологические) факторы. Некоторые унаследованные вариации влияют на аспекты нашей биологии, которые не являются медицинскими по своей природе (рост, цвет глаз, способность ощущать вкус или запах определенных соединений и т. Д.). Более того, некоторые генетические нарушения вызывают заболевание только в сочетании с соответствующими факторами окружающей среды (такими как диета). С этими оговорками генетические нарушения могут быть описаны как клинически определенные заболевания, вызванные вариацией последовательности геномной ДНК. В самых простых случаях заболевание может быть связано с изменением одного гена. Например, муковисцидоз вызывается мутациями в гене CFTR и является наиболее распространенным рецессивным заболеванием среди населения европеоидной расы, в котором известно более 1300 различных мутаций. [105]

Мутации, вызывающие заболевание, в определенных генах обычно тяжелы с точки зрения функции генов и, к счастью, редки, поэтому генетические нарушения также редки индивидуально. Однако, поскольку существует множество генов, которые могут вызывать генетические нарушения, в совокупности они составляют значительный компонент известных заболеваний, особенно в педиатрической медицине. Молекулярно охарактеризованные генетические нарушения - это те, для которых был идентифицирован основной причинный ген. В настоящее время в базе данных OMIM аннотировано около 2200 таких расстройств . [105]

Исследования генетических нарушений часто проводятся с помощью семейных исследований. В некоторых случаях подходы , основанные населения используются, в частности , в случае так называемых учредителей населения , таких как те , в Финляндии, Франции-Канада, штат Юта, Сардинию и т.д. Диагностика и лечение генетических заболеваний, как правило , осуществляется с помощью генетиком -physician прошел обучение в области клинической / медицинской генетики. Результаты проекта « Геном человека» , вероятно, обеспечат более широкую доступность генетических тестов для генетических заболеваний и, в конечном итоге, улучшат лечение. Родителей можно обследовать на предмет наследственных заболеваний и проконсультировать о последствиях, вероятности наследования и о том, как избежать или улучшить его у их потомства.

Существует много различных видов вариаций последовательностей ДНК, от полных лишних или отсутствующих хромосом до единичных нуклеотидных изменений. Обычно предполагается, что большая часть естественных генетических вариаций в человеческих популяциях фенотипически нейтральна, т. Е. Оказывает незначительное влияние или не оказывает никакого заметного влияния на физиологию человека (хотя могут быть частичные различия в приспособленности, определяемые в рамках эволюционных временных рамок). Генетические нарушения могут быть вызваны любым или всеми известными типами вариации последовательности. Чтобы молекулярно охарактеризовать новое генетическое заболевание, необходимо установить причинную связь между конкретным вариантом геномной последовательности и исследуемым клиническим заболеванием. Такие исследования составляют область молекулярной генетики человека.

С появлением проекта "Геном человека" и Международного проекта HapMap стало возможным исследовать тонкие генетические влияния на многие распространенные заболевания, такие как диабет, астма, мигрень, шизофрения и т. Д. Хотя между вариантами геномных последовательностей в определенные гены и некоторые из этих заболеваний, часто широко освещаемые в средствах массовой информации, обычно не считаются генетическими нарушениями как таковыми, поскольку их причины сложны и включают множество различных генетических факторов и факторов окружающей среды. Таким образом, в отдельных случаях могут возникать разногласия относительно того, следует ли назвать конкретное заболевание генетическим заболеванием.

Дополнительные генетические расстройства упоминания синдром Каллман и синдром Пфайфер (ген ФРФР1), Фукса дистрофии роговицы (ген Tcf4), Гиршпрунга болезнь (гены RET и FECH), синдром Барде-Бидля 1 (гены CCDC28B и BBS1), синдром Барде-Бидля 10 (ген BBS10) и фасциально-плечевой мышечной дистрофии 2 типа (гены D4Z4 и SMCHD1). [106]

Секвенирование генома теперь может сузить геном до определенных мест, чтобы более точно находить мутации, которые приведут к генетическому заболеванию. Варианты числа копий (CNV) и варианты с одним нуклеотидом (SNV) также могут быть обнаружены одновременно с секвенированием генома с помощью более новых доступных процедур секвенирования, называемых секвенированием следующего поколения (NGS). Это анализирует только небольшую часть генома, около 1-2%. Результаты этого секвенирования могут быть использованы для клинической диагностики генетического состояния, включая синдром Ашера , заболевания сетчатки, нарушения слуха, диабет, эпилепсию, болезнь Ли , наследственные раковые заболевания, нервно-мышечные заболевания, первичные иммунодефициты,тяжелый комбинированный иммунодефицит (ТКИД) и заболевания митохондрий. [107] NGS также можно использовать для выявления носителей заболеваний до зачатия. Болезни , которые могут быть обнаружены в этой последовательности включают в себя болезнь Тея-Сакса , синдром Блума , болезнь Гоше , болезнь Канавана , семейную Dysautonomia , муковисцидоз, спинальную мышечную атрофию , и синдром ломкой Х-хромосомы . Секвенирование следующего генома можно сузить, чтобы определить заболевания, более распространенные в определенных этнических группах. [108]

Эволюция [ править ]

Хронология Гоминина
-10 -
-
-9 -
-
-8 -
-
-7 -
-
-6 -
-
-5 -
-
-4 -
-
-3 -
-
-2 -
-
-1 -
-
0 -
Гоминини
Накалипитеки
Уранопитек
Ореопитек
Сахелантроп
Оррорин
Ардипитека
Австралопитек
Homo habilis
человек прямоходящий
Х. heidelbergensis
Homo sapiens
Неандертальцы
Ранние обезьяны
Раскол гориллы
Шимпанзе раскол
Самый ранний двуногий
Каменные инструменты
Расширение за пределы Африки
Самое раннее использование огня
Самая ранняя кулинария
Самая ранняя одежда
Современные люди
Р л е я с т о с й н е
П л и о ц е н е
M i o c e n e
Г о м и н и д с
( миллион лет назад )

Сравнительные геномные исследования геномов млекопитающих предполагают, что приблизительно 5% генома человека было сохранено эволюцией с момента расхождения существующих линий примерно 200 миллионов лет назад, содержащих подавляющее большинство генов. [109] [110] Опубликованный геном шимпанзе отличается от генома человека на 1,23% при прямом сравнении последовательностей. [111] Около 20% этой цифры приходится на вариации внутри каждого вида, оставляя только ~ 1,06% последовательного расхождения последовательностей между людьми и шимпанзе в общих генах. [112]Этот нуклеотид по нуклеотидной разнице меньше, чем часть каждого генома, которая не является общей, включая около 6% функциональных генов, уникальных для человека или шимпанзе. [113]

Другими словами, значительные наблюдаемые различия между людьми и шимпанзе могут быть в большей или большей степени обусловлены вариациями на уровне генома в количестве, функции и экспрессии генов, а не изменениями последовательности ДНК в общих генах. Действительно, даже у людей было обнаружено ранее недооцененное количество вариаций числа копий (CNV), которое может составлять до 5-15% генома человека. Другими словами, между людьми может быть +/- 500000000 пар оснований ДНК, некоторые из которых являются активными генами, другие инактивированы или активны на разных уровнях. Полное значение этого открытия еще предстоит увидеть. В среднем типичный ген, кодирующий белок человека, отличается от своего ортолога шимпанзе всего на две аминокислоты.замены; почти треть генов человека имеют точно такую ​​же трансляцию белка, как их ортологи шимпанзе. Основное различие между двумя геномами - хромосома 2 человека , которая эквивалентна продукту слияния хромосом 12 и 13 шимпанзе [114] (позже переименованных в хромосомы 2A и 2B соответственно).

Люди претерпели необычайную потерю генов обонятельных рецепторов во время нашей недавней эволюции, что объясняет наше относительно грубое обоняние по сравнению с большинством других млекопитающих. Эволюционные данные свидетельствуют о том, что появление цветного зрения у людей и некоторых других видов приматов уменьшило потребность в обонянии. [115]

В сентябре 2016 года ученые сообщили, что, основываясь на генетических исследованиях ДНК человека, всех неафриканцев в современном мире можно отнести к одной популяции, которая покинула Африку между 50 000 и 80 000 лет назад. [116]

Митохондриальная ДНК [ править ]

Митохондриальная ДНК человека представляет огромный интерес для генетиков, поскольку она, несомненно, играет роль в митохондриальных заболеваниях . Это также проливает свет на эволюцию человека; например, анализ вариаций митохондриального генома человека привел к постулированию недавнего общего предка для всех людей по материнской линии происхождения (см. Митохондриальная Ева ).

Из-за отсутствия системы проверки ошибок копирования [ цитата необходима ] митохондриальная ДНК (мтДНК) имеет более высокую скорость изменения, чем ядерная ДНК. Эта 20-кратная [ необходима проверка ] более высокая частота мутаций позволяет использовать мтДНК для более точного отслеживания происхождения матери. [ необходима цитата ] Исследования мтДНК в популяциях позволили проследить древние пути миграции, такие как миграция коренных американцев из Сибири [ необходима цитата ] или полинезийцев из Юго- Восточной Азии [ необходима цитата ]. Он также использовался, чтобы показать, что в европейской смеси генов, унаследованной исключительно по материнской линии , нет никаких следов ДНК неандертальцев . [117] Из-за ограничительного полного или нулевого способа наследования мтДНК этот результат (отсутствие следов мтДНК неандертальцев) был бы вероятен, если бы не был большой процент предков неандертальцев или не имелось сильного положительного отбора по этой мтДНК. Например, возвращаясь к 5 поколениям, только 1 из 32 предков человека внес свой вклад в мтДНК этого человека, поэтому, если бы один из этих 32 был чистым неандертальцем, ожидаемые ~ 3% аутосомной ДНК этого человека были бы неандертальского происхождения, но они бы имели ~ 97% шанс не иметь никаких следов мтДНК неандертальца. [ необходима цитата ]

Эпигеном [ править ]

Эпигенетика описывает различные особенности генома человека, которые выходят за рамки его первичной последовательности ДНК, такие как упаковка хроматина , модификации гистонов и метилирование ДНК., которые важны для регулирования экспрессии генов, репликации генома и других клеточных процессов. Эпигенетические маркеры усиливают и ослабляют транскрипцию определенных генов, но не влияют на фактическую последовательность нуклеотидов ДНК. Метилирование ДНК - основная форма эпигенетического контроля над экспрессией генов и одна из наиболее изученных тем в эпигенетике. В процессе развития профиль метилирования ДНК человека претерпевает кардинальные изменения. В ранних клетках зародышевой линии геном имеет очень низкий уровень метилирования. Эти низкие уровни обычно описывают активные гены. По мере развития родительские метки импринтинга приводят к повышенной активности метилирования. [118] [119]

Эпигенетические паттерны могут быть идентифицированы между тканями внутри человека, а также между самими людьми. Идентичные гены, различающиеся только эпигенетическим состоянием, называются эпиаллелями . Эпиаллели можно разделить на три категории: те, которые непосредственно определяются генотипом человека, те, на которые влияет генотип, и те, которые полностью независимы от генотипа. На эпигеном также значительно влияют факторы окружающей среды. Диета, токсины и гормоны влияют на эпигенетическое состояние. Исследования диетических манипуляций показали, что диеты с дефицитом метила связаны с гипометилированием эпигенома. Такие исследования устанавливают эпигенетику как важный интерфейс между окружающей средой и геномом. [120]

См. Также [ править ]

  • Генетика
  • Геномика
  • Генографический проект
  • Геномная организация
  • Низкая копия повторяется
  • Некодирующая ДНК
  • Секвенирование всего генома
  • Всеобщая декларация о геноме человека и правах человека

Ссылки [ править ]

  1. ^ "ГРЧ38.п13" . ncbi . Консорциум ссылок на геном . Проверено 8 июня 2020 .
  2. Перейти ↑ Brown TA (2002). Геном человека (2-е изд.). Оксфорд: Wiley-Liss.
  3. ^ a b Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang HM, Marth GT, McVean GA (ноябрь 2012 г.). «Интегрированная карта генетических вариаций из 1092 геномов человека» . Природа . 491 (7422): 56–65. Bibcode : 2012Natur.491 ... 56T . DOI : 10.1038 / nature11632 . PMC 3498066 . PMID 23128226 .  
  4. ^ Auton А, Брукс Л. Д., Дарбина Р. М., Гаррисон Е.П., Кан НМ, Корбел JO, и др. (Октябрь 2015 г.). «Глобальный справочник по генетической изменчивости человека» . Природа . 526 (7571): 68–74. Bibcode : 2015Natur.526 ... 68T . DOI : 10.1038 / nature15393 . PMC 4750478 . PMID 26432245 .  
  5. ^ Секвенирование шимпанзе; Консорциум анализа (2005 г.). «Исходная последовательность генома шимпанзе и сравнение с геномом человека» (PDF) . Природа . 437 (7055): 69–87. Bibcode : 2005Natur.437 ... 69. . DOI : 10,1038 / природа04072 . PMID 16136131 . S2CID 2638825 .   
  6. ^ Варки А, Altheide ТК (декабрь 2005). «Сравнение геномов человека и шимпанзе: поиск иголок в стоге сена» . Геномные исследования . 15 (12): 1746–58. DOI : 10.1101 / gr.3737405 . PMID 16339373 . 
  7. ^ Международный консорциум по секвенированию генома человека публикует последовательность и анализ генома человека
  8. ^ Pennisi E (февраль 2001). «Геном человека». Наука . 291 (5507): 1177–80. DOI : 10.1126 / science.291.5507.1177 . PMID 11233420 . S2CID 38355565 .  
  9. ^ a b Международный консорциум по секвенированию генома человека (октябрь 2004 г.). «Завершение эухроматической последовательности генома человека» . Природа . 431 (7011): 931–45. Bibcode : 2004Natur.431..931H . DOI : 10,1038 / природа03001 . PMID 15496913 . 
  10. ^ Молтени M (19 ноября 2018). «Теперь вы можете секвенировать весь свой геном всего за 200 долларов» . Проводной .
  11. Wade N (23 сентября 1999 г.). «Число генов человека оценивается в 140 000, значительный прирост» . Нью-Йорк Таймс .
  12. ^ Ezkurdia Я, Хуан Д, Родригес Ю.М., франкская А, Diekhans М, борона - J, J Васкес, Валенсия А, Tress ML (ноябрь 2014). «Множество доказательств предполагают, что может быть всего 19 000 генов, кодирующих человеческий белок» . Молекулярная генетика человека . 23 (22): 5866–78. DOI : 10,1093 / HMG / ddu309 . PMC 4204768 . PMID 24939910 .  
  13. ^ Saey TH (17 сентября 2018). «Пересчет человеческих генов увеличивает число как минимум до 46 831» . Новости науки .
  14. ^ Аллес Дж., Фельманн Т., Фишер У., Бэкес С., Галата В., Минет М. и др. (Апрель 2019 г.). «Оценка общего количества истинных человеческих miRNA» . Исследования нуклеиновых кислот . 47 (7): 3353–3364. DOI : 10.1093 / NAR / gkz097 . PMC 6468295 . PMID 30820533 .  
  15. ^ a b c Pennisi E (сентябрь 2012 г.). «Геномика. Проект ENCODE пишет панегирик мусорной ДНК». Наука . 337 (6099): 1159–1161. DOI : 10.1126 / science.337.6099.1159 . PMID 22955811 . 
  16. Zhang S (28 ноября 2018 г.). «300 миллионов букв ДНК отсутствуют в геноме человека». Атлантика .
  17. ^ a b c Международный консорциум по секвенированию генома человека (февраль 2001 г.). «Первоначальное секвенирование и анализ генома человека» . Природа . 409 (6822): 860–921. Bibcode : 2001Natur.409..860L . DOI : 10.1038 / 35057062 . PMID 11237011 . CS1 maint: использует параметр авторов ( ссылка )
  18. Pollack A (2 июня 2016 г.). «Ученые объявляют о HGP-Write, проекте по синтезу генома человека» . Нью-Йорк Таймс . Проверено 2 июня +2016 .
  19. ^ Boeke JD, Церковь G, Hessel A, Kelley NJ, Аркин A, Y Cai и др. (Июль 2016 г.). "Проект-Геном". Наука . 353 (6295): 126–7. Bibcode : 2016Sci ... 353..126B . DOI : 10.1126 / science.aaf6850 . PMID 27256881 . S2CID 206649424 .  
  20. Чжан, Сара (28 ноября 2018 г.). «300 миллионов букв ДНК отсутствуют в геноме человека» . Атлантика . Проверено 16 августа 2019 .
  21. ^ Chaisson МДж, Хаддлстон Дж, Дэннис МОЙ, Sudmant PH, Malig М, Hormozdiari Ж, Антоначчи Ж, Surti U, Сандстр R, Boitano М, Landolin Ю.М., Stamatoyannopoulos JA , Hunkapiller МВт, Korlach Дж, Эйхлер ЭЭ (январь 2015). «Разрешение сложности человеческого генома с помощью секвенирования одной молекулы» . Природа . 517 (7536): 608–11. Bibcode : 2015Natur.517..608C . DOI : 10,1038 / природа13907 . PMC 4317254 . PMID 25383537 .  
  22. ^ Мига, Карен Х .; Корень, Сергей; Ри, Аранг; Vollger, Mitchell R .; Гершман, Ариэль; Бзикадзе, Андрей; Брукс, Шелиз; Хау, Эдмунд; Порубский, Давид; Logsdon, Glennis A .; Шнайдер, Валери А. (сентябрь 2020 г.). «Сборка теломер-теломер полной Х-хромосомы человека» . Природа . 585 (7823): 79–84. DOI : 10.1038 / s41586-020-2547-7 . ISSN 1476-4687 . PMC 7484160 . PMID 32663838 .   
  23. ^ Версия 87 браузера Ensembl genome [ постоянная мертвая ссылка ] (декабрь 2016 г.) для большинства значений; Версия 68 браузера Ensembl genome (июль 2012 г.) для miRNA, rRNA, snRNA, snoRNA.
  24. ^ Piovesan А, Pelleri МС, Antonaros Р, Р Strippoli, Caracausi МЫ, Виталь л (февраль 2019). «О длине, весе и содержании ГК генома человека» . BMC Research Notes . 12 (1): 106. DOI : 10,1186 / s13104-019-4137-г . PMC 6391780 . PMID 30813969 .  
  25. ^ Salzberg SL (август 2018). «Открытые вопросы: сколько у нас генов?» . BMC Biology . 16 (1): 94. DOI : 10,1186 / s12915-018-0564-х . PMC 6100717 . PMID 30124169 .  
  26. ^ "Статистика Gencode, версия 28" . Архивировано из оригинального 2 -го марта 2018 года . Проверено 12 июля 2018 .
  27. ^ "Статистика Ensembl для версии 92.38, соответствующей Gencode v28" . Проверено 12 июля 2018 .
  28. ^ "NCBI Homo sapiens Аннотации Выпуск 108" . НАЦИОНАЛЬНЫЕ ИНСТИТУТЫ ЗДРАВООХРАНЕНИЯ США. 2016 г.
  29. ^ «ШАХМАТНАЯ статистика, версия 2.0» . Центр вычислительной биологии . Университет Джона Хопкинса.
  30. ^ «Завершение проекта генома человека: часто задаваемые вопросы» . Национальный институт исследования генома человека (NHGRI) . Проверено 2 февраля 2019 .
  31. ^ Christley S, Lu Y, Li C, Се X (январь 2009). «Человеческие геномы как вложения электронной почты» . Биоинформатика . 25 (2): 274–5. DOI : 10.1093 / биоинформатики / btn582 . PMID 18996942 . 
  32. Перейти ↑ Liu Z (2008). «Покрытие пространства последовательностей, энтропия геномов и возможность обнаружения нечеловеческой ДНК в образцах человека» . BMC Genomics . 9 : 509. DOI : 10.1186 / 1471-2164-9-509 . PMC 2628393 . PMID 18973670 .  , Рис. 6 с использованием оценок скорости энтропии Лемпеля-Зива .
  33. Waters K (7 марта 2007 г.). «Молекулярная генетика» . Стэнфордская энциклопедия философии . Проверено 18 июля 2013 года .
  34. ^ Гэннетт L (26 октября 2008). «Проект генома человека» . Стэнфордская энциклопедия философии . Проверено 18 июля 2013 года .
  35. ^ Круговая диаграмма PANTHER на домашней странице системы классификации PANTHER. Проверено 25 мая 2011 г.
  36. ^ Список человеческих белков в эталонном протеоме Uniprot Human ; по состоянию на 28 января 2015 г.
  37. Кауфман С.А. (март 1969 г.). «Метаболическая стабильность и эпигенез в случайно построенных генетических сетях». Журнал теоретической биологии . 22 (3): 437–67. DOI : 10.1016 / 0022-5193 (69) 90015-0 . PMID 5803332 . 
  38. ^ Оно S (1972). «Аргумент в пользу генетической простоты человека и других млекопитающих». Журнал эволюции человека . 1 (6): 651–662. DOI : 10.1016 / 0047-2484 (72) 90011-5 .
  39. ^ Семон M, Mouchiroud D, L Duret (февраль 2005). «Связь между экспрессией генов и GC-содержанием у млекопитающих: статистическая значимость и биологическая значимость» . Молекулярная генетика человека . 14 (3): 421–7. DOI : 10,1093 / HMG / ddi038 . PMID 15590696 . 
  40. ^ М. Хуан, Х. Чжу, Б. Шен, Г. Гао, «Неслучайная походка в геноме человека» , 3-я Международная конференция по биоинформатике и биомедицинской инженерии (UCBBE, 2009), 1–3
  41. ^ a b Bang ML, Centner T, Fornoff F, Geach AJ, Gotthardt M, McNabb M, Witt CC, Labeit D, Gregorio CC, Granzier H, Labeit S (2001). «Полная последовательность гена тайтина, экспрессия необычной изоформы тайтина весом приблизительно 700 кДа и ее взаимодействие с обскурином определяют новую систему связывания Z-линии с I-полосой» . Циркуляционные исследования . 89 (11): 1065–72. DOI : 10.1161 / hh2301.100981 . PMID 11717165 . 
  42. ^ a b Piovesan A, Caracausi M, Antonaros F, Pelleri MC, Vitale L (2016). «GeneBase 1.1: инструмент для обобщения данных из наборов генов NCBI и его применение для обновления статистики генов человека» . База данных: журнал биологических баз данных и курирования . 2016 : baw153. DOI : 10,1093 / базы данных / baw153 . PMC 5199132 . PMID 28025344 .  
  43. ^ Обозреватель генома Ensembl (июль 2012 г.)
  44. Грегори TR (сентябрь 2005 г.). «Синергия между последовательностью и размером в крупномасштабной геномике». Природа Обзоры Генетики . 6 (9): 699–708. DOI : 10.1038 / nrg1674 . PMID 16151375 . S2CID 24237594 .  
  45. ^ a b Palazzo AF, Akef A (июнь 2012 г.). «Ядерный экспорт как ключевой арбитр« идентичности мРНК »у эукариот». Biochimica et Biophysica Acta (BBA) - механизмы регуляции генов . 1819 (6): 566–77. DOI : 10.1016 / j.bbagrm.2011.12.012 . PMID 22248619 . 
  46. Людвиг MZ (декабрь 2002 г.). «Функциональная эволюция некодирующей ДНК». Текущее мнение в области генетики и развития . 12 (6): 634–9. DOI : 10.1016 / S0959-437X (02) 00355-6 . PMID 12433575 . 
  47. ^ Martens JA, Laprade L, Уинстон F (июнь 2004). «Межгенная транскрипция необходима для репрессии гена SER3 Saccharomyces cerevisiae». Природа . 429 (6991): 571–4. Bibcode : 2004Natur.429..571M . DOI : 10,1038 / природа02538 . PMID 15175754 . S2CID 809550 .  
  48. ^ Tsai MC, Manor O, Ван Y, Mosammaparast N, Ван JK, Lan F, Ши Y, Сегал E, Chang ГИ (август 2010). «Длинная некодирующая РНК как модульный каркас комплексов модификации гистонов» . Наука . 329 (5992): 689–93. Bibcode : 2010Sci ... 329..689T . DOI : 10.1126 / science.1192002 . PMC 2967777 . PMID 20616235 .  
  49. ^ Бартоломей MS, Zemel S, Tilghman SM (май 1991). «Родительский импринтинг мышиного гена H19». Природа . 351 (6322): 153–5. Bibcode : 1991Natur.351..153B . DOI : 10.1038 / 351153a0 . PMID 1709450 . S2CID 4364975 .  
  50. ^ Kobayashi T, Ganley AR (сентябрь 2005). «Регуляция рекомбинации посредством индуцированной транскрипцией диссоциации когезина в повторах рДНК». Наука . 309 (5740): 1581–4. Bibcode : 2005Sci ... 309.1581K . DOI : 10.1126 / science.1116102 . PMID 16141077 . S2CID 21547462 .  
  51. ^ Salmena L, L Poliseno, Tay Y, L Катс, Pandolfi PP (август 2011). «Гипотеза цРНК: Розеттский камень скрытого языка РНК?» . Cell . 146 (3): 353–8. DOI : 10.1016 / j.cell.2011.07.014 . PMC 3235919 . PMID 21802130 .  
  52. ^ Пей В, Сису С, франкская А, Howald С, Хабеггер л, Му XJ, Гарт R, S Баласубраманьян, Танзер А, Diekhans М, Reymond А, Хаббард т, J борона, Герштейн МБ (2012). «Псевдогенный ресурс GENCODE» . Геномная биология . 13 (9): R51. DOI : 10.1186 / GB-2012-13-9-r51 . PMC 3491395 . PMID 22951037 .  
  53. Gilad Y, Man O, Pääbo S, Lancet D (март 2003 г.). «Человеческая специфическая потеря генов обонятельных рецепторов» . Труды Национальной академии наук Соединенных Штатов Америки . 100 (6): 3324–7. Bibcode : 2003PNAS..100.3324G . DOI : 10.1073 / pnas.0535697100 . PMC 152291 . PMID 12612342 .  
  54. ^ Айер М.К., Niknafs Ю.С., Малик R, Singhal U, Sahu A, Hosono Y, заколка TR, Prensner JR, Evans JR, Чжао S, Полякова A, Cao X, Dhanasekaran СМ, В YM, Робинсон DR, пиво DG, Feng FY, Iyer HK, Chinnaiyan AM (март 2015 г.). «Пейзаж длинных некодирующих РНК в человеческом транскриптоме» . Генетика природы . 47 (3): 199–208. DOI : 10.1038 / ng.3192 . PMC 4417758 . PMID 25599403 .  
  55. Эдди SR (декабрь 2001 г.). «Некодирующие гены РНК и современный мир РНК». Природа Обзоры Генетики . 2 (12): 919–29. DOI : 10.1038 / 35103511 . PMID 11733745 . S2CID 18347629 .  
  56. ^ Манагадзе Д., Лобковский А.Е., Вольф Ю.И., Шабалина С.А., Рогозин И.Б., Кунин Е.В. (2013). «Обширный консервативный lincRNome млекопитающих» . PLOS Вычислительная биология . 9 (2): e1002917. Bibcode : 2013PLSCB ... 9E2917M . DOI : 10.1371 / journal.pcbi.1002917 . PMC 3585383 . PMID 23468607 .  
  57. Перейти ↑ Palazzo AF, Lee ES (2015). «Некодирующая РНК: что функционально, а что нежелательно?» . Границы генетики . 6 : 2. дои : 10,3389 / fgene.2015.00002 . PMC 4306305 . PMID 25674102 .  
  58. ^ Маттик JS, Макунин IV (апрель 2006). «Некодирующая РНК» . Молекулярная генетика человека . 15 Спец. № 1: Р17–29. DOI : 10,1093 / HMG / ddl046 . PMID 16651366 . 
  59. ^ a b Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M (сентябрь 2012 г.). «Интегрированная энциклопедия элементов ДНК в геноме человека» . Природа . 489 (7414): 57–74. Bibcode : 2012Natur.489 ... 57T . DOI : 10.1038 / nature11247 . PMC 3439153 . PMID 22955616 .  
  60. ^ Birney E (5 сентября 2012). «ENCODE: Мои собственные мысли» . Блог Юэна: биоинформатик в целом .
  61. ^ Stamatoyannopoulos JA (сентябрь 2012). "Что кодирует наш геном?" . Геномные исследования . 22 (9): 1602–11. DOI : 10.1101 / gr.146506.112 . PMC 3431477 . PMID 22955972 .  
  62. ^ Carroll SB, Gompel N, Prudhomme B (май 2008). «Регулируя эволюцию». Scientific American . 298 (5): 60–67. Bibcode : 2008SciAm.298e..60C . DOI : 10.1038 / Scientificamerican0508-60 . PMID 18444326 . 
  63. ^ Miller JH, Ippen K, Скэйф JG, Беквит JR (1968). «Промотор-операторная область lac-оперона Escherichia coli». J. Mol. Биол . 38 (3): 413–20. DOI : 10.1016 / 0022-2836 (68) 90395-1 . PMID 4887877 . 
  64. ^ Райт S, Розенталь А, Флэйвеллы R, Grosveld F (1984). «Последовательности ДНК, необходимые для регулируемой экспрессии генов бета-глобина в мышиных клетках эритролейкемии». Cell . 38 (1): 265–73. DOI : 10.1016 / 0092-8674 (84) 90548-8 . PMID 6088069 . S2CID 34587386 .  
  65. Перейти ↑ Nei M, Xu P, Glazko G (февраль 2001 г.). «Оценка времени дивергенции мультипротеиновых последовательностей для нескольких видов млекопитающих и нескольких отдаленно родственных организмов» . Труды Национальной академии наук Соединенных Штатов Америки . 98 (5): 2497–502. Bibcode : 2001PNAS ... 98.2497N . DOI : 10.1073 / pnas.051611498 . PMC 30166 . PMID 11226267 .  
  66. ^ Loots GG, Локсли RM, Blankespoor CM, Ван ZE, Миллер W, Рубин Е.М., Frazer KA (апрель 2000). «Идентификация регулятора координат интерлейкинов 4, 13 и 5 путем сравнения последовательностей между видами». Наука . 288 (5463): 136–40. Bibcode : 2000Sci ... 288..136L . DOI : 10.1126 / science.288.5463.136 . PMID 10753117 . Резюме
  67. ^ Менье М. «Genoscope и Уайтхед объявляют о высокой последовательности охвата генома Tetraodon nigroviridis» . Геноскоп. Архивировано из оригинального 16 октября 2006 года . Проверено 12 сентября 2006 года .
  68. ^ Romero IG, Ruvinsky I, Гилад Y (июль 2012). «Сравнительные исследования экспрессии генов и эволюции регуляции генов» . Природа Обзоры Генетики . 13 (7): 505–16. DOI : 10.1038 / nrg3229 . PMC 4034676 . PMID 22705669 .  
  69. ^ Шмидт D, Wilson MD, Ballester B, Schwalie PC, Браун Д., Маршалл А, Куттер C, Вт S, Мартинес-Хименес CP, Mackay S, Talianidis I, Flicek P, Одом DT (май 2010). «ChIP-seq пяти позвоночных выявляет эволюционную динамику связывания транскрипционного фактора» . Наука . 328 (5981): 1036–40. Bibcode : 2010Sci ... 328.1036S . DOI : 10.1126 / science.1186176 . PMC 3008766 . PMID 20378774 .  
  70. ^ Wilson MD, Barbosa-Morais NL, Schmidt D, Conboy CM, Vanes L, Tybulewicz VL, Fisher EM, Tavaré S, Odom DT (октябрь 2008 г.). «Видоспецифическая транскрипция у мышей, несущих хромосому 21 человека» . Наука . 322 (5900): 434–8. Bibcode : 2008Sci ... 322..434W . DOI : 10.1126 / science.1160930 . PMC 3717767 . PMID 18787134 .  
  71. ^ Treangen TJ, Salzberg SL (январь 2012). «Повторяющаяся ДНК и секвенирование следующего поколения: вычислительные задачи и решения» . Природа Обзоры Генетики . 13 (1): 36–46. DOI : 10.1038 / nrg3117 . PMC 3324860 . PMID 22124482 .  
  72. ^ Дуитам Дж, Заблоцкая А, Жмайель R, Jansen А, Болет S, Vermeesch JR, Verstrepen КДж, Froyen G (май 2014 г.). «Масштабный анализ изменчивости тандемных повторов в геноме человека» . Исследования нуклеиновых кислот . 42 (9): 5728–41. DOI : 10.1093 / NAR / gku212 . PMC 4027155 . PMID 24682812 .  
  73. Перейти ↑ Pierce BA (2012). Генетика: концептуальный подход (4-е изд.). Нью-Йорк: WH Freeman. С. 538–540. ISBN 978-1-4292-3250-0.
  74. ^ Bennett Е.А., Keller H, Миллс RE Шмидт S, Moran СП, Weichenrieder O, Devine SE (декабрь 2008). «Активные ретротранспозоны Alu в геноме человека» . Геномные исследования . 18 (12): 1875–83. DOI : 10.1101 / gr.081737.108 . PMC 2593586 . PMID 18836035 .  
  75. ^ Лян KH, Yeh CT (2013). «Сеть ограничения экспрессии генов, опосредованная смысловыми и антисмысловыми последовательностями Alu, расположенными на кодирующих белки информационных РНК» . BMC Genomics . 14 : 325. DOI : 10.1186 / 1471-2164-14-325 . PMC 3655826 . PMID 23663499 .  
  76. ^ Brouha B, Schustak J, знак RM, Lutz-Prigge S, Фарли AH, Moran СП, Kazazian HH (апрель 2003). «Горячие L1 составляют основную часть ретротранспозиции в человеческой популяции» . Труды Национальной академии наук Соединенных Штатов Америки . 100 (9): 5280–5. Bibcode : 2003PNAS..100.5280B . DOI : 10.1073 / pnas.0831042100 . PMC 154336 . PMID 12682288 .  
  77. ^ Barton NH, Бриггс DE, Эйзен JA, Goldstein DB, Patel NH (2007). Эволюция . Колд-Спринг-Харбор, Нью-Йорк: Лаборатория Колд-Спринг-Харбор. ISBN 978-0-87969-684-9.
  78. ^ NCBI . «GRCh38 - hg38 - Геном - Сборка - NCBI» . ncbi.nlm.nih.gov . Проверено 15 марта 2019 .
  79. ^ "из обращения Билла Клинтона о положении в стране в 2000 году" . Архивировано из оригинального 21 февраля 2017 года . Проверено 14 июня 2007 года .
  80. ^ Редон Р., Исикава С., Fitch KR, Феук Л., Перри Г. Х., Эндрюс Т. Д. и др. (Ноябрь 2006 г.). «Глобальные вариации числа копий в геноме человека» . Природа . 444 (7118): 444–54. Bibcode : 2006Natur.444..444R . DOI : 10,1038 / природа05329 . PMC 2669898 . PMID 17122850 .  
  81. ^ "Что такое геном?" . Genomenewsnetwork.org. 15 января 2003 . Проверено 31 мая 2009 года .
  82. ^ NCBI_user_services (29 марта 2004 г.). «Картографический информационный бюллетень» . Ncbi.nlm.nih.gov. Архивировано из оригинала 19 июля 2010 года . Проверено 31 мая 2009 года .
  83. ^ «О проекте» . HapMap . Проверено 31 мая 2009 года .
  84. ^ «Выпуск 2008: Исследователи создают первую карту последовательности крупномасштабных структурных изменений в геноме человека» . genome.gov . Проверено 31 мая 2009 года .
  85. ^ Кидд Дж. М., Купер Г. М., Донахью В. Ф., Хайден Х. С., Сампас Н., Грейвс Т. и др. (Май 2008 г.). «Картирование и секвенирование структурных вариаций из восьми геномов человека» . Природа . 453 (7191): 56–64. Bibcode : 2008Natur.453 ... 56K . DOI : 10,1038 / природа06862 . PMC 2424287 . PMID 18451855 .  
  86. ^ Серый IC, Кэмпбелл Д., Spurr NK (2000). «Однонуклеотидные полиморфизмы как инструменты в генетике человека» . Молекулярная генетика человека . 9 (16): 2403–2408. DOI : 10.1093 / HMG / 9.16.2403 . PMID 11005795 . 
  87. Лай Э (июнь 2001 г.). «Применение SNP-технологий в медицине: извлеченные уроки и будущие вызовы» . Геномные исследования . 11 (6): 927–9. DOI : 10.1101 / gr.192301 . PMID 11381021 . 
  88. ^ «Завершение проекта генома человека: часто задаваемые вопросы» . genome.gov . Проверено 31 мая 2009 года .
  89. Singer E (4 сентября 2007 г.). «Геном Крейга Вентера» . Обзор технологий Массачусетского технологического института . Проверено 25 мая 2010 года .
  90. ^ Пушкарев, Дмитрий; Нефф, Норма Ф; Quake, Стивен Р. (сентябрь 2009 г.). «Одномолекулярное секвенирование индивидуального генома человека» . Природа Биотехнологии . 27 (9): 847–850. DOI : 10.1038 / nbt.1561 . PMC 4117198 . 
  91. ^ Эшли, Юан А; Бьютт, Атул Дж; Уилер, Мэтью Т; Чен, Ронг; Klein, Teri E; Дьюи, Фредерик Э; Дадли, Джоэл Т; Ормонд, Келли Э; Павлович, Александра; Морган, Александр А; Пушкарев Дмитрий; Нефф, Норма Ф; Хаджинс, Луанн; Гонг, Ли; Ходжес, Лаура М; Берлин, Дорит С; Торн, Кэролайн Ф; Сангкуль, Катрин; Hebert, Joan M; Вун, Марк; Сагрейя, Херш; Уэйли, Райан; Ноулз, Джошуа В.; Чоу, Майкл Ф; Такурия, Джозеф V; Розенбаум, Авраам М; Заранек, Александр Ждут; Церковь, Георгий М; Грили, Генри Т; Quake, Стивен Р.; Альтман, Расс Б. (май 2010 г.). «Клиническая оценка с использованием личного генома» . Ланцет . 375 (9725): 1525–1535. DOI : 10.1016 / S0140-6736 (10) 60452-7 . ЧВК 2937184 .
  92. ^ Дьюи, Фредерик Э .; Чен, Ронг; Cordero, Sergio P .; Ормонд, Келли Э .; Калешу, Коллин; Karczewski, Konrad J .; Whirl-Carrillo, Мишель; Уилер, Мэтью Т .; Дадли, Джоэл Т .; Бирнс, Джейк К .; Cornejo, Omar E .; Ноулз, Джошуа В .; Вун, Марк; Сангкуль, Катрин; Гонг, Ли; Торн, Кэролайн Ф .; Hebert, Joan M .; Каприотти, Эмидио; Дэвид, Шон П .; Павлович, Александра; Уэст, Энн; Такурия, Джозеф V .; Болл, Мадлен П .; Заранек, Александр В .; Rehm, Heidi L .; Церковь, Джордж М .; West, John S .; Bustamante, Carlos D .; Снайдер, Майкл; Альтман, Русь Б .; Klein, Teri E .; Butte, Atul J .; Эшли, Юан А. (15 сентября 2011 г.). «Поэтапный геномный геномный риск в семейном квартете с использованием контрольной последовательности главного аллеля» . PLoS Genetics . 7 (9): e1002280.DOI : 10.1371 / journal.pgen.1002280 .
  93. ^ «Complete Genomics добавляет 29 полных наборов данных для секвенирования генома человека с широким охватом в свой общедоступный геномный репозиторий» .
  94. Образец I (17 февраля 2010 г.). «Геном Десмонда Туту секвенирован в рамках исследования генетического разнообразия» . Хранитель .
  95. ^ Шустер С. К., Миллер В., Ратан А., Томшо Л. П., Джардин Б., Кассон Л. Р. и др. (2010). «Полные геномы койсанов и банту из южной части Африки» . Природа . 463 (7283): 943–7. Bibcode : 2010Natur.463..943S . DOI : 10,1038 / природа08795 . PMC 3890430 . PMID 20164927 .  
  96. ^ Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, et al. (Февраль 2010 г.). «Древняя последовательность генома человека вымершего палео-эскимоса» . Природа . 463 (7282): 757–62. Bibcode : 2010Natur.463..757R . DOI : 10,1038 / природа08835 . PMC 3951495 . PMID 20148029 .  
  97. ^ Corpas M , Cariaso M, Coletta A, D Вайс, Харрисон AP, Moran F, Ян H (12 ноября 2013). «Полный набор данных общедоступной семейной геномики». bioRxiv 10.1101 / 000216 . 
  98. ^ Corpas M (июнь 2013). «Краудсорсинг корпасомы» . Исходный код для биологии и медицины . 8 (1): 13. DOI : 10,1186 / 1751-0473-8-13 . PMC 3706263 . PMID 23799911 .  
  99. ^ Mao Q, Ciotlos S, Zhang RY, Ball MP, Chin R, Carnevali P и др. (Октябрь 2016 г.). «Последовательности всего генома и экспериментально фазированные гаплотипы более 100 личных геномов» . GigaScience . 5 (1): 42. DOI : 10,1186 / s13742-016-0148-г . PMC 5057367 . PMID 27724973 .  
  100. ^ Цай Б., Ли Б., Кига Н., Тусберг Дж., Бергквист Т., Чен Ю.С. и др. (Сентябрь 2017 г.). «Сопоставление фенотипов с целыми геномами: уроки, извлеченные из четырех итераций задач сообщества проекта личного генома» . Мутация человека . 38 (9): 1266–1276. DOI : 10.1002 / humu.23265 . PMC 5645203 . PMID 28544481 .  
  101. ^ Гонзага-Jauregui C, Лапски JR, Гиббс RA (2012). «Секвенирование генома человека в условиях здоровья и болезней» . Ежегодный обзор медицины . 63 : 35–61. DOI : 10.1146 / annurev-med-051010-162644 . PMC 3656720 . PMID 22248320 .  
  102. Choi M, Scholl UI, Ji W, Liu T, Тихонова IR, Zumbo P, Nayir A, Bakkalolu A, Ozen S, Sanjad S, Nelson-Williams C, Farhi A, Mane S, Lifton RP (ноябрь 2009 г.). «Генетическая диагностика путем захвата всего экзома и массового параллельного секвенирования ДНК» . Труды Национальной академии наук Соединенных Штатов Америки . 106 (45): 19096–101. Bibcode : 2009PNAS..10619096C . DOI : 10.1073 / pnas.0910672106 . PMC 2768590 . PMID 19861545 .  
  103. ^ a b Нарасимхан В.М., Сюэ Y, Тайлер-Смит C (апрель 2016 г.). "Нокаутирующие люди: мертвые, больные, здоровые или улучшенные?" . Тенденции в молекулярной медицине . 22 (4): 341–351. DOI : 10.1016 / j.molmed.2016.02.006 . PMC 4826344 . PMID 26988438 .  
  104. ^ Салехин Д., Натараджан П., Армеан И.М., Чжао В., Рашид А., Хетарпал С.А. и др. (Апрель 2017 г.). «Человеческие нокауты и фенотипический анализ в когорте с высоким уровнем кровного родства» . Природа . 544 (7649): 235–239. Bibcode : 2017Natur.544..235S . DOI : 10.1038 / nature22034 . PMC 5600291 . PMID 28406212 .  
  105. ^ a b Хамош А., Скотт А.Ф., Амбергер Дж, Боккини С., Валле Д., МакКусик В.А. (январь 2002 г.). «Интернет-Менделирующее наследование в человеке (OMIM), база знаний о генах человека и генетических нарушениях» . Исследования нуклеиновых кислот . 30 (1): 52–5. DOI : 10.1093 / NAR / 30.1.52 . PMC 99152 . PMID 11752252 .  
  106. ^ Katsanis N (ноябрь 2016). «Континуум причинности в человеческих генетических нарушениях» . Геномная биология . 17 (1): 233. DOI : 10.1186 / s13059-016-1107-9 . PMC 5114767 . PMID 27855690 .  
  107. Перейти ↑ Wong, Lee-Jun C. (2017), Wong, Lee-Jun C. (ed.), «Обзор клинической полезности секвенирования следующего поколения в молекулярной диагностике генетических заболеваний человека», Клиническая молекулярная диагностика на основе секвенирования следующего поколения генетических заболеваний человека , Springer International Publishing, стр. 1–11, DOI : 10.1007 / 978-3-319-56418-0_1 , ISBN 978-3-319-56418-0
  108. ^ Fedick А, Чжан J (2017). Вонг Л.С. (ред.). Следующее поколение скрининга операторов связи . Клиническая молекулярная диагностика генетических заболеваний человека на основе секвенирования нового поколения . Издательство Springer International. С. 339–354. DOI : 10.1007 / 978-3-319-56418-0_16 . ISBN 978-3-319-56418-0.
  109. ^ Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, et al. (Декабрь 2002 г.). «Первоначальное секвенирование и сравнительный анализ генома мыши» . Природа . 420 (6915): 520–62. Bibcode : 2002Natur.420..520W . DOI : 10,1038 / природа01262 . PMID 12466850 . доля небольших (50–100 п.н.) сегментов в геноме млекопитающих, подвергающихся (очищающей) селекции, может быть оценена примерно в 5%. Эта пропорция намного выше, чем может быть объяснена только последовательностями, кодирующими белок, подразумевая, что геном содержит множество дополнительных функций (таких как нетранслируемые области, регуляторные элементы, гены, не кодирующие белки, и структурные элементы хромосом) при отборе по биологической функции. .
  110. ^ Birney Е, Stamatoyannopoulos JA, Датта А, Гиго R, Gingeras TR, Маргулис ЕН, и др. (Июнь 2007 г.). «Идентификация и анализ функциональных элементов в 1% генома человека в рамках пилотного проекта ENCODE» . Природа . 447 (7146): 799–816. Bibcode : 2007Natur.447..799B . DOI : 10,1038 / природа05874 . PMC 2212820 . PMID 17571346 .  
  111. ^ Секвенирование шимпанзе; Консорциум анализа (сентябрь 2005 г.). «Исходная последовательность генома шимпанзе и сравнение с геномом человека» . Природа . 437 (7055): 69–87. Bibcode : 2005Natur.437 ... 69. . DOI : 10,1038 / природа04072 . PMID 16136131 . Мы подсчитали, что расхождение нуклеотидов по всему геному между человеком и шимпанзе составляет 1,23%, подтверждая недавние результаты более ограниченных исследований. 
  112. ^ Секвенирование шимпанзе; Консорциум анализа (сентябрь 2005 г.). «Исходная последовательность генома шимпанзе и сравнение с геномом человека» . Природа . 437 (7055): 69–87. Bibcode : 2005Natur.437 ... 69. . DOI : 10,1038 / природа04072 . PMID 16136131 . мы оцениваем, что полиморфизм составляет 14–22% наблюдаемой скорости расхождения, и, таким образом, фиксированная дивергенция составляет ~ 1,06% или меньше. 
  113. ^ Демут ДП, Де Бие Т, Stajich JE, Cristianini N, Хан МВт (2006). «Эволюция семейств генов млекопитающих» . PLOS ONE . 1 (1): e85. Bibcode : 2006PLoSO ... 1 ... 85D . DOI : 10.1371 / journal.pone.0000085 . PMC 1762380 . PMID 17183716 . Наши результаты предполагают, что люди и шимпанзе различаются по крайней мере на 6% (1418 из 22000 генов) по своему набору генов, что резко контрастирует с часто цитируемой разницей в 1,5% между ортологичными нуклеотидными последовательностями.  
  114. ^ Секвенирование шимпанзе; Консорциум анализа (сентябрь 2005 г.). «Исходная последовательность генома шимпанзе и сравнение с геномом человека» . Природа . 437 (7055): 69–87. Bibcode : 2005Natur.437 ... 69. . DOI : 10,1038 / природа04072 . PMID 16136131 . Хромосома 2 человека возникла в результате слияния двух наследственных хромосом, которые остались отдельными в линии шимпанзе. 
    Олсон М.В., Варки А. (январь 2003 г.). «Секвенирование генома шимпанзе: понимание эволюции человека и болезней». Природа Обзоры Генетики . 4 (1): 20–8. DOI : 10.1038 / nrg981 . PMID  12509750 . S2CID  205486561 . Сейчас неизбежно крупномасштабное секвенирование генома шимпанзе.
  115. Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S (январь 2004 г.). «Утрата генов обонятельных рецепторов совпадает с приобретением полного трехцветного зрения у приматов» . PLOS Биология . 2 (1): E5. DOI : 10.1371 / journal.pbio.0020005 . PMC 314465 . PMID 14737185 . Наши результаты предполагают, что ухудшение обонятельного репертуара произошло одновременно с приобретением полного трехцветного цветового зрения у приматов.  
  116. Zimmer C (21 сентября 2016 г.). «Как мы сюда попали: ДНК указывает на единственную миграцию из Африки» . Нью-Йорк Таймс . Проверено 22 сентября 2016 года .
  117. Sykes B (9 октября 2003 г.). «Митохондриальная ДНК и история человечества» . Геном человека. Архивировано из оригинала 7 сентября 2015 года . Проверено 19 сентября 2006 года .
  118. ^ Misteli T (февраль 2007). «Вне последовательности: клеточная организация функции генома». Cell . 128 (4): 787–800. DOI : 10.1016 / j.cell.2007.01.028 . PMID 17320514 . S2CID 9064584 .  
  119. ^ Bernstein BE, Мейснер A, Lander ES (февраль 2007). «Эпигеном млекопитающих». Cell . 128 (4): 669–81. DOI : 10.1016 / j.cell.2007.01.033 . PMID 17320505 . S2CID 2722988 .  
  120. ^ Scheen AJ, Жуньен C (май-июнь 2012). «[Эпигенетика, интерфейс между окружающей средой и генами: роль в сложных заболеваниях]». Revue Médicale de Liège . 67 (5–6): 250–7. PMID 22891475 . 

Внешние ссылки [ править ]

  • Ensembl Проект браузера Ensembl Genome
  • Программа просмотра генома человека Национальной медицинской библиотеки
  • Браузер генома UCSC .
  • Проект "Геном человека" .
  • Национальный исследовательский институт генома человека * Национальное управление геномики общественного здравоохранения
  • Простая программа просмотра генома человека