Эта статья опубликована в рецензируемом журнале PLOS Genetics (2019). Щелкните, чтобы просмотреть опубликованную версию.
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Новые гены могут возникать из изначально негенных регионов с помощью плохо изученных механизмов. (A) Негенная область сначала получает транскрипцию и открытую рамку считывания (ORF) в любом порядке, способствуя рождению гена de novo . ORF предназначена только для иллюстративных целей, поскольку гены de novo также могут быть мультиэкзонными или не иметь ORF, как в случае с генами РНК . (B) Печать поверх. Создается новая ORF, которая перекрывается с существующей ORF, но в другом фрейме. (C) Экзонизация. Ранее интронная область альтернативно сплайсируется как экзон, например, когда повторяющиеся последовательности приобретаются посредством ретропозиции.и новые сайты сплайсинга создаются посредством мутационных процессов. Наложение печати и экзонизацию можно рассматривать как частные случаи рождения гена de novo.
Новые гены могут быть образованы из генов предков с помощью множества механизмов. [1] (A) Дублирование и расхождение. После дублирования одна копия подвергается более расслабленному отбору и постепенно приобретает новые функции. (B) Слияние генов. Гибридный ген, образованный из некоторых или всех двух ранее отдельных генов. Слияния генов могут происходить по разным механизмам; здесь показано межстраничное удаление. (C) Деление гена. Один ген разделяется, образуя два разных гена, например, в результате дупликации и дифференциальной дегенерации двух копий. [2] (D) Горизонтальный перенос генов . Гены, полученные от других видов путем горизонтального переноса, подвергаются дивергенции и неофункционализации. (E)Ретропозиция. Транскрипты могут быть подвергнуты обратной транскрипции и интегрированы как безинтронный ген в другом месте генома. Затем этот новый ген может подвергнуться дивергенции.

Рождение гена de novo - это процесс, при котором новые гены развиваются из последовательностей ДНК, которые изначально были негенными . [3] Гены de novo представляют собой подмножество новых генов и могут кодировать белок или вместо этого действовать как гены РНК. [4] Процессы, которые управляютрождением гена de novo , недостаточно изучены, хотя существует несколько моделей, которые описывают возможные механизмы, с помощью которыхможет происходить рождение гена de novo .

Хотя рождение гена de novo могло произойти в любой момент эволюционной истории организма, события рождения гена de novo в древности обнаружить трудно. Таким образом, большинство исследований генов de novo на сегодняшний день сосредоточено на молодых генах, как правило, таксономически ограниченных генах (TRG), которые присутствуют в одном виде или клоне, включая так называемые сиротские гены , определяемые как гены, у которых отсутствует какой-либо идентифицируемый гомолог. Однако важно отметить, что не все гены-сироты возникают de novo , а вместо этого могут возникать посредством достаточно хорошо изученных механизмов, таких как дупликация генов (включая ретропозицию) или горизонтальный перенос генов.с последующим расхождением последовательностей или делением / слиянием генов . [5] [6]

Хотя когда-то рождение гена de novo считалось крайне маловероятным [7] , теперь описано несколько однозначных примеров [8], и некоторые исследователи предполагают, что рождение гена de novo могло сыграть важную роль в эволюционных инновациях. [9] [10]

История [ править ]

Еще в 1930-х годах Дж. Б. С. Холдейн и другие предположили, что копии существующих генов могут приводить к новым генам с новыми функциями. [6] В 1970 году Сусуму Оно опубликовал основополагающий текст « Эволюция путем дублирования генов» . [11] Некоторое время спустя общее мнение заключалось в том, что практически все гены произошли от наследственных генов, [12] с известным замечанием Франсуа Жакоба в эссе 1977 года, что «вероятность того, что функциональный белок появится de novo в результате случайной ассоциации аминокислот практически равен нулю ». [7]

Однако в том же году Пьер-Поль Грассе ввел термин «наложение» для описания появления генов посредством экспрессии альтернативных открытых рамок считывания (ORF), которые перекрывают уже существующие гены. [13] Эти новые рамки считывания могут быть вне рамки или антисмысловы по отношению к уже существующему гену. Они также могут находиться в рамке с существующей ORF, создавая усеченную версию исходного гена, или представлять 3'-расширения существующей ORF в соседнюю ORF. Первые два типа надпечатки можно рассматривать как особый подтип de novoрождение гена; Хотя первичная аминокислотная последовательность нового белка перекрывается с ранее кодирующей областью генома, она является полностью новой и получена из каркаса, который ранее не содержал ген. Первые примеры этого явления у бактериофагов были описаны в серии исследований с 1976 по 1978 год [14] [15] [16], и с тех пор множество других примеров было обнаружено у вирусов, бактерий и нескольких видов эукариот. [17] [18] [19] [20] [21] [22]

Феномен экзонизации также представляет собой особый случай рождения гена de novo , когда, например, часто повторяющиеся интронные последовательности приобретают сайты сплайсинга посредством мутации, что приводит к появлению экзонов de novo . Впервые это было описано в 1994 г. в контексте последовательностей Alu , обнаруженных в кодирующих областях мРНК приматов. [23] Интересно, что такие de novo экзоны часто обнаруживаются в минорных вариантах сплайсинга, что может позволить эволюционное «тестирование» новых последовательностей при сохранении функциональности основного варианта (ов) сплайсинга. [24]

Тем не менее, некоторые считали, что большинство или все эукариотические белки были сконструированы из ограниченного пула экзонов «стартового типа». [25] Используя данные о последовательностях, доступные в то время, обзор 1991 года оценил количество уникальных предковых экзонов эукариот менее 60 000, [25] в то время как в 1992 году была опубликована статья, в которой говорилось, что подавляющее большинство белков принадлежало не более чем более 1000 семей. [26] Примерно в то же время, однако, была выпущена последовательность хромосомы III почкующихся дрожжей Saccharomyces cerevisiae , [27]представляет собой первое секвенирование всей хромосомы любого эукариотического организма. Секвенирование всего ядерного генома дрожжей было завершено к началу 1996 года в результате масштабных совместных международных усилий. [28] В своем обзоре проекта генома дрожжей Бернар Дуйон отметил, что неожиданное обилие генов, лишенных каких-либо известных гомологов, было, пожалуй, самым поразительным открытием всего проекта. [28]

В 2006 и 2007 годах серия исследований предоставила, возможно, первые задокументированные примеры рождения гена de novo без наложения отпечатков. [29] [30] [31] Анализ транскриптомов добавочных желез Drosophila yakuba и Drosophila erecta впервые выявил 20 предполагаемых генов, ограниченных по клону, которые, по-видимому, вряд ли возникли в результате дупликации генов. [31] Левин и его коллеги подтвердили происхождение de novo пяти генов-кандидатов, специфичных для Drosophila melanogaster и / или близкородственных Drosophila simulans.через строгий конвейер, сочетающий биоинформатические и экспериментальные методы. [30] Эти гены были идентифицированы путем комбинирования подходов, основанных на поиске BLAST и на основе синтении , которые продемонстрировали отсутствие генов у близкородственных видов. [30]

Несмотря на недавнюю эволюцию, все пять генов кажутся фиксированными у D. melanogaster , и наличие паралогичных некодирующих последовательностей, которые отсутствуют у близких родственников, предполагает, что четыре из пяти генов могли возникнуть в результате недавнего события внутрихромосомной дупликации. [30] Интересно, что все пять преимущественно экспрессировались в семенниках самцов мух [30] . Три гена, для которых существуют полные ORF как у D. melanogaster, так и у D. simulans, продемонстрировали свидетельства быстрой эволюции и положительного отбора. [30] Это согласуется с недавним появлением этих генов, поскольку для молодых новых генов характерна адаптивная эволюция, [32][33] [34], но это также затрудняет полную уверенность в том, что кандидаты кодируют действительно функциональные продукты. Последующее исследование с использованием методов, аналогичных Levine et al. абиблиотека экспрессируемых тегов последовательностей, полученная изсеменников D. yakuba, идентифицировала семь генов, полученных из шести уникальныхсобытий рождения гена de novo у D. yakuba и / или близкородственного D. erecta. [29]

Три из этих генов чрезвычайно короткие (<90 п.н.), что позволяет предположить, что они могут быть генами РНК [29], хотя также зарегистрировано несколько примеров очень коротких функциональных пептидов. [35] [36] [37] [38] Примерно в то же время, когда были опубликованы эти исследования на дрозофиле , поиск гомологии геномов из всех сфер жизни, включая 18 геномов грибов, выявил 132 специфичных для грибов белка, 99 из которых были уникальными для S. cerevisiae . [39]

После этих первоначальных исследований многие группы выявили конкретные случаи рождения гена de novo у различных организмов. [40] Ген BSC4 в S. cerevisiae , идентифицированный в 2008 году, демонстрирует доказательства очищающего отбора, экспрессируется как на уровне мРНК, так и на уровне белка, а при удалении является синтетически летальным с двумя другими генами дрожжей, каждый из которых указывает на функциональную роль. для продукта гена BSC4 . [41] Исторически сложилось так, что один аргумент против широко распространенного de novoРождение гена - это сложная сложность сворачивания белков. Интересно, что позже было показано, что Bsc4 принимает частично сложенное состояние, которое сочетает в себе свойства сворачивания нативных и ненативных белков. [42] Другим хорошо изученным примером дрожжей является MDF1 , который подавляет эффективность спаривания и способствует вегетативному росту, а также замысловато регулируется консервативной антисмысловой ORF. [43] [44] В растениях первым de novo геном, который был функционально охарактеризован, был QQS , ген Arabidopsis thaliana , идентифицированный в 2009 году, который регулирует метаболизм углерода и азота. [45] Первые функционально охарактеризованные de novoГен, идентифицированный у мышей, некодирующий ген РНК, также был описан в 2009 году. [46] У приматов информационный анализ 2008 года показал, что 15/270 генов-сирот приматов были сформированы de novo . [47] В отчете 2009 года были идентифицированы первые три гена человека de novo , один из которых является терапевтической мишенью при хроническом лимфолейкозе. [48] С этого времени множество исследований на уровне генома выявило большое количество генов-сирот у многих организмов, хотя степень, в которой они возникли de novo , и степень, в которой они могут считаться функциональными, остаются дискуссионными.

Идентификация [ править ]

Идентификация De Novo новых последовательностей [ править ]

Существует два основных подхода к систематической идентификации новых генов: геномная филостратиграфия [49] и методы, основанные на синтении . [50] Оба подхода широко используются, по отдельности или дополняя друг друга.

Геномная филостратиграфия [ править ]

Геномная филостратиграфия включает исследование каждого гена у фокального вида и определение наличия или отсутствия предковых гомологов с помощью алгоритмов выравнивания последовательностей BLAST [51] или связанных инструментов. Каждому гену целевого вида может быть присвоен «возраст» (он же «уровень сохранения» или «геномный филострат»), основанный на заранее определенной филогении, с возрастом, соответствующим наиболее отдаленным родственным видам, у которых обнаружен гомолог. [49] Когда в гене отсутствует какой-либо обнаруживаемый гомолог за пределами его собственного генома или близких родственников, он считается новым, таксономически ограниченным или сиротским геном, хотя такое обозначение, конечно, зависит от группы видов, в отношении которых проводится поиск. .

Филогенетические деревья ограничены набором доступных тесно связанных геномов, а результаты зависят от критериев поиска BLAST. [52] Поскольку этот подход основан на сходстве последовательностей, часто бывает трудно определить, возник ли новый ген de novo или отошел от предкового гена до неузнаваемости, например, после события дупликации. На это указывало исследование, моделировавшее эволюцию генов одного возраста и обнаружившее, что далекие ортологи могут не обнаруживаться для быстро развивающихся генов. [53] При учете изменений в скорости эволюции тех частей молодых генов, которые приобретают избранные функции, филостратиграфический подход был гораздо более точным при назначении возраста генов в смоделированных данных.[54] Последующие исследования с использованием моделированной эволюции показали, что филостратиграфия не смогла обнаружить ортолога у наиболее отдаленно родственных видов для 13,9%генов D. melanogaster и 11,4%генов S. cerevisiae . [55] [56] Точно так же в смоделированных данных была обнаружена ложная связь между возрастом гена и его вероятностью быть вовлеченным в процесс заболевания. [56] Однако повторный анализ исследований, в которых использовалась филостратиграфия на дрожжах, плодовых мушках и людях, показал, что даже с учетом такой частоты ошибок и исключения трудно стратифицируемых генов из анализа, качественные выводы не повлияли на все три исследования. [57]Влияние филостратиграфической ошибки на исследования, изучающие различные особенности генов de novo, остается дискуссионным.

Для увеличения выявляемости родовых гомологов, чувствительных последовательностей на основе поисков подобия, такие как CS-BLAST и скрытой марковской модели (СММ) основанное поиски, также могут быть использованы отдельно или в сочетании с анализом phylostratigraphy BLAST на основе, чтобы идентифицировать де novo гены. Техника PSI-BLAST [58] особенно полезна для обнаружения древних гомологов. Сравнительное исследование показало, что некоторые из этих «профильных» анализов были более точными, чем обычные парные инструменты. [59] Влияние ложных срабатываний, когда гены ошибочно предполагают наличие гомолога предков, хотя в действительности они являются новыми, на наше понимание de novo генное рождение еще не было специально оценено.

Важно отделить технические трудности, связанные с обнаружением самого старого предка гена и оценкой возраста гена (конечная цель филостратиграфии), от проблем, связанных с установлением механизмов, с помощью которых ген эволюционировал. [52] Молодые гены и гены предков могли развиться de novo или с помощью других механизмов. Текущий подход к определению того, возник ли ген de novo, является синтенией и обычно может применяться только к молодым генам. [60]

Подходы, основанные на синтении [ править ]

Подходы, основанные на анализе синтенических последовательностей во внешних группах - блоков последовательности, в которых сохраняется порядок и относительное расположение признаков - позволяют идентифицировать негенных предков генов- кандидатов de novo . [10] [52] Синтенические выравнивания закреплены короткими консервативными «маркерами». Гены являются наиболее распространенным маркером для определения синтенических блоков, хотя также используются k-меры и экзоны. [61] [50] Предполагая, что может быть получено высококачественное синтеническое выравнивание, подтверждение того, что синтеническая область лишена кодирующего потенциала у видов вне группы, позволяет с большей уверенностью утверждать происхождение de novo . [52] Наиболее убедительные доказательства того, чтоde novo эмерджентность - это вывод о конкретной мутации (-ах), которая создала кодирующий потенциал, как правило, посредством анализа микросинтенических регионов близкородственных видов.

Одна из проблем при применении методов, основанных на синтении, заключается в том, что синтению бывает трудно обнаружить в более длительных временных масштабах. Чтобы решить эту проблему, были опробованы различные методы, такие как использование экзонов, сгруппированных независимо от их конкретного порядка, для определения синтенных блоков [50] или алгоритмы, которые используют хорошо законсервированные геномные области для расширения микросинтенических блоков. [62] Существуют также трудности, связанные с применением основанных на синтении подходов к сборкам генома, которые фрагментированы [63] или находятся в клонах с высокой скоростью хромосомных перестроек, как это часто бывает у насекомых. [64] Хотя подходы, основанные на синтении, обычно имели меньшую пропускную способность по своей природе, в настоящее время они применяются к полногеномным исследованиям de novo.гены [47] [48] [65] [66] [67] [68] [69] [70] и представляют собой многообещающую область алгоритмического развития для определения даты рождения генов. Некоторые использовали подходы, основанные на синтении, в сочетании с поисками сходства в попытке разработать стандартизованные строгие конвейеры [60], которые могут быть применены к любой группе геномов в попытке устранить расхождения в различных списках генов de novo , которые были сгенерировано.

Определение статуса [ править ]

Даже когда эволюционное происхождение конкретной последовательности было строго установлено с помощью вычислений, важно отметить отсутствие единого мнения о том, что составляет подлинное событие рождения гена de novo . Одна из причин этого - отсутствие согласия относительно того, должна ли вся новая генная последовательность быть негенной по происхождению. Для генов de novo , кодирующих белок , было предложено разделить гены de novo на подтипы на основе доли рассматриваемой ORF, которая была получена из ранее некодирующей последовательности. [52] Кроме того, de novoЧтобы произошло рождение гена, рассматриваемая последовательность должна быть геном, который привел к сомнению, что составляет ген, при этом некоторые модели устанавливают строгую дихотомию между генными и негенными последовательностями, а другие предлагают более гибкий континуум.

Все определения генов связаны с понятием функции, поскольку общепринято, что настоящий ген должен кодировать функциональный продукт, будь то РНК или белок. Однако существуют разные взгляды на то, что составляет функцию, отчасти в зависимости от того, оценивается ли данная последовательность с использованием генетического, биохимического или эволюционного подходов. [52] [71] [72] [73] Неопределенность понятия «функция» особенно проблематична для области рождения генов de novo , где объекты исследования часто быстро развиваются. [73] Для решения этих проблем Питтсбургская модель функции разбивает слово «функция» на пять значений для описания различных свойств, приобретаемых локусом, подвергающимся de novoрождение гена: экспрессия, возможности, взаимодействия, физиологические последствия и эволюционные последствия. [73]

Принято считать, что настоящий ген de novo экспрессируется, по крайней мере, в некотором контексте [5], что позволяет работать отбору, и многие исследования используют доказательства экспрессии в качестве критерия включения при определении генов de novo . Экспрессия последовательностей на уровне мРНК может быть подтверждена индивидуально с помощью таких методов, как количественная ПЦР , или глобально с помощью секвенирования РНК (RNA-seq) . Точно так же экспрессия на уровне белка может быть определена с высокой степенью достоверности для отдельных белков с использованием таких методов, как масс-спектрометрия или вестерн-блоттинг , в то время как профилирование рибосом (Ribo-seq)предоставляет глобальный обзор переводов в данной выборке. В идеале, чтобы подтвердить, что ген возник de novo , также должно быть продемонстрировано отсутствие экспрессии синтенической области у видов вне группы. [74]

Подтверждение экспрессии гена - это только один из подходов к выводу о функции. Некоторые считают золотым стандартом генетические подходы, при которых стремятся обнаружить определенный фенотип или изменение приспособленности при нарушении определенной последовательности; [72], однако, для крупномасштабного анализа полных геномов получение таких доказательств часто невозможно. Другие экспериментальные подходы, включая скрининг на белок-белковые и / или генетические взаимодействия, также могут быть использованы для подтверждения биологического эффекта для конкретной открытой рамки считывания de novo . По мере того как больше узнается о конкретном локусе, стандартные методы молекулярной биологии могут применяться для анализа его специфической клеточной роли.

В качестве альтернативы можно использовать эволюционные подходы, чтобы сделать вывод о существовании молекулярной функции из полученных с помощью вычислений сигнатур отбора. В случае TRG одним общим признаком отбора является отношение несинонимичных замен к синонимичным (отношение dN / dS ), рассчитанное для разных видов одного и того же таксона. Нейтральное ожидание для этого отношения - 1; большинство генов, кодирующих белок, имеют соотношение ниже 1, что указывает на селективное ограничение, хотя ген при сильном направленном отборе может иметь соотношение выше 1. Соотношение ниже 1, таким образом, считается доказательством отбора против потери функции. [71]Точно так же в случае видоспецифичных генов данные полиморфизма можно использовать для расчета отношения pN / pS для различных штаммов или популяций основных видов. Учитывая, что молодые, видоспецифичные гены de novo по определению не обладают глубокой консервацией, обнаружение статистически значимых отклонений от 1 может быть затруднено без нереально большого количества секвенированных штаммов / популяций. Пример этого можно увидеть у Mus musculus , где три очень молодых de novo гена лишены признаков отбора, несмотря на хорошо продемонстрированные физиологические роли. [75]По этой причине подходы pN / pS часто применяются к группам генов-кандидатов, что позволяет исследователям сделать вывод, что по крайней мере некоторые из них являются эволюционно консервативными, не имея возможности указать, какие именно. Вместо этого использовались другие признаки отбора, такие как степень расхождения нуклеотидов внутри синтенных областей, сохранение границ ORF или для генов, кодирующих белок, оценка кодирования, основанная на частотах нуклеотидных гексамеров. [76]

Несмотря на эти и другие проблемы в идентификации событий рождения гена de novo , в настоящее время имеется множество свидетельств, указывающих на то, что это явление не только возможно, но и имеет место в каждой линии, систематически изученной до сих пор. [40]

Распространенность [ править ]

Оценки чисел [ править ]

Частота и количество оценок de novo генов в различных линиях сильно различаются и сильно зависят от методологии. Исследования могут идентифицировать гены de novo только методами филостратиграфии / BLAST или могут использовать комбинацию вычислительных методов, а также могут оценивать или не оценивать экспериментальные доказательства экспрессии и / или биологической роли. [10] Кроме того, анализ в масштабе генома может учитывать все или большинство ORF в геноме [77] или вместо этого может ограничивать свой анализ ранее аннотированными генами.

Линия D. melanogaster является иллюстрацией этих различных подходов. Раннее исследование с использованием комбинации поисков BLAST, выполненных на последовательностях кДНК, наряду с ручным поиском и информацией о синтении, выявило 72 новых гена, специфичных для D. melanogaster, и 59 новых генов, специфичных для трех из четырех видов в комплексе видов D. melanogaster . Этот отчет показал , что только 2/72 (~ 2,8%) от дрозофилы -специфические новые гены и 7/59 (~ 11,9%) новых генов , специфичных для видов комплекс были получены De Novo , [69] с остатком , возникающие через дупликацию / ретропозицию. Аналогичным образом, анализ 195 молодых (<35 миллионов лет) D. melanogasterгены, идентифицированные с помощью синтенических выравниваний, обнаружили, что только 16 возникли de novo . [67] Напротив, анализ, сфокусированный на транскриптомных данных семенников шести штаммов D. melanogaster , выявил 106 фиксированных и 142 сегрегационных гена de novo . [68] Для многих из них предковые ORF были идентифицированы, но не экспрессировались. Подчеркивая различия между межвидовыми и внутривидовыми сравнениями, исследование природных популяций Saccharomyces paradoxus показало, что количество идентифицированных полипептидов de novo более чем удваивается при рассмотрении внутривидового разнообразия. [78]У приматов, один из ранних исследований идентифицированы 270 генов бесхозных (уникальные для человека, шимпанзе и макак), из которых 15 были , как полагают, возникла De Novo , [47] в то время как позже докладе были определены 60 De Novo генов в одних только людей, которые поддерживаются с помощью транскрипционных и протеомных данных. [70] Исследования на других линиях / организмах также пришли к разным выводам относительно количества de novo генов, присутствующих в каждом организме, а также конкретных наборов идентифицированных генов. Образец этих крупномасштабных исследований описан в таблице ниже.

Повторный анализ трех таких исследований на мышах, которые идентифицировали от 69 до 773 генов- кандидатов de novo, показал, что различные оценки включали многие гены, которые на самом деле не были генами de novo . [79] Многие кандидаты были исключены из-за того, что больше не были аннотированы в основных базах данных. К оставшимся генам был применен консервативный подход, который исключил кандидатов с паралогами, отдаленно родственными гомологами или консервативными доменами или которые не имели информации о синтенической последовательности у негрызунов. Этот подход подтвердил ~ 40% генов- кандидатов de novo , что привело к верхней оценке только 11,6 de novo.гены образовывались (и сохранялись) за миллион лет, что примерно в 5-10 раз медленнее, чем предполагалось для новых генов, образованных в результате дупликации. [79] Примечательно, что даже после применения этого строгого конвейера 152 подтвержденных de novo гена, которые остались, по-прежнему представляют значительную часть генома мыши, вероятно, возникшего de novo . Вообще говоря, остается спорным, представляют ли дупликация и дивергенция или рождение гена de novo доминантный механизм появления новых генов, [67] [69] [77] [80] [81] [82] отчасти потому, что de novoгены могут возникать и теряться чаще, чем другие молодые гены. В исследовании происхождения генов-сирот в 3 различных эукариотических линиях авторы обнаружили, что в среднем только около 30% генов-сирот можно объяснить дивергенцией последовательностей. [82]

Динамика [ править ]

Важно различать частоту рождения гена de novo и количество генов de novo в данной линии. Если рождение гена de novo происходит часто, можно ожидать, что содержание генов в геномах со временем будет увеличиваться; однако генный состав геномов обычно относительно стабилен. [10] Это означает, что частый процесс гибели гена должен уравновешивать рождение гена de novo , и действительно, гены de novo отличаются быстрым оборотом по сравнению с установленными генами. В подтверждение этого предположения , недавно появившиеся гены дрозофилы с гораздо большей вероятностью будут потеряны, в первую очередь из-за псевдогенизации.с самыми высокими потерями детей-сирот; [83] это несмотря на то, что было показано, что некоторые гены-сироты Drosophila быстро становятся важными. [67] Подобная тенденция частой потери среди молодых семейств генов наблюдалась у нематод рода Pristionchus . [84] Аналогичным образом, анализ пяти транскриптомов млекопитающих показал, что большинство ORF у мышей были либо очень старыми, либо видоспецифичными, что подразумевает частое рождение и смерть транскриптов de novo . [81] В диких S. paradoxus популяций, De Novo ORF , возникают и теряются с такой же скоростью. [78]Тем не менее, остается положительная корреляция между количеством видоспецифичных генов в геноме и эволюционным расстоянием от его последнего предка. [85] В дополнение к рождению и смерти генов de novo на уровне ORF, мутационные и другие процессы также подвергают геномы постоянному «транскрипционному обороту». Одно исследование на мышах показало, что, хотя все области предкового генома в какой-то момент были транскрибированы по крайней мере у одного потомка, часть генома при активной транскрипции в данном штамме или подвиде подвержена быстрым изменениям. [86] Транскрипционный оборот некодирующих генов РНК происходит особенно быстро по сравнению с кодирующими генами. [87]

Пример таблицы генов de novo [ править ]

Особенности [ править ]

Недавно появившиеся гены de novo во многом отличаются от установленных генов. У широкого круга видов молодые и / или таксономически ограниченные гены или ORF, как сообщается, короче по длине, чем установленные гены, эволюционируют более быстро и менее экспрессируются. [47] [77] [83] [84] [92] [93] [94] [95] [96] [97] [98] [99]] Хотя эти тенденции могут быть результатом систематической ошибки определения гомологии, повторный анализ нескольких исследований, которые уменьшили эту систематическую ошибку, удалив гены, возраст которых сложнее определить, обнаружили, что качественные выводы, сделанные в этих исследованиях, не изменились. [57]Кроме того, тенденция молодых генов иметь меньше гидрофобных аминокислот [100] и иметь их больше кластеров рядом друг с другом вдоль первичной последовательности. [101]

Также было обнаружено, что экспрессия молодых генов более специфична для ткани или состояния, чем экспрессия установленных генов. [29] [31] [47] [68] [70] [77] [97] [102] [103] [104]] В частности, относительно высокая экспрессия генов de novo наблюдалась в мужских репродуктивных тканях у Drosophila , мышей , и люди, и в человеческом мозгу. [70] [105]У животных с адаптивной иммунной системой более высокая экспрессия в головном мозге и семенниках может быть функцией иммунопривилегированной природы этих тканей. Анализ на мышах обнаружил специфическую экспрессию межгенных транскриптов в тимусе и селезенке (в дополнение к мозгу и семенникам). Было высказано предположение, что у позвоночных транскрипты de novo должны сначала экспрессироваться в этих тканях, прежде чем они могут быть экспрессированы в тканях, подлежащих наблюдению иммунными клетками. [104] Старые гены обладают большей регуляцией транскрипционных факторов, что указывает на их интеграцию в более крупные молекулярные сети. Точно так же вероятность физических взаимодействий, а также вероятность и сила генетических взаимодействий коррелируют с возрастом ORF, определяемым филостратиграфией. [106]

Зависимые от происхождения особенности [ править ]

Характеристики генов de novo могут зависеть от исследуемого вида или происхождения. Это, по-видимому, частично является результатом различного содержания GC в геномах и того, что молодые гены имеют большее сходство с негенными последовательностями генома, в котором они возникли, чем установленные гены. [107] Характеристики полученного белка, такие как процент трансмембранных остатков и относительная частота различных предсказанных вторичных структурных особенностей, демонстрируют сильную зависимость от GC в генах-сиротах, тогда как в более древних генах эти особенности слабо зависят от содержания GC. [107]

Взаимосвязь между возрастом гена и количеством предсказанных внутренних структурных нарушений (ISD) в кодируемых белках является предметом значительных дискуссий. Было заявлено, что ISD также является зависимым от клонов признаком, примером чего является тот факт, что у организмов с относительно высоким содержанием GC, от D. melanogaster до паразита Leishmania major , молодые гены имеют высокий ISD, [108] [109] в то время как в геноме с низким GC, таком как почкующиеся дрожжи, несколько исследований показали, что молодые гены имеют низкий ISD. [77] [92] [99] [107]Однако исследование, в котором были исключены молодые гены с сомнительными доказательствами функциональности, определяемыми в бинарных терминах как находящиеся в процессе отбора для удержания генов, обнаружило, что оставшиеся молодые гены дрожжей имеют высокий ISD, что позволяет предположить, что дрожжевой результат может быть связан с загрязнением набора. молодых генов с ORF, которые не соответствуют этому определению, и, следовательно, с большей вероятностью будут иметь свойства, отражающие содержание GC и другие негенные особенности генома. [100] Помимо самых молодых сирот, это исследование показало, что ISD имеет тенденцию к снижению с увеличением возраста гена, и что это в первую очередь связано с аминокислотным составом, а не с содержанием GC. [100] В более коротких временных масштабах с использованием de novoГены, которые имеют наибольшую валидацию, позволяют предположить, что более молодые гены более неупорядочены у Lachancea , но менее неупорядочены у Saccharomyces . [99]

Роль эпигенетических модификаций [ править ]

Исследование генов de novo у A. thaliana показало, что они гиперметилированы и, как правило, лишены модификаций гистонов . [66] В соответствии либо с моделью протогена, либо с загрязнением негенами, уровни метилирования генов de novo были промежуточными между установленными генами и межгенными регионами. Паттерны метилирования этих генов de novo стабильно наследуются, а уровни метилирования были самыми высокими и наиболее сходными с установленными генами в генах de novo с подтвержденной способностью кодирования белков. [66] У патогенного гриба Magnaporthe oryzae., менее консервативные гены, как правило, имеют паттерны метилирования, связанные с низкими уровнями транскрипции. [110] Исследование на дрожжах также показало, что гены de novo обогащаются в горячих точках рекомбинации , которые, как правило, не содержат нуклеосом. [99]

У Pristionchus pacificus орфанные гены с подтвержденной экспрессией демонстрируют состояния хроматина, которые отличаются от таковых у аналогичным образом экспрессируемых установленных генов. [98] Сайты старта орфанных генов имеют эпигенетические сигнатуры, характерные для энхансеров, в отличие от консервативных генов, которые имеют классические промоторы. [98] Многие невыраженные сиротские гены украшены репрессивными модификациями гистонов, в то время как отсутствие таких модификаций облегчает транскрипцию экспрессируемой субпопуляции сирот, подтверждая представление о том, что открытый хроматин способствует образованию новых генов. [98]

Модели и механизмы [ править ]

Описано несколько теоретических моделей и возможных механизмов рождения гена de novo . Модели, как правило, не исключают друг друга, и возможно, что множественные механизмы могут дать начало генам de novo . [52]

Порядок событий [ править ]

Сначала ORF против сначала транскрипции [ править ]

Чтобы произошло рождение гена, кодирующего белок de novo, негенная последовательность должна быть как транскрибирована, так и приобретать ORF перед тем, как транслироваться. Эти события могут происходить в любом порядке, и есть доказательства, подтверждающие модели «сначала ORF» и «сначала транскрипция». [5] Анализ генов de novo , которые расщепляются у D. melanogaster, показал, что транскрибируемые последовательности обладают аналогичным кодирующим потенциалом ортологическим последовательностям из линий, не имеющих доказательств транскрипции. [68] Это открытие подтверждает мнение о том, что многие ORF могут существовать до того, как были выражены. Ген гликопротеина антифриза AFGP , возникший de novoу арктических тресковых рыб представляет собой более конкретный пример, в котором было показано, что появление ORF de novo предшествует промоторной области. [89] Кроме того, предположительно негенные ORF, достаточно длинные для кодирования функциональных пептидов, многочисленны в геномах эукариот и, как ожидается, с большой частотой встречаются случайно. [68] [77] В то же время транскрипция эукариотических геномов намного шире, чем считалось ранее, и есть задокументированные примеры геномных областей, которые были транскрибированы до появления ORF, которая стала геном de novo . [88] Доля de novoгены, кодирующие белок, неизвестны, но появление «сначала транскрипции» привело некоторых к предположению, что гены de novo, кодирующие белок, могут сначала существовать как промежуточные звенья гена РНК. Случай бифункциональных РНК, которые одновременно транслируются и функционируют как гены РНК, показывает, что такой механизм правдоподобен. [111]

Эти два события могут происходить одновременно, если хромосомная перестройка является событием, которое ускоряет рождение гена. [112]

Гипотеза «вне яичек» [ править ]

Раннее тематическое исследование рождения гена de novo , которое выявило пять генов de novo у D. melanogaster , отметило преимущественную экспрессию этих генов в семенниках [30], а несколько дополнительных генов de novo были идентифицированы с использованием транскриптомных данных, полученных из семенников и семенников. мужские дополнительные железы D. yakuba и D. erecta [29] [31] . Это согласуется с другими исследованиями, которые показали, что существует быстрая эволюция генов, связанных с воспроизводством в целом ряде клонов, [113] [114] [115], предполагая, что половой отбор может играть ключевую роль в адаптивной эволюции и de novo.генное рождение. Последующий крупномасштабный анализ шести штаммов D. melanogaster выявил 248 генов de novo, экспрессируемых семенниками , из которых ~ 57% не были зафиксированы. [68] Было высказано предположение, что большое количество генов de novo с мужской специфической экспрессией, идентифицированных у Drosophila , вероятно, связано с тем фактом, что такие гены предпочтительно сохраняются по сравнению с другими генами de novo по причинам, которые не совсем ясны. [83] Интересно, что два предполагаемых de novo гена у дрозофилы ( Годдард и Сатурн ) были необходимы для нормальной мужской фертильности.[116]

У людей исследование, выявившее 60 специфичных для человека de novo генов, показало, что их средняя экспрессия, измеренная с помощью RNA-seq, была самой высокой в ​​семенниках. [70] Другое исследование, посвященное изучению генов, специфичных для млекопитающих в более общем плане, также обнаружило повышенную экспрессию в семенниках. [117] Транскрипция в семенниках млекопитающих считается особенно беспорядочной, частично из-за повышенной экспрессии транскрипционного аппарата [118] [119] и открытого хроматина. [120] Считается, что эта беспорядочная транскрипция создает идеальные условия для экспрессии негенных последовательностей, необходимых для de novo.генное рождение. Экспрессия, специфичная для семенников, по-видимому, является общей чертой всех новых генов, поскольку анализ видов дрозофилы и позвоночных обнаружил, что молодые гены проявляют смещенную в семенниках экспрессию независимо от механизма их происхождения. [102]

Широкое выражение [ править ]

С развитием таких технологий, как RNA-seq и Ribo-seq, теперь известно, что геномы эукариот широко транскрибируются [121] [122] [123] [124] и транслируются. [125] Многие ORF, которые либо не аннотированы, либо аннотированы как длинные некодирующие РНК (lncRNAs) , транслируются на определенном уровне либо в зависимости от состояния, либо в зависимости от ткани. [77] [125] [126] [127] [128] [129] Эти события трансляции, хотя и нечастые, подвергают отбору негенные последовательности. Эта повсеместная экспрессия лежит в основе нескольких моделей, описывающих рождение гена de novo .

Большинство негенных ORF, которые транслируются, по-видимому, эволюционируют нейтрально. [78] [77] [126] Обе модели преадаптации и протогена предсказывают, однако, что экспрессия негенных ORF может иногда обеспечивать адаптивное преимущество для клетки. Дифференциальная трансляция протогенов в стрессовых условиях, а также обогащение около протогенов сайтов связывания транскрипционных факторов, участвующих в регуляции стрессового ответа [77], поддерживают адаптивный потенциал протогенов. Кроме того, известно, что новые функциональные белки могут быть экспериментально получены из случайных аминокислотных последовательностей. [130] Случайные последовательности обычно хорошо переносятся in vivo.; многие из них легко образуют вторичные структуры, и даже сильно неупорядоченные белки могут играть важную биологическую роль. [131] [132] [133] Повсеместная природа трансляции предполагает, что новые протогены возникают часто, обычно возвращаясь в негенное состояние. В популяциях диких S. paradoxus некоторые ORF с преувеличенными геноподобными особенностями обнаруживаются среди пула транслированных межгенных полипептидов. [78] Неясно, сохраняются ли предпочтительно такие ORF.

Было высказано предположение, что эпигенетический ландшафт генов de novo на ранних стадиях формирования может быть особенно изменчивым между популяциями и среди них, что приводит к различным уровням экспрессии генов и, таким образом, позволяет молодым генам исследовать «ландшафт экспрессии». [134] Ген QQS у A. thaliana является одним из примеров этого явления; его экспрессия негативно регулируется метилированием ДНК, которое, будучи наследуемым в течение нескольких поколений, широко варьирует по своим уровням как среди естественных образцов, так и среди диких популяций. [134]Эпигенетика также в значительной степени ответственна за пермиссивную транскрипционную среду в семенниках, особенно за счет включения в нуклеосомы неканонических вариантов гистонов, которые заменяются гистоноподобными протаминами во время сперматогенеза. [135]

Модель предварительной адаптации [ править ]

В преадаптационной модели рождения гена de novo используется математическое моделирование, чтобы показать, что, когда последовательности, которые обычно скрыты, подвергаются слабому или экранированному отбору, полученный пул «загадочных» последовательностей (то есть протогенов) может быть очищен от «очевидных» «вредные» варианты, такие как те, которые склонны к агрегации белков и, таким образом, обогащены потенциальными адаптациями по сравнению с полностью невыраженным и неочищенным набором последовательностей. [136] Это выявление и очистка загадочных вредных негенных последовательностей является побочным продуктом всепроникающей транскрипции и трансляции межгенных последовательностей и, как ожидается, будет способствовать рождению функциональных генов, кодирующих белки de novo . [128] Это связано с тем, что при устранении наиболее вредных вариантов то, что остается в процессе исключения, с большей вероятностью будет адаптивным, чем ожидалось от случайных последовательностей.

Математика модели преадаптации предполагает, что распределение эффектов приспособленности является бимодальным, с новыми последовательностями мутаций, имеющими тенденцию что-то сломать или исправить, но редко между ними. [136] [137] Следуя этой логике, популяции могут либо разработать локальные решения, в которых отбор работает на каждом отдельном локусе и поддерживается относительно высокий уровень ошибок, либо глобальное решение с низким уровнем ошибок, которое позволяет накапливать вредоносные загадочные последовательности. [136] De novoСчитается, что рождение генов предпочтительнее в популяциях, которые развивают локальные решения, поскольку относительно высокая частота ошибок приведет к пулу загадочных вариаций, которые «предварительно адаптированы» посредством очистки от вредоносных последовательностей. Местные решения более вероятны в группах населения с высокой эффективной численностью населения .

Протогенная модель [ править ]

Эта модель протогена согласуется с моделью преадаптации о важности всепроникающей экспрессии и относится к набору всепроникающих экспрессируемых последовательностей, которые не соответствуют всем определениям гена как «протогенов». [77] Отличие заключается в том, что он предусматривает более постепенный процесс отбора от негенного к генному состоянию, отвергая бинарную классификацию, при этом предполагается, что протогены будут проявлять признаки, промежуточные между генами и негенами.

Проверяемые различия между моделями [ править ]

Используя эволюционное определение функции (т. Е. Что ген по определению находится под очищающим отбором против потери), модель преадаптации предполагает, что «рождение гена - это внезапный переход к функциональности» [100], который происходит, как только ORF приобретает чистый полезный эффект. эффект. Ожидается, что во избежание вреда гены новорожденных будут демонстрировать преувеличенные версии генных особенностей, связанных с предотвращением вреда. Это контрастирует с моделью протогена, которая ожидает, что новорожденные гены будут иметь промежуточные характеристики между старыми генами и негенами. [100]

Некоторые особенности ORF коррелируют с возрастом ORF, как определено филостратиграфическим анализом, при этом молодые ORF обладают промежуточными свойствами между старыми и негенными; это было воспринято как доказательство в пользу модели протогена, в которой состояние протогена является континуумом. [77] Это свидетельство подверглось критике, поскольку те же очевидные тенденции ожидаются и в рамках модели, в которой идентичность как гена является бинарной. Согласно этой модели, когда каждая возрастная группа содержит различное соотношение генов и не генов, парадокс Симпсона может генерировать корреляции в неправильном направлении. [100]

Более конкретно, в поддержку модели преадаптации, анализ ISD у мышей и дрожжей показал, что молодые гены имеют более высокий ISD, чем старые гены, в то время как случайные негенные последовательности, как правило, показывают самые низкие уровни ISD. [100] Хотя наблюдаемая тенденция могла частично быть результатом подмножества молодых генов, полученных путем наложения печати, [79] более высокий ISD в молодых генах также наблюдается среди перекрывающихся пар вирусных генов. [138] Достижение консенсуса по значениям ISD самых молодых генов затруднено из-за различных стандартов аннотации, [81] [101], а также из-за разногласий по поводу того, представляют ли гены бинарную или непрерывную категорию. [77] [100]Когда протогены с меньшим количеством доказательств для выбранной функции исключаются из данных, в которых наблюдается континуум, [77] наклон тенденции ISD меняется на противоположную. [100] Однако остается неуверенность в том, сохранятся ли наблюдаемые тенденции стабильно в более короткие сроки. [81] [101] Что касается других предсказанных структурных особенностей, таких как содержание β-цепи и склонность к агрегации, пептиды, кодируемые протогенами, подобны негенным последовательностям и категорически отличаются от канонических генов. [106]

Модель роста и линьки [ править ]

Модель «медленного роста и линьки» описывает потенциальный механизм рождения гена de novo , в частности генов, кодирующих белок. В этом сценарии существующие ORF, кодирующие белок, расширяются на своих концах, особенно на их 3'-концах, что приводит к созданию новых N- и C-концевых доменов. [139] [140] [141] [142] [143] Новые С-концевые домены могут сначала развиваться при слабом отборе посредством случайной экспрессии посредством сквозной трансляции, как в модели преадаптации, только позже становятся конститутивно экспрессируемыми посредством мутации, которая нарушает стоп-кодон. [136] [140] Гены, испытывающие высокую скорость считывания трансляции, обычно имеют неупорядоченные С-концы. [144]Более того, существующие гены часто близки к повторяющимся последовательностям, кодирующим неупорядоченные домены. Эти новые неупорядоченные домены могут первоначально обеспечивать некоторую способность неспецифического связывания, которая постепенно улучшается путем отбора. Последовательности, кодирующие эти новые домены, могут иногда отделяться от их родительской ORF, приводя или способствуя созданию гена de novo . [140] Интересно, что анализ 32 геномов насекомых показал, что новые домены (то есть те, которые уникальны для насекомых) имеют тенденцию эволюционировать довольно нейтрально, только несколько сайтов находятся под положительным отбором, в то время как их белки-хозяева остаются под очищающим отбором, что позволяет предположить, что новые функциональные домены возникают постепенно и в некоторой степени случайным образом. [145]

Здоровье человека [ править ]

Помимо значения для области эволюционной биологии, рождение гена de novo имеет значение для здоровья человека. Было высказано предположение, что новые гены, в том числе гены de novo , могут играть огромную роль в видоспецифичных признаках; [6] [10] [40] [146] однако многие видоспецифичные гены не имеют функциональной аннотации. [117] Тем не менее, есть свидетельства того, что специфические для человека гены de novo участвуют в таких заболеваниях, как рак. NYCM , de novo ген, уникальный для человека и шимпанзе, регулирует патогенез нейробластом на мышиных моделях [147] и специфичных для приматовPART1 , ген днРНК , был идентифицирован как опухолевый супрессор и онкоген в различных контекстах. [47] [148] [149] Несколько других генов de novo , специфичных для человека или приматов , включая PBOV1 , [150] GR6 , [151] [152] MYEOV , [153] ELFN1-AS1 , [154] и CLLU1 , [48]также связаны с раком. Некоторые даже предлагали рассматривать специфически экспрессируемые в опухолях эволюционно новые гены как отдельный класс генетических элементов, отмечая, что многие такие гены находятся под положительным отбором и могут быть неофункционализированы в контексте опухолей. [154]

Специфическая экспрессия многих de novo генов в человеческом мозге [70] также поднимает интригующую возможность того, что de novo гены влияют на когнитивные свойства человека. Одним из таких примеров является FLJ33706 , ген de novo , который был идентифицирован в GWAS и анализах сцепления для никотиновой зависимости и демонстрирует повышенную экспрессию в мозге пациентов с болезнью Альцгеймера. [155] Вообще говоря, экспрессия молодых, специфичных для приматов генов в мозге плода человека выше по сравнению с экспрессией аналогичных молодых генов в мозге мыши. [156] Большинство этих молодых генов, некоторые из которых возникли de novo, экспрессируются в неокортексе, который, как считается, отвечает за многие аспекты человеческого познания. Многие из этих молодых генов демонстрируют признаки положительного отбора, а функциональные аннотации указывают на то, что они участвуют в различных молекулярных процессах, но обогащены факторами транскрипции. [156]

Помимо своей роли в раковых процессах, de novo человеческие гены участвуют в поддержании плюрипотентности [157] и иммунной функции. [47] [117] [158] Преимущественная экспрессия генов de novo в семенниках также указывает на их роль в репродукции. Учитывая, что функция многих de novo человеческих генов остается не охарактеризованной, кажется вероятным, что оценка их вклада в здоровье и развитие человека будет продолжать расти.

Примечание: Для целей этой таблицы, гены определяются как гены бесхозных (когда виды-специфический) или TRGS (когда ограничиваются тесно связанной группой видов) , когда механизм возникновения не был исследован, и , как De Novo гены , когда де происхождение novo предполагалось независимо от метода вывода. Обозначение генов de novo как «кандидатов» или «протогенов» отражает язык, используемый авторами соответствующих исследований.

См. Также [ править ]

  • Молекулярная эволюция
  • Популяционная генетика
  • Эволюционируемость
  • Перекрывающийся ген
  • Сиротский ген

Ссылки [ править ]

Эта статья была адаптирована из следующего источника под лицензией CC BY 4.0 ( 2019 ) ( отчеты рецензентов ): «De novo gene gene» . PLOS Genetics . 15 (5): e1008160. 23 мая 2019 г. doi : 10.1371 / JOURNAL.PGEN.1008160 . ISSN  1553-7390 . PMC  6542195 . PMID  31120894 . Викиданные  Q86320144 .

  1. ^ Long M, Betrán E, K Thornton, Ван W (ноябрь 2003). «Происхождение новых генов: взгляды молодых и старых». Природа Обзоры Генетики . 4 (11): 865–75. DOI : 10.1038 / nrg1204 . PMID 14634634 . S2CID 33999892 .  
  2. Wang W, Yu H, Long M (май 2004 г.). «Дупликация-дегенерация как механизм деления генов и происхождения новых генов у видов дрозофил » . Генетика природы . 36 (5): 523–7. DOI : 10.1038 / ng1338 . PMID 15064762 . 
  3. Леви, Адам (16 октября 2019 г.). «Как эволюция создает гены с нуля. Ученые долгое время предполагали, что новые гены появляются, когда эволюция возится со старыми. Оказывается, естественный отбор гораздо более творческий» . Природа . 574 (7778): 314–316. DOI : 10.1038 / d41586-019-03061-х . PMID 31619796 . 
  4. ^ Schmitz JF, Bornberg-Bauer E (2017). «de novo из ранее некодирующей ДНК» . F1000 Исследования . 6 : 57. DOI : 10,12688 / f1000research.10079.1 . PMC 5247788 . PMID 28163910 .  
  5. ^ a b c Schlötterer C (апрель 2015 г.). «Гены с нуля - эволюционная судьба генов de novo» . Тенденции в генетике . 31 (4): 215–9. DOI : 10.1016 / j.tig.2015.02.007 . PMC 4383367 . PMID 25773713 .  
  6. ^ a b c Kaessmann H (октябрь 2010 г.). «Происхождение, эволюция и фенотипическое влияние новых генов» . Геномные исследования . 20 (10): 1313–26. DOI : 10.1101 / gr.101386.109 . PMC 2945180 . PMID 20651121 .  
  7. ^ a b Джейкоб Ф (июнь 1977 г.). «Эволюция и ковыряние». Наука . 196 (4295): 1161–6. Bibcode : 1977Sci ... 196.1161J . DOI : 10.1126 / science.860134 . PMID 860134 . S2CID 29756896 .  
  8. ^ Карвунис, Анна-Руксандра; Осс, Стивен Бранден Ван (23.05.2019). «Рождение гена de novo» . PLOS Genetics . 15 (5): e1008160. DOI : 10.1371 / journal.pgen.1008160 . ISSN 1553-7404 . PMC 6542195 . PMID 31120894 .   
  9. ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (сентябрь 2009). «Больше, чем просто сироты: важны ли таксономически ограниченные гены в эволюции?». Тенденции в генетике . 25 (9): 404–13. DOI : 10.1016 / j.tig.2009.07.006 . PMID 19716618 . 
  10. ^ a b c d e Tautz D, Domazet-Lošo T (август 2011 г.). «Эволюционное происхождение генов-сирот». Природа Обзоры Генетики . 12 (10): 692–702. DOI : 10.1038 / nrg3053 . PMID 21878963 . S2CID 31738556 .  
  11. ^ Оно S (1970) Эволюция путем дублирования генов Allen & Unwin ; Springer-Verlag
  12. ^ Тауц D (2014). «Открытие эволюции гена de novo». Перспективы биологии и медицины . 57 (1): 149–61. DOI : 10,1353 / pbm.2014.0006 . hdl : 11858 / 00-001M-0000-0024-3416-1 . PMID 25345708 . S2CID 29552265 .  
  13. ^ Грассе П.П. (1977) Эволюция живых организмов: свидетельство новой теории трансформации Academic Press
  14. ^ Barrell BG, Air GM, Hutchison CA (ноябрь 1976). «Перекрывающиеся гены бактериофага phiX174». Природа . 264 (5581): 34–41. Bibcode : 1976Natur.264 ... 34B . DOI : 10.1038 / 264034a0 . PMID 1004533 . S2CID 4264796 .  
  15. Перейти ↑ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (апрель 1978). «Ген К, новый перекрывающийся ген в бактериофаге G4». Природа . 272 (5653): 510–5. Bibcode : 1978Natur.272..510S . DOI : 10.1038 / 272510a0 . PMID 692656 . S2CID 4218777 .  
  16. ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA и др. (Февраль 1977 г.). «Нуклеотидная последовательность ДНК бактериофага phi X174». Природа . 265 (5596): 687–95. Bibcode : 1977Natur.265..687S . DOI : 10.1038 / 265687a0 . PMID 870828 . S2CID 4206886 .  
  17. ^ Keese PK, Гиббс A (октябрь 1992). «Истоки генов:« большой взрыв »или непрерывное творчество?» . Труды Национальной академии наук Соединенных Штатов Америки . 89 (20): 9489–93. Bibcode : 1992PNAS ... 89.9489K . DOI : 10.1073 / pnas.89.20.9489 . PMC 50157 . PMID 1329098 .  
  18. ^ Оно S (апрель 1984). «Рождение уникального фермента из альтернативной рамки считывания ранее существовавшей, внутренне повторяющейся кодирующей последовательности» . Труды Национальной академии наук Соединенных Штатов Америки . 81 (8): 2421–5. Bibcode : 1984PNAS ... 81.2421O . DOI : 10.1073 / pnas.81.8.2421 . PMC 345072 . PMID 6585807 .  
  19. ^ Sabath N, Wagner A, D Карлин (декабрь 2012). «Развитие вирусных белков началось de novo путем наложения печати» . Молекулярная биология и эволюция . 29 (12): 3767–80. DOI : 10.1093 / molbev / mss179 . PMC 3494269 . PMID 22821011 .  
  20. ^ Makałowska I, Lin CF, Hernandez K (октябрь 2007). «Рождение и смерть перекрытия генов у позвоночных» . BMC Evolutionary Biology . 7 : 193. DOI : 10.1186 / 1471-2148-7-193 . PMC 2151771 . PMID 17939861 .  
  21. ^ Саманди S, Рой А.В., Делькур V, Люсьер Дж. Ф., Ганьон Дж., Бодуан М.С. и др. (Октябрь 2017 г.). «Глубокая аннотация транскриптома позволяет обнаруживать и функционально характеризовать небольшие зашифрованные белки» . eLife . 6 . DOI : 10.7554 / eLife.27860 . PMC 5703645 . PMID 29083303 .  
  22. ^ а б Хан, Ю.А.; Юнгрейс, я; Райт, JC; Mudge, JM; Choudhary, JS; Ферт, AE; Келлис, М. (6 марта 2020 г.). «Доказательства новой перекрывающейся кодирующей последовательности в POLG, инициированной в стартовом кодоне CUG» . BMC Genetics . 21 (1): 25. DOI : 10,1186 / s12863-020-0828-7 . PMC 7059407 . PMID 32138667 .  
  23. ^ Makałowski W, Mitchell Г.А., лабуда D (июнь 1994). «Последовательности Alu в кодирующих областях мРНК: источник изменчивости белка». Тенденции в генетике . 10 (6): 188–93. DOI : 10.1016 / 0168-9525 (94) 90254-2 . PMID 8073532 . 
  24. ^ Сорек R (октябрь 2007). «Рождение новых экзонов: механизмы и эволюционные последствия» . РНК . 13 (10): 1603–8. DOI : 10,1261 / rna.682507 . PMC 1986822 . PMID 17709368 .  
  25. ^ a b Дорит Р.Л., Гилберт В. (декабрь 1991 г.). «Ограниченная вселенная экзонов». Текущее мнение в области генетики и развития . 1 (4): 464–9. DOI : 10.1016 / S0959-437X (05) 80193-5 . PMID 1822278 . 
  26. ^ Chothia C (июнь 1992). «Белки. Тысяча семей для молекулярного биолога». Природа . 357 (6379): 543–4. Bibcode : 1992Natur.357..543C . DOI : 10.1038 / 357543a0 . PMID 1608464 . S2CID 4355476 .  
  27. ^ Оливер С.Г., ван дер Аарт QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D и др. (Май 1992 г.). «Полная последовательность ДНК хромосомы III дрожжей». Природа . 357 (6373): 38–46. Bibcode : 1992Natur.357 ... 38O . DOI : 10.1038 / 357038a0 . PMID 1574125 . S2CID 4271784 .  
  28. ^ a b Dujon B (июль 1996 г.). «Проект генома дрожжей: что мы узнали?». Тенденции в генетике . 12 (7): 263–70. DOI : 10.1016 / 0168-9525 (96) 10027-5 . PMID 8763498 . 
  29. ^ a b c d e Begun DJ, Lindfors HA, Kern AD, Jones CD (июнь 2007 г.). «Доказательства эволюции de novo генов, экспрессируемых семенниками в кладе Drosophila yakuba / Drosophila erecta » . Генетика . 176 (2): 1131–7. DOI : 10.1534 / genetics.106.069245 . PMC 1894579 . PMID 17435230 .  
  30. ^ a b c d e f g Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (июнь 2006 г.). «Новые гены, полученные из некодирующей ДНК у Drosophila melanogaster , часто являются X-сцепленными и демонстрируют смещенную в яичках экспрессию» . Труды Национальной академии наук Соединенных Штатов Америки . 103 (26): 9935–9. Bibcode : 2006PNAS..103.9935L . DOI : 10.1073 / pnas.0509809103 . PMC 1502557 . PMID 16777968 .  
  31. ^ a b c d Begun DJ, Lindfors HA, Thompson ME, Holloway AK (март 2006 г.). «Недавно появившиеся гены, идентифицированные у Drosophila yakuba и D. erecta, экспрессировали метки последовательности» . Генетика . 172 (3): 1675–81. DOI : 10.1534 / genetics.105.050336 . PMC 1456303 . PMID 16361246 .  
  32. ^ Betrán E, Long M (июль 2003). «Dntf-2r, молодой ретропозированный ген дрозофилы со специфической мужской экспрессией в условиях положительного дарвиновского отбора» . Генетика . 164 (3): 977–88. PMC 1462638 . PMID 12871908 .  
  33. ^ Jones CD, Begun DJ (август 2005 г.). «Параллельная эволюция химерных генов слияния» . Труды Национальной академии наук Соединенных Штатов Америки . 102 (32): 11373–8. Bibcode : 2005PNAS..10211373J . DOI : 10.1073 / pnas.0503528102 . PMC 1183565 . PMID 16076957 .  
  34. Перейти ↑ Long M, Langley CH (апрель 1993). «Естественный отбор и происхождение jingwei, химерного процессированного функционального гена у дрозофилы». Наука . 260 (5104): 91–5. Bibcode : 1993Sci ... 260 ... 91L . DOI : 10.1126 / science.7682012 . PMID 7682012 . 
  35. ^ Галиндо М.И., Pueyo СО, Fouix S, епископ SA, Couso JP (май 2007). «Пептиды, кодируемые короткими ORF, контролируют развитие и определяют новое семейство эукариотических генов» . PLOS Биология . 5 (5): e106. DOI : 10.1371 / journal.pbio.0050106 . PMC 1852585 . PMID 17439302 .  
  36. ^ Hsu PY, Бенфей PN (май 2018). «Маленький, но мощный: функциональные пептиды, кодируемые небольшими ORF в растениях». Протеомика . 18 (10): e1700038. DOI : 10.1002 / pmic.201700038 . PMID 28759167 . 
  37. Nelson BR, Makarewich CA, Anderson DM, Winders BR, Troupes CD, Wu F, Reese AL, McAnally JR, Chen X, Kavalali ET, Cannon SC, Houser SR, Bassel-Duby R, Olson EN (январь 2016). «Пептид, кодируемый транскриптом, аннотированным как длинная некодирующая РНК, усиливает активность SERCA в мышцах» . Наука . 351 (6270): 271–5. Bibcode : 2016Sci ... 351..271N . DOI : 10.1126 / science.aad4076 . PMC 4892890 . PMID 26816378 .  
  38. ^ Andrews SJ, Rothnagel JA (март 2014). «Новые доказательства функциональных пептидов, кодируемых короткими открытыми рамками считывания». Природа Обзоры Генетики . 15 (3): 193–204. DOI : 10.1038 / nrg3520 . PMID 24514441 . 
  39. Перейти ↑ Nishida H (ноябрь 2006 г.). «Обнаружение и характеристика грибковых белков в Saccharomyces cerevisiae». Биология, биотехнология и биохимия . 70 (11): 2646–52. DOI : 10.1271 / bbb.60251 . PMID 17090923 . S2CID 11035512 .  
  40. ^ a b c McLysaght A, Guerzoni D (сентябрь 2015 г.). «Новые гены из некодирующей последовательности: роль генов, кодирующих белки de novo в эволюционных инновациях эукариот» . Философские труды Лондонского королевского общества. Серия B, Биологические науки . 370 (1678 г.): 20140332. DOI : 10.1098 / rstb.2014.0332 . PMC 4571571 . PMID 26323763 .  
  41. ^ а б Цай Дж, Чжао Р., Цзян Х., Ван В. (май 2008 г.). «Создание de novo нового гена, кодирующего белок, в Saccharomyces cerevisiae» . Генетика . 179 (1): 487–96. DOI : 10.1534 / genetics.107.084491 . PMC 2390625 . PMID 18493065 .  
  42. ^ a b Bungard D, Copple JS, Yan J, Chhun JJ, Кумиров В.К., Фой С.Г. и др. (Ноябрь 2017 г.). «Складываемость природного протеина De Novo Evolved» . Структура . 25 (11): 1687–1696.e4. DOI : 10.1016 / j.str.2017.09.006 . PMC 5677532 . PMID 29033289 .  
  43. ^ а б Ли Д., Донг И, Цзян И, Цзян Х, Цай Дж, Ван В. (апрель 2010 г.). «Ген, возникший de novo, подавляет путь спаривания у почкующихся дрожжей и подавляется белком, кодируемым его антисмысловой цепью» . Клеточные исследования . 20 (4): 408–20. DOI : 10.1038 / cr.2010.31 . PMID 20195295 . 
  44. ↑ a b Li D, Yan Z, Lu L, Jiang H, Wang W (декабрь 2014 г.). «Плейотропия гена MDF1, возникшего de novo» . Научные отчеты . 4 : 7280. Bibcode : 2014NatSR ... 4E7280L . DOI : 10.1038 / srep07280 . PMC 4250933 . PMID 25452167 .  
  45. ^ a b Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM и др. (Май 2009 г.). «Идентификация нового белка QQS как компонента метаболической сети крахмала в листьях Arabidopsis» . Заводской журнал . 58 (3): 485–98. DOI : 10.1111 / j.1365-313X.2009.03793.x . PMID 19154206 . 
  46. ^ а б Хайнен Т.Дж., Штаубах Ф., Хэминг Д., Таутц Д. (сентябрь 2009 г.). «Возникновение нового гена из межгенной области». Текущая биология . 19 (18): 1527–31. DOI : 10.1016 / j.cub.2009.07.049 . PMID 19733073 . S2CID 12446879 .  
  47. ^ a b c d e f g h Толл-Риера М., Бош Н., Беллора Н., Кастело Р., Арменгол Л., Эстивилл Х и др. (Март 2009 г.). «Происхождение генов-сирот приматов: подход сравнительной геномики» . Молекулярная биология и эволюция . 26 (3): 603–12. DOI : 10.1093 / molbev / msn281 . PMID 19064677 . 
  48. ^ a b c d Knowles DG, McLysaght A (октябрь 2009 г.). «Недавнее происхождение de novo генов, кодирующих белок человека» . Геномные исследования . 19 (10): 1752–9. DOI : 10.1101 / gr.095026.109 . PMC 2765279 . PMID 19726446 .  
  49. ^ a b Domazet-Loso T, Brajković J, Tautz D (ноябрь 2007 г.). «Филостратиграфический подход к раскрытию геномной истории основных адаптаций в линиях многократных животных». Тенденции в генетике . 23 (11): 533–9. DOI : 10.1016 / j.tig.2007.08.014 . PMID 18029048 . 
  50. ^ a b c Германн Т., Рейндерс М.Дж. (ноябрь 2015 г.). «Протени: обнаружение и визуализация статистически значимых синтенических кластеров на протеомном уровне» . Биоинформатика . 31 (21): 3437–44. DOI : 10.1093 / биоинформатики / btv389 . PMC 4612220 . PMID 26116928 .  
  51. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (октябрь 1990). «Базовый инструмент поиска локального выравнивания». Журнал молекулярной биологии . 215 (3): 403–10. DOI : 10.1016 / S0022-2836 (05) 80360-2 . PMID 2231712 . 
  52. ^ a b c d e f g McLysaght A, Hurst LD (сентябрь 2016 г.). «Открытые вопросы в изучении генов de novo: что, как и почему» . Природа Обзоры Генетики . 17 (9): 567–78. DOI : 10.1038 / nrg.2016.78 . PMID 27452112 . S2CID 6033249 .  
  53. ^ Elhaik E, Sabath N, Граур D (январь 2006). «Обратная связь между скоростью эволюции и возрастом генов млекопитающих» является артефактом увеличения генетической дистанции со скоростью эволюции и временем дивергенции » . Молекулярная биология и эволюция . 23 (1): 1–3. DOI : 10.1093 / molbev / msj006 . PMID 16151190 . 
  54. ^ ALBA М.М., Castresana J (апрель 2007). «О поисках гомологии с помощью белка Blast и характеристике возраста генов» . BMC Evolutionary Biology . 7 : 53. DOI : 10.1186 / 1471-2148-7-53 . PMC 1855329 . PMID 17408474 .  
  55. ^ Moyers Б.А., Zhang J (май 2016). «Оценка филостратиграфических свидетельств широко распространенного рождения гена De Novo в эволюции генома» . Молекулярная биология и эволюция . 33 (5): 1245–56. DOI : 10.1093 / molbev / msw008 . PMC 5010002 . PMID 26758516 .  
  56. ^ a b Мойерс Б.А., Чжан Дж. (январь 2015 г.). «Филостратиграфическая предвзятость создает ложные закономерности эволюции генома» . Молекулярная биология и эволюция . 32 (1): 258–67. DOI : 10.1093 / molbev / msu286 . PMC 4271527 . PMID 25312911 .  
  57. ^ a b Домазет-Лошо Т., Карвунис А.Р., Альба М.М., Шестак М.С., Бакарич Р., Неме Р. и др. (Апрель 2017 г.). «Нет доказательств филостратиграфического смещения, влияющего на выводы о паттернах возникновения и эволюции генов» . Молекулярная биология и эволюция . 34 (4): 843–856. DOI : 10.1093 / molbev / msw284 . PMC 5400388 . PMID 28087778 .  
  58. ^ Altschul SF, Madden Т.Л., Шеффер А.А., Чжан Дж, Чжан Z, Миллер Вт, ди - джей Липмана (сентябрь 1997). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска по базам данных белков» . Исследования нуклеиновых кислот . 25 (17): 3389–402. DOI : 10.1093 / NAR / 25.17.3389 . PMC 146917 . PMID 9254694 .  
  59. ^ Saripella Г.В., Sonnhammer Е.Л., Forslund K (сентябрь 2016). «Тестирование следующего поколения инструментов вывода гомологии» . Биоинформатика . 32 (17): 2636–41. DOI : 10.1093 / биоинформатики / btw305 . PMC 5013910 . PMID 27256311 .  
  60. ^ a b Vakirlis N, McLysaght A (2019). «Вычислительное предсказание появившихся De Novo генов, кодирующих белок». Вычислительные методы эволюции белков . Методы молекулярной биологии. 1851 . С. 63–81. DOI : 10.1007 / 978-1-4939-8736-8_4 . ISBN 978-1-4939-8735-1. PMID  30298392 .
  61. ^ Ghiurcuta CG, Морэ BM (июнь 2014). «Оценка синтении для улучшенных сравнительных исследований» . Биоинформатика . 30 (12): i9-18. DOI : 10.1093 / биоинформатики / btu259 . PMC 4058928 . PMID 24932010 .  
  62. Перейти ↑ Jean G, Nikolski M (2011). «SyDiG: раскрытие синтении в отдаленных геномах» (PDF) . Международный журнал исследований и приложений в области биоинформатики . 7 (1): 43–62. DOI : 10.1504 / IJBRA.2011.039169 . PMID 21441096 .  
  63. Перейти ↑ Liu D, Hunt M, Tsai IJ (январь 2018). «Вывод синтении между сборками генома: систематическая оценка» . BMC Bioinformatics . 19 (1): 26. DOI : 10,1186 / s12859-018-2026-4 . PMC 5791376 . PMID 29382321 .  
  64. ^ Ranz JM, Casals F, Ruiz A (февраль 2001). «Насколько гибок геном эукариот? Чрезвычайная скорость хромосомной перестройки в роду Drosophila» . Геномные исследования . 11 (2): 230–9. DOI : 10.1101 / gr.162901 . PMC 311025 . PMID 11157786 .  
  65. ^ a b Лу TC, Leu JY, Lin WC (ноябрь 2017 г.). «Комплексный анализ поддерживаемых транскриптом генов De Novo в дрожжах Saccharomyces sensu stricto» . Молекулярная биология и эволюция . 34 (11): 2823–2838. DOI : 10.1093 / molbev / msx210 . PMC 5850716 . PMID 28981695 .  
  66. ^ a b c d Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (август 2016 г.). «О происхождении генов De Novo в популяциях Arabidopsis thaliana» . Геномная биология и эволюция . 8 (7): 2190–202. DOI : 10.1093 / GbE / evw164 . PMC 4987118 . PMID 27401176 .  
  67. ^ a b c d e f g h Чен С., Чжан Ю. Е., Лонг М. (декабрь 2010 г.). «Новые гены у дрозофилы быстро становятся важными» . Наука . 330 (6011): 1682–5. Bibcode : 2010Sci ... 330.1682C . DOI : 10.1126 / science.1196380 . PMC 7211344 . PMID 21164016 . S2CID 7899890 .   
  68. ^ Б с д е е г Zhao L, P, Saelao Jones CD, DJ Begun (февраль 2014). «Происхождение и распространение генов de novo в популяциях Drosophila melanogaster» . Наука . 343 (6172): 769–72. Bibcode : 2014Sci ... 343..769Z . DOI : 10.1126 / science.1248286 . PMC 4391638 . PMID 24457212 .  
  69. ^ а б в г Чжоу Ц., Чжан Г, Чжан И, Сюй С, Чжао Р, Чжань З. и др. (Сентябрь 2008 г.). «О происхождении новых генов у дрозофилы» . Геномные исследования . 18 (9): 1446–55. DOI : 10.1101 / gr.076588.108 . PMC 2527705 . PMID 18550802 .  
  70. ^ Б с д е е г Wu DD, Ирвин DM, Zhang YP (ноябрь 2011 года). «Происхождение de novo генов, кодирующих белок человека» . PLOS Genetics . 7 (11): e1002379. DOI : 10.1371 / journal.pgen.1002379 . PMC 3213175 . PMID 22102831 .  
  71. ^ a b Дулиттл В.Ф., Брюнет Т.Д., Линквист С., Грегори Т.Р. (май 2014 г.). «Различение между« функцией »и« эффектом »в геномной биологии» . Геномная биология и эволюция . 6 (5): 1234–7. DOI : 10.1093 / GbE / evu098 . PMC 4041003 . PMID 24814287 .  
  72. ^ a b Келлис М., Уолд Б., Снайдер М.П., ​​Бернштейн Б.Е., Кундаже А., Маринов Г.К. и др. (Апрель 2014 г.). «Определение функциональных элементов ДНК в геноме человека» . Труды Национальной академии наук Соединенных Штатов Америки . 111 (17): 6131–8. Bibcode : 2014PNAS..111.6131K . DOI : 10.1073 / pnas.1318948111 . PMC 4035993 . PMID 24753594 .  
  73. ^ a b c Килинг, DM; Гарза, П; Нартей, CM; Карвунис, АР (1 ноября 2019 г.). «Значение слова« функция »в биологии и проблемный случай возникновения гена de novo» . eLife . 8 . DOI : 10.7554 / eLife.47014 . PMC 6824840 . PMID 31674305 .  
  74. ^ Андерссон Д.И., Jerlström-Hultqvist J, J Näsvall (июнь 2015). «Эволюция новых функций de novo и из уже существующих генов» . Перспективы Колд-Спринг-Харбор в биологии . 7 (6): a017996. DOI : 10.1101 / cshperspect.a017996 . PMC 4448608 . PMID 26032716 .  
  75. ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (Январь 2019). «Изучение начала появления гена de novo у мышей показывает быструю интеграцию новых генов в функциональные сети» . bioRxiv . bioRxiv 10.1101 / 510214 . DOI : 10.1101 / 510214 . 
  76. ^ Руис-Орера Дж., Эрнандес-Родригес Дж., Чива С., Сабидо Е., Кондова И., Бонтроп Р. и др. (Декабрь 2015 г.). «Происхождение генов De Novo у человека и шимпанзе» . PLOS Genetics . 11 (12): e1005721. arXiv : 1507.07744 . Bibcode : 2015arXiv150707744R . DOI : 10.1371 / journal.pgen.1005721 . PMC 4697840 . PMID 26720152 .  
  77. ^ a b c d e f g h i j k l m n o Карвунис А. Р., Роллан Т., Вапински И., Колдервуд М. А., Йилдирим М. А., Симонис Н. и др. (Июль 2012 г.). «Протогены и рождение гена de novo» . Природа . 487 (7407): 370–4. Bibcode : 2012Natur.487..370C . DOI : 10.1038 / nature11184 . PMC 3401362 . PMID 22722833 .  
  78. ^ a b c d e Дюран, Э; Ганьон-Арсено, я; Халлин, Дж; Хатин, I; Dubé, AK; Нилли-Тибо, L; Нами, О; Ландри, ЧР (июнь 2019 г.). «Оборот ассоциированных с рибосомами транскриптов из открытых рамок считывания de novo дает гено-подобные характеристики, доступные для появления гена de novo в популяциях диких дрожжей» . Геномные исследования . 29 (6): 932–943. DOI : 10.1101 / gr.239822.118 . PMC 6581059 . PMID 31152050 .  
  79. ^ а б в Casola C (2018). «От de novo к« de nono »: большинство новых генов, кодирующих белок, идентифицированных с помощью филостратиграфии, представляют собой старые гены или недавние дубликаты» . bioRxiv . bioRxiv 10.1101 / 287193 . DOI : 10.1101 / 287193 . 
  80. ^ a b Neme R, Tautz D (февраль 2013 г.). «Филогенетические закономерности появления новых генов поддерживают модель частой эволюции de novo» . BMC Genomics . 14 : 117. DOI : 10.1186 / 1471-2164-14-117 . PMC 3616865 . PMID 23433480 .  
  81. ^ a b c d Шмитц Дж. Ф., Ульрих К. К., Борнберг-Бауэр Э. (октябрь 2018 г.). «Зарождающиеся гены de novo могут развиться из замороженных случайностей, которые избежали быстрой смены транскриптов». Природа, экология и эволюция . 2 (10): 1626–1632. DOI : 10.1038 / s41559-018-0639-7 . PMID 30201962 . S2CID 52181376 .  
  82. ^ a b Вакирлис, N; Карвунис, АР; МакЛисагт, А (18 февраля 2020 г.). «Анализы на основе синтении показывают, что дивергенция последовательностей не является основным источником генов-сирот» . eLife . 9 . DOI : 10.7554 / eLife.53500 . PMC 7028367 . PMID 32066524 .  
  83. ^ a b c Palmieri N, Kosiol C, Schlötterer C (февраль 2014 г.). «Жизненный цикл сиротских генов дрозофилы» . eLife . 3 : e01311. arXiv : 1401.4956 . Bibcode : 2014arXiv1401.4956P . DOI : 10.7554 / eLife.01311 . PMC 3927632 . PMID 24554240 .  
  84. ^ а б Прабх Н., Розелер В., Витте Х., Эберхардт Г., Соммер Р. Дж., Рёдельспергер С. (ноябрь 2018 г.). «Нематоды Pristionchus» . Геномные исследования . 28 (11): 1664–1674. DOI : 10.1101 / gr.234971.118 . PMC 6211646 . PMID 30232197 .  
  85. ^ a b Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). «Механизмы и динамика появления орфанных генов в геномах насекомых» . Геномная биология и эволюция . 5 (2): 439–55. DOI : 10.1093 / GbE / evt009 . PMC 3590893 . PMID 23348040 .  
  86. ^ NEME R, Таутц D (февраль 2016). «Быстрый оборот транскрипции генома во время эволюции подвергает всю некодирующую ДНК возникновению гена de novo» . eLife . 5 : e09977. DOI : 10.7554 / eLife.09977 . PMC 4829534 . PMID 26836309 .  
  87. ^ Kutter C, Вт S, Stefflova K, Wilson MD, Гонсалвес A, Понтинг CP, Одом DT, Marques AC (2012). «Быстрый оборот длинных некодирующих РНК и эволюция экспрессии генов» . PLOS Genetics . 8 (7): e1002841. DOI : 10.1371 / journal.pgen.1002841 . PMC 3406015 . PMID 22844254 .  
  88. ^ a b c d e Рейнхардт Дж. А., Ванджиру Б. М., Брант А. Т., Саелао П., Бегун Д. Д., Джонс CD (2013). «Открытые рамки считывания de novo у дрозофилы важны для приспособленности организма и быстро эволюционировали из ранее некодирующих последовательностей» . PLOS Genetics . 9 (10): e1003860. DOI : 10.1371 / journal.pgen.1003860 . PMC 3798262 . PMID 24146629 .  
  89. ^ a b Чжуан X, Ян Ц., Мерфи KR, Cheng CC (февраль 2019 г.). «Молекулярный механизм и история бессмысленной эволюции гена гликопротеина антифриза у северных гадидов» . Труды Национальной академии наук Соединенных Штатов Америки . 116 (10): 4400–4405. DOI : 10.1073 / pnas.1817138116 . PMC 6410882 . PMID 30765531 .  
  90. ^ Баальсруд, Хелле Тессанд; Торресен, Оле Кристиан; Солбаккен, Моника Хонгро; Зальцбургер, Вальтер; Ханель, Рейнхольд; Jakobsen, Kjetill S .; Джентофт, Сиссель (01.03.2018). «De Novo Gene Evolution of Antifreeze Glycoproteins in Codfishes, Reveated by Whole Genome Sequence Data» . Молекулярная биология и эволюция . 35 (3): 593–606. DOI : 10.1093 / molbev / msx311 . ISSN 1537-1719 . PMC 5850335 . PMID 29216381 .   
  91. ^ Се, Чен; Бекпен, Цемалеттин; Кюнцель, Свен; Кешаварз, Марьям; Кребс-Уитон, Ребекка; Скрабар, Нева; Ульрих, Кристиан Карстен; Тауц, Дитхард (2019). «Созданный de novo ген у домовой мыши регулирует циклы беременности самок» . eLife . 8 . DOI : 10.7554 / eLife.44392 . ISSN 2050-084X . PMC 6760900 . PMID 31436535 .   
  92. ^ a b c Экман Д., Элофссон А. (февраль 2010 г.). «Идентификация и количественная оценка последовательностей орфанных белков в грибах» . Журнал молекулярной биологии . 396 (2): 396–405. DOI : 10.1016 / j.jmb.2009.11.053 . PMID 19944701 . 
  93. ^ Domazet-Loso T, Таутц D (октябрь 2003). «Эволюционный анализ генов-сирот у дрозофилы» . Геномные исследования . 13 (10): 2213–9. DOI : 10.1101 / gr.1311003 . PMC 403679 . PMID 14525923 .  
  94. ^ Го WJ, Li P, J Ling, Е. П. (2007). «Значимые сравнительные характеристики орфанных и несиротских генов в геноме риса (Oryza sativa L.)» . Сравнительная и функциональная геномика . 2007 : 21676. дои : 10,1155 / 2007/21676 . PMC 2216055 . PMID 18273382 .  
  95. Вольф Ю.И., Новичков П.С., Карев Г.П., Кунин Е.В., Липман Д.Д. (май 2009 г.). «Универсальное распределение темпов эволюции генов и различные характеристики эукариотических генов разного видимого возраста» . Труды Национальной академии наук Соединенных Штатов Америки . 106 (18): 7273–80. DOI : 10.1073 / pnas.0901808106 . PMC 2666616 . PMID 19351897 .  
  96. ^ a b Sun W, Zhao XW, Zhang Z (сентябрь 2015 г.). «Идентификация и эволюция генов-сирот у домашнего шелкопряда Bombyx mori» . Письма FEBS . 589 (19, часть B): 2731–8. DOI : 10.1016 / j.febslet.2015.08.008 . PMID 26296317 . 
  97. ^ a b c Donoghue MT, Keshavaiah C, Swamidatta SH, Spillane C (февраль 2011 г.). «Эволюционное происхождение специфических генов Brassicaceae в Arabidopsis thaliana» . BMC Evolutionary Biology . 11 : 47. DOI : 10.1186 / 1471-2148-11-47 . PMC 3049755 . PMID 21332978 .  
  98. ^ a b c d Вернер М.С., Сириебриенников Б., Прабх Н., Лошко Т., Ланц С., Соммер Р.Дж. (ноябрь 2018 г.). «Молодые гены имеют отличную структуру генов, эпигенетические профили и регуляцию транскрипции» . Геномные исследования . 28 (11): 1675–1687. DOI : 10.1101 / gr.234872.118 . PMC 6211652 . PMID 30232198 .  
  99. ^ a b c d e Вакирлис Н., Хеберт А.С., Опуленте Д.А., Ахаз Дж., Хиттингер К.Т., Фишер Дж., Кун Дж. Дж., Лафонтен I. (март 2018 г.). «Молекулярный портрет генов De Novo в дрожжах» . Молекулярная биология и эволюция . 35 (3): 631–645. DOI : 10.1093 / molbev / msx315 . PMC 5850487 . PMID 29220506 .  
  100. ^ Б с д е е г ч я J Wilson BA, Foy SG, NEME R, Masel J (июнь 2017 г.). «Молодые гены сильно неупорядочены, как предсказывает преадаптационная гипотеза рождения гена de novo » . Природа, экология и эволюция . 1 (6): 0146–146. DOI : 10.1038 / s41559-017-0146 . PMC 5476217 . PMID 28642936 .  
  101. ^ a b c Фой С.Г., Уилсон Б.А., Бертрам Дж., Кордес М.Х., Мазель Дж. (апрель 2019 г.). «Сдвиг в стратегии предотвращения агрегации отмечает долгосрочное направление эволюции белков» . Генетика . 211 (4): 1345–1355. DOI : 10.1534 / genetics.118.301719 . PMC 6456324 . PMID 30692195 .  
  102. ^ а б Чжан, JY; Чжоу, Q (1 января 2019 г.). «О регуляторной эволюции новых генов на протяжении всей истории их жизни» . Молекулярная биология и эволюция . 36 (1): 15–27. DOI : 10.1093 / molbev / msy206 . PMID 30395322 . S2CID 53216993 .  
  103. Wu B, Knudson A (июль 2018 г.). «Происхождение De Novo генов, кодирующих белок в дрожжах» . mBio . 9 (4). DOI : 10,1128 / mBio.01024-18 . PMC 6069113 . PMID 30065088 .  
  104. ^ a b Bekpen C, Xie C, Tautz D (август 2018). «Работа с адаптивной иммунной системой во время de novo эволюции генов из межгенных последовательностей» . BMC Evolutionary Biology . 18 (1): 121. DOI : 10,1186 / s12862-018-1232-г . PMC 6091031 . PMID 30075701 .  
  105. ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A и др. (2018). «Тысячи крупномасштабных экспериментов по секвенированию РНК дают исчерпывающий список новых генов человека и выявляют обширный транскрипционный шум» . bioRxiv . bioRxiv 10.1101 / 332825 . DOI : 10.1101 / 332825 . 
  106. ^ a b Абрусан G (декабрь 2013 г.). «Интеграция новых генов в клеточные сети и их структурное созревание» . Генетика . 195 (4): 1407–17. DOI : 10.1534 / genetics.113.152256 . PMC 3832282 . PMID 24056411 .  
  107. ^ a b c Basile W, Sachenkova O, Light S, Elofsson A (март 2017 г.). «Высокое содержание GC вызывает внутреннюю неупорядоченность орфанных белков» . PLOS Вычислительная биология . 13 (3): e1005375. Bibcode : 2017PLSCB..13E5375B . DOI : 10.1371 / journal.pcbi.1005375 . PMC 5389847 . PMID 28355220 .  
  108. ^ Битард-Feildel Т, Хеберлайн М, Bornberg-Бауэр Е, Каллебау Я (декабрь 2015). «Обнаружение орфанных доменов у дрозофилы с использованием« гидрофобного кластерного анализа » ». Биохимия . 119 : 244–53. DOI : 10.1016 / j.biochi.2015.02.019 . PMID 25736992 . 
  109. Перейти ↑ Mukherjee S, Panda A, Ghosh TC (июнь 2015 г.). «Выяснение эволюционных особенностей и функциональных последствий сиротских генов у Leishmania major». Инфекция, генетика и эволюция . 32 : 330–7. DOI : 10.1016 / j.meegid.2015.03.031 . PMID 25843649 . 
  110. ^ Джеон J, J Чой, Ли GW, Парк С.Ю., Ха А, Дин Р., и др. (Февраль 2015 г.). «Полногеномное профилирование метилирования ДНК дает представление об эпигенетической регуляции развития грибов у растительного патогенного гриба Magnaporthe oryzae» . Научные отчеты . 5 : 8567. Bibcode : 2015NatSR ... 5E8567J . DOI : 10.1038 / srep08567 . PMC 4338423 . PMID 25708804 .  
  111. ^ Дингер ME, Pang KC, Mercer TR, Маттик JS (ноябрь 2008). «Дифференциация белок-кодирующих и некодирующих РНК: проблемы и неоднозначности» . PLOS Вычислительная биология . 4 (11): e1000176. Bibcode : 2008PLSCB ... 4E0176D . DOI : 10.1371 / journal.pcbi.1000176 . PMC 2518207 . PMID 19043537 .  
  112. ^ Стюарт, Николас Б .; Роджерс, Ребекка Л .; Малик, Хармит С. (23 сентября 2019 г.). «Хромосомные перестройки как источник образования новых генов у Drosophila yakuba» . PLOS Genetics . 15 (9): e1008314. DOI : 10.1371 / journal.pgen.1008314 . PMC 6776367 . PMID 31545792 .  
  113. ^ Swanson WJ, Vacquier В.Д. (февраль 2002). «Быстрая эволюция репродуктивных белков». Природа Обзоры Генетики . 3 (2): 137–44. DOI : 10.1038 / nrg733 . PMID 11836507 . S2CID 25696990 .  
  114. ^ Бустаманте CD, Fledel-Alon A, S Williamson, Nielsen R, Hubisz MT, Glanowski S, Таненбаум DM, Белый TJ, Sninsky JJ, Hernandez RD, Civello D, Adams MD, Cargill M, Clark AG (октябрь 2005). «Естественный отбор генов, кодирующих белок, в геноме человека». Природа . 437 (7062): 1153–7. Bibcode : 2005Natur.437.1153B . DOI : 10,1038 / природа04240 . PMID 16237444 . S2CID 4423768 .  
  115. ^ Clark NL, Aagaard JE, Swanson WJ (январь 2006). «Эволюция репродуктивных белков животных и растений» . Репродукция . 131 (1): 11–22. DOI : 10,1530 / rep.1.00357 . PMID 16388004 . 
  116. ^ Gubala AM, Schmitz JF, Кернс MJ, Винь TT, Bornberg-Bauer E, Wolfner MF, Финдли GD (май 2017). «Гены Годдарда и Сатурна необходимы для мужской фертильности дрозофилы и, возможно, возникли De Novo» . Молекулярная биология и эволюция . 34 (5): 1066–1082. DOI : 10.1093 / molbev / msx057 . PMC 5400382 . PMID 28104747 .  
  117. ^ a b c Луис Вильянуэва-Каньяс Дж, Руис-Орера Дж, Агея М.И., Галло М., Андреу Д., Альба М.М. (июль 2017 г.). «Новые гены и функциональные инновации у млекопитающих» . Геномная биология и эволюция . 9 (7): 1886–1900. DOI : 10.1093 / GbE / evx136 . PMC 5554394 . PMID 28854603 .  
  118. Перейти ↑ Schmidt EE (июль 1996 г.). «Транскрипционная распущенность в семенниках». Текущая биология . 6 (7): 768–9. DOI : 10.1016 / S0960-9822 (02) 00589-4 . PMID 8805310 . S2CID 14318566 .  
  119. Перейти ↑ White-Cooper H, Davidson I (июль 2011 г.). «Уникальные аспекты регуляции транскрипции в мужских половых клетках» . Перспективы Колд-Спринг-Харбор в биологии . 3 (7): а002626. DOI : 10.1101 / cshperspect.a002626 . PMC 3119912 . PMID 21555408 .  
  120. ^ Клини KC (август 2001). «Возможная мейотическая функция специфических паттернов экспрессии генов в сперматогенных клетках млекопитающих». Механизмы развития . 106 (1–2): 3–23. DOI : 10.1016 / S0925-4773 (01) 00413-0 . PMID 11472831 . S2CID 949694 .  
  121. ^ Давид Л, Huber Вт, Грановская М, Toedling J, Palm CJ, Bofkin л, Джонс Т, Дэвис RW, Стейнмец Л.М. (апрель 2006 г.). «Карта транскрипции в геноме дрожжей с высоким разрешением» . Труды Национальной академии наук Соединенных Штатов Америки . 103 (14): 5320–5. Bibcode : 2006PNAS..103.5320D . DOI : 10.1073 / pnas.0601091103 . PMC 1414796 . PMID 16569694 .  
  122. ^ Tisseur M, Kwapisz M, Мориллон A (ноябрь 2011). «Повсеместная транскрипция - Уроки дрожжей». Биохимия . 93 (11): 1889–96. DOI : 10.1016 / j.biochi.2011.07.001 . PMID 21771634 . 
  123. ^ Нагалакшми U, Ван Z, Waern К, Шо С, D Раха, Герштейн М, М Снайдер (июнь 2008 г.). «Транскрипционный ландшафт генома дрожжей, определенный с помощью секвенирования РНК» . Наука . 320 (5881): 1344–9. Bibcode : 2008Sci ... 320.1344N . DOI : 10.1126 / science.1158441 . PMC 2951732 . PMID 18451266 .  
  124. Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL, Ponting CP, Stadler PF, Morris KV, Morillon A, Rozowsky JS, Gerstein MB, Wahlestedt C, Hayashizaki Y, Carninci P, Gingeras TR, Mattick JS (июль 2011 г.). «Реальность всепроникающей транскрипции» . PLOS Биология . 9 (7): e1000625, обсуждение e1001102. DOI : 10.1371 / journal.pbio.1000625 . PMC 3134446 . PMID 21765801 .  
  125. ^ a b Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE и др. (Сентябрь 2014 г.). «Профилирование рибосом выявляет повсеместную трансляцию вне аннотированных генов, кодирующих белок» . Отчеты по ячейкам . 8 (5): 1365–79. DOI : 10.1016 / j.celrep.2014.07.045 . PMC 4216110 . PMID 25159147 .  
  126. ^ a b Руис-Орера Дж, Вердагер-Грау П., Вильянуэва-Каньяс Дж. Л., Мессегер X, Альба ММ (май 2018 г.). «Трансляция нейтрально эволюционирующих пептидов обеспечивает основу для эволюции гена de novo». Природа, экология и эволюция . 2 (5): 890–896. DOI : 10.1038 / s41559-018-0506-6 . ЛВП : 10230/36048 . PMID 29556078 . S2CID 4959952 .  
  127. ^ Руис-Орэр Дж, Messeguer Х, Subirana JA, Альба ММ (сентябрь 2014). «Длинные некодирующие РНК как источник новых пептидов» . eLife . 3 : e03523. arXiv : 1405.4174 . Bibcode : 2014arXiv1405.4174R . DOI : 10.7554 / eLife.03523 . PMC 4359382 . PMID 25233276 .  
  128. ^ a b c Уилсон Б.А., Мазел Дж. (2011). «Предположительно некодирующие транскрипты демонстрируют обширную ассоциацию с рибосомами» . Геномная биология и эволюция . 3 : 1245–52. DOI : 10.1093 / GbE / evr099 . PMC 3209793 . PMID 21948395 .  
  129. ^ Чен, Дж; Brunner, AD; Коган, JZ; Nuñez, JK; Поля, AP; Адамсон, Б. Ицхак, Д. Н.; Ли, JY; Манн, М; Леонетти, доктор медицины; Weissman, JS (6 марта 2020 г.). «Повсеместная функциональная трансляция неканонических человеческих открытых рамок чтения» . Наука . 367 (6482): 1140–1146. Bibcode : 2020Sci ... 367.1140C . DOI : 10.1126 / science.aay0262 . PMC 7289059 . PMID 32139545 .  
  130. ^ Киф AD, Шостак JW (апрель 2001). «Функциональные белки из библиотеки случайных последовательностей» . Природа . 410 (6829): 715–8. Bibcode : 2001Natur.410..715K . DOI : 10.1038 / 35070613 . PMC 4476321 . PMID 11287961 .  
  131. ^ Третьяченко В., Выметал Дж, Беднарова Л., Копецки В., Хофбауэрова К., Йиндрова Н. и др. (Ноябрь 2017 г.). «Случайные белковые последовательности могут образовывать определенные вторичные структуры и хорошо переносятся in vivo» . Научные отчеты . 7 (1): 15449. Bibcode : 2017NatSR ... 715449T . DOI : 10.1038 / s41598-017-15635-8 . PMC 5684393 . PMID 29133927 .  
  132. ^ Райт PE, Дайсон HJ (январь 2015). «Внутренне неупорядоченные белки в передаче сигналов и регуляции клеток» . Обзоры природы Молекулярная клеточная биология . 16 (1): 18–29. DOI : 10.1038 / nrm3920 . PMC 4405151 . PMID 25531225 .  
  133. ^ NEME R, Амадор С, Йилдирима В, Макконнелл Е, Тауц D (июнь 2017 г.). «Случайные последовательности - обильный источник биоактивных РНК или пептидов» . Природа, экология и эволюция . 1 (6): 0217. DOI : 10.1038 / s41559-017-0127 . PMC 5447804 . PMID 28580432 .  
  134. ^ а б Сильвейра А.Б., Тронтин С., Кортихо С., Барау Дж., Дель Бем Л.Е., Луде О. и др. (Апрель 2013). «Обширные естественные эпигенетические вариации в гене, возникшем de novo» . PLOS Genetics . 9 (4): e1003437. DOI : 10.1371 / journal.pgen.1003437 . PMC 3623765 . PMID 23593031 .  
  135. ^ Kimmins S, Sassone-Корси P (март 2005). «Ремоделирование хроматина и эпигенетические особенности половых клеток». Природа . 434 (7033): 583–9. Bibcode : 2005Natur.434..583K . DOI : 10,1038 / природа03368 . PMID 15800613 . S2CID 4373304 .  
  136. ^ a b c d Rajon E, Masel J (январь 2011 г.). «Эволюция показателей молекулярных ошибок и последствия для эволюционируемости» . Труды Национальной академии наук Соединенных Штатов Америки . 108 (3): 1082–7. Bibcode : 2011PNAS..108.1082R . DOI : 10.1073 / pnas.1012918108 . PMC 3024668 . PMID 21199946 .  
  137. ^ Masel, Joanna (март 2006). «Скрытые генетические вариации обогащаются для потенциальных адаптаций» . Генетика . 172 (3): 1985–1991. DOI : 10.1534 / genetics.105.051649 . PMC 1456269 . PMID 16387877 .  
  138. Willis S, Masel J (сентябрь 2018 г.). «Рождение гена способствует структурному нарушению, кодируемому перекрывающимися генами» . Генетика . 210 (1): 303–313. DOI : 10.1534 / genetics.118.301249 . PMC 6116962 . PMID 30026186 .  
  139. ^ Джакомелли, Майкл G .; Хэнкок, Адам С .; Масел, Джоанна (февраль 2007 г.). «Преобразование 3 'UTR в области кодирования» . Молекулярная биология и эволюция . 24 (2): 457–464. DOI : 10.1093 / molbev / msl172 . PMC 1808353 . PMID 17099057 .  
  140. ^ a b c Bornberg-Bauer E, Schmitz J, Heberlein M (октябрь 2015 г.). «Появление белков de novo из« темной геномной материи »путем« медленного роста и линьки » ». Труды биохимического общества . 43 (5): 867–73. DOI : 10.1042 / BST20150089 . PMID 26517896 . 
  141. ^ Уайлдер, Джейсон А .; Hewett, Elizabeth K .; Ганснер, Мередит Э. (декабрь 2009 г.). «Молекулярная эволюция GYPC: доказательства последних структурных инноваций и положительного отбора у людей» . Молекулярная биология и эволюция . 26 (12): 2679–2687. DOI : 10.1093 / molbev / msp183 . PMC 2775107 . PMID 19679754 .  
  142. ^ Вахрушева, Анна А .; Казанов, Марат Д .; Миронов, Андрей А .; Базыкин, Георгий А. (17 ноября 2010 г.). «Эволюция прокариотических генов путем сдвига стоп-кодонов». Журнал молекулярной эволюции . 72 (2): 138–146. DOI : 10.1007 / s00239-010-9408-1 . PMID 21082168 . S2CID 812377 .  
  143. ^ Andreatta, Мэтью E .; Левин, Джошуа А .; Фой, Скотт Дж .; Guzman, Lynette D .; Kosinski, Luke J .; Кордес, Мэтью HJ; Масел, Джоанна (июнь 2015 г.). "Недавнее происхождение De Novo протеина C-Termini" . Геномная биология и эволюция . 7 (6): 1686–1701. DOI : 10.1093 / GbE / evv098 . PMC 4494051 . PMID 26002864 .  
  144. ^ Kleppe А.С., Bornberg-Бауэр Е (ноябрь 2018). «Устойчивость благодаря внутренне неупорядоченным C-концам и трансляционному считыванию» . Исследования нуклеиновых кислот . 46 (19): 10184–10194. DOI : 10.1093 / NAR / gky778 . PMC 6365619 . PMID 30247639 .  
  145. ^ Klasberg S, Битард-Feildel Т, Каллебау я, Bornberg-Бауэр Е (июль 2018). «Происхождение и структурные свойства новых и de novo белковых доменов в процессе эволюции насекомых» . Журнал FEBS . 285 (14): 2605–2625. DOI : 10.1111 / febs.14504 . PMID 29802682 . 
  146. ^ Chen S, Krinsky BH, Long M (сентябрь 2013). «Новые гены как драйверы фенотипической эволюции» . Природа Обзоры Генетики . 14 (9): 645–60. DOI : 10.1038 / nrg3521 . PMC 4236023 . PMID 23949544 .  
  147. ^ Suenaga Y, Ислам SM, Алагу J, Канеко Y, Като М, Танака Y и др. (Январь 2014). «NCYM, цис-антисмысловой ген MYCN, кодирует образовавшийся de novo белок, который ингибирует GSK3β, что приводит к стабилизации MYCN в нейробластомах человека» . PLOS Genetics . 10 (1): e1003996. DOI : 10.1371 / journal.pgen.1003996 . PMC 3879166 . PMID 24391509 .  
  148. ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B и др. (Февраль 2000 г.). «ЧАСТЬ-1: новый ген, специфичный для простаты человека, регулируемый андрогенами, который отображается на хромосоме 5q12». Исследования рака . 60 (4): 858–63. PMID 10706094 . 
  149. Перейти ↑ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (июль 2018). «Опосредованный экзосомами перенос lncRNA PART1 индуцирует устойчивость к гефитинибу в плоскоклеточной карциноме пищевода посредством функционирования в качестве конкурирующей эндогенной РНК» . Журнал экспериментальных и клинических исследований рака . 37 (1): 171. DOI : 10,1186 / s13046-018-0845-9 . PMC 6063009 . PMID 30049286 .  
  150. ^ Самусик Н, Крюковская Л, Мельн я, Шилов Э, Козлов А.П. (2013). «PBOV1 представляет собой человеческий ген de novo с опухолеспецифической экспрессией, которая связана с положительным клиническим исходом рака» . PLOS ONE . 8 (2): e56162. Bibcode : 2013PLoSO ... 856162S . DOI : 10.1371 / journal.pone.0056162 . PMC 3572036 . PMID 23418531 .  
  151. ^ Guerzoni D, McLysaght A (апрель 2016). «Гены De Novo возникают медленно, но с постоянной скоростью по линии приматов и подвергаются неполной сортировке по линии происхождения» . Геномная биология и эволюция . 8 (4): 1222–32. DOI : 10.1093 / GbE / evw074 . PMC 4860702 . PMID 27056411 .  
  152. ^ Пекарский У, Rynditch А, Визер R, Fonatsch С, Гардинер К (сентябрь 1997 года). «Активация нового гена в 3q21 и идентификация межгенных слитых транскриптов с экотропным сайтом встраивания вируса I при лейкемии». Исследования рака . 57 (18): 3914–9. PMID 9307271 . 
  153. ^ Papamichos SI, Маргаритис D, Kotsianidis I (2015). «Адаптивная эволюция в сочетании с эксаптацией ретротранспозона позволила создать ген, специфичный для человеческого белка, который способствует пролиферации и метастазированию раковых клеток как при гематологических злокачественных новообразованиях, так и при солидных опухолях: необычный случай гена MYEOV» . Scientifica . 2015 : 984706. дои : 10,1155 / 2015/984706 . PMC 4629056 . PMID 26568894 .  
  154. ^ а б Козлов А.П. (2016). «Экспрессия эволюционно новых генов в опухолях» . Инфекционные агенты и рак . 11 : 34. DOI : 10,1186 / s13027-016-0077-6 . PMC 4949931 . PMID 27437030 .  
  155. ^ Ли CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW и др. (Март 2010 г.). «Специфический для человека ген, кодирующий белок de novo, связанный с функциями человеческого мозга» . PLOS Вычислительная биология . 6 (3): e1000734. Bibcode : 2010PLSCB ... 6E0734L . DOI : 10.1371 / journal.pcbi.1000734 . PMC 2845654 . PMID 20376170 .  
  156. ^ а б Чжан Ю.Е., Лэндбэк П., Вибрановски М.Д., Лонг М. (октябрь 2011 г.). «Ускоренный набор новых генов развития мозга в геном человека» . PLOS Биология . 9 (10): e1001179. DOI : 10.1371 / journal.pbio.1001179 . PMC 3196496 . PMID 22028629 .  
  157. ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A и др. (Декабрь 2014 г.). «Специфическая для приматов эндогенная транскрипция, управляемая ретровирусом, определяет наивные стволовые клетки» (PDF) . Природа . 516 (7531): 405–9. Bibcode : 2014Natur.516..405W . DOI : 10,1038 / природа13804 . PMID 25317556 . S2CID 205240839 .   
  158. ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E и др. (Январь 1999 г.). «Минорный человеческий антиген гистосовместимости, специфичный для В-клеточного острого лимфобластного лейкоза» . Журнал экспериментальной медицины . 189 (2): 301–8. DOI : 10,1084 / jem.189.2.301 . PMC 2192993 . PMID 9892612 .  
  159. ^ Хантер С., Апвейлер Р., Аттвуд Т.К., Байрох А., Бейтман А., Биннс Д. и др. (Январь 2009 г.). «InterPro: комплексная база данных сигнатур белков» . Исследования нуклеиновых кислот . 37 (Проблема с базой данных): D211-5. DOI : 10.1093 / NAR / gkn785 . PMC 2686546 . PMID 18940856 .  
  160. ^ Murphy Д.Н., McLysaght A (2012). «Происхождение de novo генов, кодирующих белок, у мышиных грызунов» . PLOS ONE . 7 (11): e48650. Bibcode : 2012PLoSO ... 748650M . DOI : 10.1371 / journal.pone.0048650 . PMC 3504067 . PMID 23185269 .  
  161. ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR и др. (Апрель 2019 г.). «Быстрая эволюция разнообразия белков за счет происхождения de novo в Орызе». Природа, экология и эволюция . 3 (4): 679–690. DOI : 10.1038 / s41559-019-0822-5 . PMID 30858588 . S2CID 73728579 .  
  162. ^ Прабх, Нил; Рёдельспергер, Кристиан (июль 2019 г.). «Дивергенция и смешанное происхождение способствуют появлению орфанных генов у нематод» . G3: Гены, геномы, генетика . 9 (7): 2277–2286. DOI : 10,1534 / g3.119.400326 . PMC 6643871 . PMID 31088903 .