Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

FANTOM (Functional Annotation of the Mouse / Mammalian Genome) - международный исследовательский консорциум, впервые созданный в 2000 году как часть исследовательского института RIKEN в Японии . [1] Первоначальная встреча собрала международных ученых с разным опытом, чтобы помочь аннотировать функцию клонов кДНК мыши, созданных группой Хаяшизаки. [2] Со времени первоначальной попытки FANTOM1 консорциум выпустил несколько проектов, направленных на понимание механизмов, управляющих регуляцией геномов млекопитающих . [1] Их работа позволила собрать большой объем общих данных и помогла продвинуть биохимическиеи биоинформатические методологии в исследованиях в области геномики .

История FANTOM

Фонд [ править ]

В 1995 году исследователи института RIKEN начали создание энциклопедии полноразмерных кДНК для генома мыши . Целью этого «проекта мышиной энциклопедии» было предоставить функциональную аннотацию транскриптома мыши . Это картирование предоставит ценный ресурс для открытия генов , понимания генов, вызывающих болезни, и гомологии между видами.. С самого начала это обещало стать сложной задачей. Существующие методологии были недостаточны для создания полноразмерных клонов кДНК в большом масштабе, и чтобы их можно было использовать в качестве ресурса, аннотации должны были быть согласованы с экспертами из разных дисциплин. [1] [2]

Первой целью была разработка методов, позволяющих создавать библиотеки кДНК полной длины. Обратные транскриптаза протоколов в то время были трудности с вторичной структурой в мРНКе , что приводит к сокращенному кДНКу, которые трудно согласовать и предложил дальнейшие осложнения по ходу анализа. Чтобы преодолеть это ограничение, был разработан метод с использованием трегалозы, позволяющий обратной транскриптазе функционировать при более высокой температуре, расслабляя вторичные структуры. [3] Другие методы были дополнительно разработаны для помощи в создании библиотек клональных кДНК. К ним относятся система захвата на основе биотина для отбора полноразмерной кДНК, новый лямбда-фаг. вектор, который минимизировал смещения при доставке кДНК в плазмиду , и итеративная стратегия для обогащения кДНК, которая еще не была секвенирована . [1] [2] [4] [5] [6]

Секвенирование началось в 1998 году и быстро прогрессировало, давая 246 библиотек кДНК, которые включали 21 076 клонов кДНК в большом диапазоне клеток и тканей мыши . Хотя этот этап был в основном успешным, на биоинформатическом уровне возникли дополнительные ограничения. Секвенированные кДНК были аннотированы полуавтоматическим способом с использованием доступных баз данных (таких как гомология видов и известные белковые мотивы) для назначения генов в рамках онтологии генов (GO). Однако многие новые последовательности не имели значимых совпадений при выполнении BLAST с базами данных генов. [1] [2]

После консультации с Джерри Рубином , организатором первой попытки аннотации генома для Drosophila melanogaster , стало очевидно, что для новых последовательностей требуется надежная система аннотации, включающая вычислительное предсказание и ручное редактирование . Заинтересовавшись мнением экспертов в области биоинформатики, генетики и других научных областей, группа RIKEN организовала первую встречу FANTOM.

FANTOM1 [ править ]

Чтобы облегчить аннотацию клонов кДНК мыши, исследовательская группа RIKEN разработала веб-службу под названием FANTOM + перед первой встречей. Пользователи могли искать мотивы , просматривать предварительно вычисленные оценки сходства последовательностей, а также запрашивать другие общедоступные базы данных и интегрировать соответствующие аннотации в базу данных FANTOM. Назначение и функциональная аннотация генов потребовали множества биоинформатических инструментов и баз данных. Преобладающие инструменты включали BLASTN / BLASTX, FASTA / FASTY, DECODER, EST-WISE и HMMER , при этом использовались базы данных нуклеиновых кислот и белков, такие как SwissProt , UniGene и NCBI-nr. Одновременно сотрудничество сГруппа информатики генома мышей (MGI) позволила исследователям RIKEN создать проверенный набор клонов, которые были идентичны в двух базах данных. [1] [2]

Вооружившись вычислительными методологиями и более чем 20 000 последовательностей кДНК, группа RIKEN организовала первую встречу FANTOM в городе Цукуба с 28 августа по 8 сентября 2000 г. Для обсуждения стратегий и выполнения аннотации клонов RIKEN была привлечена разнообразная группа международных ученых. Собранные вычислительные процедуры позволили для сравнения последовательностей и анализа предметной области назначить предполагаемую функцию с использованием терминов GO. Избыточность клонов кДНК представляла проблему, требующую стратегий кластеризации и обращения к набору проверки MGI для идентификации уникальных клонов. Набор клонов RIKEN был в конечном итоге сокращен до 15 295 генов, хотя это было осторожно признано завышенным. [1] [2]

Обзор определения RIKEN

Центральным в кураторских усилиях было создание определения RIKEN. Это обеспечивало иерархические и систематические средства для назначения функций клонам на основе известных генов, отдавая приоритет ранее установленным или хорошо изученным знаниям. Иерархический характер классификации учитывал последовательность, когда последовательность была очень похожа на несколько разных генов. Важно отметить, что если сходство последовательностей не было обнаружено, определение назначало предполагаемую функцию на основе предсказанных сигнатур белковых мотивов, кодирующего потенциала и совпадений с базами данных выраженных тегов последовательности (EST). Только при отсутствии какого-либо предсказанного или репрезентативного сходства клон может считаться «неклассифицируемым». [1] [2]

Благодаря совместным усилиям RIKEN / FANTOM в 2001 году была выпущена публикация Nature. [7] Результаты включали отнесение 21 076 клонов кДНК к 4012 терминам GO, идентификацию новых мышиных генов и белковых мотивов, обнаружение вероятных альтернативных форм сплайсинга и открытие генов мышей, ортологичных генам болезней человека. Кроме того, через неделю был опубликован первый секвенированный геном человека, в который были включены результаты FANTOM для прогнозирования количества генов человека. [1] [2] [8]

FANTOM2 [ править ]

Создав и улучшив протоколы генерации полноразмерных библиотек кДНК, группа RIKEN продолжила пополнять коллекцию FANTOM. Модификации их методов позволили дополнительно отобрать редкие и длинные транскрипты, что позволило идентифицировать кДНК длиной более 4 килобайт. Вторая встреча FANTOM состоялась в мае 2002 года - к тому времени количество клонов кДНК увеличилось на 39 694 до 60 770. [1] [9]

Одно понимание, полученное с помощью FANTOM1, заключалось в том, что альтернативное полиаденилирование было обычным в транскриптоме мыши, а это означает, что кластеризация 3'-конца приводит к обширной избыточности. Чтобы решить эту проблему, было выполнено дополнительное секвенирование 5'-конца для идентификации уникальных клонов. Публикация FANTOM2 внесла существенный вклад в новые транскрипты, кодирующие белок. Возможно, наиболее заметным результатом FANTOM2 было то, что попытки отбора длинных и редких транскриптов выявили значительное количество не кодирующей белок РНК . [1] [9]

И снова коллекция FANTOM оказалась плодотворным ресурсом. Некодирующие РНК были идентифицированы как антисмысловые РНК и длинные некодирующие РНК (днРНК), плохо изученные классы регуляторных РНК. [10] [11] В первой опубликованной последовательности генома мыши использовались аннотации, установленные FANTOM. [10] Другие усилия позволили описать целые семейства белков, такие как рецепторы, связанные с G-белком . [1] [12] [13]

FANTOM3 [ править ]

Конечная цель FANTOM - создать генные сети, которые фиксируют регуляторные взаимодействия транскрипции, и дифференцировать эти взаимодействия по типу или состоянию клеток . В этой степени стало понятно, что полиморфная природа 5'-конца последовательностей потребует обширного картирования. Характеристика сайтов начала транскрипции (TSS) позволит идентифицировать промоторы и дифференцировать их использование между типами клеток. Это также означало, что необходимы дальнейшие разработки методов секвенирования. В то время как полноразмерные кДНК мыши продолжали генерироваться, исследователи под руководством RIKEN разработали Cap Analysis of Gene Expression (CAGE), метод, который будет определять большую часть их будущей работы. [1]

Схема CAGE

Разработка CAGE [ править ]

CAGE был продолжением концепций, разработанных для FANTOM1 и широко используемых в следующих проектах, для захвата 5'- кэпов мРНК . В отличие от предыдущих попыток создания полноразмерной кДНК, CAGE исследует фрагменты или теги, которые имеют длину 20-27. Это обеспечило экономичное и высокопроизводительное средство картирования TSS, включая структуру и активность промотора. [1]

Общие шаги следующие: кДНК подвергается обратной транскрипции с мРНК с использованием случайных праймеров или праймеров oligo dT . Затем используется метод cap trapper, чтобы гарантировать выбор полноразмерной кДНК. Это влечет за собой добавление биотина к 5'-кэпу и последующий захват гранулами стрептавидина после стадии расщепления РНКазой для удаления однонитевой РНК, которая не гибридизовалась с кДНК. После улавливания кэпом кДНК отделяют от гибрида РНК-кДНК. Двухцепочечный линкер CAGE, который также является биотинилированным, лигируется с 5'-концом кДНК, и синтезируется вторая цепь кДНК. Полученная двухцепочечная ДНК расщепляется эндонуклеазой Mme1., разрезая линкер CAGE и производя тег CAGE размером 20-27 пар оснований. Второй линкер добавляется к 3'-концу, и метка амплифицируется с помощью ПЦР . Наконец, теги CAGE освобождаются от линкеров 5 'и 3'. Затем теги можно упорядочить, объединить или клонировать. [4] [14] [15] [16] В то время CAGE проводилась с использованием капиллярного секвенатора RISA 384, ранее разработанного RIKEN. [1]

Отображение фрагментов CAGE

Открытия [ править ]

Разработка CAGE привела к ряду важных открытий. Важно отметить, что в транскриптоме млекопитающих было обнаружено гораздо больше РНК, чем считалось ранее, что сопровождалось осознанием того, что геном транскрибируется повсеместно. [1] Комбинируя методы CAGE, сигнатуры идентификации генов и клонирование сигнатуры гена, был картирован «транскрипционный ландшафт» генома млекопитающих, характеризующий паттерн сигналов контроля транскрипции и транскриптов, которые они генерируют. [17] Было обнаружено, что в геноме мыши гораздо больше транскриптов, чем примерно 22 000 генов, и что многие из этих транскрипционных единиц имеют альтернативные промоторы и сайты полиаденилирования .

Более того, было обнаружено, что «транскрипционные леса», кластеры транскриптов, которые имеют общие области экспрессии и регуляторные события, разделены «транскрипционными пустынями» и составляют ~ 63% генома. [17] Совместно выпущенная публикация обнаружила, что многие транскрипты в этих лесах демонстрируют антисмысловую транскрипцию, и что большинство пар смысловой / антисмысловой регуляции обнаруживают согласованную регуляцию. [18] Другой примечательный результат показал, что многие некодирующие РНК экспрессируются динамически, причем многие из них инициируются в 3'- нетранслируемых областях , и что они позиционно консервативны у разных видов. [17]

Третья важная статья, вышедшая из FANTOM3, посвящена исследованию архитектуры и эволюции промоторов млекопитающих. [19] Он установил два класса промоторов млекопитающих. Первыми являются промоторы, обогащенные ТАТА-боксом , с четко определенными стартовыми сайтами транскрипции. Эти промоторы эволюционно консервативны и чаще связаны с тканеспецифическими генами. Второй и более распространенный класс промоторов, широкие промоторы, богатые CpG, пластичны, эволюционируют и экспрессируются в широком диапазоне клеток и тканей. Это исследование также продемонстрировало, что промоторы, богатые CpG, могут быть двунаправленными (продуцировать смысло-антисмысловые пары) и очень чувствительны к эпигенетическому контролю и, следовательно, являются потенциальным компонентом адаптивной эволюции.

Встреча для FANTOM3 произошла в сентябре 2004 года. Коллекция спутниковых публикаций, порожденных FANTOM3, была опубликована в PLoS Genetics . Они включают дальнейшую работу по свойствам промотора, длине экзона и псевдо-мессенджеру РНК. [20] [21]

FANTOM4 [ править ]

Подъем следующего поколения секвенирования был значительно полезным для продвижения CAGE технологии. Используя секвенатор Roche-454 , группа FANTOM разработала deepCAGE, увеличив пропускную способность CAGE до более чем миллиона тегов на образец. [22] На этой глубине исследователи могли теперь приступить к построению сетей регуляторных взаимодействий генов . Встреча FANTOM4 состоялась в декабре 2006 года.

В то время как предыдущие проекты FANTOM изучали ряд типов клеток, цель FANTOM4 состояла в том, чтобы глубоко исследовать динамику клеточной дифференцировки . Анализ был ограничен клеточной линией человека THP-1 , предоставив данные о зависимости от времени превращения монобласта в моноцит . DeepCage разрешил TSS при разрешении одного нуклеотида, точно определив места связывания факторов транскрипции (TF). Путем мониторинга зависимых от времени изменений экспрессии генов по мере дифференцировки клеток был сделан вывод о том, какие регуляторные мотивы позволяют предсказать изменения экспрессии, временную зависимость активности TF и ​​гены-мишени TF. [23] Эти усилия привели к созданию сети регуляции транскрипции, демонстрирующей, что процесс дифференцировки очень сложен и управляется большим количеством TF, осуществляющих как положительные, так и отрицательные регуляторные взаимодействия.

FANTOM4 также расширил наше понимание транскрипции ретротранспозона и РНК инициации транскрипции (tiRNAs). Ретротранспозоны вносят вклад в повторяющиеся элементы в геномах млекопитающих и могут влиять на множество биологических процессов, таких как геномная эволюция, а также на структуры, такие как альтернативные промоторы и экзоны. [24] [25] Было продемонстрировано, что ретротранспозоны экспрессируются специфично для клеток и тканей, и было идентифицировано около 250 000 ранее неизвестных TSS, управляемых ретротранспозонами. [26]

Было обнаружено, что ретротранспозоны могут влиять на транскрипцию и регуляцию транскрипции у млекопитающих как кодирующих, так и некодирующих РНК в различных тканях. [26] Дальнейшие усилия привели к обнаружению широко распространенного в геномном и эволюционном плане нового класса РНК, называемых РНК инициации транскрипции (тиРНК). [27] Этот вид РНК относительно крошечный (~ 18 нуклеотидов в длину) и обычно находится ниже TSS промоторов, богатых CpG. Количество тиРНК невелико, и они связаны с высоко экспрессируемыми генами, а также со связыванием РНК-полимеразы II и TSS. Более поздняя работа показала, что tiRNs могут быть способны модулировать эпигенетические состояния и локальную архитектуру хроматина . [28] Однако возможно, что эти тиРНК не играют регуляторной роли и являются просто побочным продуктом транскрипции. [1] [27]

После этих первоначальных результатов исследователи RIKEN опубликовали атлас комбинаторной регуляции транскрипции у мышей и людей. [29] Эта работа продемонстрировала, что транскрипционные комплексы могут взаимодействовать внутри сети, чтобы контролировать идентичность ткани / состояние клетки, и что в этих сетях часто доминируют факторы транскрипции «посредников», которые широко экспрессируются в тканях / клетках. Было обнаружено, что примерно половина измеренных регуляторных взаимодействий сохранялась между мышью и человеком. FANTOM4 привел к появлению множества дополнительных статей, исследующих такие темы, как архитектура промотора, регуляция miRNA и геномные регуляторные блоки. [30] [31] [32]

FANTOM5 [ править ]

Пятый раунд FANTOM был направлен на изучение регуляторного ландшафта транскриптома в максимально возможном количестве состояний клетки. [1] Он продолжает оставаться важным ресурсом общих данных. Проект состоял из двух этапов: первый был посвящен ячейкам в устойчивом состоянии, а второй - временным данным. Достижения в секвенировании следующего поколения были использованы для достижения огромного разнообразия FANTOM5, с секвенированием одной молекулы, позволяющим разрешить одну пару оснований активности TSS всего лишь с 100 нг РНК. [33] Образцы были взяты из каждого человеческого органа, а также из более чем 200 онкологических заболеваний.линий, 30 временных курсов клеточной дифференцировки, временных курсов развития мышей и более 200 первичных типов клеток. В общей сложности 1816 образцов человека и 11016 мышей были профилированы на обеих фазах. [33] [34]

Хотя FANTOM5 похож на проект ENCODE , он отличается двумя ключевыми отличиями. Во-первых, в ENCODE использовались иммортализованные клеточные линии , а в FANTOM5 основное внимание уделялось первичным клеткам и тканям, которые в большей степени отражают реальные биологические процессы, ответственные за поддержание идентичности типа клеток. Во-вторых, ENCODE использовал несколько геномных анализов для захвата транскриптома и эпигенома . FANTOM5 сосредоточился исключительно на транскриптоме, опираясь на другие опубликованные работы, чтобы сделать вывод о таких характеристиках, как тип клеток, определяемый статусом хроматина. [1] Встреча FANTOM5 состоялась в октябре 2011 года.

Фаза 1 [ править ]

Первый этап FANTOM5 включал получение «снимков» широкого спектра устойчивых типов клеток с использованием профилирования CAGE для 975 образцов человека и 399 образцов мышей. Это начальное усилие привело к появлению двух статей в журнале Nature: одна описывает ландшафт промоторов млекопитающих, а другая - активные энхансеры . [35] [36] Вместе они обеспечивают атлас промоторов, энхансеров и TSS для различных типов клеток, выступая в качестве «базовой линии» для изучения сложного ландшафта регуляции транскрипции. В частности, профили одиночных молекул CAGE были созданы с использованием секвенатора HeliScope на 573 образцах первичных клеток человека, 128 образцах первичных клеток мышей, 250 линиях раковых клеток, 152 посмертных тканях человека и 271 образце ткани развития мыши.[33] [37]

Был разработан новый метод идентификации пиков CAGE, названный анализом пиков разложения. Теги CAGE группируются по близости, после чего проводится независимый компонентный анализ для разложения пиков на неперекрывающиеся области. Применяется этап обогащения, чтобы гарантировать, что пики соответствуют TSS, и внешние данные EST, меток триметилирования гистона H3, лизина 4 и сайтов гиперчувствительности к ДНКазам используются для подтверждения того, что пики являются подлинными TSS. [33]

Ключевой вывод показал, что типичный промотор млекопитающих содержит несколько TSS с разными паттернами экспрессии в разных образцах. [1] [35] Это означает, что эти TSS регулируются отдельно, несмотря на то, что они находятся в непосредственной близости. Повсеместно экспрессируемые промоторы имели самую высокую консервативность в своих последовательностях, в то время как клеточно-специфические промоторы были менее консервативными. Еще один выдающийся результат показал, что РНК, полученная из энхансера (эРНК), транскрибируется специфическим для клетки / ткани образом, отражая активность этого энхансера. [37]

Фаза 2 [ править ]

В то время как первая фаза была сосредоточена на устойчивом представлении состояний ячеек, вторая фаза была направлена ​​на изучение динамического процесса перехода состояний ячеек с использованием данных динамики времени. Опять же, был использован CAGE - на этот раз более 19 временных курсов человека и 14 мыши, охватывающих диапазон типов клеток и биологических стимулов, которые представляли 408 различных временных точек. Это включало дифференцировку стволовых клеток или коммитированных клеток-предшественников по направлению к их конечной судьбе, а также полностью дифференцированных клеток, отвечающих на факторы роста или патогены . [1] [33] [38]

Неконтролируемая кластеризациябыл выполнен для идентификации набора различных классов ответа, изучения паттернов в кратных изменениях экспрессии по сравнению со временем 0. Таким образом, экспрессия энхансеров, промоторов TF и ​​промоторов не-TF была обобщена во временной шкале первых 6 часов ход времени. Как правило, самый ранний ответ клеток происходил на энхансерах, с пиком концентрации эРНК уже через 15 минут после времени 0. Даже в классах, которые представляют «более поздние» ответы, энхансеры имели тенденцию активироваться раньше проксимальных промоторов. Изменчивость наблюдалась в устойчивости этой активации - некоторые энхансеры быстро возвращались к исходному уровню после всплеска через 15 минут, в то время как другие сохранялись после активации промотора. Вместе это наводит на мысль, что эРНК может играть разные роли в регуляции активности генов. [38]

Дополнительная работа [ править ]

Помимо обычного обмена данными в базе данных FANTOM, FANTOM5 также представил два биоинформатических инструмента для исследования данных. ZENBU - это браузер генома с дополнительной функциональностью: пользователи могут загружать BAM-файлы экспериментов с CAGE, короткой РНК и ChIP-seq и выполнять контроль качества, нормализацию, поиск пиков и аннотацию среди визуальных сравнений. [39] SSTAR (семантический каталог, образцы, инициации транскрипции и правила) тем временем позволяет исследовать и искать образцы FANTOM5 и их геномные особенности. [40]

Множество данных, производимых FANTOM5, продолжает служить источником для исследователей, стремящихся объяснить регуляторные механизмы, которые формируют такие процессы, как развитие. Часто данные CAGE в конкретном типе клетки / ткани используются в сочетании с дальнейшими эпигеномными анализами - один из таких примеров описывает взаимодействие метилирования ДНК и определяемых CAGE регуляторных последовательностей во время дифференцировки гранулоцитов . [41]

Через три года после введения энхансер и промотор атласы, группа выпустила ФАНТОМ атласы для lncRNAs и микроРНК (миРНК), включающий данные FANTOM5. [42] [43]Общая цель состояла в том, чтобы обеспечить дальнейшее понимание более ранних наблюдений всеобъемлющей транскрипции генома млекопитающих. Работа по днРНК охарактеризовала 27 919 генов днРНК человека в 1829 образцах, чтобы стимулировать исследования функциональной значимости этого плохо изученного класса РНК. Результаты наводят на мысль, что 69% идентифицированных днРНК обладают потенциальной функциональностью, хотя требуются дополнительные доказательства, чтобы прокомментировать, являются ли остальные 31% просто транскрипционным «шумом» от ложной инициации транскрипции. Атлас miRNA идентифицировал 1357 промоторов miRNA человека и 804 мыши и продемонстрировал сильную консервацию последовательностей между двумя видами. Также было продемонстрировано, что первичная экспрессия miRNA может использоваться в качестве заместителя для уровней зрелой miRNA.

FANTOM6 [ править ]

В настоящее время FANTOM6 стремится систематически охарактеризовать роль днРНК в геноме человека. Биологическая функция этих больших (более 200 нуклеотидов) нетранслируемых РНК в значительной степени неизвестна. На основании нескольких работ, посвященных изучению днРНК, считается, что они участвуют в регуляции транскрипции, трансляции , посттрансляционных модификаций и эпигенетических меток. Однако текущие знания о степени и диапазоне этих предполагаемых регуляторных взаимодействий рудиментарны. [1] [44]

Перед следующим исполнением FANTOM предстоит решить множество проблем. В частности, днРНК плохо определены - они лишены консервативности и сильно различаются по размеру, от 200 до более одного миллиона нуклеотидов в длину. В отличие от кодирующих транскриптов, которые находятся в цитозоле для трансляции, днРНК обнаруживаются в основном в ядре - гораздо более сложном ландшафте РНК. В общем, lncRNA имеют более низкие уровни экспрессии, чем кодирующие транскрипты, но существует большая вариабельность в этой экспрессии, которая может быть скрыта типом клетки или локализацией в ядре. Более того, функциональная классификация lncRNAs остается предметом горячих споров - неизвестно, могут ли lncRNA быть сгруппированы на основе общих функций / механизмов действия или по активным доменам.[1]

FANTOM разработал трехэлементную экспериментальную стратегию для исследования этих неизвестных. Контрольный транскриптом и профиль эпигенома различных типов клеток будут построены в качестве базовой линии для каждого типа клеток. Затем с использованием днРНК, идентифицированных в предыдущих публикациях, данных FANTOM5 и дальнейшего профилирования CAGE, будут проведены эксперименты по возмущениям для оценки изменений клеточного молекулярного фенотипа . Наконец, дополнительная технология будет использоваться для функциональной аннотации / классификации выбранного подмножества днРНК. [44] Эти методы будут направлены на выяснение вторичной структуры днРНК, их ассоциации с белками и хроматином, а также картирование дальнодействующих взаимодействий днРНК по всему геному. [1]

Ссылки [ править ]

  1. ^ Б с д е е г ч я J к л м п о р д т ы т у V ш х де Hoon, Michiel; Шин, Джей У .; Карнинчи, Пьеро (8 августа 2015 г.). «Смена парадигмы в геномике через проекты FANTOM» . Геном млекопитающих . 26 (9–10): 391–402. DOI : 10.1007 / s00335-015-9593-8 . PMC  4602071 . PMID  26253466 .
  2. ^ a b c d e f g h "Введение в FANTOM" . fantom.gsc.riken.jp .
  3. ^ Карнинчи, Пьеро; Нишияма, Йоко; Вестовер, Артур; и другие. (20 января 1998 г.). «Термостабилизация и термоактивация термолабильных ферментов трегалозой и ее применение для синтеза полноразмерной кДНК» . Труды Национальной академии наук Соединенных Штатов Америки . 95 (2): 520–524. DOI : 10.1073 / pnas.95.2.520 . ISSN 0027-8424 . PMC 18452 . PMID 9435224 .   
  4. ^ a b Карнинчи, Пьеро; Квам, Катрин; Китамура, Акико; и другие. (Ноябрь 1996 г.). «Высокоэффективное клонирование кДНК полной длины с помощью биотинилированного CAP Trapper». Геномика . 37 (3): 327–336. DOI : 10.1006 / geno.1996.0567 . PMID 8938445 . 
  5. ^ Карнинчи, Пьеро; Шибата, Юко; Хаяцу, Норихито; и другие. (Октябрь 2000 г.). «Нормализация и вычитание кДНК, выбранных Cap-Trapper для подготовки полноразмерных библиотек кДНК для быстрого открытия новых генов» . Геномные исследования . 10 (10): 1617–1630. DOI : 10.1101 / gr.145100 . ISSN 1088-9051 . PMC 310980 . PMID 11042159 .   
  6. ^ Карнинчи, Пьеро; Шибата, Юко; Хаяцу, Норихито; и другие. (Сентябрь 2001 г.). «Сбалансированное и длинное клонирование полноразмерных кДНК, захваченных кэпом, в векторы нового семейства λ-FLC, позволяющее повысить скорость обнаружения генов и функциональный анализ». Геномика . 77 (1–2): 79–90. DOI : 10.1006 / geno.2001.6601 . PMID 11543636 . 
  7. ^ Kawai, J .; Shinagawa, A .; Shibata, K .; и другие. (8 февраля 2001 г.). «Функциональная аннотация полноразмерной коллекции кДНК мыши». Природа . 409 (6821): 685–690. DOI : 10.1038 / 35055500 . PMID 11217851 . 
  8. ^ Лендер, Эрик S .; Linton, Lauren M .; Биррен, Брюс; Нусбаум, Чад; Зоди, Майкл С .; и другие. (15 февраля 2001 г.). «Первоначальное секвенирование и анализ генома человека» . Природа . 409 (6822): 860–921. DOI : 10.1038 / 35057062 . PMID 11237011 . 
  9. ^ a b Окадзаки, Й .; Furuno, M .; Kasukawa, T .; Adachi, J .; Bono, H .; и другие. (5 декабря 2002 г.). «Анализ транскриптома мыши на основе функциональной аннотации 60 770 полноразмерных кДНК» . Природа . 420 (6915): 563–573. DOI : 10,1038 / природа01266 . PMID 12466851 . 
  10. ^ a b Нумата, К. (2 июня 2003 г.). «Идентификация предполагаемых некодирующих РНК среди коллекции полноразмерных кДНК мышей RIKEN» . Геномные исследования . 13 (6): 1301–1306. DOI : 10.1101 / gr.1011603 . PMC 403720 . PMID 12819127 .  
  11. ^ Kiyosawa, H. (2 июня 2003). «Антисмысловые транскрипты с набором клонов FANTOM2 и их значение для регуляции генов» . Геномные исследования . 13 (6): 1324–1334. DOI : 10.1101 / gr.982903 . PMC 403655 . PMID 12819130 .  
  12. Окадзаки, Ю. (2 июня 2003 г.). «Путеводитель по геному млекопитающих» . Геномные исследования . 13 (6): 1267–1272. DOI : 10.1101 / gr.1445603 .
  13. ^ Kawasawa, Y. (2 июня 2003). «Гены рецепторов, связанных с G-белками, в базе данных FANTOM2» . Геномные исследования . 13 (6): 1466–1477. DOI : 10.1101 / gr.1087603 . PMC 403690 . PMID 12819145 .  
  14. ^ "Технология RIKEN CAGE" . www.osc.riken.jp (на японском). Архивировано из оригинала на 2017-10-09 . Проверено 27 февраля 2018 .
  15. ^ Шираки, Т .; Кондо, С .; Katayama, S .; Waki, K .; Kasukawa, T .; Kawaji, H .; Kodzius, R .; Watahiki, A .; Накамура, М .; Аракава, Т .; Fukuda, S .; Sasaki, D .; Подгайская, А .; Harbers, M .; Kawai, J .; Carninci, P .; Хаяшизаки, Ю. (8 декабря 2003 г.). «Экспрессия гена анализа кэпа для высокопроизводительного анализа начальной точки транскрипции и идентификации использования промотора» . Труды Национальной академии наук . 100 (26): 15776–15781. DOI : 10.1073 / pnas.2136655100 . PMC 307644 . PMID 14663149 .  
  16. ^ Кодзиус, Римантас; Кодзима, Мики; Нишиёри, Хироми; Накамура, Мари; Фукуда, Широ; Тагами, Мичихира; Сасаки, Дайсуке; Имамура, Кенго; Кай, Чикатоши; Харберс, Матиас; Хаясизаки, Ёсихидэ; Карнинчи, Пьеро (март 2006 г.). «CAGE: кеп-анализ экспрессии гена». Методы природы . 3 (3): 211–222. DOI : 10.1038 / nmeth0306-211 . PMID 16489339 . 
  17. ^ a b c Carninci, P .; Kasukawa, T .; Katayama, S .; Gough, J .; Фрит, MC; Maeda, N .; Oyama, R .; Ravasi, T .; Lenhard, B .; Wells, C .; Kodzius, R .; Shimokawa, K .; Баич, В.Б .; Brenner, SE; Баталов, С .; Форрест, Арканзас; Заволан, М .; Дэвис, MJ; Уилминг, LG; Aidinis, V .; Аллен, Дж. Э .; Ambesi-Impiombato, A .; Apweiler, R .; Атуралия, РН; Бейли, TL; Бансал, М .; Baxter, L .; Байзель, кВт; Bersano, T .; и другие. (2 сентября 2005 г.). "Транскрипционный ландшафт генома млекопитающих". Наука . 309 (5740): 1559–1563. DOI : 10.1126 / science.1112014 . PMID 16141072 . 
  18. ^ Катаяма, S; Томару, Y; Kasukawa, T; и другие. (2 сентября 2005 г.). «Антисмысловая транскрипция в транскриптоме млекопитающих». Наука . 309 (5740): 1564–1566. DOI : 10.1126 / science.1112009 . PMID 16141073 . 
  19. ^ Карнинчи, Пьеро; Санделин, Альбин; Ленхард, Борис; Катаяма, Синтаро; Симокава, Кадзуро; и другие. (2006). «Полногеномный анализ архитектуры и эволюции промоторов млекопитающих». Генетика природы . 38 (6): 626–635. DOI : 10.1038 / ng1789 . ISSN 1546-1718 . PMID 16645617 .  
  20. ^ "FANTOM3 - Бумаги" . fantom.gsc.riken.jp .
  21. ^ "PLOS Genetics: результаты поиска FANTOM3" . journals.plos.org .
  22. ^ де Хун, Михиэль; Хаясизаки, Ёсихидэ (апрель 2008 г.). «Экспрессия генов глубокого кэп-анализа (CAGE): идентификация промоторов по всему геному, количественная оценка их экспрессии и сетевой вывод» . Биотехнологии . 44 Приложение (4): 627–632. DOI : 10.2144 / 000112802 . PMID 18474037 . 
  23. ^ Сузуки, Harukazu; Консорциум, ФАНТОМ; Форрест, Алистер Р. Р.; и другие. (2009). «Транскрипционная сеть, которая контролирует остановку роста и дифференцировку в линии клеток миелоидной лейкемии человека» . Генетика природы . 41 (5): 553–562. DOI : 10,1038 / нг . 375 . ISSN 1546-1718 . PMC 6711855 . PMID 19377474 .   
  24. ^ Kazazian, HH (12 марта 2004). «Мобильные элементы: драйверы эволюции генома». Наука . 303 (5664): 1626–1632. DOI : 10.1126 / science.1089670 . PMID 15016989 . 
  25. ^ Финнеган, Дэвид Дж. (Июнь 2012 г.). «Ретротранспозоны» . Текущая биология . 22 (11): R432 – R437. DOI : 10.1016 / j.cub.2012.04.025 . PMID 22677280 . 
  26. ^ a b Фолкнер, Джеффри Дж; Кимура, Ясумаса; Дауб, Карстен О; и другие. (19 апреля 2009 г.). «Регулируемый транскриптом ретротранспозона клеток млекопитающих». Генетика природы . 41 (5): 563–571. DOI : 10.1038 / ng.368 . PMID 19377475 . 
  27. ^ а б Тафт, Райан Дж; Глазов Евгений А; Клунан, Николь; и другие. (19 апреля 2009 г.). «Крошечные РНК, связанные с сайтами начала транскрипции у животных». Генетика природы . 41 (5): 572–578. DOI : 10.1038 / ng.312 . PMID 19377478 . 
  28. ^ Тафт, Райан Дж; Хокинс, Питер Дж; Мэттик, Джон С; Моррис, Кевин V (2011). «Взаимосвязь между РНК инициации транскрипции и локализацией CCCTC-связывающего фактора (CTCF)» . Эпигенетика и хроматин . 4 (1): 13. DOI : 10,1186 / 1756-8935-4-13 . PMC 3170176 . PMID 21813016 .  
  29. ^ Раваси, Тимоти; Сузуки, Харукадзу; Каннистрачи, Карло Витторио; и другие. (Март 2010 г.). «Атлас комбинаторной регуляции транскрипции у мышей и человека» . Cell . 140 (5): 744–752. DOI : 10.1016 / j.cell.2010.01.044 . PMC 2836267 . PMID 20211142 .  
  30. ^ Кратц, Антон; Арнер, Эрик; Сайто, Ринтаро; Кубосаки, Ацутака; Кавай, Джун; Сузуки, Харукадзу; Карнинчи, Пьеро; Аракава, Такахиро; Томита, Масару; Хаясизаки, Ёсихидэ; Дауб, Карстен О (2010). «Корневая структура промотора и геномный контекст отражают паттерны ацетилирования гистона 3 лизина 9» . BMC Genomics . 11 (1): 257. DOI : 10.1186 / 1471-2164-11-257 . PMC 2867832 . PMID 20409305 .  
  31. ^ Акалин, Алтуна; Фредман, Дэвид; Арнер, Эрик; Дун, Сяньцзюнь; Брюн, Ян; Сузуки, Харукадзу; Дауб, Карстен О; Хаясизаки, Ёсихидэ; Ленхард, Борис (2009). «Особенности транскрипции регуляторных блоков генома» . Геномная биология . 10 (4): R38. DOI : 10.1186 / ГБ-2009-10-4-r38 . PMC 2688929 . PMID 19374772 .  
  32. ^ "Публикации FANTOM 4" . fantom.gsc.riken.jp .
  33. ^ a b c d e Ногучи, Шухей; Аракава, Такахиро; Фукуда, Широ; и другие. (29 августа 2017 г.). «Профили FANTOM5 CAGE образцов человека и мышей» . Научные данные . 4 : 170112. DOI : 10.1038 / sdata.2017.112 . PMC 5574368 . PMID 28850106 .  
  34. ^ Лизио, Марина; Харшбаргер, Джейсон; Симодзи, Хисаши; и другие. (2015). «Ворота к атласу экспрессии млекопитающих на уровне промотора FANTOM5» . Геномная биология . 16 (1): 22. DOI : 10.1186 / s13059-014-0560-6 . PMC 4310165 . PMID 25723102 .  
  35. ^ a b Консорциум FANTOM - RIKEN PMI CLST (DGT); Форрест, Арканзас; Kawaji, H .; Rehli, M .; Baillie, JK; Де Хун, MJ; Haberle, V .; Lassmann, T .; Кулаковский, И.В. Лизио, М .; Ито, М .; Andersson, R .; Мунгалл, CJ; Михан, TF; Schmeier, S .; Bertin, N .; Jørgensen, M .; Dimont, E .; Arner, E .; Schmidl, C .; Schaefer, U .; Медведева Ю.А.; Plessy, C .; Витезич, М .; Severin, J .; Семпл, С .; Ishizu, Y .; Янг, RS; Francescatto, M .; и другие. (27 марта 2014 г.). «Атлас экспрессии млекопитающих на уровне промотора» . Природа . 507 (7493): 462–470. DOI : 10,1038 / природа13182 . PMC 4529748 . PMID 24670764 .  
  36. ^ Андерссон, Робин; Гебхард, Клаудиа; Мигель-Эскалада, Ирэн; и другие. (27 марта 2014 г.). «Атлас активных энхансеров для разных типов клеток и тканей человека» . Природа . 507 (7493): 455–461. DOI : 10,1038 / природа12787 . PMC 5215096 . PMID 24670763 .  
  37. ^ a b Kanamori-Katayama, M .; Ито, М .; Kawaji, H .; и другие. (19 мая 2011 г.). «Неамплифицированный кэп-анализ экспрессии генов на одномолекулярном секвенаторе» . Геномные исследования . 21 (7): 1150–1159. DOI : 10.1101 / gr.115469.110 . PMC 3129257 . PMID 21596820 .  
  38. ^ a b Arner, E .; Дауб, Колорадо; Vitting-Seerup, K .; и другие. (12 февраля 2015 г.). «Транскрибируемые энхансеры ведут волны координированной транскрипции в переходных клетках млекопитающих» . Наука . 347 (6225): 1010–1014. DOI : 10.1126 / science.1259418 . PMC 4681433 . PMID 25678556 .  
  39. ^ Северин, Джессика; Лизио, Марина; Харшбаргер, Джейсон; и другие. (1 марта 2014 г.). «Интерактивная визуализация и анализ крупномасштабных наборов данных секвенирования с использованием ZENBU». Природа Биотехнологии . 32 (3): 217–219. DOI : 10.1038 / nbt.2840 . PMID 24727769 . 
  40. ^ "FANTOM5_SSTAR" . fantom.gsc.riken.jp .
  41. ^ Ronnerblad, M .; Andersson, R .; Olofsson, T .; и другие. (26 марта 2014 г.). «Анализ ДНК-метилома и транскриптома в гранулопоэзе выявляет синхронизированные изменения и динамическое метилирование энхансера» . Кровь . 123 (17): e79 – e89. DOI : 10.1182 / кровь-2013-02-482893 . PMID 24671952 . 
  42. ^ Хон, Чунг-Чау; Ramilowski, Jordan A .; Харшбаргер, Джейсон; и другие. (1 марта 2017 г.). «Атлас длинных некодирующих РНК человека с точными 5'-концами» . Природа . 543 (7644): 199–204. DOI : 10,1038 / природа21374 . PMC 6857182 . PMID 28241135 .  
  43. ^ де Ри, Дерек; Абугессайса, Имад; Алам, Танвир; и другие. (21 августа 2017 г.). «Интегрированный атлас экспрессии miRNA и их промоторов у человека и мыши» . Природа Биотехнологии . 35 (9): 872–878. DOI : 10.1038 / nbt.3947 . PMC 5767576 . PMID 28829439 .  
  44. ^ а б "ФАНТОМ - ФАНТОМ6" . fantom.gsc.riken.jp .