Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В генетике , выражается последовательность тэгов ( EST ) короткий суб-последовательности из кДНК - последовательности. [1] EST могут использоваться для идентификации транскриптов генов , и они играют важную роль в открытии генов и определении последовательности генов. [2] Идентификация ESTs продвигается быстро: в настоящее время в общедоступных базах данных доступно около 74,2 миллиона EST (например, GenBank 1 января 2013 г., все виды).

EST является результатом однократного секвенирования о наличии клонированного кДНК . КДНК, используемые для генерации EST, обычно представляют собой отдельные клоны из библиотеки кДНК . Полученная последовательность представляет собой фрагмент относительно низкого качества, длина которого ограничена существующими технологиями приблизительно от 500 до 800 нуклеотидов . Поскольку эти клоны состоят из ДНК, комплементарной мРНК, EST представляют собой части экспрессируемых генов. Они могут быть представлены в базах данных либо как последовательность кДНК / мРНК, либо как обратный комплемент мРНК, цепочки матрицы .

Можно сопоставить EST с определенными местоположениями хромосом, используя методы физического картирования , такие как гибридное картирование излучения , счастливое картирование или FISH . В качестве альтернативы, если геном организма, который является источником EST, секвенирован, можно выровнять последовательность EST с этим геномом с помощью компьютера.

Текущее понимание набора генов человека (по состоянию на 2006 г. ) включает существование тысяч генов, основанных исключительно на данных EST. В этом отношении EST стали инструментом для уточнения предсказанных транскриптов для этих генов, что приводит к предсказанию их белковых продуктов и, в конечном итоге, их функции. Более того, ситуация, в которой получены эти EST (ткань, орган, болезненное состояние - например, рак ), дает информацию об условиях, в которых действует соответствующий ген. EST содержат достаточно информации для создания точных зондов для ДНК-микрочипов, которые затем можно использовать для определения профилей экспрессии генов .

Некоторые авторы используют термин «EST» для описания генов, для которых существует мало или совсем не существует дополнительной информации, кроме метки. [3]

История [ править ]

В 1979 году команды из Гарварда и Калифорнийского технологического института расширили основную идею создания ДНК-копий мРНК in vitro на амплификацию их библиотеки в бактериальных плазмидах. [4]

В 1982 году идея выбора случайных или полуслучайных клонов из такой библиотеки кДНК для секвенирования была исследована Грегом Сатклиффом и его сотрудниками. [5]

В 1983 году Патни и др. секвенировали 178 клонов из библиотеки кДНК мышц кролика. [6]

В 1991 году Адамс и его сотрудники придумали термин EST и инициировали более систематическое секвенирование в качестве проекта (начиная с 600 кДНК мозга). [2]

Источники данных и аннотации [ править ]

dbEST [ править ]

DbEST - это подразделение Genbank, основанного в 1992 году. Что касается GenBank , данные в dbEST предоставляются лабораториями по всему миру напрямую и не курируются.

Контиги EST [ править ]

Из-за способа секвенирования EST многие отдельные теги экспрессируемой последовательности часто являются частичными последовательностями, которые соответствуют одной и той же мРНК организма. В попытке уменьшить количество тегов экспрессированной последовательности для последующих анализов обнаружения генов несколько групп собрали теги экспрессированной последовательности в контиги EST . Примеры ресурсов, которые предоставляют контиги EST, включают: индексы генов TIGR, [7] Unigene, [8] и STACK [9]

Создание контигов EST нетривиально и может давать артефакты (контиги, содержащие два различных генных продукта). Когда доступна полная последовательность генома организма и транскрипты аннотированы, можно обойти сборку контигов и напрямую сопоставить транскрипты с EST. Этот подход используется в системе TissueInfo (см. Ниже) и позволяет легко связывать аннотации в геномной базе данных с информацией о тканях, предоставляемой данными EST.

Информация о тканях [ править ]

Высокопроизводительный анализ EST часто сталкивается с аналогичными проблемами управления данными. Первая проблема заключается в том, что тканевое происхождение библиотек EST описано простым английским языком в dbEST. [10] Это затрудняет написание программ, которые могут однозначно определить, что две библиотеки EST были секвенированы из одной и той же ткани. Точно так же болезненные состояния ткани не аннотируются удобным для вычислений способом. Например, происхождение библиотеки от рака часто смешивают с названием ткани (например, название ткани « глиобластома » указывает на то, что библиотека EST была секвенирована из ткани мозга, и болезненное состояние представляет собой рак). [11]За заметным исключением рака, болезненное состояние часто не регистрируется в записях dbEST. Проект TissueInfo был начат в 2000 году, чтобы помочь в решении этих проблем. Проект предоставляет тщательно отобранные данные (обновляемые ежедневно) для устранения неоднозначности происхождения ткани и состояния болезни (рак / отсутствие рака), предлагает онтологию тканей, которая связывает ткани и органы с помощью отношений «является частью» (т.е. формализует знания о том, что гипоталамус является частью мозга , и этот мозг является частью центральной нервной системы) и распространяет программное обеспечение с открытым исходным кодом для связывания аннотаций транскриптов из секвенированных геномов с профилями экспрессии тканей, рассчитанными с данными в dbEST. [12]

См. Также [ править ]

  • Экспрессия гена
  • Комплементарная ДНК (кДНК)
  • транскриптомика
  • ИЗОБРАЖЕНИЕ клонов кДНК
  • Секвенирование всего генома (WGS)

Ссылки [ править ]

  1. ^ Информационный бюллетень ESTs . Национальный центр биотехнологической информации .
  2. ^ а б Адамс MD, Келли JM, Gocayne JD, et al. (Июнь 1991 г.). «Комплементарное секвенирование ДНК: метки экспрессированной последовательности и проект генома человека». Наука . 252 (5013): 1651–6. DOI : 10.1126 / science.2047873 . PMID  2047873 . S2CID  13436211 .
  3. ^ dbEST
  4. Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (декабрь 1979). «Использование библиотеки кДНК для изучения эволюции и развития экспрессии мультигенных семейств хориона» . Cell . 18 (4): 1303–16. DOI : 10.1016 / 0092-8674 (79) 90241-1 . PMID 519770 . 
  5. ^ Сатклифф JG, Милнер RJ, Bloom FE, Lerner RA (август 1982). «Общая 82-нуклеотидная последовательность, уникальная для РНК мозга» . Proc Natl Acad Sci USA . 79 (16): 4942–6. DOI : 10.1073 / pnas.79.16.4942 . PMC 346801 . PMID 6956902 .  
  6. ^ Putney SD, Herlihy WC, Шиммеля P (1983). «Новые клоны тропонина Т и кДНК для 13 различных мышечных белков, обнаруженные методом дробового секвенирования». Природа . 302 (5910): 718–21. DOI : 10.1038 / 302718a0 . PMID 6687628 . S2CID 4364361 .  
  7. ^ Ли Й, Цай Дж, Сункара С. и др. (Январь 2005 г.). «Индексы генов TIGR: кластеризация и сборка EST и известных генов и интеграция с геномами эукариот» . Nucleic Acids Res . 33 (Выпуск базы данных): D71–4. DOI : 10.1093 / NAR / gki064 . PMC 540018 . PMID 15608288 .  
  8. ^ Stanton JA, Макгрегор AB, Green DP (2003). «Идентификация тканевой экспрессии гена в тканях мышей с использованием базы данных NIH UniGene». Appl Bioinform . 2 (3 доп.): S65–73. PMID 15130819 . 
  9. Christoffels A, van Gelder A, Greyling G, Miller R, Hide T, Hide W (январь 2001 г.). «СТЕК: выравнивание тегов последовательности и консенсусная база знаний» . Nucleic Acids Res . 29 (1): 234–8. DOI : 10.1093 / NAR / 29.1.234 . PMC 29830 . PMID 11125101 .  
  10. ^ Skrabanek L, Кампань F (ноябрь 2001). «TissueInfo: высокопроизводительная идентификация профилей тканевой экспрессии и специфичности» . Nucleic Acids Res . 29 (21): E102–2. DOI : 10.1093 / NAR / 29.21.e102 . PMC 60201 . PMID 11691939 .  
  11. ^ Кампань F, Skrabanek L (2006). «Поиск экспрессируемых тегов последовательностей позволяет идентифицировать раковые маркеры, представляющие клинический интерес» . BMC Bioinformatics . 7 : 481. DOI : 10,1186 / 1471-2105-7-481 . PMC 1635568 . PMID 17078886 .  
  12. ^ : Институт вычислительной биомедицины :: TissueInfo. Архивировано 4 июня 2008 г., в Wayback Machine.

Внешние ссылки [ править ]

  • «ESTs: открытие генов стало проще» . Учебник по науке . NCBI. 29 марта, 2004. Архивировано из оригинального 28 февраля 2007 года.
  • Понтий, Джоан У .; Вагнер, Лукас; Шулер, Грегори Д. (2003) [2002]. «21 UniGene: единый взгляд на транскриптом § Теги выраженной последовательности (EST)» . В McEntyre, J; Остелл, Дж (ред.). Справочник NCBI [Интернет] . Национальный центр биотехнологической информации. NBK21101. Эта публикация предназначена только для исторической справки, и информация может быть устаревшей.
  • Friedel, CC1; Jahn, KH; Sommer, S; Радд, S; Mewes, HW; Тетько, И.В. (15 апреля 2005 г.). «Вспомогательные векторные машины для разделения коллекций смешанных растений-патогенов EST на основе использования кодонов (ECLAT)» . Биоинформатика . 21 (8): 1383–8. DOI : 10.1093 / биоинформатики / bti200 . PMID  15585526 .
    • «ЭКЛАТ» . MIPS . Архивировано 27 сентября 2008 г. Сервер для классификации EST из смешанных пулов EST (из растений, инфицированных грибком) с использованием кодонов.
  • "dbEST" . GenBank .
    • "Резюме dbEST" . GenBank . 1 января 2013 г. Архивировано из оригинала 7 июня 2019 года.
  • Ранганатан, Шоба. «Биоинформатика» .
    • «Интернет-ресурсы для данных и анализа EST» . Архивировано из оригинального 29 августа 2007 года.

Информация о тканях [ править ]

  • "TissueInfo" . Вики .
  • "TissueInfo" . Архивировано из оригинала на 4 июня 2008 года Куратор EST ткани происхождения, ткани онтология, с открытым исходным кодом
  • Skrabanek L, Campagne F (1 ноября 2001 г.). «TissueInfo: высокопроизводительная идентификация профилей тканевой экспрессии и специфичности» . Nucleic Acids Res . 29 (21): E102–2. DOI : 10.1093 / NAR / 29.21.e102 . PMC  60201 . PMID  11691939 .