Из Википедии, свободной энциклопедии
  (Перенаправлено из аннотации Gene )
Перейти к навигации Перейти к поиску

Аннотации ДНК или аннотации генома - это процесс определения местоположения генов и всех кодирующих областей в геноме и определения того, что эти гены делают. Аннотация (независимо от контекста) - это примечание, добавленное в виде пояснения или комментария. После того, как геном секвенирован, его необходимо аннотировать, чтобы понять его смысл. [1]

Для аннотирования ДНК, ранее неизвестное представление последовательности генетического материала обогащаются с информацией , относящейся геномной позицией в интронах - экзон границ, регуляторные последовательности , повторы , генные имена и белковых продукты. Эта аннотация хранится в геномных базах данных, таких как Mouse Genome Informatics , FlyBase и WormBase . Учебные материалы по некоторым аспектам биологической аннотации из лагеря аннотаций Gene Ontology 2006 и аналогичных мероприятий доступны на веб-сайте Gene Ontology. [2]

Национальный центр биомедицинской онтологии (www.bioontology.org) разрабатывает инструменты для автоматического аннотирования [3] записей базы данных на основе текстовых описаний этих записей.

В качестве общего метода dcGO [4] имеет автоматизированную процедуру для статистического вывода ассоциаций между терминами онтологии и доменами белков или комбинациями доменов из существующих аннотаций на уровне гена / белка.

Процесс [ править ]

Аннотации генома состоят из трех основных этапов: [5]

  1. определение частей генома, которые не кодируют белки
  2. идентификация элементов в геноме , процесс, называемый предсказанием генов
  3. прикрепление биологической информации к этим элементам

Инструменты автоматического аннотирования пытаются выполнить эти шаги с помощью компьютерного анализа, в отличие от ручного аннотирования (также известного как курирование), который требует человеческого опыта. В идеале эти подходы сосуществуют и дополняют друг друга в одном конвейере аннотаций .

Простой метод аннотации генов основан на инструментах поиска на основе гомологии, таких как BLAST , для поиска гомологичных генов в конкретных базах данных, а затем полученная информация используется для аннотирования генов и геномов. [6] Однако по мере добавления информации на платформу аннотаций ручные аннотаторы становятся способными устранять несоответствия между генами, которым даны одинаковые аннотации. Некоторые базы данных используют контекстную информацию генома, оценки сходства, экспериментальные данные и интеграцию других ресурсов для предоставления аннотаций генома через свой подход «Подсистемы». Другие базы данных (например, Ensembl ) полагаются на тщательно отобранные источники данных, а также на ряд различных программных инструментов в своем конвейере автоматической аннотации генома. [7]

Структурная аннотация состоит из идентификации геномных элементов.

  • ORF и их локализация
  • генная структура
  • кодирующие области
  • расположение регуляторных мотивов

Функциональная аннотация состоит из присоединения биологической информации к геномным элементам.

  • биохимическая функция
  • биологическая функция
  • вовлеченное регулирование и взаимодействия
  • выражение

Эти шаги могут включать как биологические эксперименты, так и анализ in silico . Подходы, основанные на протеогеномике, используют информацию от экспрессируемых белков, часто получаемую из масс-спектрометрии , для улучшения аннотаций геномики. [8]

Было разработано множество программных инструментов, позволяющих ученым просматривать и обмениваться аннотациями генома; например, MAKER .

Аннотации генома остаются серьезной проблемой для ученых, изучающих геном человека , теперь, когда последовательности генома более тысячи человек (Проект 100 000 геномов, Великобритания) и нескольких модельных организмов в значительной степени завершены. [9] [10] Определение местоположения генов и других элементов генетического контроля часто описывается как определение биологического «списка частей» для сборки и нормальной работы организма. [6] Ученые все еще находятся на ранней стадии процесса определения этого списка частей и понимания того, как все части «сочетаются друг с другом». [11]

Аннотации генома - это активная область исследований, в которой участвует ряд различных организаций в сообществе медико- биологических наук, которые публикуют результаты своих усилий в общедоступных биологических базах данных, доступных через Интернет и другие электронные средства. Вот алфавитный список текущих проектов, имеющих отношение к аннотации генома:

  • Энциклопедия элементов ДНК (ENCODE)
  • Энтрез Джин
  • Ансамбль
  • GENCODE
  • Консорциум генных онтологий
  • GeneRIF
  • RefSeq
  • Uniprot
  • Проект аннотации позвоночных и генома (Vega)

В Википедии аннотации генома начали автоматизировать под эгидой портала Gene Wiki, который управляет ботом, который собирает данные о генах из исследовательских баз данных и создает на их основе заглушки генов. [12]

Ссылки [ править ]

  1. ^ «Определение аннотации генома» .
  2. ^ «Учебные ресурсы GO» . Архивировано из оригинального 10 -го октября 2006 года . Проверено 21 сентября 2006 года .
  3. ^ http://bioontology.stanford.edu/annotator-service
  4. ^ Фанг, H; Гоф, Дж (2013). «DcGO: База данных онтологий, ориентированных на предметную область, по функциям, фенотипам, заболеваниям и многому другому» . Исследования нуклеиновых кислот . 41 (Выпуск базы данных): D536–44. DOI : 10.1093 / NAR / gks1080 . PMC 3531119 . PMID 23161684 .  
  5. Перейти ↑ Stein, L. (2001). «Аннотации генома: от последовательности к биологии». Природа Обзоры Генетики . 2 (7): 493–503. DOI : 10.1038 / 35080529 . PMID 11433356 . S2CID 12044602 .  
  6. ^ a b Певзнер, Джонатан (2009). Биоинформатика и функциональная геномика (2-е изд.). Хобокен, Нью-Джерси: Уайли-Блэквелл. ISBN 9780470085851.
  7. ^ "Электронная документация по конвейеру аннотации генома Ensembl" . Архивировано из оригинала 5 марта 2016 года.
  8. ^ Гупта, Нитин; Стивен Таннер; Навдип Джайтли; Джошуа Н. Адкинс; Мэри Липтон; Роберт Эдвардс; Маргарет Ромайн; Андрей Остерман; Винит Бафна; Ричард Д. Смит; Павел А Певзнер (сентябрь 2007 г.). «Полнопротеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации» . Геномные исследования . 17 (9): 1362–1377. DOI : 10.1101 / gr.6427907 . ISSN 1088-9051 . PMC 1950905 . PMID 17690205 .   
  9. ^ Консорциум проектов ENCODE (2011). Беккер ПБ (ред.). «Руководство пользователя Энциклопедии элементов ДНК (ENCODE)» . PLOS Биология . 9 (4): e1001046. DOI : 10.1371 / journal.pbio.1001046 . PMC 3079585 . PMID 21526222 .  
  10. ^ Маквин, Джорджия; Abecasis, DM; Auton, RM; Brooks, GAR; Депристо, ДР; Дурбин, А .; Handsaker, AG; Kang, P .; Marth, EE; McVean, P .; Габриэль, SB; Гиббс, РА; Зеленый, ED; Hurles, ME; Knoppers, BM; Korbel, JO; Lander, ES; Lee, C .; Lehrach, H .; Мардис, ER; Март, GT; Маквин, Джорджия; Никерсон, Д.А.; Schmidt, JP; Шерри, ST; Wang, J .; Уилсон, РК; Гиббс (главный исследователь), РА; Dinh, H .; и другие. (2012). «Интегрированная карта генетических вариаций из 1092 геномов человека» . Природа . 491 (7422): 56–65. Bibcode : 2012Natur.491 ... 56T . DOI : 10.1038 / nature11632 . PMC 3498066 . PMID  23128226 .
  11. ^ Данхэм, I .; Бернштейн, А .; Бирни, Сан-Франциско; Dunham, PJ; Грин, Калифорния; Gunter, F .; Снайдер, CB; Frietze, S .; Harrow, J .; Kaul, R .; Хатун, Дж .; Lajoie, BR; Landt, SG; Ли, Б.К .; Паули, Ф .; Розенблум, КР; Sabo, P .; Safi, A .; Sanyal, A .; Шореш, Н .; Саймон, JM; Песня, Л .; Тринклейн, Северная Дакота; Альтшулер, РК; Birney, E .; Браун, JB; Cheng, C .; Джебали, С .; Донг, X .; и другие. (2012). «Интегрированная энциклопедия элементов ДНК в геноме человека» . Природа . 489 (7414): 57–74. Bibcode : 2012Natur.489 ... 57T . DOI : 10.1038 / nature11247 . PMC 3439153 . PMID 22955616 .  
  12. ^ Хасс, Джон У .; Ороско, К; Гудейл, Дж; Wu, C; Баталов, С; Виккерс, Т.Дж.; Валафар, Ф; Су, AI (2008). «Вики-сайт по генам для аннотации функций генов» . PLOS Биология . 6 (7): e175. DOI : 10.1371 / journal.pbio.0060175 . PMC 2443188 . PMID 18613750 .