GeneRIF или генов ссылки в функции является коротким (255 символов или меньше) утверждение о функции гена. GeneRIFs обеспечивают простой механизм для обеспечения возможности ученого , чтобы добавить к функциональной аннотации из генов , описанных в Entrez Gene базах данных. На практике функцияпостроен довольно широко. Например, есть GeneRIF, которые обсуждают роль гена в заболевании, GeneRIF, которые указывают зрителю на обзорную статью о гене, и GeneRIF, которые обсуждают структуру гена. Однако заявленное намерение состоит в том, чтобы GeneRIF касались функции генов. В настоящее время создано более полумиллиона geneRIF для генов почти 1000 различных видов. [1]
GeneRIF всегда связаны с конкретными записями в базе данных Entrez Gene. Каждый GeneRIF имеет указатель на PubMed ID (тип идентификатора документа) научной публикации, который обеспечивает доказательство утверждения, сделанного GeneRIF. GeneRIF часто извлекаются непосредственно из документа, который идентифицируется идентификатором PubMed, очень часто из его заголовка или из его последнего предложения.
GeneRIF обычно создаются индексаторами NCBI , но любой может отправить GeneRIF. Для обработки должен существовать действительный идентификатор гена для конкретного гена, или сотрудники отдела генов должны назначить общий идентификатор гена для вида . Последний случай реализуется через записи в Gene с символом NEWENTRY. После того, как идентификатор гена будет идентифицирован, для подачи заявки потребуются только три типа информации :
- краткая фраза, описывающая функцию или функции (длиной менее 255 символов , предпочтительно больше, чем повторное изложение названия статьи);
- опубликованный документ, описывающий эту функцию, реализованную путем предоставления PubMed ID цитирования в PubMed;
- действующий адрес электронной почты (который останется конфиденциальным).
Пример
Вот некоторые GeneRIF, взятые из Entrez Gene для GeneID 7157, человеческого гена TP53 . Идентификаторы документов PubMed в примерах опущены. Обратите внимание на широкую вариативность в отношении наличия или отсутствия знаков препинания и заглавных букв в начале предложения.
- p53 и c-erbB-2 могут играть независимую роль в канцерогенезе рака желчного пузыря.
- Распад эндогенного HIPK2 зависит от присутствия функционального белка p53.
- Аллели 72 кодона p53 влияют на реакцию на противоопухолевые препараты в клетках пожилых людей, регулируя ингибитор клеточного цикла p21WAF1
- Логистический регрессионный анализ показал, что р53 и ЦОГ-2 являются зависимыми предикторами канцерогенеза поджелудочной железы и взаимной взаимосвязью с прогрессированием опухолей между p53 и ЦОГ-2.
GeneRIF - это необычный тип текстового жанра, и недавно они стали предметом ряда статей сообщества разработчиков естественного языка.
Внешние ссылки
- Веб-страница NCBI с описанием GeneRIF
- Митчелл Дж. А., Аронсон А. Р., Морк Дж. Г., Народный LC, Хамфри С. М., Уорд Дж. М. (2003). «Индексирование генов: характеристика и анализ GeneRIFs NLM» . AMIA Annu Symp Proc : 460–4. PMC 1480312 . PMID 14728215 .
Рекомендации
- Уильям Херш, Рави Теджа Бхупатираджу (2003). Обзор TREC Genomics Track (PDF) . Архивировано из оригинального (PDF) 12 мая 2005 года.Документ, описывающий «общую задачу» конференции по поиску текста, включающую автоматическое предсказание GeneRIF.
- Лу, Чжиюн; К. Бретоннель Коэн; Лоуренс Хантер (2006). Поиск GeneRIF с помощью аннотаций Gene Ontology (PDF) . Proc. Тихоокеанский симпозиум по биокомпьютингу 2006. С. 52–63. Архивировано из оригинального (PDF) 13 февраля 2006 года. Статья Лу и др., Описывающая систему, которая автоматически предлагает GeneRIF.