Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

GeneCards - это база данных генов человека, которая предоставляет геномную , протеомную , транскриптомную , генетическую и функциональную информацию обо всех известных и предполагаемых генах человека. [1] [2] [3] [4] Он разрабатывается и поддерживается Центром генома человека Crown при Научном институте Вейцмана .

База данных нацелена на предоставление быстрого обзора текущей доступной биомедицинской информации об искомом гене, включая человеческие гены, кодируемые белки и соответствующие заболевания. [1] [5] [6] База данных GeneCards обеспечивает доступ к бесплатным веб- ресурсам о более чем 7000 всех известных человеческих генах, которые интегрированы из> 90 источников данных, таких как HGNC , Ensembl и NCBI . Список основных генов основан на утвержденных символах генов, опубликованных Комитетом по номенклатуре генов HUGO (HGNC). [7] [8]Информация тщательно собирается и выбирается из этих баз данных его механизмом. Если поиск не дает никаких результатов, эта база данных предоставит несколько предложений, которые помогут пользователям выполнить их поиск, в зависимости от типа запроса и предложит прямые ссылки на поисковую систему других баз данных. [1]

Со временем база данных GeneCards разработала набор инструментов (GeneDecks, GeneLoc, GeneALaCart), который имеет более специализированные возможности. С 1998 года база данных GeneCards широко используется биоинформатиками , геномиками и медицинскими сообществами более 15 лет. [7] [8]

История [ править ]

С 1980-х годов информация о последовательностях становится все более обширной; впоследствии многие лаборатории осознали это и начали хранить такую ​​информацию в центральных репозиториях - первичной базе данных. [9] Однако информация, предоставляемая первичными базами данных последовательностей (базами данных более низкого уровня), сосредоточена на различных аспектах. Для сбора этих разрозненных данных Центр генома человека в короне Института Вейцмана в 1997 году разработал базу данных под названием «Генные карты». Эта база данных в основном касалась информации о геноме человека, генов человека, функций кодируемых белков и связанных с ними заболеваний, хотя и имела расширился с того времени. [1]

Рост [ править ]

Изначально база данных GeneCards имела две основные функции: предоставление интегрированной биомедицинской информации о гене в формате «карты» и поисковую систему на основе текста . С 1998 года в базу данных интегрировано больше ресурсов данных и типов данных, таких как экспрессия белков и информация о генных сетях. Он также повысил скорость и изощренность поисковой системы и расширил с геноцентрической догмы на анализ генов. Версия 3 базы данных собирает информацию из более чем 90 ресурсов базы данных на основе консолидированного списка генов. Он также добавил набор инструментов GeneCards, которые ориентированы на более конкретные цели. «GeneNote и GeneAnnot для анализа транскриптомов., GeneLoc для геномных местоположений и маркеров, GeneALaCart для пакетных запросов и GeneDecks для поиска функциональных партнеров и для дистилляции набора генов ". База данных обновляется в течение трехлетнего цикла планирования, реализации, разработки, полуавтоматической проверки качества и развертывания . Используемые технологии включают Eclipse , Apache , Perl , XML , PHP , Propel , Java , R и MySQL . [7] [8]

Текущее расширение генетических карт [7] [ править ]

  • Модели животных
  • Профилирование протеомики тканей
  • Гены РНК
  • Картирование идентификаторов генов и белков
  • Онлайн-аналитическая обработка (OLAP)

Доступность [ править ]

Некоммерческие организации могут получить свободный доступ к генетическим картам в образовательных и исследовательских целях на https://www.genecards.org/ и на академических зеркальных сайтах . Для коммерческого использования требуется лицензия. [ необходима цитата ]

GeneCards Suite [ править ]

GeneDecks [ править ]

GeneDecks - это новый инструмент анализа для выявления похожих генов или генов-партнеров, который обеспечивает метрику сходства путем выделения общих дескрипторов между генами на основе уникального богатства комбинаторных аннотаций генов человека GeneCards.

  1. Комбинаторная аннотация : Используя GeneDecks, можно получить набор похожих генов для конкретного гена с выбранной комбинаторной аннотацией . Сводная таблица приводит к ранжированию различного уровня сходства между идентифицированными генами и геном зонда.
  2. Унификация аннотаций : разные источники данных часто предлагают аннотации с разнородной системой именования. Унификация аннотаций GeneDecks основана на схожести алгоритмов обнаружения пространства ген-содержимого GeneCards .
  3. Поиск партнеров : в программе «Охотник за партнерами» GeneDecks пользователи задают ген запроса, а система ищет похожие гены на основе комбинаторного сходства взвешенных атрибутов.
  4. Установка дистилляции : в Set distiller пользователи задают набор генов, а система ранжирует атрибуты по степени их совместного использования в данном наборе генов. Как и Partner Hunter, он позволяет проводить сложные исследования множества наборов генов различного происхождения для обнаружения и выяснения соответствующих биологических закономерностей, тем самым улучшая систематическую геномику и изучение системной биологии. [8] [10] [11]

GeneALaCart [ править ]

GeneALaCart - это ориентированный на набор генов механизм пакетных запросов, основанный на популярной базе данных GeneCards. Это позволяет получать информацию о нескольких генах в пакетном запросе. [7] [12]

GeneLoc [ править ]

Член костюма GeneLoc представляет интегрированную карту хромосом человека , которая очень важна для разработки индивидуального чипа захвата , основанного на данных, интегрированных с помощью алгоритма GeneLoc. GeneLoc включает дополнительные ссылки на GeneCard, NCBI's Human Genome Sequencing, UniGene и ресурсы по картированию. [7] [13]

Использование [ править ]

Искать [ редактировать ]

Во-первых, введите поисковый запрос в пустое поле на домашних страницах. Методы поиска включают ключевые слова, только символ, символ / псевдоним / идентификатор и символ / псевдоним. [5] По умолчанию используется поиск по ключевым словам. Когда пользователь выполняет поиск по ключевым словам, отображаются MicroCard и MiniCard. Однако, когда пользователь выполняет поиск только по символу, он будет перенаправлен на GeneCard. [14]Поиск можно продолжить, нажав на расширенный поиск, где пользователь может напрямую выбрать раздел, категорию, ПОДАРКИ, Источник символов и наборы генов. Разделы включают псевдонимы и описания, заболевания, лекарственные препараты и соединения, экспрессию в тканях человека, функции, геномное местоположение, геномные варианты, ортологи, паралоги, пути и взаимодействия, белковые домены / семейства, белки, публикации, резюме и стенограммы. По умолчанию поиск выполняется по всем разделам. [5] Категории включают кодирование белков , псевдогены , гены РНК, генетические локусы , кластеры генов и без категорий. По умолчанию выполняется поиск по всем категориям. [5]GIFtS - это оценка предполагаемой функциональности генных карт, которая дает объективные числа, показывающие уровень знаний о функциональности генов человека. Он включает в себя высокий, средний, низкий и настраиваемый диапазон. [4] [15] Источники символов включают HGNC ( комитет по номенклатуре генов HUGO ), EntrezGene (информация о генах в NCBI), Ensembl, гены РНК GeneCards, CroW21 и так далее. [5]

Более того, пользователь может выбрать поиск по всем картам генов или по подмножеству генов, что будет более конкретным и приоритетным.

Во-вторых, на странице результатов поиска отображаются все соответствующие миникарты. На странице отображаются символ, описание, категория, ПОДАРКИ, идентификатор GC и оценка. [5] Пользователь может щелкнуть кнопку «плюс» для каждой мини-карты, чтобы открыть мини-карту. Кроме того, пользователь может щелкнуть непосредственно по символу, чтобы просмотреть подробную информацию о конкретной генной карте.

Профиль экспрессии FAM214A обнаружен в нормальной ткани человека, как показано в GeneCards.

Содержание GeneCards [5] [ править ]

Для конкретной карты GeneCard (например, GeneCard для TGFB1 ) она состоит из следующего содержания.

  1. Заголовок : Заголовок состоит из символа гена, категории (т. Е. Кодирования белка), GIFtS (т. Е. 74) и GCID (GC19M041837). Разные категории имеют разные цвета для выражения: кодирование белка, псевдоген, ген РНК, кластер генов , генетический локус и некатегории. Фон указывает на источники символов: гены, одобренные HGNC, база данных EntrezGene, база данных генов Ensembl или гены, созданные с помощью генных карт.
  2. Псевдонимы : Псевдонимы, как следует из названия, показывают синонимы и псевдонимы гена в соответствии с различными источниками, такими как HGNC. Правый столбец показывает, как псевдонимы связаны с ресурсами, и дает предыдущие идентификаторы GC.
  3. Сводные данные : левый столбец такой же, как и столбец в псевдонимах, в котором показаны источники. В правом столбце приведены краткие сведения о функции, локализации и влиянии гена на фенотип из различных источников.
  4. Геномные представления : в дополнение к источникам в этом разделе приведены эталонные последовательности ДНК, регуляторные элементы, эпигенетика, полосы хромосом и геномное расположение различных источников. Красная линия на изображении указывает на интегрированное местоположение GeneLoc. В частности, если интегрированное местоположение GeneLoc отличается от местоположения в Entrez Gene, оно отображается зеленым; Синий появляется, когда интегрированная локация GeneLoc отличается от локации в Ensembl. Подробности дополнения доступны по ссылкам в разделе.
  5. Белки : в этом разделе представлена ​​аннотированная информация о генах, включая рекомендованное название, размер, субъединицу, субклеточное расположение и вторичные образцы. Также представлены посттрансляционные модификации, данные об экспрессии белка, белки REF SEQ, белки ENSEMBL, детали белка Reactome, продукты рекомбинантного белка человека, генная онтология , продукты антител и продукты анализа.
  6. Белковые домены / семейства : в этом разделе представлена ​​аннотированная информация о белковых доменах и семействах.
  7. Функция : Раздел функций описывает функцию гена, в том числе: фенотипы человека , связанные мишени, shRNA для человека и / или мыши / крысы, генные мишени miRNA , продукты RNAi , микроРНК для ортологов человека и / или мыши / крысы, редактирование генов , клоны , Клеточные линии , животные модели, анализы гибридизации in situ .
  8. Пути и взаимодействия : в этом разделе показаны унифицированные пути и взаимодействия генных карт, которые происходят из разных источников. Пути Unified GeneCard собраны в супер-пути, которые отображают связь между различными путями. Взаимодействие показывает взаимодействующие стороны и детали взаимодействия.
  9. Наркотики и соединения : в этом разделе генные карты связаны с лекарствами и соединениями. Соединения TOCRIS показывают состав, действие и номер CAS. Состав DrugBank дает состав, синонимы, номер CAS (регистрационный номер Chemical Abstracts), тип (транспортер / цель / носитель / фермент), действия и идентификаторы PubMed. HMDB и Novoseek показывают взаимосвязь химических соединений, включая состав, синонимы, номер CAS и идентификаторы PubMed (статьи, относящиеся к данному соединению). BitterDB отображает соединение, номер CAS и УЛЫБКИ ( упрощенная спецификация ввода строки молекулярного ввода ). ФармГКБ дает лекарство / соединение и его аннотацию.
  10. Транскрипты : этот раздел состоит из мРНК эталонных последовательностей, кластера унигена и репрезентативной последовательности, продуктов miRNA, продуктов ингибирования РНК, продуктов клонирования, продуктов праймеров и дополнительной последовательности мРНК. Кроме того, пользователь может получить структуру экзона от GeneLoc.
  11. Выражение : левый столбец показывает ресурсы данных. В этот раздел включены изображения и данные экспрессии, похожие гены, массивы ПЦР, праймеры для человека и анализы гибридизации in situ.
  12. Ортологи : в этом разделе приведены ортологи для определенного гена из числа видов. В таблице отображается соответствующий организм, таксономическая классификация, ген, описание, человеческое сходство, тип ортологии и детали. Он подключен к генам ENSEMBL, генам TreeFam и Aminode . [16]
  13. Паралоги : в этом разделе отображаются паралоги и псевдогены для определенного гена.
  14. Геномные варианты : геномные варианты показывают результат NCBI SNP / вариантов, отчет о неравновесном сцеплении HapMap, структурные вариации, базу данных мутаций генов человека (HGMD), праймеры для ПЦР дальнего действия QIAGEN SeqTarget в массивах ПЦР с мутациями рака человека, мыши и крысы и SABiosciences. Стол в этом разделе показано , SNP ID, Действительно, клиническое значение, Chr поз, последовательность для геномных данных, AAChg, тип и дополнительные данные , связанные транскрипции, аллель FREQ, Pop, Total sample и многое другое для частот аллелей. Для Valid разные символы представляют разные методы проверки. «C» означает по кластерам; «A» - это by-2hit-2allele; «F» - это частота; «H» - это by-hapmap, а «O» - это by-pop. Клиническое значение может быть одним из следующих: непатогенный, патогенный, лекарственный ответ, гистосовместимость, вероятностно-непатогенный, вероятностно-патогенный, непатизированный, неизвестный и другие. Тип должен быть одним из следующих: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, обозначения PupaSUITE.
  15. Disorders / Diseases : показывает нарушения / заболевания, связанные с данным геном.
  16. Публикации : отображает публикации, связанные с геном.
  17. Внешний поиск : поиск дополнительной информации в PubMed , OMIM и NCBI.
  18. Базы данных генома : другие базы данных и специализированные базы данных.
  19. Интеллектуальная собственность : в этом разделе представлена ​​патентная информация и лицензируемые технологии.
  20. Товары

Приложения [ править ]

Генные карты широко используются в биологических и биомедицинских областях. Например, SH Shah извлек из GeneCards данные о ранней ишемической болезни сердца, чтобы идентифицировать гены, которые способствуют этой болезни . Подтверждено, что действие хромосомы 3q13, 1q25 и т. Д. Оказывает влияние, и в этой статье дополнительно обсуждалась взаимосвязь между патологическими генами и липопротеинами сыворотки с помощью GeneCard. [17]

Другой пример - исследование синтетической летальности при раке . Синтетическая летальность возникает, когда мутация в одном гене не влияет на функцию клетки, но мутация в дополнительном гене приводит к гибели клетки. Это исследование было направлено на поиск новых методов лечения рака путем блокирования летальности лекарств. GeneCards использовались при сравнении данных заданного целевого гена со всеми возможными генами. В этом процессе оценка совместного использования аннотаций была рассчитана с использованием GeneDecks Partner Hunter (теперь называется Genes Like Me), чтобы выявить паралогию. Мишени инактивации были извлечены после экспериментов с микрочипами устойчивых и неустойчивых клеточных линий нейробластомы . [7]

Ссылки [ править ]

  1. ^ a b c d Ребхан М., Чалифа-Каспи В., Прилуски Дж., Ланцет Д. (апрель 1997 г.). «Генные карты: интеграция информации о генах, белках и заболеваниях». Тенденции в генетике . 13 (4): 163. DOI : 10.1016 / S0168-9525 (97) 01103-7 . PMID 9097728 . 
  2. ^ Rebhan МЫ, Chalifa-Каспи В, Prilusky Дж, Ланцет D (1998). «GeneCards: новый справочник по функциональной геномике с автоматическим анализом данных и поддержкой переформулирования запросов» . Биоинформатика . 14 (8): 656–64. DOI : 10.1093 / биоинформатики / 14.8.656 . PMID 9789091 . 
  3. ^ Сафран М., Соломон I, Шмуэли О., Лапидот М., Шен-Орр С., Адато А. и др. (Ноябрь 2002 г.). «GeneCards 2002: к полному, объектно-ориентированному компендиуму человеческих генов» . Биоинформатика . 18 (11): 1542–3. DOI : 10.1093 / биоинформатики / 18.11.1542 . PMID 12424129 . 
  4. ^ а б Харел А., Ингер А., Стельцер Г., Стрихман-Альмашану Л., Дала I, Сафран М., Ланцет Д. (октябрь 2009 г.). «ПОДАРКИ: анализ аннотационного ландшафта с помощью GeneCard» . BMC Bioinformatics . 10 (1): 348. DOI : 10,1186 / 1471-2105-10-348 . PMC 2774327 . PMID 19852797 .  
  5. ^ a b c d e f g «Генные карты» . Генные карты. Архивировано из оригинала на 2013-10-14 . Дата обращения 18 октября 2013 .
  6. ^ «Генные карты» . Дата обращения 19 октября 2013 .
  7. ^ Б с д е е г Штельцер G, I, Dalah Stein TI, Satanower Y, Rosen N, N, Натив и др. (Октябрь 2011 г.). «In-silico геномика человека с генными картами» . Геномика человека . 5 (6): 709–17. DOI : 10.1186 / 1479-7364-5-6-709 . PMC 3525253 . PMID 22155609 .  
  8. ^ a b c d Safran M, Dalah I, Alexander J, Rosen N, Iny Stein T, Shmoish M и др. (Август 2010 г.). «GeneCards Version 3: интегратор генов человека» . База данных . 2010 : baq020. DOI : 10,1093 / базы данных / baq020 . PMC 2938269 . PMID 20689021 .  
  9. ^ Эттвуд Т.К., Парри-Smith DJ (1999). Введение в биоинформатику . Харлоу Лонгман.
  10. ^ "GeneDecks" . Генные карты. Архивировано из оригинала на 2013-10-14 . Дата обращения 20 октября 2013 .
  11. ^ Stelzer G, Inger A, Olender T, Iny-Stein T, Dalah I, Harel A и др. (Декабрь 2009 г.). «GeneDecks: поиск паралогов и дистилляция генов с аннотацией GeneCards». Омикс . 13 (6): 477–87. DOI : 10.1089 / omi.2009.0069 . PMID 20001862 . 
  12. ^ "GeneALaCart" . Генные карты. Архивировано из оригинала на 2013-09-30 . Дата обращения 20 октября 2013 .
  13. ^ "GeneLoc" . Генные карты . Дата обращения 20 октября 2013 .
  14. ^ Шридхар ГР, Divakar СН, Хануман Т, Рао А. (2006). «Биоинформатический подход к извлечению информации из генов». Журнал диабета в развивающихся странах . 26 (4): 149–51. DOI : 10.4103 / 0973-3930.33179 .
  15. ^ Чалифа-Каспи V, Шмуэли О, Бенджамин-Родриг Х, Розен Н, Шмоиш М, Янаи I и др. (Декабрь 2003 г.). «GeneAnnot: взаимодействие карт генов с высокопроизводительными сборниками экспрессии генов» . Брифинги по биоинформатике . 4 (4): 349–60. DOI : 10.1093 / нагрудник / 4.4.349 . PMID 14725348 . 
  16. ^ Чанг КТ, Го J, ди Ronza А, Sardiello М (январь 2018). «Аминод: определение эволюционных ограничений в протеоме человека» . Научные отчеты . 8 (1): 1357. Bibcode : 2018NatSR ... 8.1357C . DOI : 10.1038 / s41598-018-19744-ш . PMC 5778061 . PMID 29358731 .  
  17. ^ Шах С.Х., Краус В.Е., Кроссман, округ Колумбия, Грейнджер С.Б., Хейнс Дж.Л., Джонс С.Дж. и др. (Ноябрь 2006 г.). «Липиды сыворотки крови в исследовании ишемической болезни сердца GENECARD выявляют локусы количественных признаков и фенотипические подмножества на хромосомах 3q и 5q». Анналы генетики человека . 70 (Pt 6): 738–48. DOI : 10.1111 / j.1469-1809.2006.00288.x . PMID 17044848 . S2CID 24239757 .  

Внешние ссылки [ править ]

  • Официальный веб-сайт