Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

KEGG ( Киотская энциклопедия генов и геномов ) - это собрание баз данных, касающихся геномов , биологических путей , болезней , лекарств и химических веществ . KEGG используется для биоинформатических исследований и образования, включая анализ данных в геномике , метагеномике , метаболомике и других омических исследованиях, моделирование и симуляцию в системной биологии , а также трансляционные исследования в разработке лекарств .

Введение [ править ]

Проект базы данных KEGG был инициирован в 1995 году Минору Канехиса , профессором Института химических исследований Киотского университета , в рамках осуществлявшейся тогда Японской программы генома человека . [1] [2] Предвидя потребность в компьютеризированном ресурсе, который можно использовать для биологической интерпретации данных последовательности генома , он начал разработку базы данных KEGG PATHWAY. Это коллекция нарисованных вручную карт путей KEGG, представляющих экспериментальные знания о метаболизме и различных других функциях клетки и организма.. Каждая карта пути содержит сеть молекулярных взаимодействий и реакций и предназначена для связывания генов в геноме с продуктами генов (в основном белками ) пути. Это позволило провести анализ, называемый картированием путей KEGG, при котором содержание гена в геноме сравнивается с базой данных KEGG PATHWAY, чтобы изучить, какие пути и связанные с ними функции, вероятно, закодированы в геноме.

По словам разработчиков, KEGG - это «компьютерное представление» биологической системы . [3] Он объединяет строительные блоки и схемы соединений системы - точнее, генетические строительные блоки генов и белков, химические строительные блоки малых молекул и реакций, а также схемы соединений молекулярных взаимодействий и реакционных сетей. Эта концепция реализована в следующих базах данных KEGG, которые подразделяются на системные, геномные, химические и медицинские. [4]

  • Системная информация
    • ПУТЬ - карты путей для клеточных и организменных функций
    • МОДУЛЬ - модули или функциональные единицы генов
    • BRITE - иерархическая классификация биологических объектов
  • Геномная информация
    • ГЕНОМ - полные геномы
    • ГЕНЫ - гены и белки в полных геномах
    • ОРТОЛОГИЯ - ортологи группы генов в полных геномах
  • Химическая информация
    • СОЕДИНЕНИЕ, ГЛИКАН - химические соединения и гликаны
    • REACTION, RPAIR, RCLASS - химические реакции
    • ENZYME - номенклатура ферментов
  • Информация о здоровье
    • БОЛЕЗНИ - болезни человека
    • НАРКОТИКИ - одобренные препараты
    • ЭНВИРОН - сырые лекарства и вещества, связанные со здоровьем

Базы данных [ править ]

Информация о системе [ править ]

База данных KEGG PATHWAY, база данных схем подключения, является ядром ресурса KEGG. Это набор карт путей, объединяющих множество объектов, включая гены, белки, РНК, химические соединения, гликаны и химические реакции, а также гены болезней и мишени для лекарств, которые хранятся в виде отдельных записей в других базах данных KEGG. Карты путей подразделяются на следующие разделы:

  • Метаболизм
  • Обработка генетической информации ( транскрипция , трансляция , репликация и репарация и т. Д.)
  • Обработка информации об окружающей среде ( мембранный перенос , передача сигнала и т. Д.)
  • Клеточные процессы ( рост клеток , гибели клеток , клеточные мембраны , функция и т.д.)
  • Органические системы ( иммунная система , эндокринная система , нервная система и т. Д.)
  • Болезни человека
  • Разработка лекарств

Раздел метаболизма содержит эстетически нарисованные глобальные карты, показывающие общую картину метаболизма, в дополнение к обычным картам метаболических путей. Глобальные карты с низким разрешением могут использоваться, например, для сравнения метаболических возможностей различных организмов в исследованиях геномики и различных образцов окружающей среды в исследованиях метагеномики. Напротив, модули KEGG в базе данных KEGG MODULE представляют собой локализованные электрические схемы с более высоким разрешением, представляющие более узкие функциональные единицы в пределах карты путей, такие как подпути, сохраненные среди определенных групп организмов и молекулярных комплексов. Модули KEGG определяются как характерные наборы генов, которые могут быть связаны с конкретными метаболическими возможностями и другими фенотипическими особенностями, чтобы их можно было использовать для автоматической интерпретации данных генома и метагенома.

Еще одна база данных, дополняющая KEGG PATHWAY, - это база данных KEGG BRITE. Это онтологическая база данных, содержащая иерархические классификации различных объектов, включая гены, белки, организмы, болезни, лекарства и химические соединения. В то время как KEGG PATHWAY ограничивается молекулярными взаимодействиями и реакциями этих сущностей, KEGG BRITE включает в себя множество различных типов отношений.

Геномная информация [ править ]

Спустя несколько месяцев после начала проекта KEGG в 1995 году был опубликован первый отчет о полностью секвенированном бактериальном геноме. [5] С тех пор все опубликованные полные геномы накапливаются в KEGG как для эукариот, так и для прокариот . База данных KEGG GENES содержит информацию на уровне генов / белков, а база данных KEGG GENOME содержит информацию на уровне организма для этих геномов. База данных KEGG GENES состоит из наборов генов для полных геномов, и гены в каждом наборе снабжены аннотациями в форме установления соответствия схемам соединений карт путей KEGG, модулей KEGG и иерархий BRITE.

Эти соответствия производятся с использованием концепции ортологов . Карты путей KEGG составлены на основе экспериментальных данных на конкретных организмах, но они разработаны для применения и к другим организмам, поскольку разные организмы, такие как человек и мышь, часто имеют общие пути, состоящие из функционально идентичных генов, называемых ортологичными генами или ортологи. Все гены в базе данных KEGG GENES сгруппированы в такие ортологи в базе данных KEGG ORTHOLOGY (KO). Поскольку узлам (генным продуктам) карт путей KEGG, а также модулям KEGG и иерархиям BRITE присваиваются идентификаторы KO, соответствия устанавливаются после того, как гены в геноме аннотируются идентификаторами KO с помощью процедуры аннотации генома в KEGG. [4]

Химическая информация [ править ]

Карты метаболических путей KEGG составлены для представления двойных аспектов метаболической сети: геномной сети, показывающей, как кодируемые геномом ферменты связаны, чтобы катализировать последовательные реакции, и химической сети, как химические структуры субстратов и продуктов трансформируются в результате этих реакций. [6] Набор генов ферментов в геноме будет идентифицировать сети ферментативных отношений при наложении на карты путей KEGG, которые, в свою очередь, характеризуют сети трансформации химической структуры, позволяя интерпретировать потенциалы биосинтеза и биодеградации организма. Как вариант, набор метаболитовИдентификация в метаболоме приведет к пониманию ферментативных путей и вовлеченных ферментных генов.

Базы данных категории химической информации, которые в совокупности называются KEGG LIGAND, организованы путем сбора информации о химической сети. В начале проекта KEGG KEGG LIGAND состоял из трех баз данных: KEGG COMPOUND для химических соединений, KEGG REACTION для химических реакций и KEGG ENZYME для реакций в номенклатуре ферментов. [7] В настоящее время существуют дополнительные базы данных: KEGG GLYCAN для гликанов [8] и две вспомогательные базы данных реакций, называемые RPAIR (выравнивание пар реагентов) и RCLASS (класс реакции). [9] KEGG COMPOUND также был расширен, чтобы содержать различные соединения, такие как ксенобиотики , помимо метаболитов.

Информация о здоровье [ править ]

В KEGG заболевания рассматриваются как возмущенные состояния биологической системы, вызванные возмущающими воздействиями генетических факторов и факторов окружающей среды, а лекарства рассматриваются как различные типы возмущающих факторов. [10] База данных KEGG PATHWAY включает не только нормальные состояния, но и возмущенные состояния биологических систем. Однако карты путей распространения болезни не могут быть составлены для большинства болезней, поскольку молекулярные механизмы недостаточно изучены. Альтернативный подход используется в базе данных KEGG DISEASE, которая просто каталогизирует известные генетические факторы и факторы окружающей среды болезней. Эти каталоги могут в конечном итоге привести к более полным схемам заболеваний.

База данных KEGG НАРКОТИКОВ содержит активные ингредиенты из одобренных лекарств в Японии, США и Европе. Они различаются по химическим структурам и / или химическим компонентам и связаны с молекулами- мишенями , метаболизирующими ферментами и другой сетевой информацией о молекулярных взаимодействиях в картах путей KEGG и иерархиях BRITE. Это позволяет проводить комплексный анализ взаимодействия лекарств с геномной информацией. Необработанные лекарства и другие вещества, влияющие на здоровье, которые не входят в категорию одобренных лекарств, хранятся в базе данных KEGG ENVIRON. Базы данных в категории информации о здоровье все вместе называются KEGG MEDICUS, что также включает в себя вкладыши. всех препаратов, продаваемых в Японии.

Модель подписки [ править ]

В июле 2011 года KEGG представила модель подписки для загрузки по FTP из-за значительного сокращения государственного финансирования. KEGG по-прежнему доступен бесплатно через свой веб-сайт, но модель подписки вызвала дискуссии об устойчивости баз данных биоинформатики. [11] [12]

См. Также [ править ]

  • База данных сравнительной токсикогеномики - CTD объединяет пути KEGG с токсикогеномными данными и данными о заболеваниях
  • ConsensusPathDB , база данных молекулярных функциональных взаимодействий, объединяющая информацию из KEGG
  • Генная онтология
  • PubMed
  • Uniprot
  • База данных генных болезней

Ссылки [ править ]

  1. ^ Kanehisa M, Goto S (2000). «KEGG: Киотская энциклопедия генов и геномов» . Nucleic Acids Res . 28 (1): 27–30. DOI : 10.1093 / NAR / 28.1.27 . PMC 102409 . PMID 10592173 .  
  2. ^ Kanehisa M (1997). «База данных для постгеномного анализа». Тенденции Genet . 13 (9): 375–6. DOI : 10.1016 / S0168-9525 (97) 01223-7 . PMID 9287494 . 
  3. ^ Kanehisa МЫ, Гот S, Хаттори М, Аки-Киношита К.Ф., Ито М, Кавасим S, Т Катаям, Араки М, Hirakawa М (2006). «От геномики к химической геномике: новые разработки в KEGG» . Nucleic Acids Res . 34 (Выпуск базы данных): D354–7. DOI : 10.1093 / NAR / gkj102 . PMC 1347464 . PMID 16381885 .  
  4. ^ а б Канехиса М, Гото С, Сато Й, Кавасима М, Фурумичи М, Танабэ М (2014). «Данные, информация, знания и принципы: назад к метаболизму в KEGG» . Nucleic Acids Res . 42 (выпуск базы данных): D199–205. DOI : 10.1093 / NAR / gkt1076 . PMC 3965122 . PMID 24214961 .  
  5. ^ Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM и др. (1995). «Полногеномное случайное секвенирование и сборка Haemophilus influenzae Rd» . Наука . 269 (5223): 496–512. Bibcode : 1995Sci ... 269..496F . DOI : 10.1126 / science.7542800 . PMID 7542800 . S2CID 10423613 .  
  6. ^ Kanehisa M (2013). «Химическая и геномная эволюция сетей реакций, катализируемых ферментами». FEBS Lett . 587 (17): 2731–7. DOI : 10.1016 / j.febslet.2013.06.026 . hdl : 2433/178762 . PMID 23816707 . S2CID 40074657 .  
  7. ^ Гото S, Т Нисиока, Kanehisa М (1999). «База данных LIGAND по ферментам, соединениям и реакциям» . Nucleic Acids Res . 27 (1): 377–9. DOI : 10.1093 / NAR / 27.1.377 . PMC 148189 . PMID 9847234 .  
  8. ^ Хасимото К, Гото S, S Кавано, Аоки-Киношиты KF, Уэда N, Hamajima М, Кавасаки Т, Kanehisa М (2006). «KEGG как ресурс по информатике glycome» . Гликобиология . 16 (5): 63R – 70R. DOI : 10.1093 / glycob / cwj010 . PMID 16014746 . 
  9. ^ Муто А, Котеры М, Tokimatsu Т, Накагава Z, Гото S, Kanehisa М (2013). «Модульная архитектура метаболических путей, выявленная консервативными последовательностями реакций» . Модель J Chem Inf . 53 (3): 613–22. DOI : 10.1021 / ci3005379 . PMC 3632090 . PMID 23384306 .  
  10. ^ Kanehisa M, Goto S, M Furumichi, Tanabe M, Hirakawa M (2010). «KEGG для представления и анализа молекулярных сетей, включающих болезни и лекарства» . Nucleic Acids Res . 38 (Выпуск базы данных): D355–60. DOI : 10.1093 / NAR / gkp896 . PMC 2808910 . PMID 19880382 .  
  11. ^ Гальперин М.Ю., Фернандес-Суарес XM (2012). «Выпуск базы данных исследований нуклеиновых кислот 2012 года и онлайн-сборник базы данных по молекулярной биологии» . Nucleic Acids Res . 40 (выпуск базы данных): D1–8. DOI : 10.1093 / NAR / gkr1196 . PMC 3245068 . PMID 22144685 .  
  12. Перейти ↑ Hayden, EC (2013). «Популярная база данных растений для взимания платы с пользователей» . Природа . DOI : 10.1038 / nature.2013.13642 .

Внешние ссылки [ править ]

  • Сайт KEGG
  • Сайт-зеркало GenomeNet
  • Вход для KEGG в изменения текста