Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В молекулярной биологии STRING ( инструмент поиска для поиска взаимодействующих генов / белков ) представляет собой биологическую базу данных и веб-ресурс известных и прогнозируемых межбелковых взаимодействий .[1] [2] [3] [4] [5] [6]

База данных STRING содержит информацию из многочисленных источников, включая экспериментальные данные, методы расчетов и общедоступные текстовые коллекции. Он находится в свободном доступе и регулярно обновляется. Ресурс также служит для выделения функционального обогащения в списках белков, предоставляемых пользователями, с использованием ряда систем функциональной классификации, таких как GO , Pfam и KEGG . Последняя версия 11b содержит информацию о 24,5 миллионах белков от более чем 5000 организмов. STRING был разработан консорциумом академических институтов, включая CPR , EMBL , KU , SIB , TUD и UZH .

Использование [ править ]

Сети межбелкового взаимодействия - важный компонент для понимания клеточных процессов на системном уровне. Такие сети можно использовать для фильтрации и оценки данных функциональной геномики и для предоставления интуитивно понятной платформы для аннотирования структурных, функциональных и эволюционных свойств белков. Изучение предсказанных сетей взаимодействия может предложить новые направления для будущих экспериментальных исследований и обеспечить межвидовые прогнозы для эффективного картирования взаимодействий. [7]

Сеть белок-белковых взаимодействий, визуализированная STRING. В этом представлении насыщенность цвета краев представляет собой показатель достоверности функциональной ассоциации.

Особенности [ править ]

Данные взвешиваются и интегрируются, и для всех взаимодействий с белками рассчитывается показатель достоверности. Результаты различных расчетных прогнозов можно просматривать с разных назначенных точек зрения. Существует два режима STRING: режим протеина и режим COG . Прогнозируемые взаимодействия распространяются на белки других организмов, взаимодействие которых описано на основании ортологии . Доступен веб-интерфейс для доступа к данным и быстрого обзора белков и их взаимодействий. Доступен плагин для cytoscape для использования данных STRING. Другой возможностью доступа к данным STRING является использование интерфейса прикладного программирования (API) путем создания URL-адреса, содержащего запрос.

Источники данных [ править ]

Как и многие другие базы данных, в которых хранятся сведения о белковых ассоциациях, STRING импортирует данные экспериментально полученных межбелковых взаимодействий посредством литературных источников. Кроме того, STRING также хранит рассчитанные с помощью вычислений взаимодействия из: (i) интеллектуального анализа научных текстов, (ii) взаимодействий, вычисленных на основе геномных характеристик, и (iii) взаимодействий, переданных от модельных организмов на основе ортологии.[8]

Все предсказанные или импортированные взаимодействия сравниваются с общим эталоном функционального партнерства, как аннотировано KEGG (Киотская энциклопедия генов и геномов).

Импортированные данные [ править ]

STRING импортирует информацию об ассоциации белков из баз данных о физическом взаимодействии и баз данных курируемых знаний о биологических путях ( MINT , HPRD , BIND , DIP , BioGRID , KEGG , Reactome , IntAct , EcoCyc , NCI-Nature Pathway Interaction Database , GO ). Ссылки предоставляются на исходные данные соответствующих экспериментальных репозиториев и ресурсов базы данных.

Анализ текста [ править ]

Большой объем научных текстов ( SGD , OMIM , FlyBase , PubMed ) анализируется для поиска статистически значимых совпадений названий генов.

Прогнозируемые данные [ править ]

  • Соседство: одинаковый геномный контекст у разных видов предполагает схожую функцию белков.
  • События слияния-деления: белки, которые слиты в некоторых геномах, с большой вероятностью будут функционально связаны (как и в других геномах, где гены не слиты).
  • Возникновение: белки, выполняющие схожую функцию или встречающиеся в одном и том же метаболическом пути, должны экспрессироваться вместе и иметь сходный филогенетический профиль .
  • Коэкспрессия: предсказанная ассоциация между генами, основанная на наблюдаемых моделях одновременной экспрессии генов.

Ссылки [ править ]

  1. ^ Шкларчик, Дамиан; Гейбл, Анника Л .; Лион, Дэвид; Юнге, Александр; Уайдер, Стефан; Уэрта-Сепас, Хайме; Симонович, Милан; Дончева, Надежда Т .; Моррис, Джон Х .; Борк, Пер; Дженсен, Ларс Дж. (8 января 2019 г.). «STRING v11: сети белок-белковых ассоциаций с увеличенным охватом, поддерживающие функциональные открытия в общегеномных экспериментальных наборах данных» . Исследования нуклеиновых кислот . 47 (D1): D607 – D613. DOI : 10.1093 / NAR / gky1131 . ISSN 1362-4962 . PMC 6323986 . PMID 30476243 .   
  2. ^ Шкларчик, Дамиан; Моррис, Джон Х .; Повар, Хелен; Кун, Майкл; Уайдер, Стефан; Симонович, Милан; Сантос, Альберто; Дончева, Надежда Т .; Рот, Александр; Борк, Пер; Дженсен, Ларс Дж. (4 января 2017 г.). «База данных STRING в 2017 году: сети белок-белковых ассоциаций с контролируемым качеством, стали общедоступными» . Исследования нуклеиновых кислот . 45 (D1): D362 – D368. DOI : 10.1093 / NAR / gkw937 . ISSN 1362-4962 . PMC 5210637 . PMID 27924014 .   
  3. ^ Szklarczyk D, Franceschini A, Wyder S, Forslund K, Heller D, Huerta-Cepas J, Simonovic M, Roth A, Santos A, Tsafou KP, Kuhn M, Bork P, Jensen LJ, von Mering C (2015). «STRING v10: сети белок-белкового взаимодействия, интегрированные в древо жизни» . Nucleic Acids Res . 43 (выпуск базы данных): D447–52. DOI : 10.1093 / NAR / gku1003 . PMC 4383874 . PMID 25352553 .  
  4. ^ Франческини А, Szklarczyk D, Frankild S, Куна М, Симонович М, Рот А, Лин Дж, Mínguez Р, Р Bork, фон Меринг С, Йенсен LJ (2013). «STRING v9.1: сети белок-белкового взаимодействия с увеличенным охватом и интеграцией» . Nucleic Acids Res . 41 (Выпуск базы данных): D808–15. DOI : 10.1093 / NAR / gks1094 . PMC 3531103 . PMID 23203871 .  
  5. ^ Szklarczyk D, Franceschini A, Kuhn M, Simonovic M, Roth A, Minguez P, Doerks T, Stark M, Muller J, Bork P, Jensen LJ, von Mering C (2011). «База данных STRING в 2011 году: сети функционального взаимодействия белков, глобально интегрированные и оцененные» . Nucleic Acids Res . 39 (выпуск базы данных): D561–8. DOI : 10.1093 / NAR / gkq973 . PMC 3013807 . PMID 21045058 .  
  6. ^ Снел, B; Lehmann, G; Борк, П и Хьюйнен, Массачусетс (2000). «СТРОКА: веб-сервер для получения и отображения повторяющегося соседства гена» . Nucleic Acids Res . 28 (18): 3442–4. DOI : 10.1093 / NAR / 28.18.3442 . PMC 110752 . PMID 10982861 .  
  7. ^ Шварц, AS; Ю, Дж; Гарденур, КР; Финли-младший; Р.Л. и Идекер, Т. (2008). «Экономически эффективные стратегии завершения интерактома» . Методы природы . 6 (1): 55–61. DOI : 10.1038 / nmeth.1283 . PMC 2613168 . PMID 19079254 .  
  8. ^ Wodak, SJ; Pu, S; Власблом, Дж. И Серафин, Б. (2009). «Проблемы и преимущества протеомики взаимодействия» . Протеомика клеток Mol . 8 (1): 3–18. DOI : 10.1074 / mcp.R800014-MCP200 . PMID 18799807 . 

Внешние ссылки [ править ]

  • STRING сайт
  • Веб-сайт STITCH , соответствующая база данных по взаимодействиям белков с небольшими молекулами