Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Протеогеномика использует комплексный подход, объединяя геномику, протеомику и транскриптомику.

Протеогеномика - это область биологических исследований, в которой используется комбинация протеомики , геномики и транскриптомики для помощи в открытии и идентификации пептидов . Протеогеномика используется для идентификации новых пептидов путем сравнения спектров МС / МС с базой данных белков, которая была получена из геномной и транскриптомной информации. Протеогеномика часто относится к исследованиям, в которых используется протеомная информация, часто полученная из масс-спектрометрии , для улучшения аннотаций генов . [1]Геномика занимается генетическим кодом целых организмов, а транскриптомика занимается изучением секвенирования РНК и транскриптов. Proteomics использует тандемную масс-спектрометрию и жидкостную хроматографию для идентификации и изучения функций белков. Протеомика используется для обнаружения всех белков, экспрессируемых в организме, известных как его протеом . [2]Проблема с протеомикой заключается в том, что она основана на предположении, что текущие генные модели верны и что правильные последовательности белков можно найти с помощью базы данных эталонных последовательностей белков; однако это не всегда так, поскольку некоторые пептиды не могут быть найдены в базе данных. Кроме того, новые белковые последовательности могут возникать в результате мутаций. эти проблемы могут быть исправлены с использованием протеомных, геномных и транскриптомных данных. Использование как протеомики, так и геномики привело к протеогеномике, которая стала отдельной областью в 2004 году. [1] [3] [4]

Совсем недавно совместное профилирование поверхностных белков и транскриптов мРНК из отдельных клеток с помощью таких методов, как CITE-Seq , было названо одноклеточной протеогеномикой [5] [6], хотя цели этих исследований не связаны с идентификацией пептидов. .

Методология [ править ]

Изображение клетки эукариота, показывающее, как образуются белки: ДНК в ядре считывается РНК-полимеразой, затем рибосомы в цитоплазме производят аминокислотную цепь, которая складывается в функциональный белок.

Основная идея протеогеномного подхода состоит в том, чтобы идентифицировать пептиды путем сравнения данных МС / МС с базами данных белков, которые содержат предсказанные последовательности белков. База данных белков создается различными способами за счет использования геномных и транскриптомных данных. Ниже приведены некоторые из способов создания баз данных белков:

Шестикадровый перевод [ править ]

Шесть кадровых трансляций можно использовать для создания базы данных, которая предсказывает последовательности белков. Ограничение этого метода состоит в том, что базы данных будут очень большими из-за количества генерируемых последовательностей, некоторые из которых не существуют в природе. [1]

Прогнозирование гена ab initio [ править ]

В этом методе основа белка создается с помощью алгоритмов прогнозирования генов, которые позволяют идентифицировать области, кодирующие белок . База данных похожа на базу данных, сгенерированную шестикадровым преобразованием, в том, что она может быть очень большой. [1]

Выраженные данные тега последовательности [ править ]

Трансляции с шестью рамками могут использовать тег экспрессируемой последовательности (EST) для создания баз данных белков. Данные EST предоставляют информацию о транскрипции, которая может помочь в создании базы данных. База данных может быть очень большой, и ее недостатком является наличие нескольких копий данной последовательности; однако эту проблему можно обойти, сжав последовательность белка, сгенерированную с помощью вычислительных стратегий. [1]

Другие методы [ править ]

Базы данных белков также могут быть созданы с использованием данных секвенирования РНК , аннотированных транскриптов РНК и вариантных последовательностей белков. Кроме того, существуют другие более специализированные базы данных белков, которые могут быть созданы для надлежащей идентификации интересующего пептида. [1]

Другой метод идентификации белков с помощью протеогеномики - сравнительная протеогеномика. Сравнительная протеогеномика сравнивает протеомные данные нескольких родственных видов одновременно и использует гомологию между их белками для улучшения аннотаций с более высокой статистической достоверностью. [7] [8]

Приложения [ править ]

Протеогеномика может применяться по-разному. Одно из приложений - улучшение аннотаций генов у различных организмов. Аннотации генов включают в себя открытие генов и их функций. [9] Протеогеномика стала особенно полезной в открытии и улучшении аннотаций генов у прокариотических организмов. Например, геномная аннотация различных микроорганизмов была изучена с помощью протеогеномного подхода, включая Escherichia coli , Mycobacterium и несколько видов бактерий Shewanella . [10]

Помимо улучшения аннотаций генов, протеогеномные исследования могут также предоставить ценную информацию о наличии запрограммированных сдвигов рамки считывания , N-концевом удалении метионина , сигнальных пептидах , протеолизе и других посттрансляционных модификациях . [3] [7] Протеогеномика имеет потенциальное применение в медицине, особенно в онкологических исследованиях. Рак возникает в результате генетических мутаций, таких как метилирование , транслокация и соматические нарушения.мутации. Исследования показали, что для понимания молекулярных вариаций, ведущих к раку, необходима как геномная, так и протеомная информация. [2] [11] Протеогеномика помогла в этом путем идентификации белковых последовательностей, которые могут играть функциональную роль при раке. [12] Конкретный пример этого произошел в исследовании рака толстой кишки, в результате которого были обнаружены потенциальные мишени для лечения рака. [2] Протеогеномика также привела к индивидуализированным иммунотерапевтическим методам лечения рака, при которых эпитопы антител к раковым антигенам предсказываются с использованием протеогеномики для создания лекарств, действующих на специфическую опухоль пациента. [13]Помимо лечения, протеогенономика может помочь в диагностике рака. В исследованиях рака прямой и толстой кишки протеогеномика использовалась для выявления соматических мутаций. Идентификация соматических мутаций у пациентов может быть использована для диагностики рака у пациентов. Помимо непосредственного применения в лечении и диагностике рака, протеогеномный подход можно использовать для изучения белков, которые приводят к устойчивости к химиотерапии . [11]

Проблемы [ править ]

Протеогеномика может предлагать методы идентификации пептидов без недостатка неполных или неточных баз данных белков, с которыми сталкивается протеомика; тем не менее, существуют проблемы с протеогеномным подходом. [1]Одна из самых больших проблем протеогеномики - это огромный размер создаваемых белковых баз данных. статистически большая база данных белков с большей вероятностью приведет к неправильному сопоставлению данных из базы данных белков с данными MS / MS, эта проблема может затруднить идентификацию новых пептидов. Ложноположительные результаты также являются проблемой при использовании протеогеномных подходов. ложные срабатывания могут возникать в результате очень больших баз данных о белках, где несовпадающие данные приводят к неправильной идентификации. Другой проблемой является неправильное сопоставление спектров МС / МС с данными о последовательности белка, которые соответствуют аналогичному пептиду, а не фактическому пептиду. Есть случаи получения данных о пептиде, расположенном на нескольких сайтах генов, это может привести к данным, которые можно интерпретировать по-разному. Несмотря на эти проблемы,есть способы уменьшить количество возникающих ошибок. Например, имея дело с очень большой базой данных белков, можно сравнить идентифицированные новые пептидные последовательности со всеми последовательностями в базе данных, а затем сравнить посттрансляционные модификации. Затем можно определить, представляют ли две последовательности один и тот же пептид или два разных пептида.[1]

Ссылки [ править ]

  1. ^ a b c d e f g h Несвижский, Алексей I (1 ноября 2014 г.). «Протеогеномика: концепции, приложения и вычислительные стратегии» . Методы природы . 11 (11): 1114–1125. DOI : 10.1038 / nmeth.3144 . PMC  4392723 . PMID  25357241 .
  2. ^ a b c Саджад, Васим; Рафик, Мухаммед; Али, Баркат; Хаят, Мухаммад; Зада, сахиб; Саджад, Васим; Кумар, Танвир (июль 2016 г.). «Протеогеномика: новые развивающиеся технологии» . ХАЯТИ Журнал биологических наук . 23 (3): 97–100. DOI : 10.1016 / j.hjb.2016.11.002 .
  3. ^ а б Гупта Н., Таннер С., Джайтли Н., Адкинс Дж. Н., Липтон М., Эдвардс Р., Ромин М., Остерман А., Бафна В., Смит Р. Д. и др. Полный протеомный анализ посттрансляционных модификаций: применение масс-спектрометрии для протеогеномной аннотации. Genome Res. 2007. 17: 1362–1377.
  4. ^ . Ансон С., Пурвин С.О., Адкинс Дж. Н., Липтон М. С., Смит Р. Д. (2008) Протеогеномика: потребности и роли, которые должны быть заполнены протеомикой в ​​аннотации генома. Краткий. Функц. Геномика Протеомика 7, 50–62.
  5. ^ "Электронная книга TotalSeq" . БиоЛегенда . Проверено 23 ноября 2020 года .
  6. ^ «Proteona выпускает секвенирование РНК ESCAPE ™ для измерения белка и РНК в отдельных клетках с акцентом на клинические вопросы» . Proteona . Проверено 23 ноября 2020 года .
  7. ^ a b Гупта Н., Бенхамида Дж., Бхаргава В., Гудман Д., Каин Э., Керман И., Нгуен Н., Олликайнен Н., Родригес Дж., Ван Дж. и др. Сравнительная протеогеномика: сочетание масс-спектрометрии и сравнительной геномики для анализа нескольких геномов. Genome Res. 2008; 18: 1133–1142.
  8. ^ Gallien С., Perrodou Е., Карапит С., Deshayes С., Reyrat Ю.М., Ван Dorsselaer А., Poch О., Шеффер С., Lecompte О. (2009) орто-proteogenomics: множественные протеомы исследование через Ортологию и а новый протокол на базе MS. Genome Res 19, 128–135.
  9. ^ Ансонг, C .; Purvine, SO; Адкинс, JN; Lipton, MS; Смит, Р. Д. (7 марта 2008 г.). «Протеогеномика: потребности и роли протеомики в аннотации генома» . Брифинги по функциональной геномике и протеомике . 7 (1): 50–62. DOI : 10.1093 / bfgp / eln010 . PMID 18334489 . 
  10. ^ Кучарова, Вероника; Викер, Харальд Г. (декабрь 2014 г.). «Протеогеномика в микробиологии: правильный поворот на стыке геномики и протеомики». Протеомика . 14 (23–24): 2360–2675. DOI : 10.1002 / pmic.201400168 . hdl : 1956/9547 . PMID 25263021 . 
  11. ^ а б Шукла, Подол Д .; Махмуд, Джавед; Вуяскович, Желько (декабрь 2015 г.). «Комплексный протеогеномный подход для ранней диагностики и прогноза рака». Письма о раке . 369 (1): 28–36. DOI : 10.1016 / j.canlet.2015.08.003 . PMID 26276717 . 
  12. ^ Чемберс, Мэтью С .; Jagtap, Pratik D .; Джонсон, Джеймс Э .; Макгоуэн, Томас; Кумар, Правин; Онсонго, Гетирия; Герреро, Кэндис Р .; Барснес, Харальд; Водель, Марк (2017-11-01). "Доступный ресурс информатики протеогеномики для исследователей рака" . Исследования рака . 77 (21): e43 – e46. DOI : 10,1158 / 0008-5472.can-17-0331 . PMC 5675041 . PMID 29092937 .  
  13. ^ Крич, Аманда Л .; Ting, Ying S .; Гулдинг, Скотт П .; Саулд, Джон Ф. К.; Бартельме, Доминик; Руни, Майкл С .; Аддона, Терри А .; Абелин, Дженнифер Г. (2018). «Роль масс-спектрометрии и протеогеномики в продвижении предсказания эпитопа HLA» . Протеомика . 18 (12): н / д. DOI : 10.1002 / pmic.201700259 . ISSN 1615-9861 . PMC 6033110 . PMID 29314742 .