Перейти к навигации Перейти к поиску
Вычислительные методы используют сигнатуры последовательности нарушения, чтобы предсказать, является ли белок неупорядоченным , учитывая его аминокислотную последовательность . В приведенной ниже таблице, которая первоначально была адаптирована из [1] и недавно была обновлена, показаны основные функции программного обеспечения для прогнозирования нарушений. Обратите внимание, что в разных программах используются разные определения беспорядка.
Предсказатель | Год публикации | Что предсказано | На основе | Создает и использует множественное выравнивание последовательностей ? | Бесплатно для коммерческого использования |
---|---|---|---|---|---|
SPOT-Disorder2 [2] | 2020 г. | Вероятность разупорядочения остатка последовательности по остатку. | Ансамбль двунаправленной долговременной кратковременной памяти и сверточных нейронных сетей с начально-остаточным сжатием и возбуждением | да | Нет |
Disprot [3] | 2019 г. | ||||
NetSurfP-2.0 [4] | 2019 г. | Метод прогнозирования вторичной структуры и беспорядка | Долговременная кратковременная память и сверточные нейронные сети | да | Нет |
SPOT-Disorder-Single [5] | 2018 г. | Предиктор нарушений по остаткам для входных данных с одной последовательностью (т. Е. Без профиля MSA). | Ансамбль двунаправленных рекуррентных нейронных сетей с кратковременной памятью и остаточных сверточных сетей. | Нет | Нет |
IUPred | 2005-2018 гг. | Регионы, в которых отсутствует четкая 3D-структура в естественных условиях | Энергия, возникающая в результате взаимодействия между остатками, рассчитанная на основе местного аминокислотного состава | Нет | Нет |
MobiDB-lite [6] | 2017 г. | Прогноз остаточного беспорядка на основе консенсуса | Восемь отдельных предикторов расстройств из разных групп | Нет | Нет |
SPOT-расстройство [7] | 2017 г. | Выводит вероятность того, что каждый остаток в последовательности белка будет неупорядоченным или упорядоченным. | Архитектура глубокой рекуррентной нейронной сети с использованием ячеек с длительной краткосрочной памятью (LSTM). | да | Нет |
Disopred2 [8] | 2004-2015 гг. | Регионы без упорядоченной регулярной вторичной структуры | Каскадные машинные классификаторы опорных векторов, обученные на профилях PSI-BLAST | да | Нет |
s2D | 2015 г. | Прогнозирование вторичной структуры и внутреннего беспорядка в единой статистической системе на основе анализа химических сдвигов ЯМР [9] | Нейронные сети, обученные на данных на основе раствора ЯМР. | да | Нет |
DisPredict_v1.0 [10] | 2015 г. | Назначает бинарный класс порядка / беспорядка и соответствующий показатель достоверности для каждого остатка белка с использованием оптимизированной SVM с радиальным базисным ядром из последовательности белка. | Состав AA, физические свойства, спираль, вероятность прядей и мотков, доступная площадь поверхности, колебания угла кручения, монограмма, биграмма. | Нет | ? |
СЛАЙДЕР [11] | 2014 г. | Бинарное предсказание того, имеет ли белок длинную неупорядоченную область (> 30 остатков) | Физико-химические свойства аминокислот, сложность последовательности и аминокислотный состав | Нет | ? |
MFDp2 [12] | 2013 | Прогнозирование вероятности спирали, цепочки и клубка, относительной энтропии и разброса по остаткам. | Комбинация предикторов MFDp и DisCon с уникальной постобработкой. Улучшенное предсказание по MFDp. | да | Нет |
ESpritz | 2012 г. | Определения нарушения включают: недостающие рентгеновские атомы (короткие), беспорядки в стиле Диспрот (длинные) и гибкость ЯМР. Вероятность беспорядка обеспечивается двумя порогами принятия решения, которые зависят от предпочтительного количества ложных срабатываний пользователя. | Двунаправленные нейронные сети с разнообразными и высококачественными данными, полученными из Protein Data Bank и DisProt. Очень хорошо сравнивается с другими серверами CASP 9. Этот метод был разработан, чтобы быть очень быстрым. | Нет | Нет |
Метадисправность GeneSilico [13] | 2012 г. | Области, в которых отсутствует четко определенная трехмерная структура в естественных условиях (REMARK-465) | Мета-метод, который использует другие предикторы расстройства (например, RONN, IUPred, POODLE и многие другие). На их основе рассчитывается консенсус в соответствии с точностью метода (оптимизированный с использованием ИНС, фильтрации и других методов). На данный момент лучший доступный метод (первые 2 места в последнем эксперименте CASP (слепой тест)) | да | Нет |
ПОЗВОНОЧНИК-D [14] | 2012 г. | Выходной длинный / короткий беспорядок и полубеспорядок (0,4-0,7) и полный беспорядок (0,7-1,0). Полубеспорядок - это полусколлапс с некоторой вторичной структурой. | Предиктор с тремя состояниями на основе нейронной сети, основанный как на локальных, так и на глобальных характеристиках. Входит в пятерку лучших на основе AUC в CASP 9. | да | Нет |
CSpritz | 2011 г. | Определения беспорядка включают: недостающие рентгеновские атомы (короткие) и беспорядок в стиле DisProt (длинные). Вероятность беспорядка обеспечивается двумя порогами принятия решения, которые зависят от количества ложных срабатываний. Линейные мотивы в сегменте беспорядка определяются простым сопоставлением с образцом из ELM. | Поддержка векторной машины и двунаправленных нейронных сетей с помощью высококачественных и разнообразных данных, полученных из Protein Data Bank и Disprot. Структурная информация также предоставляется в виде гомологичных шаблонов. Очень хорошо сравнивается с другими серверами CASP 9. | да | Нет |
PONDR | 1999-2010 | Все нежесткие области, включая случайные клубки, частично неструктурированные области и расплавленные глобулы. | Местный состав, гибкость, гидропатия и др. | Нет | Нет |
MFDp [15] | 2010 г. | Различные типы беспорядка, включая случайные клубки, неструктурированные области, расплавленные глобулы и области на основе REMARK-465. | Набор из 3 SVM, специализирующихся на прогнозировании коротких, длинных и общих неупорядоченных областей, который объединяет три дополнительных предиктора беспорядка, последовательность, профили последовательности, прогнозируемую вторичную структуру, доступность растворителя, двугранные углы кручения основной цепи, гибкость остатков и B-факторы. MFDp (неофициально) занял 3-е место в последнем эксперименте CASP ) | да | Нет |
FoldIndex [16] | 2005 г. | Области с низкой гидрофобностью и высоким чистым зарядом (петли или неструктурированные области) | Заряд / гидрофатность анализируется локально с помощью скользящего окна | Нет | ? |
RONN | 2005 г. | Регионы, в которых отсутствует четкая трехмерная структура в естественных условиях | Нейронная сеть с функцией биоосновы, обученная на неупорядоченных белках | Нет | Нет |
GlobPlot | 2003 г. | Области с высокой склонностью к глобулярности по шкале Рассела / Линдинга (склонность к вторичным структурам и случайным катушкам) | Шкала беспорядка Рассела / Линдинга | Нет | да |
DisEMBL | 2003 г. | ПЕТЛИ (области, лишенные регулярной вторичной структуры); HOT LOOPS (высокомобильные петли); ЗАМЕЧАНИЕ 465 (области кристаллической структуры с недостаточной электронной плотностью) | Нейронные сети, обученные на данных рентгеновской структуры | Нет | да |
SEG | 1994 г. | Сегменты низкой сложности, то есть «простые последовательности» или «области с субъективной структурой». | Локально оптимизированные сегменты низкой сложности производятся с определенными уровнями строгости, а затем уточняются в соответствии с уравнениями Вуттона и Федерхена. | Нет | ? |
Методы больше не доступны:
Предсказатель | Что предсказано | На основе | Создает и использует множественное выравнивание последовательностей? |
---|---|---|---|
OnD-CRF [17] | Переход между структурно упорядоченными и подвижными или неупорядоченными аминокислотными интервалами в нативных условиях. | OnD-CRF применяет условные случайные поля, CRF, которые полагаются на функции, сгенерированные из аминокислотной последовательности и из предсказания вторичной структуры. | Нет |
НОРСП | Регионы без упорядоченной регулярной вторичной структуры (НОРС). Большинство, но не все, очень гибкие. | Вторичная структура и доступность растворителей | да |
HCA (гидрофобный кластерный анализ) | Гидрофобные кластеры, образующие элементы вторичной структуры. | Спиральная визуализация аминокислотной последовательности | Нет |
PreLink | Области, которые, как ожидается, будут неструктурированными при любых условиях, независимо от присутствия связывающего партнера. | Композиционная ошибка и низкое содержание гидрофобных кластеров. | Нет |
MD (предиктор мета-расстройства) [18] | Регионы разных «типов»; например, неструктурированные петли и области, содержащие несколько стабильных внутрицепочечных контактов | Мета-предсказатель на основе нейронной сети, который использует различные источники информации, преимущественно получаемые с помощью ортогональных подходов. | да |
IUPforest-L | Длинные неупорядоченные области в наборе белков | Автокорреляционная функция Моро-Брото аминокислотных индексов ( AAI ) | Нет |
MeDor (Метасервер беспорядка) [19] | Регионы разных «типов». MeDor предоставляет единое представление о нескольких прогностических факторах заболевания. | Мета-метод, который использует другие предикторы расстройства (например, FoldIndex, DisEMBL REMARK465, IUPred, RONN ...) и предоставляет дополнительные функции (например, график HCA, прогноз вторичной структуры, трансмембранные домены ...), которые все вместе помогают пользователю в определении регионов вовлечены в беспорядок. | Нет |
Ссылки [ править ]
- ^ Ferron F, Лонги S, Утка B, D Карлин (октябрь 2006). «Практический обзор методов прогнозирования белковых расстройств». Белки . 65 (1): 1–14. DOI : 10.1002 / prot.21075 . PMID 16856179 . S2CID 30231497 .
- ^ Хэнсон, Джек; Paliwal, Kuldip K .; Литфин, Томас; Чжоу, Яоци (13 марта 2020 г.). «SPOT-Disorder2: Улучшенное предсказание внутреннего расстройства белков с помощью комплексного глубокого обучения» . Геномика, протеомика и биоинформатика . 17 (6): 645–656. DOI : 10.1016 / j.gpb.2019.01.004 . ISSN 1672-0229 . PMC 7212484 . PMID 32173600 .
- ^ Хатос, Андраш; Хайду-Солтес, Борбала; Монзон, Александр М .; Палополи, Николас; Альварес, Люсия; Айкач-Фас, Бурджу; Бассо, Клаудио; Бенитес, Гильермо I .; Бевилаква, Мартина; Часапи, Анастасия; Чемес, Люсия (8 января 2020 г.). «DisProt: аннотация нарушения внутреннего белка в 2020 году» . Исследования нуклеиновых кислот . 48 (D1): D269 – D276. DOI : 10.1093 / NAR / gkz975 . ISSN 1362-4962 . PMC 7145575 . PMID 31713636 .
- ^ Клаузен М.С., Джесперсен М.С., Нильсен Х, Йенсен К.К., Юрц В.И., Сендерби СК, Соммер М, Отто А, Винтер О, Нильсен М., Петерсен Б., Маркатили П. (2019). «NetSurfP-2.0: улучшенное предсказание структурных особенностей белка за счет интегрированного глубокого обучения» . Белки: структура, функции и биоинформатика . 87 (6): 520–527. DOI : 10.1002 / prot.25674 . PMID 30785653 . S2CID 216629401 .
- ^ Хэнсон Дж, Паливал К, Чжоу Y (2018). «Точное однопоследовательное предсказание внутреннего нарушения белков с помощью ансамбля глубоких рекуррентных и сверточных архитектур» . Журнал химической информации и моделирования . 58 (11): 2369–2376. DOI : 10.1021 / acs.jcim.8b00636 . ЛВП : 10072/382201 . PMID 30395465 . S2CID 53235372 .
- ^ Некчи, Марко; Пиовезан, Дамиано; Dosztányi, Zsuzsanna; Тосатто, Сильвио CE (18 января 2017 г.). «MobiDB-lite: быстрое и высокоспецифичное консенсусное прогнозирование внутреннего нарушения в белках» . Биоинформатика . 33 (9): 1402–1404. DOI : 10.1093 / биоинформатики / btx015 . ISSN 1367-4803 . PMID 28453683 .
- ^ Хэнсон Дж, Ян Y, Паливал К, Чжоу Y (2016). «Улучшение предсказания белковых расстройств с помощью глубоких двунаправленных рекуррентных нейронных сетей с долговременной краткосрочной памятью» . Биоинформатика . 33 (5): 685–692. DOI : 10.1093 / биоинформатики / btw678 . PMID 28011771 .
- ^ Ward JJ, Sodhi JS, McGuffin LJ, Бакстон BF, Jones DT (март 2004). «Прогнозирование и функциональный анализ нативных нарушений в белках трех царств жизни». J. Mol. Биол . 337 (3): 635–45. CiteSeerX 10.1.1.120.5605 . DOI : 10.1016 / j.jmb.2004.02.002 . PMID 15019783 .
- ^ Sormanni Р, Camilloni С, Fariselli Р, М Vendruscolo (февраль 2015). «Метод s2D: одновременное прогнозирование на основе последовательности статистических популяций упорядоченных и неупорядоченных областей в белках». J. Mol. Биол . 427 (4): 982–996. DOI : 10.1016 / j.jmb.2014.12.007 . PMID 25534081 .
- ^ Sumaiya Iqbal; Md Tamjidul Hoque (октябрь 2015 г.). «DisPredict: предсказатель неупорядоченного белка с использованием оптимизированного ядра RBF, содержимого и профилей» . PLOS ONE . 10 (10): e0141551. DOI : 10.1371 / journal.pone.0141551 . PMC 4627842 . PMID 26517719 .
- ^ Peng Z, Mizianty MJ, Курган L (январь 2014). «Прогнозирование в масштабе генома белков с длинными внутренне неупорядоченными областями» . Белки . 82 (1): 145–58. DOI : 10.1002 / prot.24348 . PMID 23798504 . S2CID 21229963 .
- ^ Marcin J. Miziantya, Zhenling Penga и Лукаш Курган (апрель 2013). «Точный предсказатель нарушения в белках путем слияния вероятностей нарушения, содержания и профилей» . Внутренне нарушенные белки . 1 (1): e24428. DOI : 10.4161 / idp.24428 . PMC 5424793 . PMID 28516009 .
- ^ Козловский, LP; Буйницки, JM (2012). «MetaDisorder: мета-сервер для предсказания внутреннего нарушения в белках» . BMC Bioinformatics . 13 : 111. DOI : 10,1186 / 1471-2105-13-111 . PMC 3465245 . PMID 22624656 .
- ^ Чжан Т, Faraggi Е, Сю В, Дункер К, Uversky В.Н., Чжоу Y (февраль 2012). «SPINE-D: точное предсказание коротких и длинных неупорядоченных областей с помощью единого метода на основе нейронной сети» (PDF) . Журнал биомолекулярной структуры и динамики . 29 (4): 799–813. DOI : 10.1080 / 073911012010525022 . hdl : 10072/57573 . PMC 3297974 . PMID 22208280 .
- ^ Mizianty MJ, Стах W, Chen K, Kedarisetti KD, Disfani FM, Курган L (сентябрь 2010). «Улучшенное предсказание на основе последовательностей неупорядоченных областей с многослойным слиянием нескольких источников информации» . Биоинформатика . 26 (18): i489–96. DOI : 10.1093 / биоинформатики / btq373 . PMC 2935446 . PMID 20823312 .
- ^ Prilusky Дж, Felder CE, Зив-Бен-Мордехай Т, и др. (Август 2005 г.). «FoldIndex: простой инструмент, позволяющий предсказать, является ли данная последовательность белка внутренне развернутой» . Биоинформатика . 21 (16): 3435–8. DOI : 10.1093 / биоинформатики / bti537 . PMID 15955783 .
- Перейти ↑ Wang L, Sauer UH (июнь 2008 г.). «OnD-CRF: прогнозирование порядка и беспорядка в белках с использованием условных случайных полей» . Биоинформатика . 24 (11): 1401–2. DOI : 10.1093 / биоинформатики / btn132 . PMC 2387219 . PMID 18430742 .
- ^ Шлезингер А, Пунта М, Yachdav G, Kajan л, Рост В (2009). Оргель JP (ред.). «Улучшенное предсказание беспорядков за счет комбинации ортогональных подходов» . PLOS ONE . 4 (2): e4433. Bibcode : 2009PLoSO ... 4.4433S . DOI : 10.1371 / journal.pone.0004433 . PMC 2635965 . PMID 19209228 .
- ^ Lieutaud P, Утка B, Лонги S (сентябрь 2008). «MeDor: метасервер для прогнозирования белковых нарушений» . BMC Genomics . 16 : S25. DOI : 10.1186 / 1471-2164-9-S2-S25 . PMC 2559890 . PMID 18831791 .
Внешние ссылки [ править ]
- Кураторский список из ~ 40 программ прогнозирования расстройств