Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Наложены целевая структура (ленты) и 354 прогноза на основе шаблонов (серые скелеты Calpha); из CASP8

Критическая оценка прогнозирования структуры белка , или CASP , - это всемирный эксперимент по прогнозированию структуры белка, проводимый в масштабах всего сообщества каждые два года с 1994 года. [1] CASP предоставляет исследовательским группам возможность объективно протестировать свои методы прогнозирования структуры и предоставляет независимая оценка современного состояния моделирования структуры белков для исследовательского сообщества и пользователей программного обеспечения. Несмотря на то, что основная цель CASP - помочь продвинуть методы идентификации белковтрехмерная структура из его аминокислотной последовательности, многие рассматривают эксперимент больше как «чемпионат мира» в этой области науки. Более 100 исследовательских групп со всего мира участвуют в CASP на регулярной основе, и нередко целые группы приостанавливают другие исследования на месяцы, пока они сосредоточены на подготовке своих серверов к эксперименту и выполнении подробных прогнозов.

Выбор целевых белков [ править ]

Чтобы гарантировать, что ни один предсказатель не может иметь предварительную информацию о структуре белка, которая дала бы ему / ей преимущество, важно, чтобы эксперимент проводился двойным слепым способом: ни предсказатели, ни организаторы и эксперты не знают структуры целевых белков в то время, когда делаются прогнозы. Цели для предсказания структуры - это либо структуры, которые вскоре будут решены с помощью рентгеновской кристаллографии или ЯМР-спектроскопии, либо структуры, которые только что решены (в основном одним из центров структурной геномики ) и хранятся в базе данных белков . Если выясняется, что данная последовательность связана общим происхождением с белковой последовательностью известной структуры (называемой матрицей), сравнительное моделирование белковможет использоваться для прогнозирования третичной структуры . Шаблоны можно найти с помощью методов выравнивания последовательностей (например, BLAST или HHsearch ) или методов потоковой передачи белков , которые лучше подходят для поиска удаленно связанных шаблонов. В противном случае необходимо применять предсказание структуры белка de novo (например, Rosetta), которое гораздо менее надежно, но иногда может давать модели с правильной укладкой (обычно для белков менее 100–150 аминокислот). По-настоящему новые складки становятся довольно редкими среди целей [2] [3], что делает эту категорию меньше желаемой.

Оценка [ править ]

Первичный метод оценки [4] - это сравнение предсказанных модельных положений α-углерода с положением в целевой структуре. Сравнение показано визуально с помощью кумулятивных графиков расстояний между парами эквивалентов α-углерода в выравнивании модели и структуры, например, как показано на рисунке (идеальная модель будет оставаться на нуле на всем протяжении), и присвоено числовая оценка GDT-TS (Global Distance Test - Total Score), описывающая процент хорошо смоделированных остатков в модели по отношению к цели. [5] Бесплатное моделирование (без шаблона или de novo) также оценивается экспертами визуально, так как числовые баллы не подходят для нахождения общих сходств в самых сложных случаях. [6] Высокоточные прогнозы на основе шаблонов были оценены в CASP7 по тому, работают ли они для фазирования молекулярного замещения целевой кристаллической структуры [7] с успехом, последующим позже, [8] и с помощью полной модели (а не только α- Carbon ) качество модели и полная модель соответствуют цели в CASP8. [9]

Оценка результатов проводится по следующим категориям прогнозов:

Категория прогнозирования третичной структуры была далее подразделена на:

  • моделирование гомологии
  • Распознавание складок (также называемое протеиновым потоком ; обратите внимание, это неверно, поскольку многопоточность - это метод)
  • Предсказание структуры de novo , теперь называемое «новой складкой», поскольку многие методы применяют функции оценки или скоринга, которые зависят от знания структур нативных белков, таких как искусственная нейронная сеть.

Начиная с CASP7, категории были переопределены, чтобы отразить развитие методов. Категория «Моделирование на основе шаблонов» включает все предыдущие модели сравнительного моделирования, модели на основе гомологичных складок и некоторые модели на основе аналогичных складок. Категория «моделирование без шаблонов» (FM) включает модели белков с ранее невиданными складками и модели на основе жестких аналогичных складок. Из-за ограниченного количества целей без шаблонов (они довольно редки) в 2011 году был введен так называемый CASP ROLL. Этот непрерывный (непрерывный) эксперимент CASP направлен на более тщательную оценку методов прогнозирования без шаблонов путем оценки большего количества целей за пределами обычного сезона прогнозирования CASP. В отличие от LiveBench и EVA, этот эксперимент находится в духе слепого предсказания CASP, то есть все предсказания делаются на еще неизвестных структурах. [10]

Результаты CASP публикуются в специальных выпусках приложений к научному журналу Proteins , которые доступны на веб-сайте CASP. [11] Передовая статья в каждом из этих приложений описывает специфику эксперимента [12] [13], а заключительная статья оценивает прогресс в этой области. [14] [15]

В декабре 2018 года CASP13 попал в заголовки газет, когда его выиграла AlphaFold , программа искусственного интеллекта, созданная DeepMind . [16] В ноябре 2020 года улучшенная версия AlphaFold 2 выиграла CASP14. [17] По словам одного из соучредителей CASP Джона Моулта, AlphaFold набрал около 90 баллов по 100-балльной шкале точности прогноза для умеренно сложных белковых мишеней. [18]

См. Также [ править ]

  • Критическая оценка предсказания взаимодействий (CAPRI)
  • Критическая оценка функциональной аннотации (CAFA)

Ссылки [ править ]

  1. ^ Moult, J .; и другие. (1995). «Масштабный эксперимент по оценке методов предсказания структуры белков» . Белки . 23 (3): ii – iv. DOI : 10.1002 / prot.340230303 . PMID  8710822 . S2CID  11216440 .
  2. ^ Тресс, М .; и другие. (2009). «Определение и классификация целевого домена в CASP8» . Белки . 77 (Дополнение 9): 10–17. DOI : 10.1002 / prot.22497 . PMC 2805415 . PMID 19603487 .  
  3. ^ Zhang Y, Сколник J (2005). «Проблема предсказания структуры белка может быть решена с использованием текущей библиотеки PDB» . Proc Natl Acad Sci USA . 102 (4): 1029–1034. Bibcode : 2005PNAS..102.1029Z . DOI : 10.1073 / pnas.0407152101 . PMC 545829 . PMID 15653774 .  
  4. ^ Cozzetto, D .; и другие. (2009). «Оценка шаблонных моделей в CASP8 со стандартными мерами» . Белки . 77 (Дополнение 9): 18–28. DOI : 10.1002 / prot.22561 . PMC 4589151 . PMID 19731382 .  
  5. ^ Zemla A (2003). «LGA: метод нахождения трехмерных сходств в структурах белков» . Исследования нуклеиновых кислот . 31 (13): 3370–3374. DOI : 10.1093 / NAR / gkg571 . PMC 168977 . PMID 12824330 .  
  6. ^ Бен-Дэвид, М .; и другие. (2009). «Оценка предсказаний структуры CASP8 для целей без шаблонов». Белки . 77 (Дополнение 9): 50–65. DOI : 10.1002 / prot.22591 . PMID 19774550 . S2CID 16517118 .  
  7. ^ Читать, RJ; Чавали, Г. (2007). «Оценка прогнозов CASP7 в категории высокоточного моделирования на основе шаблонов» . Белки: структура, функции и биоинформатика . 69 (Дополнение 8): 27–37. DOI : 10.1002 / prot.21662 . PMID 17894351 . S2CID 33172629 .  
  8. ^ Qian, B .; и другие. (2007). «Предсказание структуры высокого разрешения и проблема кристаллографической фазы» . Природа . 450 (7167): 259–264. Bibcode : 2007Natur.450..259Q . DOI : 10,1038 / природа06249 . PMC 2504711 . PMID 17934447 .  
  9. ^ Киди, DA; Уильямс, CJ; Headd, JJ; Арендалл, ВБ; Чен, В.Б .; Капрал, ГДж; Гиллеспи, РА; Блок, JN; Земля, А; Ричардсон, округ Колумбия; Ричардсон, Дж. С. (2009). «Остальные 90% белка: оценка за пределами α-углерода для высокоточных моделей на основе шаблона CASP8» . Белки . 77 (Дополнение 9): 29–49. DOI : 10.1002 / prot.22551 . PMC 2877634 . PMID 19731372 .  
  10. ^ Kryshtafovych, A; Монастырский, Б; Фиделис, К. (2014). «Инфраструктура центра прогнозирования CASP и меры оценки в CASP10 и CASP ROLL» . Белки: структура, функции и биоинформатика . 82 Дополнение 2: 7–13. DOI : 10.1002 / prot.24399 . PMC 4396618 . PMID 24038551 .  
  11. ^ "Протоколы CASP" .
  12. ^ Moult, J .; и другие. (2007). «Критическая оценка методов предсказания структуры белков - VII раунд» . Белки . 69 (Дополнение 8): 3–9. DOI : 10.1002 / prot.21767 . PMC 2653632 . PMID 17918729 .  
  13. ^ Moult, J .; и другие. (2009). «Критическая оценка методов предсказания структуры белков - VIII раунд» . Белки . 77 (Дополнение 9): 1–4. DOI : 10.1002 / prot.22589 . PMID 19774620 . S2CID 9704851 .  
  14. ^ Kryshtafovych, A .; и другие. (2007). «Прогресс от CASP6 к CASP7». Белки: структура, функции и биоинформатика . 69 (Дополнение 8): 194–207. DOI : 10.1002 / prot.21769 . PMID 17918728 . S2CID 40200832 .  
  15. ^ Kryshtafovych, A .; и другие. (2009). «Результаты CASP8 в контексте предыдущих экспериментов» . Белки . 77 (Дополнение 9): 217–228. DOI : 10.1002 / prot.22562 . PMC 5479686 . PMID 19722266 .  
  16. ^ Образец, Ян (2 декабря 2018 г.). «DeepMind от Google предсказывает трехмерные формы белков» . Хранитель . Проверено 19 июля 2019 .
  17. ^ «Искусственный интеллект DeepMind по сворачиванию белков решил грандиозную биологическую задачу 50-летней давности» . Обзор технологий Массачусетского технологического института . Проверено 30 ноября 2020 .
  18. ^ 'Это изменит все': ИИ DeepMind делает гигантский скачок в решении белковых структур

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • КАСП РОЛЛ
  • Форум FORCASP

Рейтинг результатов [ править ]

Автоматическая оценка для CASP13 (2018)

  • Официальный рейтинг только для серверов
  • Официальный рейтинг для людей и серверов

Автоматическая оценка для CASP12 (2016)

  • Официальный рейтинг только для серверов
  • Официальный рейтинг для людей и серверов

Автоматизированная оценка для CASP11 (2014 г.)

  • Официальный рейтинг только для серверов (126 целей)
  • Официальный рейтинг для людей и серверов (78 целей)

Автоматическая оценка для CASP10 (2012 г.)

  • Официальный рейтинг только для серверов (127 целей)
  • Официальный рейтинг для людей и серверов (71 цель)
  • Рейтинг Zhang Lab

Автоматическая оценка для CASP9 (2010 г.)

  • Официальный рейтинг только для серверов (147 целей)
  • Официальный рейтинг для людей и серверов (78 целей)
  • Рейтинг Лаборатории Гришина (только для сервера)
  • Рейтинг Лаборатории Гришина (для человека и серверов)
  • Рейтинг Zhang Lab
  • Рейтинг Cheng Lab

Автоматическая оценка для CASP8 (2008 г.)

  • Официальный рейтинг только для серверов
  • Официальный рейтинг для людей и серверов
  • Рейтинг Zhang Lab
  • Рейтинг лаборатории Гришина
  • Рейтинг McGuffin Lab
  • Рейтинг Cheng Lab

Автоматическая оценка для CASP7 (2006 г.)

  • Рейтинг Livebench
  • Рейтинг Zhang Lab