Predictprotein


PredictProtein (PP) — это автоматический сервис, который выполняет поиск в актуальных общедоступных базах данных последовательностей, создает выравнивания и прогнозирует аспекты структуры и функции белка. Пользователи отправляют последовательность белка и получают один файл с результатами сравнения баз данных и методов прогнозирования. PP появился в сети в 1992 году в Европейской лаборатории молекулярной биологии ; с 1999 года он работает на базе Колумбийского университета , а в 2009 году перешел в Технический университет Мюнхена .. Хотя на многих серверах реализованы определенные аспекты, PP остается наиболее широко используемым общедоступным сервером для прогнозирования структуры: было обработано более 1,5 миллиона запросов от пользователей из 104 стран; более 13000 пользователей отправили 10 или более различных запросов. Веб-страницы PP отражены в 17 странах на 4 континентах. Система оптимизирована для удовлетворения потребностей экспериментаторов, не имеющих опыта в области биоинформатики. Это означало, что мы сосредоточились на включении только высококачественных методов и пытались сопоставить результаты, опуская менее надежные или менее важные.

Попытка «предварительно усвоить» как можно больше информации, чтобы упростить интерпретацию результатов, является уникальным столпом PP. Например, по умолчанию PP возвращает только те белки, найденные в базе данных, которые, скорее всего, имеют схожую структуру с белком запроса. [1] Конкретные прогнозы, такие как предсказания для мембранных спиралей, спиральных областей, сигнальных пептидов и сигналов ядерной локализации, не возвращаются, если обнаружено, что они ниже заданных порогов вероятности.

Пользователи получают один выходной файл со следующими результатами. Поиск в базе данных: похожие последовательности регистрируются и выравниваются с помощью стандартного попарного поиска BLAST, [2] повторного поиска PSI-BLAST. [3] Хотя попарный поиск BLAST идентичен поиску, который можно получить на сайте NCBI, повторный поиск PSI-BLAST выполняется в тщательно отфильтрованной базе данных, чтобы избежать накопления ложных срабатываний во время итерации. [4] [5] Стандартный поиск функциональных мотивов в базе данных PROSITE. [6] PP теперь также определяет предполагаемые границы структурных доменов с помощью процедуры CHOP. Методы предсказания структуры: вторичная структура, доступность растворителя и мембранные спирали, предсказанные программами PHD и PROF, [7][8] мембранные нити, предсказанные с помощью PROFtmb, [9] спиральные области с помощью COILS, [10] и межостаточные контакты с помощью PROFcon, [11] области низкой сложности, отмеченные с помощью SEG [12] и длинные области без регулярных вторичная структура идентифицируется NORSp,. [13] [14] Программы PHD/PROF доступны только через PP. Конкретный способ, которым PP автоматически повторяет поиск PSI-BLAST, и способ, которым мы решаем, что включать в семейства последовательностей, также уникален для PP. Конкретные аспекты функции, которые в настоящее время явно встроены в PP, так или иначе связаны с субклеточной локализацией: мы обнаруживаем сигналы ядерной локализации с помощью PredictNLS [15] .[16] мы прогнозируем локализацию независимо от целевых сигналов через LOCnet; [17] и аннотации гомологичны белкам, участвующим в контроле клеточного цикла. [18]

Веб-сервис PredictProtein доступен по адресу www.predictprotein.org. Пользователи могут отправить аминокислотную последовательность и получить взамен набор автоматических аннотаций для отправленной последовательности. Сервис поддерживается базой данных предварительно рассчитанных результатов, которые ускоряют время взаимодействия.