Внутренне неупорядоченный белок ( IDP ) — это белок , которому не хватает фиксированной или упорядоченной трехмерной структуры , [2] [3] [4] , как правило, в отсутствие его макромолекулярных партнеров по взаимодействию, таких как другие белки или РНК. IDP варьируются от полностью неструктурированных до частично структурированных и включают случайные клубки , агрегаты, подобные расплавленным глобулам , или гибкие линкеры в крупных многодоменных белках. Иногда их выделяют в отдельный класс белков наряду с глобулярными , фиброзными и мембранными белками . [5]
IDP представляют собой очень большой и функционально важный класс белков, и их открытие опровергло идею о том, что трехмерные структуры белков должны быть зафиксированы для выполнения их биологических функций . Например, было идентифицировано, что IDPs участвуют в слабых мультивалентных взаимодействиях, которые очень кооперативны и динамичны, что придает им важность в регуляции ДНК и в передаче сигналов клетками . [6] Многие IDP также могут принимать фиксированную трехмерную структуру после связывания с другими макромолекулами. В целом, IDP во многих отношениях отличаются от структурированных белков и, как правило, имеют отличительную функцию, структуру, последовательность, взаимодействие, эволюцию и регуляцию. [7]
В 1930–1950-х годах с помощью кристаллографии белков были решены первые структуры белков . Эти ранние структуры предполагали, что для обеспечения биологических функций белков обычно может потребоваться фиксированная трехмерная структура . Эти публикации укрепили центральную догму молекулярной биологии , согласно которой аминокислотная последовательность белка определяет его структуру, которая, в свою очередь, определяет его функцию. В 1950 году Каруш написал о «конфигурационной адаптивности», противоречащей этому предположению. Он был убежден, что белки имеют более одной конфигурации на одном и том же энергетическом уровне и могут выбирать одну из них при связывании с другими субстратами. В 1960- х годах парадокс Левинталяпредположили, что систематический конформационный поиск длинного полипептида вряд ли приведет к получению единой свернутой белковой структуры в биологически релевантных временных масштабах (т.е. от микросекунд до минут). Любопытно, что для многих (небольших) белков или белковых доменов можно наблюдать относительно быструю и эффективную рефолдинг in vitro. Как указано в «Догме Анфинсена» 1973 г., фиксированная трехмерная структура этих белков уникально закодирована в своей первичной структуре (аминокислотной последовательности), кинетически доступна и стабильна в ряде (близких) физиологических условий и, следовательно, может рассматриваться как нативное состояние таких «упорядоченных» белков. [9]
Однако в последующие десятилетия многие крупные белковые области не могли быть отнесены к наборам рентгеновских данных, что указывало на то, что они занимают несколько позиций, которые усредняются на картах электронной плотности . Отсутствие фиксированных уникальных положений относительно кристаллической решетки предполагало, что эти области «неупорядочены». Спектроскопия ядерного магнитного резонанса белков также продемонстрировала наличие больших гибких линкеров и концов во многих решенных структурных ансамблях.
В 2001 году Дункер задался вопросом, не игнорировалась ли недавно найденная информация в течение 50 лет [10] с появлением дополнительных количественных анализов в 2000-х годах. [11] В 2010-х годах стало ясно, что IDP распространены среди связанных с болезнью белков, таких как альфа-синуклеин и тау . [12]
В настоящее время общепризнано, что белки существуют как ансамбль подобных структур, причем некоторые области более ограничены, чем другие. IDPs занимают крайний конец этого спектра гибкости и включают белки со значительной тенденцией к локальной структуре или гибкие многодоменные сборки. [13] [14]
Биоинформационные предсказания показали, что внутренние беспорядки чаще встречаются в геномах и протеомах , чем в известных структурах в базе данных белков . На основании предсказания DISOPRED2 длинные (>30 остатков) неупорядоченные сегменты встречаются в 2,0% архейных, 4,2% эубактериальных и 33,0% эукариотических белков [11] , включая определенные белки, связанные с заболеванием. [12]
Высокодинамичные неупорядоченные области белков связаны с такими функционально важными явлениями, как аллостерическая регуляция и ферментативный катализ . [13] [14] Многие неупорядоченные белки имеют аффинность связывания с их рецепторами, регулируемую посттрансляционной модификацией , поэтому было высказано предположение, что гибкость неупорядоченных белков способствует различным конформационным требованиям для связывания модифицирующих ферментов, а также их рецепторов. [15] Внутреннее расстройство особенно обогащено белками, участвующими в клеточной передаче сигналов, транскрипции и функциях ремоделирования хроматина . [16] [17]Гены, недавно возникшие de novo , как правило, имеют более высокий уровень беспорядка. [18] [19]
Неупорядоченные области часто встречаются в виде гибких линкеров или петель, соединяющих домены. Линкерные последовательности сильно различаются по длине, но обычно богаты полярными незаряженными аминокислотами . Гибкие линкеры позволяют соединяющим доменам свободно скручиваться и вращаться, чтобы рекрутировать своих партнеров по связыванию посредством динамики белковых доменов . Они также позволяют своим партнерам по связыванию вызывать крупномасштабные конформационные изменения с помощью дальнодействующей аллостерии . [13] [2] Гибкий линкер FBP25, который соединяет два домена FKBP25, важен для связывания FKBP25 с ДНК. [20]
Линейные мотивы представляют собой короткие неупорядоченные участки белков, которые опосредуют функциональные взаимодействия с другими белками или другими биомолекулами (РНК, ДНК, сахара и т. д.). Многие роли линейных мотивов связаны с клеточной регуляцией, например, в контроле формы клеток, субклеточной локализации отдельных белков и регулировании оборота белков. Часто посттрансляционные модификации, такие как фосфорилирование, настраивают сродство (нередко на несколько порядков) отдельных линейных мотивов к конкретным взаимодействиям. Относительно быстрая эволюция и относительно небольшое количество структурных ограничений для установления новых (низкоаффинных) интерфейсов делают обнаружение линейных мотивов особенно сложным, но их широко распространенная биологическая роль и тот факт, что многие вирусы имитируют/перехватывают линейные мотивы для эффективного перекодирования инфицированных клеток, подчеркивают своевременная актуальность исследований по этой очень сложной и интересной теме. В отличие от глобулярных белков, IDP не имеют пространственно расположенных активных карманов. Тем не менее, в 80% IDP (~ 3 дюжины), подвергнутых подробной структурной характеристике с помощью ЯМР, присутствуют линейные мотивы, называемые PreSMos (предварительно структурированные мотивы), которые представляют собой временные вторичные структурные элементы, предназначенные для распознавания мишеней. В нескольких случаях было продемонстрировано, что эти переходные структуры становятся полными и стабильными вторичными структурами, например, спирали при связывании с мишенью. Следовательно, PreSMos являются предполагаемыми активными сайтами у ВПЛ.[21]
Многие неструктурированные белки претерпевают переходы в более упорядоченные состояния при связывании со своими мишенями (например, Molecular Recognition Features (MoRFs) [22] ). Парное сворачивание и связывание могут быть локальными, затрагивающими лишь несколько взаимодействующих остатков, или могут затрагивать весь белковый домен. Недавно было показано, что совмещенное сворачивание и связывание позволяют закопать большую площадь поверхности, что было бы возможно только для полностью структурированных белков, если бы они были намного больше. [23] Кроме того, некоторые неупорядоченные области могут служить «молекулярными переключателями» в регуляции определенных биологических функций путем переключения на упорядоченную конформацию при молекулярном распознавании, например, связывание малых молекул, связывание ДНК/РНК, взаимодействие ионов и т. д. [24]
Способность неупорядоченных белков связываться и, таким образом, выполнять свою функцию показывает, что стабильность не является обязательным условием. Многие короткие функциональные участки, например, короткие линейные мотивы , чрезмерно представлены в неупорядоченных белках. Неупорядоченные белки и короткие линейные мотивы особенно распространены во многих РНК-вирусах , таких как вирус Хендра , ВГС , ВИЧ-1 и вирусы папилломы человека . Это позволяет таким вирусам преодолевать свои информационно ограниченные геномы, облегчая связывание и манипулирование большим количеством белков клетки-хозяина . [25] [26]
Внутренне неупорядоченные белки могут сохранять свою конформационную свободу, даже если они специфически связываются с другими белками. Структурный беспорядок в связанном состоянии может быть статическим или динамическим. В нечетких комплексах для функционирования требуется структурная множественность, и манипулирование связанной неупорядоченной областью изменяет активность. Конформационный ансамбль комплекса модулируется посредством посттрансляционных модификаций или белковых взаимодействий. [27] Специфичность ДНК-связывающих белков часто зависит от длины нечетких участков, которая варьируется путем альтернативного сплайсинга. [28] Некоторые нечеткие комплексы могут проявлять высокую аффинность связывания, [29]хотя другие исследования показали разные значения сродства для одной и той же системы в другом режиме концентрации. [30]
Внутренне неупорядоченные белки адаптируют множество различных структур in vivo в соответствии с условиями клетки, создавая структурный или конформационный ансамбль. [31] [32]
Следовательно, их структуры тесно связаны с функциями. Однако лишь немногие белки полностью разупорядочены в нативном состоянии. Нарушение в основном обнаруживается в внутренне неупорядоченных областях (IDR) в хорошо структурированном белке. Таким образом, термин внутренне неупорядоченный белок (IDP) включает белки, содержащие IDR, а также полностью неупорядоченные белки.
Наличие и вид нарушения белка закодированы в его аминокислотной последовательности. [2] В целом, IDP характеризуются низким содержанием объемных гидрофобных аминокислот и высокой долей полярных и заряженных аминокислот, что обычно называют низкой гидрофобностью. [31] Это свойство приводит к хорошему взаимодействию с водой. Кроме того, высокие суммарные заряды способствуют беспорядку из-за электростатического отталкивания, возникающего из-за одинаково заряженных остатков. [32] Таким образом, неупорядоченные последовательности не могут достаточно похоронить гидрофобное ядро, чтобы свернуться в стабильные глобулярные белки. В некоторых случаях гидрофобные кластеры в неупорядоченных последовательностях дают ключ к идентификации областей, которые подвергаются сопряженному сворачиванию и связыванию (см.биологические роли ). Многие неупорядоченные белки обнаруживают участки без регулярной вторичной структуры. Эти области можно назвать гибкими по сравнению со структурированными петлями. В то время как последние являются жесткими и содержат только один набор углов Рамачандрана, IDP включают несколько наборов углов. [32] Термин гибкость также используется для хорошо структурированных белков, но описывает другое явление в контексте неупорядоченных белков. Гибкость структурированных белков связана с равновесным состоянием, в отличие от IDP. [32] Многие неупорядоченные белки также обнаруживают последовательности низкой сложности , т. е. последовательности с чрезмерным представлением нескольких остатков .. Хотя последовательности низкой сложности являются явным признаком беспорядка, обратное не обязательно верно, то есть не все неупорядоченные белки имеют последовательности низкой сложности. Неупорядоченные белки имеют низкое содержание предсказанной вторичной структуры .
IDP могут быть проверены в нескольких контекстах. Большинство подходов к экспериментальной проверке IDP ограничены извлеченными или очищенными белками, в то время как некоторые новые экспериментальные стратегии направлены на изучение конформаций in vivo и структурных вариаций IDP внутри интактных живых клеток и систематическое сравнение их динамики in vivo и in vitro .
Первое прямое доказательство персистенции внутреннего расстройства in vivo было получено с помощью внутриклеточного ЯМР при электропорации очищенного IDP и восстановлении клеток до интактного состояния. [33]
Теперь возможна более масштабная проверка прогнозов IDR in vivo с использованием «окрашивания» биотином. [34] [35]
Внутренне развернутые белки после очистки могут быть идентифицированы различными экспериментальными методами. Основным методом получения информации о неупорядоченных участках белка является ЯМР-спектроскопия . Отсутствие электронной плотности в рентгеноструктурных исследованиях также может быть признаком беспорядка.
Свернутые белки имеют высокую плотность (частичный удельный объем 0,72-0,74 мл/г) и соизмеримо малый радиус инерции . Следовательно, развернутые белки могут быть обнаружены методами, которые чувствительны к размеру молекулы, плотности или гидродинамическому сопротивлению , таким как эксклюзионная хроматография , аналитическое ультрацентрифугирование , малоугловое рассеяние рентгеновских лучей (SAXS) и измерение константы диффузии . Несвернутые белки также характеризуются отсутствием вторичной структуры , о чем свидетельствует круговой дихроизм в дальнем УФ (170-250 нм) (особенно ярко выраженный минимум при ~200 нм) или в инфракрасном диапазоне .спектроскопия. Несвернутые белки также имеют открытые пептидные группы основной цепи, подвергающиеся воздействию растворителя, так что они легко расщепляются протеазами , подвергаются быстрому водородно-дейтериевому обмену и демонстрируют небольшую дисперсию (<1 м.д.) химических сдвигов амида 1H , измеренную с помощью ЯМР . (Свернутые белки обычно имеют дисперсию до 5 м.д. для амидных протонов.) Недавно были введены новые методы, включая быстрый параллельный протеолиз (FASTpp) , которые позволяют определять свернутые/неупорядоченные фракции без необходимости очистки. [36] [37]Даже тонкие различия в стабильности миссенс-мутаций, связывании белков-партнеров и индуцированном (само)полимеризацией сворачивании (например) спиральных спиралей могут быть обнаружены с использованием FASTpp, как недавно продемонстрировано с использованием взаимодействия белков тропомиозин-тропонин. [38] Полностью неструктурированные участки белка могут быть подтверждены экспериментально по их гиперчувствительности к протеолизу с использованием короткого времени расщепления и низких концентраций протеазы. [39]
Массовые методы изучения структуры и динамики IDP включают SAXS для получения информации о форме ансамбля, ЯМР для уточнения атомистического ансамбля, флуоресценцию для визуализации молекулярных взаимодействий и конформационных переходов, рентгеновскую кристаллографию для выделения более подвижных областей в других жестких белковых кристаллах, крио-ЭМ для выявления менее фиксированные части белков, светорассеяние для контроля распределения размеров IDP или кинетики их агрегации, химический сдвиг ЯМР и круговой дихроизм для контроля вторичной структуры IDP.
Одномолекулярные методы изучения IDP включают spFRET [40] для изучения конформационной гибкости IDP и кинетики структурных переходов, оптический пинцет [41] для изучения ансамблей IDP и их олигомеров или агрегатов с высоким разрешением, нанопоры [42] для выявления глобальных распределений формы IDP, магнитный пинцет [43] для изучения структурных переходов в течение длительного времени при малых силах, высокоскоростной АСМ [44] для прямой визуализации пространственно-временной гибкости IDP.
Внутренний беспорядок можно либо аннотировать на основе экспериментальной информации, либо предсказать с помощью специального программного обеспечения. Алгоритмы прогнозирования расстройств могут предсказывать склонность к внутренним расстройствам (ID) с высокой точностью (приблизительно к 80%) на основе состава первичной последовательности, сходства с неназначенными сегментами в наборах данных рентгеновского исследования белков, гибких областей в исследованиях ЯМР и физико-химических свойств аминокислот. .
Были созданы базы данных для аннотирования белковых последовательностей информацией о внутренних нарушениях. База данных DisProt содержит набор отобранных вручную белковых сегментов, которые были экспериментально определены как неупорядоченные. MobiDB представляет собой базу данных, объединяющую экспериментально подобранные аннотации беспорядка (например, из DisProt) с данными, полученными из отсутствующих остатков в рентгеноструктурных кристаллографических структурах и гибких областей в структурах ЯМР.
Отделение неупорядоченных белков от упорядоченных имеет важное значение для предсказания беспорядка. Одним из первых шагов в поиске фактора, который отличает ВПЛ от не-ВПЛ, является определение предвзятости в аминокислотном составе. Следующие гидрофильные заряженные аминокислоты A, R, G, Q, S, P, E и K были охарактеризованы как аминокислоты, способствующие упорядочению, в то время как аминокислоты, способствующие упорядочению, W, C, F, I, Y, V, L и N являются гидрофобными и незаряженными. Остальные аминокислоты H, M, T и D неоднозначны, встречаются как в упорядоченных, так и в неструктурированных областях. [2] Более поздний анализ ранжировал аминокислоты по их склонности к образованию неупорядоченных областей следующим образом (порядок, способствующий развитию расстройства): W, F, Y, I, M, L, V, N, C, T, A, G. , R, D, H, Q, K, S, E, P. [45]
Эта информация является основой большинства предикторов на основе последовательностей. Области с незначительной вторичной структурой или без нее, также известные как области NORS (NO Regular Secondary Structure) [46] , и области низкой сложности могут быть легко обнаружены. Однако не все неупорядоченные белки содержат такие последовательности низкой сложности.
Определение неупорядоченных участков биохимическими методами требует больших затрат времени и средств. Из-за изменчивого характера ИДП удается обнаружить лишь отдельные аспекты их строения, поэтому для полной характеристики требуется большое количество различных методов и экспериментов. Это дополнительно увеличивает затраты на определение IDP. Чтобы преодолеть это препятствие, создаются компьютерные методы прогнозирования структуры и функции белка. Получение знаний путем прогнозирования является одной из основных целей биоинформатики. Предикторы функции IDP также разрабатываются, но в основном используют структурную информацию, такую как сайты линейных мотивов . [4] [47] Существуют различные подходы к прогнозированию структуры IDP, такие как нейронные сети.или матричные расчеты, основанные на различных структурных и/или биофизических свойствах.
Многие вычислительные методы используют информацию о последовательности, чтобы предсказать, является ли белок неупорядоченным. [48] Известные примеры такого программного обеспечения включают IUPRED и Disopred. В разных методах могут использоваться разные определения расстройства. Мета-предикторы демонстрируют новую концепцию, объединяющую различные первичные предикторы для создания более компетентного и точного предиктора.
Из-за различных подходов к предсказанию неупорядоченных белков оценка их относительной точности довольно затруднительна. Например, нейронные сети часто обучаются на разных наборах данных. Категория предсказания беспорядка является частью проводимого два раза в год эксперимента CASP , предназначенного для проверки методов на соответствие точности обнаружения областей с отсутствующей трехмерной структурой (помечены в файлах PDB как REMARK465, отсутствующие плотности электронов в рентгеновских структурах).
Внутренне неструктурированные белки вызывают ряд заболеваний. [12] Агрегация белков с неправильной укладкой является причиной многих синуклеинопатий и токсичности, поскольку эти белки начинают случайным образом связываться друг с другом и могут привести к раку или сердечно-сосудистым заболеваниям. Таким образом, неправильное сворачивание может происходить спонтанно, потому что за время жизни организма создаются миллионы копий белков. Агрегация внутренне неструктурированного белка α-синуклеинасчитается ответственным. Структурная гибкость этого белка вместе с его восприимчивостью к модификации в клетке приводит к неправильной укладке и агрегации. Генетика, окислительный и нитративный стресс, а также митохондриальные нарушения влияют на структурную гибкость неструктурированного белка α-синуклеина и связанные с ним механизмы заболевания. [49] Многие ключевые супрессоры опухолей имеют большие по своей природе неструктурированные области, например p53 и BRCA1. Эти области белков отвечают за опосредование многих их взаимодействий. Взяв за модель нативные защитные механизмы клетки, можно разработать лекарства, пытающиеся заблокировать место вредных субстратов и ингибировать их, тем самым противодействуя заболеванию. [50]
Из-за высокой структурной неоднородности полученные экспериментальные параметры ЯМР/МУРР будут средними по большому числу весьма разнообразных и неупорядоченных состояний (ансамбля неупорядоченных состояний). Следовательно, чтобы понять структурные последствия этих экспериментальных параметров, необходимо точное представление этих ансамблей с помощью компьютерного моделирования. Для этой цели можно использовать молекулярно-динамические модели всего атома, но их использование ограничено точностью текущих силовых полей в представлении неупорядоченных белков. Тем не менее, некоторые силовые поля были специально разработаны для изучения неупорядоченных белков путем оптимизации параметров силового поля с использованием доступных данных ЯМР для неупорядоченных белков. (примеры: CHARMM 22*, CHARMM 32, [51] Amber ff03* и т. д.)
Моделирование MD, ограниченное экспериментальными параметрами (ограниченное MD), также использовалось для характеристики неупорядоченных белков. [52] [53] [54] В принципе, можно сэмплировать все конформационное пространство, если МД-моделирование (с точным силовым полем) выполняется достаточно долго. Из-за очень высокой структурной неоднородности масштабы времени, необходимые для этой цели, очень велики и ограничены вычислительной мощностью. Однако другие вычислительные методы, такие как ускоренное моделирование МД, [55] моделирование обмена репликами , [56] [57] метадинамика , [58] [59] мультиканоническое моделирование МД, [60] или методы, использующиекрупнозернистое представление с неявными и явными растворителями [61] [62] [63] использовалось для выборки более широкого конформационного пространства в меньших временных масштабах.
Кроме того, для понимания функциональных сегментов IDP использовались различные протоколы и методы анализа IDP, такие как исследования, основанные на количественном анализе содержания GC в генах и их соответствующих хромосомных полосах. [64] [65]