Секвенирование белков

Использование секвенатора белок-пептид Beckman-Spinco, 1970 г.

Секвенирование белков - это практический процесс определения аминокислотной последовательности всего или части белка или пептида . Это может служить для идентификации белка или характеристики его посттрансляционных модификаций . Как правило, частичное секвенирование белка , обеспечивает достаточную информацию (один или несколько тегов последовательности) , чтобы идентифицировать его со ссылкой на базы данных белковых последовательностей , полученных из концептуального перевода из генов .

Двумя основными прямыми методами секвенирования белков являются масс-спектрометрия и деградация по Эдману с использованием секвенатора белков ( секвенатора ). Методы масс-спектрометрии сейчас наиболее широко используются для секвенирования и идентификации белков, но деградация по Эдману остается ценным инструментом для характеристики N- конца белка .

Определение аминокислотного состава [ править ]

Часто желательно знать неупорядоченный аминокислотный состав белка до попытки найти упорядоченную последовательность, так как это знание может использоваться для облегчения обнаружения ошибок в процессе секвенирования или для различения неоднозначных результатов. Знание частоты встречаемости определенных аминокислот также может быть использовано для выбора протеазы, используемой для переваривания белка. Также может быть определено неправильное включение низких уровней нестандартных аминокислот (например, норлейцина) в белки. ^[1] Обобщенный метод определения частоты встречаемости аминокислот, часто называемый аминокислотным анализом ^[2], выглядит следующим образом:

Гидролиз известного количества белка на составляющие его аминокислоты.
Разделите и определите количество аминокислот каким-либо образом.

Гидролиз [ править ]

Гидролиз осуществляется путем нагревания образца белка в 6 М соляной кислоте до 100–110 ° C в течение 24 часов или дольше. Белки с большим количеством объемных гидрофобных групп могут потребовать более длительных периодов нагревания. Однако эти условия настолько сильны, что некоторые аминокислоты ( серин , треонин , тирозин , триптофан , глутамин и цистеин ) разлагаются. Чтобы обойти эту проблему, Biochemistry Online предлагает нагревать отдельные образцы в течение разного времени, анализировать каждый полученный раствор и экстраполировать обратно на нулевое время гидролиза. Расталл предлагает различные реагенты для предотвращения или уменьшения разложения, такие кактиоловые реагенты или фенол для защиты триптофана и тирозина от воздействия хлора и предварительно окисляющего цистеина. Он также предлагает измерить количество выделившегося аммиака, чтобы определить степень гидролиза амида .

Разделение и количественный анализ [ править ]

Аминокислоты можно разделить с помощью ионообменной хроматографии, а затем дериватизировать, чтобы облегчить их обнаружение. Обычно аминокислоты дериватизируют, а затем разделяют с помощью ВЭЖХ с обращенной фазой .

Пример ионообменной хроматографии приведен NTRC с использованием сульфированного полистирола в качестве матрицы, добавления аминокислот в кислотный раствор и пропускания через колонку буфера со стабильно увеличивающимся pH . Аминокислоты элюируются, когда pH достигает их соответствующих изоэлектрических точек . После разделения аминокислот определяют их соответствующие количества, добавляя реагент, который образует окрашенное производное. Если количество аминокислот превышает 10 нмоль, нингидринможно использовать для этого; он дает желтый цвет при реакции с пролином и ярко-фиолетовый цвет с другими аминокислотами. Концентрация аминокислоты пропорциональна поглощению полученного раствора. В очень малых количествах, вплоть до 10 пмоль, флуоресцентные производные могут быть образованы с использованием таких реагентов, как ортофтальдегид (OPA) или флуоресцин .

Для получения производных перед колонкой можно использовать реагент Эдмана для получения производного, которое определяется УФ-светом. Более высокая чувствительность достигается при использовании реагента, генерирующего флуоресцентное производное. Дериватизированные аминокислоты подвергаются обращенно-фазовой хроматографии, обычно с использованием колонки с диоксидом кремния C8 или C18 и оптимизированного градиента элюирования . Элюирующие аминокислоты обнаруживают с помощью УФ-детектора или флуоресцентного детектора, а площади пиков сравнивают с таковыми для дериватизированных стандартов, чтобы количественно определить каждую аминокислоту в образце.

Анализ N- концевых аминокислот [ править ]

Метод Сэнгер пептида концевых групп анализа: дериватизация N - терминальном конце с реагентом Сангера (DNFB), В общей сложности кислотный гидролиз динитрофенил пептида

Определение того, какие аминокислотные , формирует N -terminus из пептидной цепи полезно по двум причинам: чтобы помочь упорядочению последовательностей отдельных пептидных фрагментов в целую цепь, и потому , что первый раунд деградации по Эдману часто загрязнен примесями и , следовательно , делает не дают точного определения N -концевой аминокислоты. Ниже приводится обобщенный метод анализа N- концевых аминокислот:

Взаимодействуйте с пептидом с реагентом, который избирательно метит концевую аминокислоту.
Гидролизовать белок.
Определите аминокислоту с помощью хроматографии и сравнения со стандартами.

Существует множество различных реагентов, которые можно использовать для мечения концевых аминокислот. Все они реагируют с аминогруппами и, следовательно, также будут связываться с аминогруппами в боковых цепях аминокислот, таких как лизин - по этой причине необходимо быть осторожным при интерпретации хроматограмм, чтобы убедиться, что выбрано правильное пятно. Двумя наиболее распространенными реагентами являются реагент Сенгера ( 1-фтор-2,4-динитробензол ) и производные дансила, такие как дансилхлорид . Фенилизотиоцианат, реагент для разложения Эдмана, также может быть использован. Здесь применяются те же вопросы, что и при определении аминокислотного состава, за исключением того, что окрашивание не требуется, поскольку реагенты производят окрашенные производные, и требуется только качественный анализ. Таким образом, аминокислоту не нужно элюировать из хроматографической колонки, а просто сравнивать со стандартом. Еще одно соображение, которое следует принять во внимание, заключается в том, что, поскольку любые аминогруппы будут реагировать с реагентом для метки, нельзя использовать ионообменную хроматографию, и вместо нее следует использовать тонкослойную хроматографию или жидкостную хроматографию высокого давления .

Анализ C-концевых аминокислот [ править ]

Количество доступных методов анализа C-концевых аминокислот намного меньше, чем количество доступных методов анализа N-концевых аминокислот. Наиболее распространенный метод - это добавление карбоксипептидаз к раствору белка, регулярный отбор образцов и определение конечной аминокислоты путем анализа графика зависимости концентраций аминокислот от времени. Этот метод будет очень полезен в случае полипептидов и N-концов, блокированных белком. С-концевое секвенирование может значительно помочь в проверке первичных структур белков, предсказанных на основе последовательностей ДНК, и для обнаружения пострансляционного процессинга генных продуктов из известных последовательностей кодонов.

Деградация Эдмана [ править ]

Деградации по Эдману является очень важной реакции для секвенирования белка, поскольку она позволяет упорядоченная аминокислотный состав белка , чтобы быть обнаружены. В настоящее время широко используются автоматические секвенаторы Эдмана, которые способны секвенировать пептиды длиной примерно до 50 аминокислот. Схема реакции для секвенирования белка деградацией Эдмана следует; некоторые из шагов будут подробно описаны позже.

Разрушьте любые дисульфидные мостики в белке с помощью восстановителя, такого как 2-меркаптоэтанол . Защитная группа , такая как йодуксусная кислота может быть необходима , чтобы предотвратить связи от повторного формирования.
Разделите и очистите отдельные цепи белкового комплекса, если их больше одной.
Определите аминокислотный состав каждой цепи.
Определите концевые аминокислоты каждой цепи.
Разбейте каждую цепь на фрагменты длиной менее 50 аминокислот.
Разделите и очистите фрагменты.
Определите последовательность каждого фрагмента.
Повторите то же самое с другим рисунком декольте.
Постройте последовательность общего белка.

Расщепление пептидными фрагментами [ править ]

Пептиды длиной более 50-70 аминокислот не могут быть надежно секвенированы деградацией по Эдману. Из-за этого длинные белковые цепи необходимо разбивать на небольшие фрагменты, которые затем можно секвенировать индивидуально. Переваривание осуществляется либо эндопептидазами, такими как трипсин или пепсин, либо химическими реагентами, такими как цианогенбромид . Различные ферменты дают разные модели расщепления, и перекрытие между фрагментами может использоваться для построения общей последовательности.

Реакция [ править ]

Секвенируемый пептид адсорбируется на твердой поверхности. Одна из распространенных подложек - это стекловолокно, покрытое полибреном , катионным полимером . Реагент Эдмана, фенилизотиоцианат (PITC), добавляют к адсорбированному пептиду вместе со слабощелочным буферным раствором 12% триметиламина . Он реагирует с аминогруппой N-концевой аминокислоты.

Конечная аминокислота затем может быть избирательно отделена добавлением безводной кислоты. Затем производное изомеризуется с образованием замещенного фенилтиогидантоина , который можно смыть и идентифицировать хроматографией, и цикл можно повторить. Эффективность каждого этапа составляет около 98%, что позволяет надежно определить около 50 аминокислот.

Аппарат для секвенирования белков Beckman-Coulter Porton LF3000G

Секвенсор белков [ править ]

Белок секвенатор ^[3] является машиной , которая выполняет Эдман деградация в автоматическом режиме. Образец белка или пептида иммобилизуют в реакционном сосуде секвенатора белка и проводят деградацию по Эдману. Каждый цикл высвобождает и дериватизирует одну аминокислоту с N- конца белка или пептида, а затем высвобожденное производное аминокислоты идентифицируется с помощью ВЭЖХ. Процесс секвенирования повторяется для всего полипептида до тех пор, пока не будет установлена вся измеримая последовательность, или в течение заранее определенного количества циклов.

Идентификация масс-спектрометрией [ править ]

Идентификация белка - это процесс присвоения имени интересующему белку (POI) на основе его аминокислотной последовательности. Как правило, только часть последовательности белка необходимо определить экспериментально, чтобы идентифицировать белок со ссылкой на базы данных последовательностей белков, выведенных из последовательностей ДНК их генов. Дальнейшая характеристика белка может включать подтверждение фактических N- и C-концов POI, определение вариантов последовательности и идентификацию любых присутствующих посттрансляционных модификаций.

Протеолитические переваривания [ править ]

Описана общая схема идентификации белков. ^[4]^[5]

POI выделяют, как правило, с помощью SDS-PAGE или хроматографии .
Выделенный POI может быть химически модифицирован для стабилизации остатков цистеина (например, S-амидометилирование или S-карбоксиметилирование).
POI переваривается специфической протеазой с образованием пептидов. Трипсин , который избирательно расщепляет C-концевую сторону остатков лизина или аргинина, является наиболее часто используемой протеазой. Его преимущества включают i) частоту остатков Lys и Arg в белках, ii) высокую специфичность фермента, iii) стабильность фермента и iv) пригодность триптических пептидов для масс-спектрометрии.
Пептиды можно обессолить для удаления ионизируемых примесей и подвергнуть масс-спектрометрии MALDI-TOF . Прямое измерение масс пептидов может предоставить достаточную информацию для идентификации белка (см. Массовый отпечаток пептидов ), но дальнейшая фрагментация пептидов внутри масс-спектрометра часто используется для получения информации о последовательностях пептидов. В качестве альтернативы пептиды можно обессолить и разделить с помощью ВЭЖХ с обращенной фазой и ввести в масс-спектрометр через источник ESI . LC-ESI-MS может предоставить больше информации, чем MALDI-MS для идентификации белков, но требует больше инструментального времени.
В зависимости от типа масс-спектрометра, фрагментация пептидных ионов может происходить с помощью различных механизмов, таких как диссоциация, вызванная столкновениями (CID) или распад после источника (PSD). В каждом случае структура фрагментных ионов пептида предоставляет информацию о его последовательности.
Информация, включая измеренную массу предполагаемых пептидных ионов и их фрагментных ионов, затем сопоставляется с расчетными значениями массы из концептуального (in-silico) протеолиза и фрагментации баз данных белковых последовательностей. Успешное совпадение будет найдено, если его оценка превышает пороговое значение, определенное параметрами анализа. Даже если фактический белок не представлен в базе данных, устойчивое к ошибкам сопоставление позволяет предполагаемую идентификацию белка на основе сходства с гомологичными белками. Для выполнения этого анализа доступны различные программные пакеты.
Пакеты программного обеспечения обычно создают отчет, показывающий идентичность (код доступа) каждого идентифицированного белка, его оценку соответствия и предоставляют меру относительной силы совпадения, когда идентифицировано несколько белков.
Диаграмма сопоставленных пептидов в последовательности идентифицированного белка часто используется для демонстрации покрытия последовательности (% белка, обнаруженного как пептиды). Если предполагается, что POI значительно меньше, чем соответствующий белок, диаграмма может предложить, является ли POI N- или C-концевым фрагментом идентифицированного белка.

Последовательность de novo [ править ]

Характер фрагментации пептида позволяет напрямую определять его последовательность путем секвенирования de novo . Эта последовательность может использоваться для сопоставления баз данных последовательностей белков или для исследования посттрансляционных или химических модификаций. Это может предоставить дополнительные доказательства для идентификации белков, выполненной, как указано выше.

N- и C-конец [ править ]

Пептиды, сопоставленные во время идентификации белка, не обязательно включают N- или C-концы, предсказанные для сопоставленного белка. Это может быть результатом того, что N- или C-концевые пептиды трудно идентифицировать с помощью MS (например, слишком короткие или слишком длинные), посттрансляционно модифицированные (например, N-концевое ацетилирование) или действительно отличные от предсказанных. Посттрансляционные модификации или усеченные концы могут быть идентифицированы путем более тщательного изучения данных (т.е. секвенирования de novo ). Также может быть полезно повторное расщепление с использованием протеазы различной специфичности.

Посттрансляционные модификации [ править ]

Хотя подробное сравнение данных MS с прогнозами, основанными на известной последовательности белка, может использоваться для определения посттрансляционных модификаций, могут также использоваться целевые подходы к сбору данных. Например, специфическое обогащение фосфопептидов может помочь в идентификации сайтов фосфорилирования в белке. Альтернативные методы фрагментации пептидов в масс-спектрометре, такие как ETD или ECD , могут дать информацию о комплементарной последовательности.

Определение всей массы [ править ]

Полная масса белка - это сумма масс его аминокислотных остатков плюс масса молекулы воды с поправкой на любые посттрансляционные модификации. Хотя белки ионизируются хуже, чем пептиды, полученные из них, белок в растворе может быть подвергнут ESI-MS и его масса измерена с точностью до 1 части из 20 000 или лучше. Этого часто бывает достаточно, чтобы подтвердить концы (таким образом, что измеренная масса белка совпадает с предсказанной его последовательностью) и сделать вывод о наличии или отсутствии многих посттрансляционных модификаций.

Ограничения [ править ]

Протеолиз не всегда дает набор легко анализируемых пептидов, покрывающих всю последовательность POI. Фрагментация пептидов в масс-спектрометре часто не дает ионов, соответствующих расщеплению каждой пептидной связи. Таким образом, выведенная последовательность для каждого пептида не обязательно является полной. Стандартные методы фрагментации не различают остатки лейцина и изолейцина, поскольку они изомерные.

Поскольку деградация по Эдману происходит от N-конца белка, она не будет работать, если N-конец был химически модифицирован (например, путем ацетилирования или образования пироглутаминовой кислоты). Деградация по Эдману обычно не используется для определения положения дисульфидных мостиков. Он также требует количества пептида 1 пикомоль или выше для различимых результатов, что делает его менее чувствительным, чем масс-спектрометрия .

Прогнозирование по последовательностям ДНК / РНК [ править ]

В биологии белки производятся путем трансляции информационной РНК (мРНК) с последовательностью белка, происходящей из последовательности кодонов в мРНК. Сама мРНК образуется в результате транскрипции генов и может быть дополнительно модифицирована. Эти процессы достаточно изучены, чтобы использовать компьютерные алгоритмы для автоматизации предсказаний последовательностей белков на основе последовательностей ДНК, например, из проектов секвенирования ДНК всего генома, и привели к созданию больших баз данных последовательностей белков, таких как UniProt . Предсказанные белковые последовательности являются важным ресурсом для идентификации белков с помощью масс-спектрометрии.

Исторически короткие последовательности белка (от 10 до 15 остатков), определенные деградацией по Эдману, были обратно транслированы в последовательности ДНК, которые можно было использовать в качестве зондов или праймеров для выделения молекулярных клонов соответствующего гена или комплементарной ДНК. Затем определяли последовательность клонированной ДНК и использовали ее для определения полной аминокислотной последовательности белка.

Инструменты биоинформатики [ править ]

Существуют инструменты биоинформатики для помощи в интерпретации масс-спектров (см. Секвенирование пептидов De novo ), для сравнения или анализа белковых последовательностей (см. Анализ последовательностей ) или поиска в базах данных с использованием пептидных или белковых последовательностей (см. BLAST ).

См. Также [ править ]

Протеомика
Секвенирование ДНК
Клаус Биманн
Дональд Ф. Хант
Матиас Манн
Джон Р. Йейтс

Ссылки [ править ]

^ Богосян G, Виоланд BN, Dorward-King EJ, Workman WE, Jung PE, Kane JF (январь 1989). «Биосинтез и включение в белок норлейцина Escherichia coli». Журнал биологической химии . 264 (1): 531–9. PMID 2642478 .
^ Михаил А. Альтерман; Питер Ханзикер (2 декабря 2011 г.). Аминокислотный анализ: методы и протоколы . Humana Press. ISBN 978-1-61779-444-5.
^ Edman P, Begg G (март 1967). «Секвенатор белка». Европейский журнал биохимии . 1 (1): 80–91. DOI : 10.1111 / j.1432-1033.1967.tb00047.x . PMID 6059350 .
^ Шевченко А, Томас Н, Havlis Дж, Olsen СП, Манн М (2006). «Расщепление в геле для масс-спектрометрической характеристики белков и протеомов». Протоколы природы . 1 (6): 2856–60. DOI : 10.1038 / nprot.2006.468 . PMID 17406544 .
^ Gundry RL, White MY, Мюррей CI, Кейн LA, Fu Q, Стэнли Б., Ван Эйк JE (октябрь 2009). «Подготовка белков и пептидов для масс-спектрометрического анализа в восходящем потоке протеомики» . Текущие протоколы в молекулярной биологии . Глава 10: Unit10.25. DOI : 10.1002 / 0471142727.mb1025s88 . PMC 2905857 . PMID 19816929 .

Дальнейшее чтение [ править ]

Стин Х., Манн М (сентябрь 2004 г.). «ABC (и XYZ) пептидного секвенирования». Обзоры природы Молекулярная клеточная биология . 5 (9): 699–711. DOI : 10.1038 / nrm1468 . PMID 15340378 .

[1] Богосян G, Виоланд BN, Dorward-King EJ, Workman WE, Jung PE, Kane JF (январь 1989). «Биосинтез и включение в белок норлейцина Escherichia coli». Журнал биологической химии . 264 (1): 531–9. PMID 2642478 .

[AltermanHunziker2011-2] Михаил А. Альтерман; Питер Ханзикер (2 декабря 2011 г.). Аминокислотный анализ: методы и протоколы . Humana Press. ISBN 978-1-61779-444-5.

[3] Edman P, Begg G (март 1967). «Секвенатор белка». Европейский журнал биохимии . 1 (1): 80–91. DOI : 10.1111 / j.1432-1033.1967.tb00047.x . PMID 6059350 .

[4] Шевченко А, Томас Н, Havlis Дж, Olsen СП, Манн М (2006). «Расщепление в геле для масс-спектрометрической характеристики белков и протеомов». Протоколы природы . 1 (6): 2856–60. DOI : 10.1038 / nprot.2006.468 . PMID 17406544 .

[5] Gundry RL, White MY, Мюррей CI, Кейн LA, Fu Q, Стэнли Б., Ван Эйк JE (октябрь 2009). «Подготовка белков и пептидов для масс-спектрометрического анализа в восходящем потоке протеомики» . Текущие протоколы в молекулярной биологии . Глава 10: Unit10.25. DOI : 10.1002 / 0471142727.mb1025s88 . PMC 2905857 . PMID 19816929 .

[1]

vтеБелки : основные методы исследования
Экспериментальный	Очистка белков Зеленый флуоресцентный белок Вестерн-блоттинг Иммуноокрашивание белков Секвенирование белков Гель-электрофорез / Белковый электрофорез Иммунопреципитация белков Масс-фингерпринт пептидов / масс-спектрометрия белков Двухполяризационная интерферометрия Микромасштабный термофорез Иммунопреципитация хроматина Поверхностный плазмонный резонанс Изотермическая калориметрия титрования Рентгеновская кристаллография ЯМР белков Крио-электронная микроскопия Электронная микроскопия замерзания трещин
Биоинформатика	Прогноз структуры белка Белок-белковая стыковка Структурное выравнивание белков Онтология белка Прогнозирование белок-белкового взаимодействия
Анализ	Ферментный анализ Протеиновый анализ Анализ секреции
Методы отображения	Бактериальный дисплей отображение мРНК Фаговый дисплей Рибосомный дисплей Дисплей дрожжей
Микроскопия сверхвысокого разрешения	Фотоактивированная локализационная микроскопия Вертико СМИ