Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Гексамерный тор белка LSm Hfq, показывающий остов пептида, причем каждый белок имеет разный цвет, каждая бета-цепь представлена ​​в виде ленты, каждая альфа-спираль - в виде цилиндра, а олигонуклеотид РНК - в виде дуги 300 °.

В молекулярной биологии , LSM белки представляют собой семейство РНК - связывающий белки , найденные в практически в каждом клеточном организме . LSm - это сокращение от «like Sm», потому что первыми идентифицированными членами семейства белков LSm были белки Sm . LSM белки определяются характерной трехмерной структуры и их сборки в кольцах шести или семи отдельных LSM белковых молекул , а также воспроизводить большое количество различных ролей в мРНК обработки и регулирования.

Белки Sm были впервые обнаружены как антигены, нацеленные на так называемые антитела против Sm, у пациента с формой системной красной волчанки (СКВ), изнурительного аутоиммунного заболевания . Они были названы белками Sm в честь Стефани Смит, пациентки, страдающей СКВ. [1] Впоследствии были обнаружены и другие белки с очень похожей структурой, получившие название LSm-белки. Идентификация и регистрация новых членов семейства белков LSm продолжается.

Белки с похожей структурой сгруппированы в иерархию семейств белков, суперсемейств и складок. Структура белка LSm представляет собой пример небольшого бета-листа, свернутого в короткий ствол. Индивидуальные белки LSm собираются в кольцеобразное кольцо из шести или семи членов (правильнее называть тор ), которое обычно связывается с небольшой молекулой РНК с образованием рибонуклеопротеинового комплекса. Тор LSm помогает молекуле РНК принимать и поддерживать свою правильную трехмерную структуру. В зависимости от того, какие белки LSm и молекула РНК задействованы, этот комплекс рибонуклеопротеидов способствует широкому разнообразию процессинга РНК, включая деградацию, редактирование, сплайсинг и регуляцию.

Альтернативные термины для семейства LSm - это LSm-свертка и Sm-подобная свертка , а альтернативные стили использования заглавных букв, такие как lsm , LSM и Lsm, являются общими и одинаково приемлемыми.

История [ править ]

Открытие антигена Смита [ править ]

История открытия первых белков LSm начинается с молодой женщины Стефани Смит, у которой в 1959 году была диагностирована системная красная волчанка (СКВ) , которая в конечном итоге скончалась от осложнений этого заболевания в 1969 году в возрасте 22 лет [1]. В течение этого периода она лечилась в больнице Нью-Йоркского университета Рокфеллера под присмотром доктора Генри Кункеля и доктора Энга Тана. Как и люди с аутоиммунным заболеванием , пациенты с СКВ вырабатывают антитела к антигенам в ядрах своих клеток , чаще всего к собственной ДНК . Однако в 1966 году д-р Кункель и д-р Тан обнаружили, что г-жа Смит произвелаантитела к набору ядерных белков, которые они назвали « антигеном Смита » ( Sm Ag ). [2] Около 30% пациентов с СКВ вырабатывают антитела к этим белкам в отличие от двухцепочечной ДНК. Это открытие улучшило диагностику СКВ, но природа и функция этого антигена были неизвестны.

Белки Sm, мяРНП, сплайсинг сплайсосомы и информационной РНК [ править ]

Исследования продолжались в 1970-х и начале 1980-х годов. Было обнаружено, что антиген Смита представляет собой комплекс молекул рибонуклеиновой кислоты ( РНК ) и нескольких белков. Набор уридина -Rich малых ядерных РНК ( мяРНК ) молекулы была частью этого комплекса, и дали имена U1 , U2 , U4 , U5 и U6 . Были обнаружены четыре из этих snRNAs (U1, U2, U4 и U5) , чтобы быть тесно связан с несколькими небольшими белками, которые были названы SmB , СМД, SME , Smf и SMG в порядке убывания размера. SmB имеет альтернативный вариант сращивания,SmB ' и очень похожий белок SmN заменяет SmB' / B в определенных (в основном нервных) тканях. Позже было обнаружено, что SmD представляет собой смесь трех белков, которые были названы SmD1 , SmD2 и SmD3 . Эти девять белков (SmB, SmB ', SmN, SmD1, SmD2, SmD3, SmE, SmF и SmG) стали известны как основные белки Sm или просто белки Sm . МнРНК образуют комплекс с белками ядра Sm и с другими белками с образованием частиц в ядре клетки, называемых малыми ядерными рибонуклеопротеидами или мяРНП . К середине 1980-х стало ясно, что эти snRNP помогают формировать большую (4,8 MDмолекулярной массы ), называемый сплайсосомой , вокруг пре-мРНК , вырезающий части пре-мРНК, называемые интронами, и сплайсинг кодирующих частей ( экзонов ) вместе. [3] После еще нескольких модификаций сплайсированная пре-мРНК становится информационной РНК (мРНК), которая затем экспортируется из ядра и транслируется в белок рибосомами .

Открытие белков, похожих на белки Sm [ править ]

МяРНК U6 (в отличие от U1, U2, U4 и U5) не связывается с белками Sm, даже несмотря на то, что мяРНП U6 является центральным компонентом сплайсосомы . В 1999 году был обнаружен белковый гетеромер, который специфически связывается с U6 и состоит из семи белков, явно гомологичных белкам Sm. Эти белки были обозначены как LSm (как и Sm) белки ( LSm1 , LSm2 , LSm3 , LSm4 , LSm5 , LSm6 и LSm7 ), а аналогичный белок LSm8 был идентифицирован позже. В бактерии Escherichia coli Sm-подобный белок HF-I, кодируемый геном hfqбыл описан в 1968 г. как существенный ч оста ф актер РНК бактериофага Q репликацию р. Геном из Saccharomyces CEREVISIAE (хлебопекарных дрожжей) был секвенирован в середине 1990-х годов, предоставляя богатый ресурс для идентификации гомологов этих белков человека. Впоследствии, когда было секвенировано больше геномов эукариот , стало ясно, что эукариоты, как правило, имеют общие гомологи с одним и тем же набором из семи белков Sm и восьми белков LSm. [4] Вскоре после этого белки, гомологичные этим белкам LSm эукариот, были обнаружены у архей ( Sm1 и Sm2 ) иБактерии ( гомологи Hfq и YlxS ). [5] LSm-белки архей больше похожи на LSm-белки эукариот, чем на бактериальные LSm-белки. Белки LSm, описанные до сих пор, были довольно небольшими белками, варьирующими от 76 аминокислот ( молекулярная масса 8,7 кДа ) для человеческого SmG до 231 аминокислоты (молекулярная масса 29 кДа) для человеческого SmB. Но недавно были обнаружены более крупные белки, которые включают структурный домен LSm в дополнение к другим структурным доменам белка (например, LSm10 , LSm11 , LSm12 , LSm13 , LSm14 , LSm15, LSm16 , атаксин-2 , а также архейные Sm3 ).

Открытие LSm-фолда [ править ]

Примерно в 1995 году сравнения между различными гомологами LSm выявили два мотива последовательности длиной 32 нуклеиновых кислоты (14 аминокислот), которые были очень похожи в каждом гомологе LSm и были разделены неконсервативной областью переменной длины. Это указывало на важность этих двух мотивов последовательности (названных Sm1 и Sm2 ) и предполагало, что все гены белка LSm произошли от одного предкового гена. [6] В 1999 году были приготовлены кристаллы рекомбинантных белков Sm, что позволило провести рентгеновскую кристаллографию и определить их атомную структуру в трех измерениях. [7] Это продемонстрировало, что белки LSm имеют одинаковый трехмерныйскладка короткой альфа-спирали и пятицепочечного сложенного бета-листа , впоследствии названная LSm-складкой . Другие исследования показали, что белки LSm собираются в тор (кольцеобразное кольцо) из шести или семи белков LSm, и что РНК связывается с внутренней частью тора, причем один нуклеотид связан с каждым белком LSm.

Структура [ править ]

Вторичная структура LSm, показывающая N-концевую альфа-спираль и пятицепочечный антипараллельный бета-лист.
Белок LSm SmD1 человека, показывающий описание основной цепи восьмицепочечного бета-сэндвич-пептида. (Петля сгиба бета-листа проходит по нижней части изображения.)

Фосфат уридина связывается в Sm1 архей между петлей β2b / β3a и петлей β4b / β5. Урацил укладывается между гистидином и аргинином остатками, стабилизированным водородной связью к аспарагину остатку и образованием водородных связей между аспартатами остатком и рибозой . Белки LSm характеризуются бета-слоем ( вторичная структура ), свернутым в складку LSm ( третичная структура ), полимеризацией в шести- или семичленный тор ( четвертичная структура ) и связыванием с РНК. олигонуклеотиды . [8] современная парадигма классифицирует белки на основе структуры белка и является в настоящее время активное поле, с тремя основными подходами, СКОП ( S tructural С lassification о е р roteins), Cath ( С Lass, rchitecture, Т opology, H omologous надсемейство), и FSSP / DALI ( F amilies из S tructurally S imilar P roteins).

Вторичный [ править ]

Вторичная структура белка LSM представляет собой небольшой пять-нить антипараллельно бета - листа , с нитями , идентифицированных от N-терминального конца к C-концу , как & beta ; 1, & beta ; 2, & beta ; 3, β4, β5. Класс SCOP для всех бета-белков и класс CATH для Mainly Beta определяются как белковые структуры, которые в основном представляют собой бета-листы, включая LSm. Мотив последовательности SM1соответствует цепям β1, β2, β3, а мотив последовательности SM2 соответствует цепям β4 и β5. Первые четыре бета-нити примыкают друг к другу, но β5 примыкает к β1, превращая общую структуру в короткий ствол. Эта структурная топология описана как 51234. Короткая (от двух до четырех витков) N-концевая альфа-спираль также присутствует в большинстве белков LSm. Нити β3 и β4 короткие в некоторых белках LSm и разделены неструктурированной спиралью переменной длины. Нити β2, β3 и β4 сильно изогнуты примерно на 120 ° в своих средних точках. Изгибы в этих цепях часто представляют собой глицин , а боковые цепи, расположенные внутри бета-ствола, часто представляют собой гидрофобные остатки валина , лейцина ,изолейцин и метионин .

Высшее [ править ]

SCOP просто классифицирует структуру LSm как Sm-подобную складку , одну из 149 различных складок бета-белка, без каких-либо промежуточных группировок. Бета-лист LSm резко изогнут и описывается как архитектура Roll в CATH (одна из 20 различных архитектур бета-белков в CATH). Одна из бета-прядей (β5 в LSm) пересекает открытый край рулона, образуя небольшую цилиндрическую топологию типа SH3 (одна из 33 топологий бета-валков в CATH). CATH перечисляет 23 гомологичных суперсемейства с цилиндрической топологией типа SH3, одним из которых является структура LSm ( RNA Binding Proteinв системе CATH). SCOP продолжает свою структурную классификацию после складывания до суперсемейства, семейства и домена, в то время как CATH продолжает свою структурную классификацию до семейств последовательностей, но эти подразделения более точно описаны в разделе «Эволюция и филогения».

Бочкообразная третичная структура SH3-типа складки LSm образована сильно изогнутыми (около 120 °) нитями β2, β3 и β4, при этом цилиндрическая структура закрывается цепью β5. Подчеркивая третичную структуру, каждую изогнутую бета-цепь можно описать как две более короткие бета-цепи. Сгиб LSm можно рассматривать как антипараллельный бета-сэндвич из восьми нитей , с пятью нитями в одной плоскости и тремя нитями в параллельной плоскости с углом наклона около 45 ° между двумя половинами бета-сэндвича. Короткая (от двух до четырех витков) N-концевая альфа-спираль находится на одном крае бета-сэндвича. Эта альфа-спираль и бета-цепи могут быть помечены (от N-конца до C-конца) α, β1, β2a, β2b, β3a, β3b, β4a, β4b, β5, где a и b относятся либо к двум половинкам изогнутой нити в описании с пятью нитями, либо к отдельным нитям в восьмицепочечной нити. описание. Каждая цепь (в описании восьми цепей) образована из пяти аминокислотных остатков. Включая изгибы и петли между нитями и альфа-спираль, около 60 аминокислотных остатков вносят вклад в LSm-складку, но это варьируется между гомологами из-за различий в межцепочечных петлях, альфа-спирали и даже длинах β3b и Нити β4a.

Четвертичный [ править ]

Белки LSm обычно собираются в кольцо LSm , шести- или семичленный тор , диаметром около 7  нанометров с отверстием 2 нанометра. Условие родовым является homohexamer или homoheptamer одинаковых LSM субъединиц. Белки LSm у эукариот образуют гетерогептамерысеми различных субъединиц LSm, таких как белки Sm. Связывание между белками LSm лучше всего понять с помощью восьмицепочечного описания укладки LSm. Пятицепочечная половина бета-сэндвича одной субъединицы совпадает с трехнитевой половиной бета-сэндвича соседней субъединицы, образуя скрученный 8-нитевой бета-лист Aβ4a / Aβ3b / Aβ2a / Aβ1 / Aβ5 / Bβ4b / Bβ3a / Bβ2b, где A и B относятся к двум различным субъединицам. Помимо водородных связей между бета-цепями Aβ5 и Bβ4b двух субъединиц белка LSm, существуют энергетически выгодные контакты между боковыми цепями гидрофобных аминокислот внутри области контакта и энергетически выгодные контакты между гидрофильными боковые цепи аминокислот по периферии области контакта.

Связывание олигонуклеотидов РНК [ править ]

Кольца LSm образуют комплексы рибонуклеопротеидов с олигонуклеотидами РНК , сила связывания которых различается от очень стабильных комплексов (таких как snRNPs класса Sm) до временных комплексов. Олигонуклеотиды РНК обычно связываются внутри отверстия (просвета) тора LSm, по одному нуклеотиду на субъединицу LSm, но сообщалось о дополнительных сайтах связывания нуклеотидов в верхней части ( сторона α-спирали ) кольца. Точная химическая природа этого связывания варьируется, но общие мотивы включают укладку гетероциклического основания (часто урацила ) между плоскими боковыми цепями двух аминокислот, водородную связь с гетероциклическим основанием и / или рибозой и солевые мостики.к фосфатной группе.

Функции [ править ]

Различные типы колец LSm действуют как каркасы или шапероны для олигонуклеотидов РНК , помогая РНК принимать и поддерживать правильную трехмерную структуру. В некоторых случаях это позволяет олигонуклеотидной РНК каталитически функционировать как рибозим . В других случаях это облегчает модификацию или деградацию РНК или сборку, хранение и внутриклеточный транспорт рибонуклеопротеидных комплексов. [9]

Sm кольцо [ править ]

Sm кольцо находится в ядре всех эукариот (около 2,5 × 10 6 копий в пролиферирующие клетки человека), и имеет лучшие понятные функции. Кольцо Sm представляет собой гетерогептамер . Молекула мяРНК класса Sm (в направлении от 5 'к 3') входит в просвет (бублик) в субъединице SmE и движется последовательно по часовой стрелке (если смотреть со стороны α-спирали) внутри просвета (бублика), субъединицы SmG, SmD3, SmB, SmD1, SmD2, выходящие из субъединицы SmF. [10] (SmB может быть заменен вариантом сплайсинга SmB 'и SmN в нервных тканях.) Кольцо Sm постоянно связывается с мяРНК U1, U2, U4 и U5, которые образуют четыре из пятиsnRNP, которые составляют главную сплайсосому . Sm кольцо также постоянно связывается с U11 , U12 и U4atac snRNAs , которые образуют четыре из пять мяРНПа ( в том числе U5 snRNP) , которые составляют незначительную сплайсосому . Обе эти сплайсосомы являются центральными комплексами процессинга РНК при созревании матричной РНК из пре-мРНК . Сообщалось также, что белки Sm являются частью рибонуклеопротеинового компонента теломеразы . [11]

Кольцо лсм2-8 [ править ]

Два Lsm2-8 snRNP (U6 и U6atac ) выполняют ключевую каталитическую функцию в основных и второстепенных сплайсосомах. Эти мяРНП не включают Sm кольцо, но вместо того, чтобы использовать heteroheptameric Lsm2-8 кольцо . Кольца LSm примерно в 20 раз менее распространены, чем кольца Sm. Порядок этих семи белков LSm в этом кольце неизвестен, но, основываясь на гомологии аминокислотной последовательности с белками Sm, предполагается, что мяРНК (в направлении от 5 'до 3') может сначала связываться с LSm5 и предшествовать ей. последовательно по часовой стрелке к LSm7, LSm4, LSm8, LSm2, LSm3 и выходу на субъединице LSm6. Эксперименты с Saccharomyces cerevisiae(у почкующихся дрожжей) мутации предполагают, что кольцо Lsm2-8 помогает реассоциации snRNP U4 и U6 в ди-snRNP U4 / U6 . [12] (После завершения делеции экзона и сплайсинга интронов эти два snRNP должны повторно объединиться для сплайсосомы, чтобы инициировать другой цикл сплайсинга экзона / интрона. В этой роли кольцо Lsm2-8 действует как шаперон РНК, а не каркас РНК. Кольцо Lsm2-8 также образует мяРНП с малой ядрышковой РНК U8 (мяРНК), которая локализуется в ядрышке . Этот рибонуклеопротеидный комплекс необходим для обработки рибосомной РНК и перевода РНК в их зрелые формы. [13]Lsm2-8 кольцо , как сообщается, играют определенную роль в обработке пре-P РНК в РНКазы Р РНК . В отличие от кольца Sm, кольцо Lsm2-8 не связывается постоянно со своими мяРНК и мяРНК.

Кольцо Sm10 / Sm11 [ править ]

Существует второй тип кольца Sm, в котором LSm10 заменяет SmD1, а LSm11 заменяет SmD2. LSm11 представляет собой двухдоменный белок с C-концевым доменом, который является доменом LSm. Это гетерогептамерное кольцо связывается с мяРНК U7 в мяРНП U7 . Обработка The U7 snRNP опосредует 3' UTR стволовых петли из гистона мРНК в ядре. [14] Как и кольцо Sm, оно собирается в цитоплазме на мяРНК U7 с помощью специализированного комплекса SMN.

Lsm1-7 кольцо [ править ]

Второй тип кольца Lsm - это кольцо Lsm1-7 , которое имеет ту же структуру, что и кольцо Lsm2-8, за исключением того, что LSm1 заменяет LSm8. В отличие от кольца Lsm2-8, кольцо Lsm1-7 локализуется в цитоплазме, где оно способствует деградации матричной РНК в рибонуклеопротеидных комплексах. Этот процесс контролирует оборот информационной РНК, так что рибосомная трансляция мРНК в белок быстро реагирует на изменения транскрипции ДНК в матричную РНК клеткой.

Gemin6 и Gemin7 [ править ]

Комплекс SMN (описанный в разделе «Биогенез мяРНП») состоит из белка SMN и Gemin2-8 . Два из них, Gemin 6 и Gemin7 , как было обнаружено, имеют структуру LSm и образуют гетеродимер. Они могут выполнять функцию шаперона в комплексе SMN, помогая формированию кольца Sm на мяРНК класса Sm . [15] Комплекс PRMT5 состоит из PRMT5 , pICln , WD45 (Mep50) . pICln помогает сформировать открытое кольцо Sm на комплексе SMN. Комплекс SMN помогает в сборке snRNPsгде кольцо Sm находится в открытой конформации на комплексе SMN, и это кольцо Sm загружено на мяРНК комплексом SMN. [16]

LSm12-16 и другие многодоменные белки LSm [ править ]

В LSm12-16 белки были описаны совсем недавно. Это двухдоменные белки с N-концевым доменом LSm и C-концевым доменом метилтрансферазы. [17] Очень мало известно о функции этих белков, но предположительно они являются членами колец LSm-доменов, которые взаимодействуют с РНК. Есть некоторые доказательства того, что LSm12, возможно, участвует в деградации мРНК, а LSm13-16 может играть роль в регуляции митоза . Большой белок неизвестной функции, атаксин-2 , связанный с нейродегенеративным заболеванием, спиноцеребеллярной атаксией 2 типа , также имеет N-концевой LSm-домен.

Кольца из архей Sm [ править ]

Два белка LSm обнаружены во втором домене жизни, архее . Это белки Sm1 и Sm2 (не путать с мотивами последовательностей Sm1 и Sm2 ), и по этой причине их иногда идентифицируют как S m-подобные a rchaeal p roteins SmAP1 и SmAP2 . [18] Sm1 и Sm2 обычно образуют гомогептамерные кольца, хотя наблюдались гомогексамерные кольца. Кольца Sm1 похожи на кольца Lsm эукариот в том, что они образуются в отсутствие РНК, в то время как кольца Sm2 похожи на кольца эукариотSm кольца в том , что они требуют уридин -богатой РНК для их образования. Сообщалось, что они связаны с РНК РНКазы Р , что предполагает их роль в процессинге транспортной РНК , но их функция в архее в этом процессе (и, возможно, процессинг другой РНК, такой как рибосомная РНК ) в основном неизвестна. Одна из двух основных ветвей архей, кренархеоты, имеют третий известный тип архейного белка LSm, Sm3 . Это двухдоменный белок с N-концевым доменом LSm, который образует гомогептамер.звенеть. Ничего не известно о функции этого белка LSm, но предположительно он взаимодействует с РНК и, вероятно, помогает ей обрабатывать РНК в этих организмах.

Бактериальные кольца LSm [ править ]

Сообщалось о нескольких белках LSm, относящихся к третьей области жизни - бактериям . Белок Hfq образует гомогексамерные кольца и первоначально был обнаружен как необходимый для инфицирования бактериофагом Qβ , хотя это явно не является нативной функцией этого белка у бактерий. Он присутствует не во всех бактериях, но был обнаружен у Proteobacteria , Firmicutes , Spirochaetes , Thermotogae , Aquificae и одного вида архей . (Этот последний случай, вероятно, является случаем горизонтального переноса генов .) Hfq - этоплейотропный с множеством взаимодействий, обычно связанных с регуляцией трансляции . К ним относятся блокирование связывания рибосом с мРНК , маркировка мРНК для деградации путем связывания с их поли-A-хвостами и ассоциация с бактериальными малыми регуляторными РНК (такими как РНК DsrA), которые контролируют трансляцию путем связывания с определенными мРНК . [19] [20] Второй бактериальный белок LSm - это YlxS (иногда также называемый YhbC), который впервые был идентифицирован у почвенной бактерии Bacillus subtilis . Это двухдоменный белок с N-концевым доменом LSm. Его функция неизвестна, но гомологи аминокислотной последовательности are found in virtually every bacterial genome to date, and it may be an essential protein.[21] The middle domain of the small conductance mechanosensitive channel MscS in Escherichia coli forms a homoheptameric ring.[22] This LSm domain has no apparent RNA-binding function, but the homoheptameric torus is part of the central channel of this membrane protein.

Evolution and phylogeny[edit]

LSm homologs are found in all three domains of life, and may even be found in every single organism. Computational phylogenetic methods are used to infer phylogenetic relations. Sequence alignment between the various LSm homologs are the appropriate tool for this, such as multiple sequence alignment of the primary structure (amino acid sequence), and structural alignment of the tertiary structure (three-dimensional structure). It is hypothesized that a gene for a LSm protein was present in the last universal ancestor of all life.[23] Based on the functions of known LSm proteins, this original LSm protein may have assisted ribozymes in the processing of RNA for synthesizing proteins as part of the RNA world hypothesis of early life. According to this view, this gene was passed from ancestor to descendant, with frequent mutations, gene duplications and occasional horizontal gene transfers. In principle, this process can be summarized in a phylogenetic tree with the root in the last universal ancestor (or earlier), and with the tips representing the universe of LSm genes existing today.

Homomeric LSm rings in bacteria and archaea[edit]

Based on structure, the known LSm proteins divide into a group consisting of the bacterial LSm proteins (Hfq, YlxS and MscS) and a second group of all other LSm proteins, in accordance with the most recently published phylogenetic trees.[24] The three archaeal LSm proteins (Sm1, Sm2 and Sm3) also cluster as a group, distinct from the eukaryote LSm proteins. Both the bacterial and archaeal LSm proteins polymerize to homomeric rings, which is the ancestral condition.

Heteromeric LSm rings in eukaryotes[edit]

A series of gene duplications of a single eukaryote LSm gene resulted in most (if not all) of the known eukaryote LSm genes. Each of the seven Sm proteins has greater amino acid sequence homology to a corresponding Lsm protein than to the other Sm proteins. This suggests that an ancestral LSm gene duplicated several times, resulting in seven paralogs. These subsequently diverged from each other so that the ancestral homoheptamer LSm ring became a heteroheptamer ring. Based on the known functions of LSm proteins in eukaryotes and archaea, the ancestral function may have been processing of pre-ribosomal RNA, pre-transfer RNA, and pre-RNase P. Then, according to this hypothesis, the seven ancestral eukaryote LSm genes duplicated again to seven pairs of Sm/LSm paralogs; LSm1/SmB, LSm2/SmD1, LSm3/SmD2, LSm4/SmD3, LSm5/SmE, LSm6/SmF and LSm7/SmG. These two group of seven LSm genes (and the corresponding two kinds of LSm rings) evolved to an Sm ring (requiring RNA) and a Lsm ring (which forms without RNA). The LSm1/LSm8 paralog pair also seems to have originated prior to the last common eukaryote ancestor, for a total of at least 15 LSm protein genes. The SmD1/LSm10 paralog pair and the SmD2/LSm11 paralog pair exist only in animals, fungi, and the amoebozoa (sometimes identified as the unikont clade) and appears to be absent in the bikont clade (chromalveolates, excavates, plants and rhizaria). Therefore, these two gene duplications predated this fundamental split in the eukaryote lineage. The SmB/SmN paralog pair is seen only in the placental mammals, which dates this LSm gene duplication.

Biogenesis of snRNPs[edit]

Small nuclear ribonucleoproteins (snRNPs) assemble in a tightly orchestrated and regulated process that involves both the cell nucleus and cytoplasm.[25]

References[edit]

  1. ^ a b Reeves WH, Narain S, Satoh M (2003). "Henry Kunkel, Stephanie Smith, clinical immunology, and split genes". Lupus. 12 (3): 213–7. doi:10.1191/0961203303lu360xx. PMID 12708785. S2CID 33112464.
  2. ^ Tan EM, Kunkel HG (March 1966). "Characteristics of a soluble nuclear antigen precipitating with sera of patients with systemic lupus erythematosus". J. Immunol. 96 (3): 464–71. PMID 5932578.
  3. ^ Will CL, Lührmann R (June 2001). "Spliceosomal UsnRNP biogenesis, structure and function". Curr. Opin. Cell Biol. 13 (3): 290–301. doi:10.1016/S0955-0674(00)00211-8. hdl:11858/00-001M-0000-0012-F770-0. PMID 11343899.
  4. ^ He W, Parker R (June 2000). "Functions of Lsm proteins in mRNA degradation and splicing". Curr. Opin. Cell Biol. 12 (3): 346–50. doi:10.1016/S0955-0674(00)00098-3. PMID 10801455.
  5. ^ Törö I, Thore S, Mayer C, Basquin J, Séraphin B, Suck D (May 2001). "RNA binding in an Sm core domain: X-ray structure and functional analysis of an archaeal Sm protein complex". EMBO J. 20 (9): 2293–303. doi:10.1093/emboj/20.9.2293. PMC 125243. PMID 11331594.
  6. ^ Hermann H, Fabrizio P, Raker VA, Foulaki K, Hornig H, Brahms H, Lührmann R (May 1995). "snRNP Sm proteins share two evolutionarily conserved sequence motifs which are involved in Sm protein-protein interactions". EMBO J. 14 (9): 2076–88. doi:10.1002/j.1460-2075.1995.tb07199.x. PMC 398308. PMID 7744013.
  7. ^ Kambach C, Walke S, Young R, Avis JM, de la Fortelle E, Raker VA, Lührmann R, Li J, Nagai K (February 1999). "Crystal structures of two Sm protein complexes and their implications for the assembly of the spliceosomal snRNPs". Cell. 96 (3): 375–87. doi:10.1016/S0092-8674(00)80550-4. PMID 10025403. S2CID 17379935.
  8. ^ National Center for Biotechnology Information Structure Database PDB codes 1B34, 1D3B, 1I5L, 1KQ2, 1N9S, 1IB8.
  9. ^ Khusial P, Plaag R, Zieve GW (September 2005). "LSm proteins form heptameric rings that bind to RNA via repeating motifs". Trends Biochem. Sci. 30 (9): 522–8. doi:10.1016/j.tibs.2005.07.006. PMID 16051491.
  10. ^ Urlaub H, Raker VA, Kostka S, Lührmann R (January 2001). "Sm protein-Sm site RNA interactions within the inner ring of the spliceosomal snRNP core structure". EMBO J. 20 (1–2): 187–96. doi:10.1093/emboj/20.1.187. PMC 140196. PMID 11226169.
  11. ^ Seto AG, Zaug AJ, Sobel SG, Wolin SL, Cech TR (September 1999). "Saccharomyces cerevisiae telomerase is an Sm small nuclear ribonucleoprotein particle". Nature. 401 (6749): 177–80. Bibcode:1999Natur.401..177S. doi:10.1038/43694. PMID 10490028. S2CID 4414530.
  12. ^ Beggs JD (June 2005). "Lsm proteins and RNA processing". Biochem. Soc. Trans. 33 (Pt 3): 433–8. doi:10.1042/BST0330433. PMID 15916535.
  13. ^ Kufel J, Allmang C, Petfalski E, Beggs J, Tollervey D (January 2003). "Lsm Proteins are required for normal processing and stability of ribosomal RNAs". J. Biol. Chem. 278 (4): 2147–56. doi:10.1074/jbc.M208856200. PMID 12438310.
  14. ^ Schümperli D, Pillai RS (October 2004). "The special Sm core structure of the U7 snRNP: far-reaching significance of a small nuclear ribonucleoprotein" (PDF). Cell. Mol. Life Sci. 61 (19–20): 2560–70. doi:10.1007/s00018-004-4190-0. PMID 15526162. S2CID 5780814.
  15. ^ Ma Y, Dostie J, Dreyfuss G, Van Duyne GD (June 2005). "The Gemin6-Gemin7 heterodimer from the survival of motor neurons complex has an Sm protein-like structure". Structure. 13 (6): 883–92. doi:10.1016/j.str.2005.03.014. PMID 15939020.
  16. ^ Chari A, Golas MM, Klingenhäger M, Neuenkirchen N, Sander B, Englbrecht C, Sickmann A, Stark H, Fischer U (2008-10-31). "An Assembly Chaperone Collaborates with the SMN Complex to Generate Spliceosomal SnRNPs". Cell. 135 (3): 497–509. doi:10.1016/j.cell.2008.09.020. hdl:11858/00-001M-0000-0010-93A3-A. PMID 18984161. S2CID 119444.
  17. ^ Albrecht M, Lengauer T (July 2004). "Novel Sm-like proteins with long C-terminal tails and associated methyltransferases". FEBS Lett. 569 (1–3): 18–26. doi:10.1016/j.febslet.2004.03.126. PMID 15225602. S2CID 37187215.
  18. ^ Mura C, Kozhukhovsky A, Gingery M, Phillips M, Eisenberg D (April 2003). "The oligomerization and ligand-binding properties of Sm-like archaeal proteins (SmAPs)". Protein Sci. 12 (4): 832–47. doi:10.1110/ps.0224703. PMC 2323858. PMID 12649441.
  19. ^ Schumacher MA, Pearson RF, Møller T, Valentin-Hansen P, Brennan RG (July 2002). "Structures of the pleiotropic translational regulator Hfq and an Hfq-RNA complex: a bacterial Sm-like protein". EMBO J. 21 (13): 3546–56. doi:10.1093/emboj/cdf322. PMC 126077. PMID 12093755.
  20. ^ Lease RA, Woodson SA (December 2004). "Cycling of the Sm-like protein Hfq on the DsrA small regulatory RNA". J. Mol. Biol. 344 (5): 1211–23. doi:10.1016/j.jmb.2004.10.006. PMID 15561140.
  21. ^ Yu L, Gunasekera AH, Mack J, Olejniczak ET, Chovan LE, Ruan X, Towne DL, Lerner CG, Fesik SW (August 2001). "Solution structure and function of a conserved protein SP14.3 encoded by an essential Streptococcus pneumoniae gene". J. Mol. Biol. 311 (3): 593–604. doi:10.1006/jmbi.2001.4894. PMID 11493012.
  22. ^ Bass RB, Strop P, Barclay M, Rees DC (November 2002). "Crystal structure of Escherichia coli MscS, a voltage-modulated and mechanosensitive channel" (PDF). Science. 298 (5598): 1582–7. Bibcode:2002Sci...298.1582B. doi:10.1126/science.1077945. PMID 12446901. S2CID 15945269.
  23. ^ Achsel T, Stark H, Lührmann R (March 2001). "The Sm domain is an ancient RNA-binding motif with oligo(U) specificity". Proc. Natl. Acad. Sci. U.S.A. 98 (7): 3685–9. Bibcode:2001PNAS...98.3685A. doi:10.1073/pnas.071033998. PMC 31112. PMID 11259661.
  24. ^ Ciccarelli FD, Doerks T, von Mering C, Creevey CJ, Snel B, Bork P (March 2006). "Toward automatic reconstruction of a highly resolved tree of life". Science. 311 (5765): 1283–7. Bibcode:2006Sci...311.1283C. CiteSeerX 10.1.1.381.9514. doi:10.1126/science.1123061. PMID 16513982. S2CID 1615592.
  25. ^ Kiss T (December 2004). "Biogenesis of small nuclear RNPs". J. Cell Sci. 117 (Pt 25): 5949–51. doi:10.1242/jcs.01487. PMID 15564372.

External links[edit]

  • Pfam entry LSM. Pfam is the Sanger Institute database, which is a collection of protein families and domains.