生物化學與分子生物學/真核生物前體RNA的加工和降解
RNA的合成 -
原核生物轉錄的模板和酶 -
原核生物的轉錄過程 -
真核生物RNA的合成 -
真核生物前體RNA的加工和降解
真核生物轉錄生成的RNA分子是前體RNA(pre-RNA),也稱為初級RNA轉錄物(primary RNA transcript), 幾乎所有的初級RNA轉錄物都要經過加工,才能成為具有功能的成熟的RNA。加工主要在細胞核中進行。
真核前體mRNA經首、尾修飾、剪接和編輯加工後才能成熟
編輯真核生物前體mRNA合成後,需要進行5'-端和3'-端(首、尾部)的修飾以及對前體mRNA進行剪接(splicing), 才能成為成熟的mRNA,被轉運到核糖體,指導蛋白質翻譯。
前體mRNA在5'-端加入「帽」結構
編輯前體mRNA(precursor mRNA)也稱為初級mRNA轉錄物(primary mRNA transcript)或核不均一RNA(heterogeneous nuclear RNA, hnRNA)。大多數真核mRNA的5'-端有7-甲基鳥嘌呤的帽結構。RNA pol Ⅱ催化合成的新生RNA在長度達25~30個核苷酸時,其5'-端的核苷酸就與7-甲基鳥嘌呤核苷通過不常見的5',5'-三磷酸連接鍵相連。
加帽過程由加帽酶(capping enzyme)和甲基轉移酶(methyltransferase)催化完成。加帽酶有兩個亞基。在添加帽結構的過程中,此酶與 RNA pol Ⅱ的CTD結合在一起,其氨基端部分具有磷酸酶活性,其作用是去除新生RNA的5'-端核苷酸的γ-磷酸;其羧基端部分具有mRNA鳥苷酸轉移酶活性,將一個GTP分子中的GMP部分和新生RNA的5'端結合,形成5',5'-三磷酸結構;然後由S-腺苷甲硫氨酸先後提供甲基,使加上去的GMP中鳥嘌呤的N7和原新生RNA的5'-端核苷酸的核糖2'-O甲基巨化這兩步甲基化反應由不同的甲基轉移酶,即鳥嘌呤N-7甲基轉移酶和2'-O核糖甲基轉移酶進行催化的。
5'帽結構可以使mRNA免遭核酸酶的攻擊,也能與帽結合蛋白質複合體(cap-binding complex of protein)結合,並參與mRNA和核糖體的結合,啟動蛋白質的生物合成。
前體mRNA在3'-端特異位點斷裂並加上多聚腺苷酸尾
編輯真核mRNA,除了組蛋白的mRNA,在3'-端都有多聚腺苷酸[poly(A)]尾結構,約含80~250個腺苷酸。大多數已研究過的基因中,都沒有3'-端相應的多聚胸苷酸序列,說明poly(A)尾的出現是不依賴於DNA模板的。轉錄最初生成的前體mRNA 3'端長於成熟的mRNA。因此認為,加入poly(A)之前,先由核酸內切酶切去前體mRNA 3'端的一些核苷酸,然後加入poly(A)。前體mRNA上的斷裂點也是聚腺苷酸化(polyadenylation)的起始點,斷裂點的上游10~30nt有AAUAAA信號序列,斷裂點的下游20~40nt有富含G和U的序列,前者是特異序列,後者是非特異序列。在前體mRNA上也發現poly(A)尾巴,推測這一過程也應在核內完成,而且先於mRNA中段的剪接。尾部修飾是和轉錄終止同時進行的過程。
一般認為poly(A)的長度與mRNA的壽命呈正相關。隨着poly(A)縮短,以該mRNA作為模板的翻譯活性下降。因此推測,poly(A)的有無與長短與維持mRNA本身穩定性和mRNA作為翻譯模板的活性高度相關。一般真核生物在細胞質內出現的 mRNA, 其poly(A)長度在100~200個核苷酸之間,也有少數例外,如組蛋白基因的轉錄產物,無論是初級的或成熟的,都沒有poly(A)尾巴。
前體mRNA分子的斷裂和加poly(A)尾是多步驟過程。斷裂和聚腺苷酸化特異性因子(cleavage and polyadenylation specificity factor, CPSF)是由4條不同的多肽組成的蛋白質,分子質量為360kD。CPSF先與AAUAAA信號序列形成不穩定的複合體,然後至少有3種蛋白質——斷裂激動因子(cleavage stimulatory factor, CStF)、斷裂因子Ⅰ(cleavage factor Ⅰ, CFⅠ)、斷裂因子Ⅱ(CF Ⅱ)與CPSF-RNA複合體結合。CStF與斷裂點的下游富含G和U的序列相互作用能使形成的多蛋白複合體穩定。最後在前體mRNA分子斷裂之前,多聚腺苷酸聚合酶[poly(A) polymerase, PAP]加入到多蛋白質複合體,前體mRNA在斷裂點斷裂後,立即在斷裂產生的游離3'-0H進行多聚腺苷酸化。在加入大約前12個腺苷酸時,速度較慢,隨後快速加入腺苷酸,完成多聚腺苷酸化。多聚腺苷酸化的快速期有一種多聚腺苷酸結合蛋白Ⅱ[poly(A) binding protein Ⅱ, 簡稱PABPⅡ或PABⅡ,與細胞質里的腺苷酸結合蛋白PABP不同]參與,PABPⅡ和慢速期合成的多聚腺苷酸結合,提高多聚腺苷酸聚合酶合成多聚腺苷酸的速度。PABPⅡ的另一個功能是:當多聚腺苷酸尾結構達足夠長時,使多聚腺苷酸聚合酶停止作用。
前體mRNA的剪接主要是去除內含子
編輯真核基因結構最突出的特點是其不連續性,即:如果將成熟的 mRNA 分子序列與其基因序列比較,可以發現並不是全部的基因序列都保留在成熟的mRNA分子中,有一些區段被去除了,因此真核基因又稱為斷裂基因。
實際上,在細胞核內出現的初級轉錄物的分子量往往比在胞質內出現的成熟mRNA大幾倍,甚至數十倍。核酸序列分析證明,mRNA來自前體mRNA,而前體mRNA和DNA模板鏈可以完全配對。前體mRNA中被剪接去除的核酸序列為內含子的序列,而最終出現在成熟mRNA分子中、作為模板指導蛋白質翻譯的序列為外顯子序列。去除初級轉錄物上的內含子,把外顯子連接為成熟RNA的過程稱為mRNA剪接。
以雞的卵清蛋白基因為例說明 mRNA 剪接:卵清蛋白基因全長為7.7kb, 有8個外顯子和7個內含子。初級轉錄物即前體mRNA是和相應的基因等長的,說明內含子也存在於初級轉錄物中。成熟的 mRNA 分子長度約為1.2kb, 編碼386個胺基酸。
- 內含子形成套索RNA被剪除 剪接首先涉及套索RNA(lariat RNA)的形成,即內含子區段彎曲,使相鄰的兩個外顯子互相靠近而利於剪接。
- 內含子在剪接接口處剪除 從前體mRNA一級結構分析及特性的研究,目前對剪接已有較深了解。前體mRNA含有可被剪接體所識別的特殊序列,其內含子兩端存在一定的序列保守性。內含子含有5'-剪接位點(5'-splicesite)、剪接分支點(branch point)和3'-剪接位點(3'-splice site)。大多數內含子都以GU為5'-端的起始序列,而其末端則為AG-OH-3'。5'-GU……AG-OH-3'稱為剪接接口(splicing junction)或邊界序列。
- 剪接過程需兩次轉酯反應 外顯子1和外顯子2之間的內含子因與剪接體結合而彎曲,內含子5'-端與內含子中的剪接分支點和內含子3 -端互相靠近。第一次轉酯反應是由位於內含子分支點的腺嘌呤核苷酸的2'-0H作為親核基團攻擊連接外顯子l與內含子之間的3',5'-磷酸二酯鍵,使外顯子1與內含子之間的鍵斷裂,外顯子l的3'-0H游離出來。此時套索狀的內含子與外顯子2仍然相連。第二次轉酯反應由外顯子1的3'-0H對內含子和外顯子2之間的磷酸二酯鍵進行親核攻擊,使內含子與外顯子2斷開,由外顯子1取代了套索狀內含子。這樣,兩個外顯子被連接起來而內含子則被以套索狀的形式切除掉。在這兩步反應中磷酸酷鍵的數目並沒有改變,因此也沒有能量的消耗。
- 剪接體是內含子剪接場所 前體mRNA的剪接發生在剪接體(spliceosome), 因此這類內含子稱為剪接體內含子。剪接體是一種超大分子(supram olecule)複合體,由5種核小RNA(snRNA)和100種以上的蛋白質裝配而成。其中的snRNA被分別稱為Ul、U2、U4、U5和U6, 其長度範圍在100~300 個核苷酸,分子中的鹼基以尿嘧啶含量最為豐富,因而以U作分類命名。每一種snRNA分別與多種蛋白質結合,形成5種核小核糖核蛋白(small nuclear ribonucleoprotein, snRNP)顆粒。從酵母到人類,真核生物的snRNP中的RNA和蛋白質都高度保守。各種snRNP在內含子剪接過程中先後結合到前體mRNA上,使內含子形成套索並拉近上、下游外顯子。剪接體的裝配需要ATP提供能量。
剪接體的形成步驟:①內含子5-端和分支點分別與Ul、U2的snRNA結合,使snRNP結合在內含子上。②U4、U5和U6加入,形成完整的剪接體。此時內含子發生彎曲而形成套索狀。上、下游的外顯子1和外顯子2靠近。③結構調整,釋放Ul和U4。U2和U6形成催化中心,發生第一次轉酯反應。此時內含子發生彎曲而形成套索狀。隨後發生第二次轉酯反應,內含子被以套索狀切除,外顯子1和外顯子2被連接在一起。snRNA是以snRNP的形式參與剪切體的組裝的,但剪接體中起催化作用的是其中所含的RNA組分。近期的研究證明結合金屬離子的U6催化剪接反應。
- 前體mRNA分子有剪切和剪接兩種模式 前體mRNA分子的加工除上述剪接外,還有一種剪切(cleavage)模式。剪切指的是剪去某些內含子後,在上游的外顯子3'-端再進行多聚腺苷酸化,不進行相鄰外顯子之間的連接反應。剪接是指剪切後又將相鄰的外顯子片段連接起來。
- 前體mRNA分子可發生可變剪接 許多前體mRNA分子經過加工只產生一種成熟的mRNA,翻譯成相應的一種多肽;有些則可剪切或(和)剪接加工成結構有所不同的mRNA, 這一現象稱為可變剪接(alternative splicing), 又稱選擇性剪接。也就是說,這些真核生物前體mRNA分子的加工可能具有2個以上的加多聚腺苷酸的斷裂和多聚腺苷酸化的位點,因而可採取剪切或(和)可變剪接形成不同的mRNA。可變剪接提高了有限的基因數目的利用率,是增加生物蛋白質多樣性的機制之一。
例如,免疫球蛋白重鏈基因的前體mRNA分子有幾個加多聚腺苷酸的斷裂和多聚腺苷酸化的位點,通過多聚腺苷酸位點選擇機制,經過剪切產生免疫球蛋白重鏈的多樣性;果蠅發育過程中的不同階段會產生 3種不同形式的肌球蛋白重鏈,這是由於同一肌球蛋白重鏈的前體mRNA分子通過選擇性剪接機制,產生3種不同形式的mRNA。同一種前體mRNA分子在大鼠甲狀腺產生降鈣素(calcitonin) , 而在大鼠腦產生降鈣素-基因相關肽(calcitonin-gene related peptide, CGRP), 是由於兩種機制都參與了加工過程。
mRNA編輯是對基因的編碼序列進行轉錄後加工
編輯有些基因的 蛋白質產物的胺基酸序列與基因的初級轉錄物序列並不完全對應,mRNA上的一些序列在轉錄後發生了改變,稱為RNA編輯(RNA editing)。
例如,人類基因組上只有1個載脂蛋白B(apolipoprotein B, ApoB) 的基因, 轉錄後發生RNA編輯,編碼產生的apoB蛋白卻有2種,一種是apoBlOO, 由4536個胺基酸殘基構成,在肝細胞合成;另一種是apoB48, 含2152個胺基酸殘基,由小腸黏膜細胞合成。這兩種apoB都是由ApoB基因產生的mRNA編碼的,然而小腸黏膜細胞存在一種胞嘧啶核苷脫氨酶(cytosine deaminase), 能將ApoB基因轉錄生成的mRNA的第2153位胺基酸的密碼子CAA(編碼Gln)中的C轉變為U, 使其變成終止密碼子UAA, 因此apoB48的mRNA翻譯在第2153個密碼子處終止。
又如,腦細胞穀氨酸受體(GluR)是一種重要的離子通道。編碼GluR的mRNA在轉錄後還可發生脫氨基使A轉變為G,導致一個關鍵位點上的穀氨醯胺密碼子CAG變為CGG(精氨酸),含精氨酸的GluR不能使Ca2+通過。這樣,不同功能的腦細胞就可以選擇地產生不同的受體。人類基因組計劃執行中曾估計人類基因總數在5萬~10萬甚至10萬以上。測序完成後,現在認為人類只有約l.9萬個編碼蛋白質的基因。RNA編輯作用說明,基因的編碼序列經過轉錄後加工,是可有多用途分化的,因此也稱為分化加工(differential RNA processing)。
真核前體rRNA經過剪切形成不同類別的rRNA
編輯真核細胞的rRNA基因(rDNA)屬於冗餘基因(redundant gene)族的DNA序列,即染色體上一些相似或完全一樣的縱列串聯基因(tandem gene)單位的重複。屬於冗餘基因族的還有5S rRNA基因、組蛋白基因、免疫球蛋白基因等。不同物種基因組可有數百或上千個rDNA,每個基因又被不能轉錄的基因間隔(gene spacer)分段隔開。可轉錄片段大小為7 ~13kb, 間隔區也有若干kb大小。這些基因間隔不是內含子。rDNA位於核仁內,每個基因各自為一個轉錄單位。
真核生物基因組的rRNA基因中,18S、5.8S和28SrRNA基因是串聯在一起的,轉錄後產生45S的轉錄產物。45SrRNA是3種rRNA的前身。45SrRNA在核仁小RNA(small nucleolar RNA, snoRNA)以及多種蛋白質分子組成的核仁小核糖核蛋白 (small nucleolar ribonucleoprotein, snoRNP)的介導下經歷了2'-O-核糖甲基化等化學修飾,這些修飾可能與其後續的加工、摺疊和組裝後的核糖體功能有關。45S rRNA經過某些核糖核酸內切酶和核糖核酸外切酶的剪切,去除內含子等序列,而產生成熟的18S、5.8S及28S的rRNA。
rRNA成熟後,就在核仁上裝配,與核糖體蛋白質一起形成核糖體,輸送到胞質。生長中的細胞,其rRNA較穩定;靜止狀態的細胞,其rRNA的壽命較短。
真核前體tRNA的加工包括核苷酸的鹼基修飾
編輯真核生物的大多數細胞有40-50種不同的tRNA分子。編碼tRNA的基因在基因組內都有多個拷貝。前體tRNA分子需要多種轉錄後加工才能成為成熟的tRNA。
以酵母前體tRNATyr分子為例,加工主要包括以下變化:
- 酵母前體tRNATyr分子5'-端的16個核苷酸前導序列由核糖核酸酶P(RNaseP)切除,核糖核酸酶P屬於核酶(Ribozyme)。核酶是具有催化功能的RNA。
- 胺基酸臂的3'-端2個U被核糖核酸內切酶RNaseZ切除,有時核糖核酸外切酶RNase D等也參與切除過程,然後胺基酸臂的3'-端再由核苷酸轉移酶加上特有的CCA末端。
- 莖-環結構中的一些核苷酸鹼基經化學修飾為稀有鹼基,包括某些嘌呤甲基化生成甲基嘌呤、某些尿嘧啶還原為二氫尿嘧啶(DHU)、尿嘧啶核苷轉變為假尿嘧啶核苷(φ)某些腺苷酸脫氨成為次黃嘌呤核苷酸(I)等。
- 通過剪接切除莖-環結構中部14個核苷酸的內含子。內含子剪切由tRNA剪接內切酶(tRNA-splicing endonuclease, TSEN)完成。切除後的連接反應由tRNA連接酶催化。前體tRNA分子必須摺疊成特殊的二級結構,剪接反應才能發生,內含子一般都位於前體tRNA分子的反密碼子環。
RNA催化一些內含子的自剪接
編輯1982年,美國科學家T. Cech和他的同事發現四膜蟲編碼rRNA前體的DNA序列含有間隔內含子序列,他們在體外用從細菌純化得到的RNA pol轉錄從四膜蟲純化的編碼rRNA前體的DNA,發現在沒有任何來自四膜蟲的蛋白質情況下,rRNA前體能準確地剪接去除內含子。這種由RNA分子催化自身內含子剪接的反應稱為自剪接(self-splicing)。隨後,在其他原核生物以及真核生物的線粒體、葉綠體的rRNA前體加工中,亦證實了這種剪接。這些自身剪接內含子的RNA具有催化功能,屬於核酶。
一些噬菌體的前體mRNA及細菌tRNA前體也發現有這類自身剪接的內含子,並被稱之為組Ⅰ型內含子(group Ⅰ intron)。組Ⅰ型內含子以游離的鳥嘌呤核苷或鳥嘌呤核苷酸作為輔因子完成剪接。鳥嘌呤核苷或鳥嘌呤核苷酸的3'-0H與內含子的5'-磷酸共同參與轉酯反應,切除的內含子是線狀。
許多生物中還存在組Ⅱ型內含子(group Ⅱ intron)。組Ⅱ型內含子是另一類獨特的、能起催化作用的RNA,其RNA能催化內含子的自剪接。組Ⅱ型內含子不如組Ⅰ型內含子更普遍。這兩類內含子有一個共同的特性,就是在體外(in vitro)能夠自我剪接,而不需要任何蛋白質酶的催化。但是在體內(in vivo)它們卻都需要蛋白質幫助摺疊成二級結構。組Ⅱ型內含子與組Ⅰ型內含子的內部保守序列和摺疊結構不同。另外,組Ⅱ型內含子通過產生一個套索狀中間體來進行自剪接,而組Ⅰ型內含子則不形成套索狀中間體。
組Ⅱ型內含子的剪接與前面介紹的前體mRNA的剪接都形成套索狀結構,但是前者沒有剪接體參與。
與上面三種內含子不同的是,真核細胞tRNA和古菌tRNA的內含子屬於tRNA內含子。這些tRNA中位於內部的內含子是由蛋白質催化來進行剪接的,參與的酶是tRNA剪切內切酶和tRNA連接酶。因此,現在發現至少存在有4種類型的內含子,它們分別是組Ⅰ型內含子、組Ⅱ型內含子、剪接體內含子和tRNA內含子。
需要指出的是,剪接和剪切等RNA轉錄後加工在原核生物細胞內的前體rRNA、前體tRNA等非編碼RNA中普遍存在,但是,原核生物細胞內沒有剪接體,其編碼蛋白質的mRNA沒有內含子,不進行剪接等轉錄後加工,也不進行5'-末端「 帽」結構和3'-端多聚腺苷酸尾的添加。
真核RNA在細胞內的降解有多種途徑
編輯真核細胞的mRNA降解途徑可分為兩類:正常轉錄物的降解和異常轉錄物的降解。正常轉錄物是指細胞產生的有正常功能的mRNA。異常轉錄物是細胞產生的一些非正常轉錄物。正常轉錄物的降解和異常轉錄物的降解都是細胞保持其正常的生理狀態所必需的。
依賴於脫腺苷酸化的mRNA降解是重要的正常mRNA代謝途徑
編輯當前體mRNA的轉錄後加工完成後,mRNA的分子在5'-端有一個7-甲基鳥苷三磷酸 (m7Gppp) 帽狀結構,而在3'-端帶有一個多聚腺苷酸尾。當細胞以mRNA作為模板進行蛋白質的生物合成(翻譯)時,mRNA通過5'-端結合的eIF4E、eIF4G與3'-端多聚腺苷酸結合的多聚腺苷結合蛋白質 (poly adenine binding protein, PABP)相互作用而形成封閉的環狀結構,這樣可以防止來自脫腺苷酸化酶和脫帽酶的攻擊。
依賴於脫腺苷酸化的mRNA降解是體內mRNA降解的主要方式。多數正常mRNA的降解過程的第一步是脫腺苷酸化酶侵入環狀結構,進行脫腺苷酸化反應。脫腺苷酸化反應結束後,脫腺苷酸化酶脫離帽狀結構,使脫帽酶能夠結合mRNA的5'-端,從而對7-甲基鳥嘌呤帽狀結構進行水解。以上說明脫腺苷酸化反應是脫帽反應得以進行的前提條件。脫腺苷酸化和脫帽反應結束後,mRNA被5'→3'核酸外切酶識別並水解。也有部分mRNA在脫腺苷酸化後不進行脫帽反應,而由3'→5'核酸外切酶識別並水解。
除依賴於脫腺苷酸化的mRNA降解外,大部分真核細胞內還存在着其他不依賴於脫腺苷酸化的mRNA降解途徑,比如有少部分mRNA可以不經過脫腺苷酸化反應而直接進行脫帽反應。脫帽反應後mRNA被5'→3'核酸外切酶識別並水解。
有些mRNA也可以被核糖核酸內切酶參與的降解途徑降解,核糖核酸內切酶識別mRNA內部特異序列並對mRNA進行切割。這種切割產生游離的3'-端和5'-端,mRNA隨後被核糖核酸外切酶降解。
其他如微RNA(microRNA)和RNA干擾(RNAi)誘導的mRNA降解途徑,是細胞內基因表達調控的方式之一。
無義介導的mRNA降解是一種重要的真核生物細胞mRNA質量監控機制
編輯真核細胞,尤其是哺乳動物細胞的前體mRNA常常具有多個外顯子和內含子。細胞在對前體mRNA進行剪接加工時,異常的剪接反應會在可讀框架內產生無義的終止密碼子,常稱作提前終止密碼子(premature translational-termination codon, PTC)。PTC也可由錯誤轉錄或翻譯過程中的移碼而產生。無義介導的mRNA降解(nonsense-mediated mRNA decay, NMD)是一種廣泛存在於真核生物細胞中的mRNA質量監控機制。該機制通過識別和降解含有PTC的轉錄產物防止有潛在毒性的截短蛋白的產生。外顯子拼接複合體(exon-junction complex, EJC)是誘導無義介導的mRNA降解的重要因子。EJC通常位於外顯子和外顯子拼接點的上游附近,在翻譯過程中,結合在mRNA上的EJC會隨着核糖體在mRNA上的滑動而被逐一移除。如果在外顯子-外顯子的拼接點之前出現PTC, 核糖體會被從mRNA上提前釋放,這時PTC下游的EJC仍然保留在mRNA上,EJC結合的一些蛋白質如UPF3(無義轉錄物調節因子3)等誘導UPFl的磷酸化。磷酸化的UPFl募集脫帽酶Dcpla和外切酶Xrnl等,對mRNA進行降解。許多遺傳性疾病是由出現PTC而引起的。
除無義介導的mRNA降解外,異常轉錄物尚有無終止密碼子引起的mRNA降解(non-stopdecay, NSD降解)和非正常停滯引起的mRNA降解(no-godecay, NGD降解)及核糖體延伸介導的降解(1ibosome extension-mediated decay, REMD)等。