生物化学与分子生物学/真核生物前体RNA的加工和降解

RNA的合成 - 原核生物转录的模板和酶 - 原核生物的转录过程 - 真核生物RNA的合成 - 真核生物前体RNA的加工和降解
真核生物转录生成的RNA分子是前体RNA(pre-RNA),也称为初级RNA转录物(primary RNA transcript), 几乎所有的初级RNA转录物都要经过加工,才能成为具有功能的成熟的RNA。加工主要在细胞核中进行。

真核前体mRNA经首、尾修饰、剪接和编辑加工后才能成熟

编辑

真核生物前体mRNA合成后,需要进行5'-端和3'-端(首、尾部)的修饰以及对前体mRNA进行剪接(splicing), 才能成为成熟的mRNA,被转运到核糖体,指导蛋白质翻译。

前体mRNA在5'-端加入“帽”结构

编辑

前体mRNA(precursor mRNA)也称为初级mRNA转录物(primary mRNA transcript)或核不均一RNA(heterogeneous nuclear RNA, hnRNA)。大多数真核mRNA的5'-端有7-甲基鸟嘌呤的帽结构。RNA pol Ⅱ催化合成的新生RNA在长度达25~30个核苷酸时,其5'-端的核苷酸就与7-甲基鸟嘌呤核苷通过不常见的5',5'-三磷酸连接键相连。
加帽过程由加帽酶(capping enzyme)和甲基转移酶(methyltransferase)催化完成。加帽酶有两个亚基。在添加帽结构的过程中,此酶与 RNA pol Ⅱ的CTD结合在一起,其氨基端部分具有磷酸酶活性,其作用是去除新生RNA的5'-端核苷酸的γ-磷酸;其羧基端部分具有mRNA鸟苷酸转移酶活性,将一个GTP分子中的GMP部分和新生RNA的5'端结合,形成5',5'-三磷酸结构;然后由S-腺苷甲硫氨酸先后提供甲基,使加上去的GMP中鸟嘌呤的N7和原新生RNA的5'-端核苷酸的核糖2'-O甲基巨化这两步甲基化反应由不同的甲基转移酶,即鸟嘌呤N-7甲基转移酶和2'-O核糖甲基转移酶进行催化的。
5'帽结构可以使mRNA免遭核酸酶的攻击,也能与帽结合蛋白质复合体(cap-binding complex of protein)结合,并参与mRNA和核糖体的结合,启动蛋白质的生物合成。

前体mRNA在3'-端特异位点断裂并加上多聚腺苷酸尾

编辑

真核mRNA,除了组蛋白的mRNA,在3'-端都有多聚腺苷酸[poly(A)]尾结构,约含80~250个腺苷酸。大多数已研究过的基因中,都没有3'-端相应的多聚胸苷酸序列,说明poly(A)尾的出现是不依赖于DNA模板的。转录最初生成的前体mRNA 3'端长于成熟的mRNA。因此认为,加入poly(A)之前,先由核酸内切酶切去前体mRNA 3'端的一些核苷酸,然后加入poly(A)。前体mRNA上的断裂点也是聚腺苷酸化(polyadenylation)的起始点,断裂点的上游10~30nt有AAUAAA信号序列,断裂点的下游20~40nt有富含G和U的序列,前者是特异序列,后者是非特异序列。在前体mRNA上也发现poly(A)尾巴,推测这一过程也应在核内完成,而且先于mRNA中段的剪接。尾部修饰是和转录终止同时进行的过程。
一般认为poly(A)的长度与mRNA的寿命呈正相关。随着poly(A)缩短,以该mRNA作为模板的翻译活性下降。因此推测,poly(A)的有无与长短与维持mRNA本身稳定性和mRNA作为翻译模板的活性高度相关。一般真核生物在细胞质内出现的 mRNA, 其poly(A)长度在100~200个核苷酸之间,也有少数例外,如组蛋白基因的转录产物,无论是初级的或成熟的,都没有poly(A)尾巴。
前体mRNA分子的断裂和加poly(A)尾是多步骤过程。断裂和聚腺苷酸化特异性因子(cleavage and polyadenylation specificity factor, CPSF)是由4条不同的多肽组成的蛋白质,分子质量为360kD。CPSF先与AAUAAA信号序列形成不稳定的复合体,然后至少有3种蛋白质——断裂激动因子(cleavage stimulatory factor, CStF)、断裂因子Ⅰ(cleavage factor Ⅰ, CFⅠ)、断裂因子Ⅱ(CF Ⅱ)与CPSF-RNA复合体结合。CStF与断裂点的下游富含G和U的序列相互作用能使形成的多蛋白复合体稳定。最后在前体mRNA分子断裂之前,多聚腺苷酸聚合酶[poly(A) polymerase, PAP]加入到多蛋白质复合体,前体mRNA在断裂点断裂后,立即在断裂产生的游离3'-0H进行多聚腺苷酸化。在加入大约前12个腺苷酸时,速度较慢,随后快速加入腺苷酸,完成多聚腺苷酸化。多聚腺苷酸化的快速期有一种多聚腺苷酸结合蛋白Ⅱ[poly(A) binding protein Ⅱ, 简称PABPⅡ或PABⅡ,与细胞质里的腺苷酸结合蛋白PABP不同]参与,PABPⅡ和慢速期合成的多聚腺苷酸结合,提高多聚腺苷酸聚合酶合成多聚腺苷酸的速度。PABPⅡ的另一个功能是:当多聚腺苷酸尾结构达足够长时,使多聚腺苷酸聚合酶停止作用。

前体mRNA的剪接主要是去除内含子

编辑

真核基因结构最突出的特点是其不连续性,即:如果将成熟的 mRNA 分子序列与其基因序列比较,可以发现并不是全部的基因序列都保留在成熟的mRNA分子中,有一些区段被去除了,因此真核基因又称为断裂基因。
实际上,在细胞核内出现的初级转录物的分子量往往比在胞质内出现的成熟mRNA大几倍,甚至数十倍。核酸序列分析证明,mRNA来自前体mRNA,而前体mRNA和DNA模板链可以完全配对。前体mRNA中被剪接去除的核酸序列为内含子的序列,而最终出现在成熟mRNA分子中、作为模板指导蛋白质翻译的序列为外显子序列。去除初级转录物上的内含子,把外显子连接为成熟RNA的过程称为mRNA剪接。
以鸡的卵清蛋白基因为例说明 mRNA 剪接:卵清蛋白基因全长为7.7kb, 有8个外显子和7个内含子。初级转录物即前体mRNA是和相应的基因等长的,说明内含子也存在于初级转录物中。成熟的 mRNA 分子长度约为1.2kb, 编码386个氨基酸。

  • 内含子形成套索RNA被剪除 剪接首先涉及套索RNA(lariat RNA)的形成,即内含子区段弯曲,使相邻的两个外显子互相靠近而利于剪接。
  • 内含子在剪接接口处剪除 从前体mRNA一级结构分析及特性的研究,目前对剪接已有较深了解。前体mRNA含有可被剪接体所识别的特殊序列,其内含子两端存在一定的序列保守性。内含子含有5'-剪接位点(5'-splicesite)、剪接分支点(branch point)和3'-剪接位点(3'-splice site)。大多数内含子都以GU为5'-端的起始序列,而其末端则为AG-OH-3'。5'-GU……AG-OH-3'称为剪接接口(splicing junction)或边界序列。
  • 剪接过程需两次转酯反应 外显子1和外显子2之间的内含子因与剪接体结合而弯曲,内含子5'-端与内含子中的剪接分支点和内含子3 -端互相靠近。第一次转酯反应是由位于内含子分支点的腺嘌呤核苷酸的2'-0H作为亲核基团攻击连接外显子l与内含子之间的3',5'-磷酸二酯键,使外显子1与内含子之间的键断裂,外显子l的3'-0H游离出来。此时套索状的内含子与外显子2仍然相连。第二次转酯反应由外显子1的3'-0H对内含子和外显子2之间的磷酸二酯键进行亲核攻击,使内含子与外显子2断开,由外显子1取代了套索状内含子。这样,两个外显子被连接起来而内含子则被以套索状的形式切除掉。在这两步反应中磷酸酷键的数目并没有改变,因此也没有能量的消耗。
  • 剪接体是内含子剪接场所 前体mRNA的剪接发生在剪接体(spliceosome), 因此这类内含子称为剪接体内含子。剪接体是一种超大分子(supram olecule)复合体,由5种核小RNA(snRNA)和100种以上的蛋白质装配而成。其中的snRNA被分别称为Ul、U2、U4、U5和U6, 其长度范围在100~300 个核苷酸,分子中的碱基以尿嘧啶含量最为丰富,因而以U作分类命名。每一种snRNA分别与多种蛋白质结合,形成5种核小核糖核蛋白(small nuclear ribonucleoprotein, snRNP)颗粒。从酵母到人类,真核生物的snRNP中的RNA和蛋白质都高度保守。各种snRNP在内含子剪接过程中先后结合到前体mRNA上,使内含子形成套索并拉近上、下游外显子。剪接体的装配需要ATP提供能量。

剪接体的形成步骤:①内含子5-端和分支点分别与Ul、U2的snRNA结合,使snRNP结合在内含子上。②U4、U5和U6加入,形成完整的剪接体。此时内含子发生弯曲而形成套索状。上、下游的外显子1和外显子2靠近。③结构调整,释放Ul和U4。U2和U6形成催化中心,发生第一次转酯反应。此时内含子发生弯曲而形成套索状。随后发生第二次转酯反应,内含子被以套索状切除,外显子1和外显子2被连接在一起。snRNA是以snRNP的形式参与剪切体的组装的,但剪接体中起催化作用的是其中所含的RNA组分。近期的研究证明结合金属离子的U6催化剪接反应。

  • 前体mRNA分子有剪切和剪接两种模式 前体mRNA分子的加工除上述剪接外,还有一种剪切(cleavage)模式。剪切指的是剪去某些内含子后,在上游的外显子3'-端再进行多聚腺苷酸化,不进行相邻外显子之间的连接反应。剪接是指剪切后又将相邻的外显子片段连接起来。
  • 前体mRNA分子可发生可变剪接 许多前体mRNA分子经过加工只产生一种成熟的mRNA,翻译成相应的一种多肽;有些则可剪切或(和)剪接加工成结构有所不同的mRNA, 这一现象称为可变剪接(alternative splicing), 又称选择性剪接。也就是说,这些真核生物前体mRNA分子的加工可能具有2个以上的加多聚腺苷酸的断裂和多聚腺苷酸化的位点,因而可采取剪切或(和)可变剪接形成不同的mRNA。可变剪接提高了有限的基因数目的利用率,是增加生物蛋白质多样性的机制之一。

例如,免疫球蛋白重链基因的前体mRNA分子有几个加多聚腺苷酸的断裂和多聚腺苷酸化的位点,通过多聚腺苷酸位点选择机制,经过剪切产生免疫球蛋白重链的多样性;果蝇发育过程中的不同阶段会产生 3种不同形式的肌球蛋白重链,这是由于同一肌球蛋白重链的前体mRNA分子通过选择性剪接机制,产生3种不同形式的mRNA。同一种前体mRNA分子在大鼠甲状腺产生降钙素(calcitonin) , 而在大鼠脑产生降钙素-基因相关肽(calcitonin-gene related peptide, CGRP), 是由于两种机制都参与了加工过程。

mRNA编辑是对基因的编码序列进行转录后加工

编辑

有些基因的 蛋白质产物的氨基酸序列与基因的初级转录物序列并不完全对应,mRNA上的一些序列在转录后发生了改变,称为RNA编辑(RNA editing)。
例如,人类基因组上只有1个载脂蛋白B(apolipoprotein B, ApoB) 的基因, 转录后发生RNA编辑,编码产生的apoB蛋白却有2种,一种是apoBlOO, 由4536个氨基酸残基构成,在肝细胞合成;另一种是apoB48, 含2152个氨基酸残基,由小肠黏膜细胞合成。这两种apoB都是由ApoB基因产生的mRNA编码的,然而小肠黏膜细胞存在一种胞嘧啶核苷脱氨酶(cytosine deaminase), 能将ApoB基因转录生成的mRNA的第2153位氨基酸的密码子CAA(编码Gln)中的C转变为U, 使其变成终止密码子UAA, 因此apoB48的mRNA翻译在第2153个密码子处终止。
又如,脑细胞谷氨酸受体(GluR)是一种重要的离子通道。编码GluR的mRNA在转录后还可发生脱氨基使A转变为G,导致一个关键位点上的谷氨酰胺密码子CAG变为CGG(精氨酸),含精氨酸的GluR不能使Ca2+通过。这样,不同功能的脑细胞就可以选择地产生不同的受体。人类基因组计划执行中曾估计人类基因总数在5万~10万甚至10万以上。测序完成后,现在认为人类只有约l.9万个编码蛋白质的基因。RNA编辑作用说明,基因的编码序列经过转录后加工,是可有多用途分化的,因此也称为分化加工(differential RNA processing)。

真核前体rRNA经过剪切形成不同类别的rRNA

编辑

真核细胞的rRNA基因(rDNA)属于冗余基因(redundant gene)族的DNA序列,即染色体上一些相似或完全一样的纵列串联基因(tandem gene)单位的重复。属于冗余基因族的还有5S rRNA基因、组蛋白基因、免疫球蛋白基因等。不同物种基因组可有数百或上千个rDNA,每个基因又被不能转录的基因间隔(gene spacer)分段隔开。可转录片段大小为7 ~13kb, 间隔区也有若干kb大小。这些基因间隔不是内含子。rDNA位于核仁内,每个基因各自为一个转录单位。
真核生物基因组的rRNA基因中,18S、5.8S和28SrRNA基因是串联在一起的,转录后产生45S的转录产物。45SrRNA是3种rRNA的前身。45SrRNA在核仁小RNA(small nucleolar RNA, snoRNA)以及多种蛋白质分子组成的核仁小核糖核蛋白 (small nucleolar ribonucleoprotein, snoRNP)的介导下经历了2'-O-核糖甲基化等化学修饰,这些修饰可能与其后续的加工、折叠和组装后的核糖体功能有关。45S rRNA经过某些核糖核酸内切酶和核糖核酸外切酶的剪切,去除内含子等序列,而产生成熟的18S、5.8S及28S的rRNA。
rRNA成熟后,就在核仁上装配,与核糖体蛋白质一起形成核糖体,输送到胞质。生长中的细胞,其rRNA较稳定;静止状态的细胞,其rRNA的寿命较短。

真核前体tRNA的加工包括核苷酸的碱基修饰

编辑

真核生物的大多数细胞有40-50种不同的tRNA分子。编码tRNA的基因在基因组内都有多个拷贝。前体tRNA分子需要多种转录后加工才能成为成熟的tRNA。
以酵母前体tRNATyr分子为例,加工主要包括以下变化:

  • 酵母前体tRNATyr分子5'-端的16个核苷酸前导序列由核糖核酸酶P(RNaseP)切除,核糖核酸酶P属于核酶(Ribozyme)。核酶是具有催化功能的RNA。
  • 氨基酸臂的3'-端2个U被核糖核酸内切酶RNaseZ切除,有时核糖核酸外切酶RNase D等也参与切除过程,然后氨基酸臂的3'-端再由核苷酸转移酶加上特有的CCA末端。
  • 茎-环结构中的一些核苷酸碱基经化学修饰为稀有碱基,包括某些嘌呤甲基化生成甲基嘌呤、某些尿嘧啶还原为二氢尿嘧啶(DHU)、尿嘧啶核苷转变为假尿嘧啶核苷(φ)某些腺苷酸脱氨成为次黄嘌呤核苷酸(I)等。
  • 通过剪接切除茎-环结构中部14个核苷酸的内含子。内含子剪切由tRNA剪接内切酶(tRNA-splicing endonuclease, TSEN)完成。切除后的连接反应由tRNA连接酶催化。前体tRNA分子必须折叠成特殊的二级结构,剪接反应才能发生,内含子一般都位于前体tRNA分子的反密码子环。

RNA催化一些内含子的自剪接

编辑

1982年,美国科学家T. Cech和他的同事发现四膜虫编码rRNA前体的DNA序列含有间隔内含子序列,他们在体外用从细菌纯化得到的RNA pol转录从四膜虫纯化的编码rRNA前体的DNA,发现在没有任何来自四膜虫的蛋白质情况下,rRNA前体能准确地剪接去除内含子。这种由RNA分子催化自身内含子剪接的反应称为自剪接(self-splicing)。随后,在其他原核生物以及真核生物的线粒体、叶绿体的rRNA前体加工中,亦证实了这种剪接。这些自身剪接内含子的RNA具有催化功能,属于核酶。
一些噬菌体的前体mRNA及细菌tRNA前体也发现有这类自身剪接的内含子,并被称之为组Ⅰ型内含子(group Ⅰ intron)。组Ⅰ型内含子以游离的鸟嘌呤核苷或鸟嘌呤核苷酸作为辅因子完成剪接。鸟嘌呤核苷或鸟嘌呤核苷酸的3'-0H与内含子的5'-磷酸共同参与转酯反应,切除的内含子是线状。
许多生物中还存在组Ⅱ型内含子(group Ⅱ intron)。组Ⅱ型内含子是另一类独特的、能起催化作用的RNA,其RNA能催化内含子的自剪接。组Ⅱ型内含子不如组Ⅰ型内含子更普遍。这两类内含子有一个共同的特性,就是在体外(in vitro)能够自我剪接,而不需要任何蛋白质酶的催化。但是在体内(in vivo)它们却都需要蛋白质帮助折叠成二级结构。组Ⅱ型内含子与组Ⅰ型内含子的内部保守序列和折叠结构不同。另外,组Ⅱ型内含子通过产生一个套索状中间体来进行自剪接,而组Ⅰ型内含子则不形成套索状中间体。
组Ⅱ型内含子的剪接与前面介绍的前体mRNA的剪接都形成套索状结构,但是前者没有剪接体参与。
与上面三种内含子不同的是,真核细胞tRNA和古菌tRNA的内含子属于tRNA内含子。这些tRNA中位于内部的内含子是由蛋白质催化来进行剪接的,参与的酶是tRNA剪切内切酶和tRNA连接酶。因此,现在发现至少存在有4种类型的内含子,它们分别是组Ⅰ型内含子、组Ⅱ型内含子、剪接体内含子和tRNA内含子。
需要指出的是,剪接和剪切等RNA转录后加工在原核生物细胞内的前体rRNA、前体tRNA等非编码RNA中普遍存在,但是,原核生物细胞内没有剪接体,其编码蛋白质的mRNA没有内含子,不进行剪接等转录后加工,也不进行5'-末端“ 帽”结构和3'-端多聚腺苷酸尾的添加。

真核RNA在细胞内的降解有多种途径

编辑

真核细胞的mRNA降解途径可分为两类:正常转录物的降解和异常转录物的降解。正常转录物是指细胞产生的有正常功能的mRNA。异常转录物是细胞产生的一些非正常转录物。正常转录物的降解和异常转录物的降解都是细胞保持其正常的生理状态所必需的。

依赖于脱腺苷酸化的mRNA降解是重要的正常mRNA代谢途径

编辑

当前体mRNA的转录后加工完成后,mRNA的分子在5'-端有一个7-甲基鸟苷三磷酸 (m7Gppp) 帽状结构,而在3'-端带有一个多聚腺苷酸尾。当细胞以mRNA作为模板进行蛋白质的生物合成(翻译)时,mRNA通过5'-端结合的eIF4E、eIF4G与3'-端多聚腺苷酸结合的多聚腺苷结合蛋白质 (poly adenine binding protein, PABP)相互作用而形成封闭的环状结构,这样可以防止来自脱腺苷酸化酶和脱帽酶的攻击。
依赖于脱腺苷酸化的mRNA降解是体内mRNA降解的主要方式。多数正常mRNA的降解过程的第一步是脱腺苷酸化酶侵入环状结构,进行脱腺苷酸化反应。脱腺苷酸化反应结束后,脱腺苷酸化酶脱离帽状结构,使脱帽酶能够结合mRNA的5'-端,从而对7-甲基鸟嘌呤帽状结构进行水解。以上说明脱腺苷酸化反应是脱帽反应得以进行的前提条件。脱腺苷酸化和脱帽反应结束后,mRNA被5'→3'核酸外切酶识别并水解。也有部分mRNA在脱腺苷酸化后不进行脱帽反应,而由3'→5'核酸外切酶识别并水解。
除依赖于脱腺苷酸化的mRNA降解外,大部分真核细胞内还存在着其他不依赖于脱腺苷酸化的mRNA降解途径,比如有少部分mRNA可以不经过脱腺苷酸化反应而直接进行脱帽反应。脱帽反应后mRNA被5'→3'核酸外切酶识别并水解。
有些mRNA也可以被核糖核酸内切酶参与的降解途径降解,核糖核酸内切酶识别mRNA内部特异序列并对mRNA进行切割。这种切割产生游离的3'-端和5'-端,mRNA随后被核糖核酸外切酶降解。
其他如微RNA(microRNA)和RNA干扰(RNAi)诱导的mRNA降解途径,是细胞内基因表达调控的方式之一。

无义介导的mRNA降解是一种重要的真核生物细胞mRNA质量监控机制

编辑

真核细胞,尤其是哺乳动物细胞的前体mRNA常常具有多个外显子和内含子。细胞在对前体mRNA进行剪接加工时,异常的剪接反应会在可读框架内产生无义的终止密码子,常称作提前终止密码子(premature translational-termination codon, PTC)。PTC也可由错误转录或翻译过程中的移码而产生。无义介导的mRNA降解(nonsense-mediated mRNA decay, NMD)是一种广泛存在于真核生物细胞中的mRNA质量监控机制。该机制通过识别和降解含有PTC的转录产物防止有潜在毒性的截短蛋白的产生。外显子拼接复合体(exon-junction complex, EJC)是诱导无义介导的mRNA降解的重要因子。EJC通常位于外显子和外显子拼接点的上游附近,在翻译过程中,结合在mRNA上的EJC会随着核糖体在mRNA上的滑动而被逐一移除。如果在外显子-外显子的拼接点之前出现PTC, 核糖体会被从mRNA上提前释放,这时PTC下游的EJC仍然保留在mRNA上,EJC结合的一些蛋白质如UPF3(无义转录物调节因子3)等诱导UPFl的磷酸化。磷酸化的UPFl募集脱帽酶Dcpla和外切酶Xrnl等,对mRNA进行降解。许多遗传性疾病是由出现PTC而引起的。
除无义介导的mRNA降解外,异常转录物尚有无终止密码子引起的mRNA降解(non-stopdecay, NSD降解)和非正常停滞引起的mRNA降解(no-godecay, NGD降解)及核糖体延伸介导的降解(1ibosome extension-mediated decay, REMD)等。