生物化学与分子生物学/真核生物RNA的合成

RNA的合成 - 原核生物转录的模板和酶 - 原核生物的转录过程 - 真核生物RNA的合成 - 真核生物前体RNA的加工和降解
真核生物的转录过程比原核复杂。真核生物和原核生物的RNA pol种类不同,结合模板的特性不一样。原核生物RNA pol可直接结合DNA模板,而真核生物RNA pol需与辅因子结合后才结合模板,所以两者的转录起始过程有较大区别,转录终止也不相同。真核基因组中转录生成的RNA中有20%以上存在反义RNA(antisense RNA), 提示某些DNA双链区域在不同的时间点两条链都可以作为模板进行转录。另外,基因组中的基因间区也可以作为模板被转录而产生长非编码RNA等,提示真核基因组RNA生物合成是很广泛的现象。

真核生物有多种DNA依赖的RNA聚合酶 编辑

真核生物至少具有3种主要的RNA pol, 分别是RNA聚合酶Ⅰ(RNA pol Ⅰ)、RNA聚合酶Ⅱ(RNA pol Ⅱ)和RNA聚合酶Ⅲ(RNA pol Ⅲ)。RNA pol Ⅰ位于细胞核的核仁(nucleolus) , 催化合成rRNA的前体,rRNA的前体再加工成28S、5.8S及18S rRNA。
RNA pol Ⅱ在核内转录生成前体 mRNA, 然后加工成 mRNA并输送给胞质的蛋白质合成体系。mRNA是各种RNA中寿命最短、最不稳定的,需经常重新合成。在此意义上说,RNA pol Ⅱ是真核生物中最活跃的RNA pol。RNA pol Ⅱ也合成一些非编码RNA如长非编码RNA(long non-coding RNA, lncRNA)微小RNA和 piRNA(与Piwi蛋白相互作用的RNA)。
RNA pol Ⅲ位于核仁外,催化tRNA、5SrRNA和一些核小RNA(small nuclear RNA, snRNA)的合成。
真核细胞的三种RNA pol不仅在功能和理化性质上不同,而且对一种毒蘑菇含有的环八肽(cyclic octapeptide)毒素——α-鹅膏覃碱(α-amanitine)的敏感性也不同,RNA pol Ⅰ对α-鹅膏覃碱不敏感;RNA pol Ⅱ对α-鹅膏覃碱十分敏感;RNA pol Ⅲ对α-鹅膏簟碱比较敏感。
真核生物RNA pol的结构比原核生物复杂,以上所述三种真核生物的RNA pol都有两个不同的大亚基和十几个小亚基。三种真核生物RNA pol都具有核心亚基,与大肠杆菌RNA pol的核心亚基有一些序列同源性。最大的亚基(分子质量160~220kD)和另一大亚基(分子质量128~150kD)与大肠杆菌RNA pol的β'和β亚基有一定同源性。例如,RNA pol Ⅱ由12个亚基组成,其最大的亚基称为 RBP1。除核心亚基外,3种真核生物RNA pol具有数个共同小亚基。另外,每种真核生物RNA pol各自还有3~7个特有的小亚基。这些小亚基的作用还不十分清楚,但是,每一种亚基对真核生物RNA pol发挥正常功能都是必需的。
RNA pol Ⅱ最大亚基的羧基末端有一段共有序列(consensus sequence), 为Tyr-Ser-Pro-Thr-Ser-Pro-Ser样的七肽重复序列片段,称为羧基末端结构域(carboxyl-terminal domain, CTD)。RNApol Ⅰ和RNA pol Ⅲ没有CTD。 所有真核生物的RNA pol Ⅱ都具有CTD, 只是7个氨基酸共有序列的重复程度不同。酵母RNA pol Ⅱ的 CTD有27个重复共有序列,其中18个与上述7个氨基酸共有序列完全一致;哺乳动物RNA pol Ⅱ的CTD有52个重复基序,其中21个与上述7个氨基酸共有序列完全一致。CTD对于维持RNA pol Ⅱ的催化活性是必需的。体内外实验都证明,CTD的磷酸化在转录起始中起关键作用。当RNA pol Ⅱ启动转录后,CTD的许多Ser和一些Tyr残基是处于磷酸化状态。
RNA聚合酶Ⅰ、Ⅱ、Ⅲ分别使用不同类型的启动子,分别为Ⅰ类、Ⅱ类和Ⅲ类启动子,其中Ⅲ类启动子又可被分为3个亚型。
染色体上两个相邻基因的转录方向有的是相同的,有的是不同的。双向启动子(bidirectional promoter)是位于两个相邻且转录方向相反的基因之间的一段DNA序列。近年来在人类等动植物基因组中存在大量的相邻且转录方向相反的基因,被称为双向转录基因对(bidirectional gene psirs), 也被称之为“头对头”基因对(head-to-head gene pairs)。当这两个相邻的“头对头”基因转录起始位点之间的距离小于1kb左右时,这段基因间DNA序列可称之为双向启动子。根据相反方向基因重叠程度不同,双向转录基因对可分为两类:基因5'-端不重叠的双向转录基因对和基因5'-端重叠的双向转录基因对。相应的双向启动子也分为两类:启动子序列重叠的双向启动子和启动子序列不重叠的双向启动子。第1类双向启动子是真正意义上的双向启动子。
真核细胞内还有其他类型的DNA依赖的RNA聚合酶,例如RNA聚合酶Ⅳ(RNA polmerase Ⅳ)在植物中合成小干扰RNA(siRNA); RNA聚合酶Ⅴ(RNA polymerase Ⅴ)在植物中合成的RNA与siRNA介导的异染色质形成有关。真核细胞线粒体的RNA聚合酶属于单亚基RNA聚合酶蛋白质家族,与上述 RNA聚合酶在结构上非常不同,在此不详述。

顺式作用元件和转录因子在真核生物转录起始中有重要作用 编辑

RNA pol Ⅱ催化基因转录的过程,可以分为3个期:起始期(RNA pol Ⅱ和通用转录因子形成闭合复合体)、延长期和终止期 ,起始期和延长期都有相关的蛋白质参与。
真核生物的转录起始上游区段比原核生物多样化。转录起始时,RNA pol不直接结合模板,其起始过程比原核生物复杂。

与转录起始有关的顺式作用元件 编辑

不同物种、不同细胞或不同的基因,转录起始点上游可以有不同的DNA序列,但这些序列都可统称为顺式作用元件(cis-acting element)。顺式作用元件包括核心启动子序列、启动子上游元件 (upstream promoter elements), 又叫近端启动子元件(proximal promoter elements)等近端调控元件和增强子(enhancer)等远隔序列。
转录起始点至上游-37bp的启动子区域是核心启动子(core promoter)区,是转录起始前复合物(prein 山ation com plex, PIC) 的结合位点。真核生物转录起始也需要RNA pol对起始区上游DNA序列作辨认和结合,生成起始复合物。 起始点上游多数有共同的TATA序列,称为Hognest盒或TATA盒(TATA box)。通常认为这就是启动子的核心序列。 TATA盒的位置不像原核生物上游-35区和-10区那样典型。某些真核生物基因如管家基因(house-keeping gene)也可以没有TATA盒。许多RNA pol Ⅱ识别的启动子具有保守的共有序列:位于转录起始点附近的起始子(initiator, Inr)。
启动子上游元件是位于TATA盒上游的DNA序列,多在转录起始点上游约40~200bp的位置,比较常见的是位于-70bp至-200bp的CAAT盒和GC盒。这些元件与相应的蛋白因子结合能提高或改变转录效率。
增强子是能够结合特异基因调节蛋白并促进邻近或远隔特定基因表达的DNA序列。增强子距转录起始点的距离变化很大,从lOOObp到50 OOObp, 甚至更大,但一般作用于最近的启动子,在所控基因的上游和下游都可发挥调控作用,但以上游为主。

转录因子 编辑

RNA pol Ⅱ启动转录时,需要一些称为转录因子(transcription factor, TF)的蛋白质,才能形成具有活性的转录复合体。能直接、间接辨认和结合转录上游区段DNA或增强子的蛋白质,统称为反式作用因子(trans-acting factor)。前缀trans-有“分子外”的意义,指的是它们从DNA分子之外影响转录过程。反式作用因子包括通用转录因子(general trans cription factor)和特异转录因子。通用转录因子,有时称为基本转录因子(basal trans cription factor) , 是直接或间接结合RNA pol的一类转录调控因子。相应于RNA pol Ⅰ、Ⅱ、Ⅲ的TF,分别称为TF Ⅰ、TFⅡ、TFⅢ。真核生物的TFⅡ又分为TFⅡA,TFⅡB 等,主要的TFⅡ的功能巳清楚。所有的RNA pol Ⅱ都需要通用转录因子,这些通用转录因子有TFⅡA、TFⅡB、TFⅡD、TFⅡE、TFⅡF、TFⅡH,在真核生物进化中高度保守。
通用转录因子TFⅡD不是一种单一蛋白质。它实际上是由TATA盒结合蛋白质(TATA binding protein, TBP)和8~10个TBP相关因子(TEP-associated factor, TAF)组成的复合物。TBP结合一个lObp长度DNA片段,刚好覆盖基因的TATA盒,而TFⅡD则覆盖一个35bp或者更长的区域。TBP的分子量为20~40kD, 而TFⅡD 复合物的分子量大约为700kD。TBP支待基础转录但是不是诱导等所致的增强转录所必需的。而TFⅡD中的TAFs 对诱导引起的增强转录是必要的。有时把TAFs叫做辅激活因子( co-activator)。人类细胞中至少有12种TAF。可以想象TFⅡD 复合物中不同TAFs与TBP的结合可能结合不同启动子,这可以解释这些因子对特定启动子存在不同的亲和力和在各种启动子中的选择性活化。中介子(mediator)也是在反式作用因子和RNA pol之间的蛋白质复合体,它与某些反式作用因子相互作用,同时能够促进TFⅡH对RNA pol羧基端结构域的磷酸化。有时把中介子也归类于辅激活因子。
此外,还有与启动子上游元件如GC盒、CAAT盒等顺式作用元件结合的转录因子,称为上游因子 (upstream factor) , 如SPl结合到GC盒上,C/EBP结合到CAAT盒上。这些转录因子调节通用转录因子与TATA盒的结合、RNA pol在启动子的定位及起始复合物的形成,从而协助调节基因的转录效率。
特异转录因子是在特定类型的细胞中高表达,并对一些基因的转录进行时间和空间特异性调控的转录因子。与远隔调控序列如增强子等结合的转录因子是主要的特异转录因子。例如,属于特异转录因子的可诱导因子(inducible factor)是与增强子等远端调控序列结合的转录因子。它们只在某些特殊生理或病理情况下才被诱导产生的,如MyoD在肌肉细胞中高表达,HIF-1在缺氧时高表达。可诱导因子在特定的时间和组织中表达而影响转录。
RNA pol Ⅱ与启动子结合后启动转录,这需要多种蛋白质因子的协同作用。这通常包括:可诱导因子或上游因子与增强子或启动子上游元件的结合;辅激活因子和(或)中介子在可诱导因子、上游因子与通用转录因子RNA pol Ⅱ复合物之间起中介和桥梁作用;通用转录因子和RNA pol Ⅱ在启动子处组装成转录起始前复合物。因子和因子之间互相辨认、结合,以准确地控制基因是否转录、何时转录。上游因子和可诱导因子等在广义上也称为转录因子,但一般不冠以 TF 的词头而各有自己特殊的名称。

转录起始前复合物 编辑

真核生物RNA pol不与 DNA 分子直接结合,而需依靠众多的转录因子。首先是 TFⅡD 的 TBP 亚基结合 TATA, 另一 TFIID 亚基 TAF 有多种,在不同基因或不同状态转录时,不同的 TAF 与 TBP 进行搭配。在 TFⅡA 和ⅡB 的促进和配合下,形成ⅡD-ⅡA-ⅡB-DNA复合体。
具有转录活性的闭合复合体形成过程中,先由 TBP 结合启动子的 TATA 盒,这时 DNA 发生弯曲,然后 TFⅡB 与 TBP 结合,TFⅡB 也能与 TATA 盒上游邻近的 DNA 结合。TFⅡA 不是必需的,其存在时能稳定已与 DNA 结合的 TFⅡD-TBP 复合体,并且在 TBP 与不具有特征序列的启动子结合时(这种结合比较弱)发挥重要作用。TFⅡB可以结合RNA pol Ⅱ。TFⅡB-TBP复合体再与由RNA pol Ⅱ和TFⅡF组成的复合体结合。TFⅡF的作用是通过和RNA pol Ⅱ 一起与TFIIB相互作用,降低RNA pol Ⅱ与DNA的非特异部位的结合,来协助RNA pol Ⅱ靶向结合启动子。最后是TF ⅡE和TFⅡH加入,形成闭合复合体,装配完成,这就是转录起始前复合物。
TFⅡH具有解旋酶(helicase)活性,能使转录起始点附近的DNA双螺旋解开,使闭合复合体成为开放复合体启动转录。TFⅡH还具有激酶活性,它的一个亚基能使RNA pol Ⅱ的CTD磷酸化。还有一种使CTD磷酸化的蛋白质是周期蛋白依赖性激酶9(cyclin-dependent kinase 9, CDK9) , 是正性转录延长因子(positive transcription elongation factor, P-TEFb)复合体的组成部分,对RNA pol Ⅱ的活性起正性调节作用。CTD磷酸化能使开放复合体的构象发生改变,启动转录。这时TFⅡD、TFⅡA和TFⅡB 等就会脱离转录起始前复合物。当合成一段含有30个左右核苷酸的RNA时,TFⅡE和TFⅡH释放,RNA pol Ⅱ进入转录延长期。在延长阶段,TFⅡF仍然结合RNA pol Ⅱ, 防止其与DNA的结 合。CTD磷酸化在转录延长期也很重要,而且影响转录后加工过程中转录复合体和参与加工的酶之间的相互作用。

少数几个反式作用因子和搭配启动特定基因的转录 编辑

上述的是典型而有代表性的RNA pol Ⅱ催化的转录起始。RNA pol Ⅰ、RNA pol Ⅲ的转录起始与此大致相似。不同基因转录特性的研究已广泛开展,并发现数以百计、数量还在不断增加的转录因子。人类编码蛋白质的基因估计有2万个左右,为了保证转录的准确性,不同基因的转录起始需要不同的转录因子来参与,这是可理解的。转录因子是蛋白质,也需要基因为它们编码。一般认为,数个反式作用因子(主要是可诱导因子和上游因子等转录因子)之间互相作用,再与基本转录因子、RNA pol搭配而有针对性地结合、转录相应的基因。可诱导因子和上游因子常常通过辅激活因子或中介子与基本转录因子、RNA pol结合,但有时可不通过它们而直接与基本转录因子、RNA pol结合。 转录因子的相互辨认结合,恰如儿童玩具七巧板那样,搭配得当就能拼出多种不同的图形。人类基因虽数以万计,但需要的转录因子可能几百个就能满足表达不同类型基因的需要。目前不少实验都支持这一理论。用生物信息学估算人类细胞中大约有2000种编码DNA结合蛋白的基因,约占基因总数的10%。其中大部分可能是反式作用因子。

真核生物RNA转录延长过程不与翻译同步 编辑

真核生物转录延长过程与原核生物大致相似,但因有核膜相隔,没有转录与翻译同步的现象。真核生物基因组DNA在双螺旋结构的基础上,与多种组蛋白组成核小体(nucleosome)高级结构。RNA pol前移处处都遇上核小体。RNA聚合 酶(500kD,14nmx13nm)和核小体组蛋白八聚体(300kD,6nmxl6nm)大小差别不太大。转录延长可以观察到核小体移位 和解聚现象。用含核小体结构的DNA片段作模板,在酶、底物存在及合适反应条件下进行转录,能够观察到核小体移位。在试管内(in vitro)转录实验中以DNA酶对DNA进行水解,从DNA电泳图像观察到约200bp及其倍数的阶梯形电泳条带。这种阶梯形电泳条带证明了核小体在转录过程中存在,提示转录过程中核小体只是发生了移位。但在培养细胞的体内(in vivo)转录实验中观察到,组蛋白中含量丰富的精氨酸发生了乙酰化,该修饰降低正电荷。核小体组蛋白与DNA的结合是靠碱性氨基酸提供正电荷和核苷酸磷酸根上的负电荷来维系的。据此推论:核小体在转录过程中可能发生一时性解聚并重新装配。

真核生物的转录终止和加尾修饰同时进行 编辑

真核生物的转录终止,是和转录后修饰密切相关的。真核生物 mRNA有多聚腺苷酸[poly(A)]尾巴结构,是转录后才加进去的,因为在模板链上没有相应的多聚胸苷酸(poly dT)。转录不是在poly(A)的位置上终止,而是超出数百个乃至上千个核苷酸后才停止。已发现在可读框的下游,常有一组共同序列AATAAA,再下游还有相当多的GT序列。这些序列称为转录终止的修饰点。
转录越过修饰点后,前体mRNA在修饰点处被切断,随即加入poly(A)尾及5'-帽子结构。下游的RNA虽继续转录,但很快被RNA酶降解。因此有理由相信,帽子结构是保护RNA免受降解的,因为修饰点以后的转录产物无帽子结构,很快被降解。
RNA pol缺乏具有校读(proofreading)功能的3'→5'核酸外切酶活性,因此转录发生的错误率比复制发生的错误率高,大约是十万分之一到万分之一。因为对大多数基因而言,一个基因可以转录产生许多RNA拷贝,而且RNA最终是要被降解和替代的,所以转录产生错误RNA对细胞的影响远比复制产生错误DNA对细胞的影响小。