生物化学与分子生物学/真核基因表达调控
基因表达调控 -
基因表达调控的基本概念与特点 -
原核基因表达调控 -
真核基因表达调控
原核细胞的基因表达调控机制已经十分复杂,与之相比,真核生物的基因组结构要复杂得多,加之个体内细胞间广泛存在的信号通讯网络,其基因表达调控的多样性和复杂性远非原核生物所能比拟。
真核基因表达特点
编辑多细胞真核生物的基因表达调控具有以下特点:①真核基因组比原核基因组大得多。②原核基因组的大部分序列都为编码基因,而哺乳类基因组中大约只有10%的序列编码蛋白质、rRNA、tRNA等,其余90%的序列,包括大量的重复序列,功能至今还不清楚,可能参与调控。③真核生物编码蛋白质的基因是不连续的,转录后需要剪接去除内含子,这就增加了基因表达调控的层次。④原核生物的基因编码序列在操纵子中,多顺反子mRNA使得几个功能相关的基因自然协调控制;而真核生物则是一个结构基因转录生成一条mRNA, 即mRNA是单顺反子(monocistron), 许多功能相关的蛋白质,即使是一种蛋白质的不同亚基也将涉及多个基因的协调表达。⑤真核生物DNA在细胞核内与多种蛋白质结合构成染色质,这种复杂的结构直接影响着基因表达。⑥真核生物的遗传信息不仅存在于核DNA上,还存在于线粒体DNA上,核内基因与线粒体基因的表达调控既相互独立又需要协调。
由于真核基因组的这些特点,真核基因表达的调控过程较原核生物要复杂许多。该过程包括了染色质激活、转录起始、转录后修饰、转录产物的细胞内转运、翻译起始、翻译后修饰等多个步骤。在上述过程的每一个环节都可以对基因表达进行干预,从而使得基因表达调控呈现出多层次和综合协调的特点。但是,转录起始的调控是基因表达调控较为关键的环节。
染色质结构与真核基因表达密切相关
编辑以染色质形式组装在细胞核内的DNA所携带的遗传信息表达直接受到染色质结构的制约。当基因被激活时,可观察到染色质相应区域发生某些结构和性质变化,这些具有转录活性的染色质被称为活性染色质(active chromatin)。
转录活化的染色质对核酸酶极为敏感
编辑当染色质活化后,常出现一些对核酸酶(如DNase Ⅰ)高度敏感的位点,称之超敏位点(hype rsensitive site)。超敏位点通常位于被活化基因的5'-侧翼区1kb内,但有时也会在更远的5'-侧翼区或3'-侧翼区出现一些超敏位点。这些转录活化区域是缺乏或没有核小体蛋白结合的“裸露”DNA链。
转录活化染色质的组蛋白发生改变
编辑转录活跃区域的染色质中组蛋白的特点是:①富含赖氨酸的H1组蛋白含量降低;②H2A-H2B组蛋白二聚体的不稳定 性增加,使它们容易从核小体核心中被置换出来;③核心组蛋白H3、H4可发生乙酰化、磷酸化以及泛素化等修饰。这些都使得核小体的结构变得松弛而不稳定,降低核小体蛋白对DNA 的亲和力,易于基因转录。
在真核细胞中,核小体是染色质的主要结构单位,四种组蛋白(H2A、H2B、H3和H4各2个分子) 组成的八聚体构成核小体的核心区(core particle), 其外面盘绕着 DNA 双螺旋链。每个组蛋白的氨基端都会伸出核小体外,形成组蛋白尾巴。这些尾巴可以形成核小体间相互作用的纽带,同时也是发生组蛋白修饰的位点。这些修饰包括对组蛋白中富含的赖氨酸、精氨酸、组氨酸等带有正电荷的碱性氨基酸进行的乙酰化、磷酸化和甲基化等修饰过程。
一般来说,乙酰化修饰能够中和组蛋白尾巴上碱性氨基酸残基的正电荷,减弱组蛋白与带有负电荷的 DNA 之间的结合,选择性地使某些染色质区域的结构从紧密变得松散,有利于转录因子与 DNA 的结合,从而开放某些基因的转录,增强其表达水平。 而组蛋白甲基化通常不会在整体上改变组蛋白尾巴的电荷,但是能够增加其碱性度和疏水性,因而增强其与 DNA 的亲和力。乙酰化修饰和甲基化修饰都是通过改变组蛋白尾巴与 DNA 之间的相互作用发挥基因表达调控的功能,而乙酰化修饰和甲 基化修饰的作用往往又是相互排斥的。 组蛋白的磷酸化修饰在细胞有丝分裂和减数分裂期间染色体浓缩以及基因转录激活过程中发挥重要的调节作用。
发挥组蛋白共价修饰作用的一些蛋白质分子,如组蛋白乙酰基转移酶(histone acetyltransferase , HAT)和 组蛋白去乙酰化酶(histone deacetylase, HDAC) , 在 DNA 水平的基因表达调控中具有重要作用。HAT 使组蛋白发生乙酰化,促使染色质结构松弛,有利于基因的转录,被称为转录辅激活因子(co-activator), 而HDAC 促进组蛋白的去乙酰化,抑制基因的转录,被称为转录辅抑制因子(co-repressor) 。
CpG岛甲基化水平降低
编辑DNA甲基化是真核生物在染色质水平控制基因转录的重要机制。真核基因组中胞嘧啶的第5位碳原子可以在DNA甲基转移酶(DNA methyltransferase)的作用下被甲基化修饰为5-甲基胞嘧啶,并且以序列CG中的胞嘧啶甲基化更加常见。但是这些甲基化胞嘧啶在基因组中并不是均匀分布,有些成簇的非甲基化CG存在于整个基因组中,人们将这些GC含量可达60%,长度为300~3000bp的区段称作CpG岛(CpG island)。CpG岛主要位于基因的启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛。业已发现处于转录活跃状态的染色质中,CpG岛的甲基化程度下降,例如管家基因的CpG岛中胞嘧啶甲基化水平较低。CpG岛的高甲基化促进染色质形成致密结构,因而不利
于基因表达。
染色质结构对基因表达的影响可以遗传给子代细胞,其机制是细胞内存在着具有维持甲基化作用的DNA甲基转移酶,可以在DNA复制后,依照亲本DNA链的甲基化位置催化子链DNA在相同位置上发生甲基化。这种现象称为表观遗传(epigenetic inheritance)。这种遗传信息不是蕴藏在DNA序列中,而是通过对染色质结构的影响及基因表达变化而实现的。表观遗传对基因表达的调控不仅体现在DNA 甲基化上,组蛋白的乙酰化、甲基化以及非编码小RNA的调控等都属于表观遗传调控的范畴。
转录起始的调节
编辑与原核细胞一样,转录起始是真核生物基因表达调控的关键,但是真核生物的基因转录起始过程比原核细胞的复杂得多。这是因为真核生物的RNA聚合酶需要与多个转录因子相互作用,才能完成转录起始复合物的装配,装配速度决定着基因表达的水平。
顺式作用元件是转录起始的关键调节部位
编辑绝大多数真核基因调控机制都涉及编码基因附近的非编码DNA序列一顺式作用元件。顺式作用元件是指可影响自身基因表达活性的DNA序列。真核生物基因组中每一个基因都有各自特异的顺式作用元件。顺式作用元件通常是非编码序列,但是并非都位于转录起始点上游。 根据顺式作用元件在基因中的位置、转录激活作用的性质及发挥作用的方式,可将真核基因的这些功能元件分为启动子、增强子、沉默子及绝缘子等。
1、真核生物启动子结构和调节远较原核生物复杂 真核生物不同基因的启动子序列间的一致性不像原核生物那样明显,而且RNA聚合酶与DNA的结合需要多种蛋白质因子的相互协调作用。因此,真核生物的启动子序列要比原核生物的复杂得多、序列也更长。
真核生物启动子一般位于转录起始点上游,为100~200bp 序列,包含有若干具有独立功能的DNA序列元件,每个元件长7~30bp。启动子通常含有1个以上的功能组件,其中最具典型意义的就是TATA盒,它的共有序列是TATAAAA。TATA盒是基本转录因子TFⅡD的结合位点通常位于转录起始点上游-25~-30bp区域,控制转录起始的准确性及频率。除TATA盒外,GC盒(GGGCGG)和CAAT盒(GCCAAT)也是很多基因中常见的功能组件。此外,还发现很多其他类型的功能组件。典型的Ⅱ类启动子由TATA盒或下游启动子元件(downstream promoter element, DPE)和起始元件(initiator element, Inr)以及上游调控元件组成。
然而,还有很多启动子并不含TATA盒,这类启动子分为两类:一类为富含GC的启动子,最初发现于一些管家基因,这类启动子一般含数个分离的转录起始点,并有数个转录因子SPl结合位点,对基本转录活化有重要作用;另一类启动子既不含TATA盒,也没有GC富含区,这类启动子可有一个或多个转录起始点,大多转录活性很低或根本没有转录活性,而是在胚胎发育、组织分化或再生过程中受调节。
真核生物主要有三种RNA聚合酶,它们分别结合在三类不同的启动子上负责转录不同的RNA。
2、增强子是—种能够提高转录效率的顺式作用元件 增强子的长度大约是200bp,可使旁侧的基因转录效率提高100倍或更多。增强子也是由若干功能组件组成,有些功能组件既可在增强子中出现,也可在启动子中出现。这些功能组件是特异转录因子结合DNA的核心序列。增强子的核心组件常为8~12bp, 可以单拷贝或多拷贝串联形式存在。增强子和启动子常交错覆盖或连续。酵母有一种类似高等真核生物增强子样作用的序列,称为上游激活序列(upstream activator sequence, UAS) , 其在转录激活中的作用方式与增强子类似。增强子的功能及其作用特征如下:
- 增强子与被调控基因位于同一条DNA链上,属于顺式作用元件。
- 增强子是组织特异性转录因子的结合部位,当某些细胞或组织中存在能够与之相结合的特异转录因子时方能表现活性。
- 增强子不仅能够在基因的上游或下游起作用,而且还可以远距离实施调节作用(通常为14kb), 个别情况下甚至可以调控30kb以外的基因。
- 增强子作用与序列的方向性无关。将增强子的方向倒置后依然能起作用,而方向倒置后的启动子就不能起作用。
- 增强子需要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。
3、沉默子能够抑制基因的转录 沉默子是一类基因表达的负性调控元件,当其结合特异蛋白因子时,对基因转录起阻遏作用,最初在酵母中发现。 已有的证据显示沉默子与增强子类似,其作用亦不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。
4、绝缘子阻碍其他调控元件的作用 绝缘子最初在酵母中发现,一般位于增强子或沉默子与启动子之间,与特异蛋白因子结合后,阻碍增强子或沉默子对启动子的作用。绝缘子还可位千常染色质与异染色质之间,保护常染色质的基因表达不受异染色质结构的影响。绝缘子与增强子类似,发挥作用与序列的方向性无关。
转录因子是转录起始调控的关键分子
编辑真核基因的转录调节蛋白又称转录调节因子或转录因子(transcription factor, TF)。绝大多数真核转录调节因子由其编码基因表达后进人细胞核,通过识别、结合特异的顺式作用元件而增强或降低相应基因的表达。转录因子也被称为反式作用蛋白或反式作用因子。
这些反式作用因子的编码基因与其作用的靶基因之间不存在结构的关联,而顺式作用元件则是在结构上与靶基因串联连接在一起。这种来自于一个基因编码的蛋白质对另一基因的调节作用称为反式激活或反式抑制作用。真核生物转录调控的基本方式就是反式作用因子对顺式作用元件的识别与结合,即通过DNA-蛋白质的相互作用实施调控。并不是所有真核转录调节蛋白都起反式作用,也有些基因产物可特异识别、结合自身基因的调节序列,调节自身基因的开启或关闭,这就是顺式调节作用。具有这种调节方式的调节蛋白称为顺式作用蛋白。
依据功能特性,可将转录因子分为通用转录因子(general transcription factor)和特异转录因子(special transcription factor)两大类。
1、通用转录因子 这些转录因子是 RNA 聚合酶介导基因转录时所必需的一类辅助蛋白质,帮助聚合酶与启动子结合并起始转录,对所有基因都是必需的。有人将其视为 RNA 聚合酶的组成成分或亚基,故又称为基本转录因子。通用转录因子 TFⅡD 是由 TBP 和 TAFs 组成的复合物。TFⅡD 复合物中不同 TAFs 与 TBP 的结合可能结合不同启动子,这可以解释这些因子在各种启动子中的选择性活化作用以及对特定启动子存在不同的亲和力。中介子 (mediator) 也是在反式作用因子和 RNA 聚合酶之间的蛋白质复合体,它与某些反式作用因子相互作用,同时能够促进TFⅡH对 RNA 聚合酶最大亚基的羧基端结构域的磷酸化。有时将中介子也归类于辅激活因子。通用转录因子的存在没有组织特异性,因而对于基因表达的时空选择性并不重要。
2、特异转录因子 这些转录因子为个别基因转录所必需,决定该基因表达的时间空间特异性,故称特异转录因子。此类特异因子有的起转录激活作用,有的起转录抑制作用。前者称转录激活因子(transcription activator), 后者称转录抑制因子(transcription inhibitor)。
转录激活因子通常是一些增强子结合蛋白(enhancer binding protein, EBP);多数转录抑制因子是沉默子结合蛋白,但也有抑制因子以不依赖 DNA 的方式起作用,而是通过蛋白质-蛋白质相互作用“中和”转录激活因子或 TFⅡD, 降低它们在细胞内的有效浓度,抑制基因转录。
因为在不同的组织或细胞中各种特异转录因子分布不同,所以基因表达状态、方式不同。 这些组织特异性的转录因子才真正决定着细胞基因的时间、空间特异性表达。特异转录因子自身的含量、活性和细胞内定位随时都受到细胞所处环境的影响,是使环境变化在基因表达水平得到体现的关键分子。组织特异性转录因子在细胞分化和组织发育过程中具有重要作用。例如,胚胎干细胞的分化方向在相当大的程度上是由细胞内转录因子的种类所决定。阐明各种组织细胞所特有的转录因子种类,就有可能控制细胞的分化方向。诱导多能干细胞(induced pluripotent stem cell, iPS) 的建立说明关键转录因子可以改变一个细胞的命运。科学家们仅用4种转录因子就可以使终末分化的皮肤成纤维细胞转变成为类似于胚胎干细胞样的具有多向分化能力的细胞。
此外,还有与启动子上游元件如 GC 盒、CAAT 盒等顺式作用元件结合的蛋白质,称为上游因子(up-stream factor) , 如 SPl 结合到 GC 盒上,C/EBP 结合到 CAAT 盒上。这些反式作用因子调节通用转录因子与 TATA 盒的结合、RNA 聚合酶与启动子的结合及起始复合物的形成,从而协助调节基因的转录效率。
与远隔调控序列如增强子等结合的反式作用因子有很多。可诱导因子 (inducible factor) 是与增强子等远端调控序列结合的转录因子。它们能结合应答元件,只在某些特殊生理或病理情况下才被诱导产生,如 MyoD 在肌细胞中高表达,HIF-1 在缺氧时高表达。与上游因子不同,可诱导因子只在特定的时间和组织中表达而影响转录。 RNA 聚合酶Ⅱ与启动子结合并启动转录需要多种蛋白质因子的协同作用。这通常包括:可诱导因子或上游因子与增强子或启动子上游元件的结合;通用转录因子在核心启动子处的组装;辅激活因子和(或)中介子在通用转录因子或 RNA 聚合酶Ⅱ复合物与可诱导 因子、上游因子之间的辅助和中介作用,以准确地控制基因是否转录、何时转录。 应该指出的是,上游因子和可诱导因子等在广义上也可称为转录因子,但一般不冠以 TF 的词头而各有自己特殊的名称。
3、转录因子的结构特点 转录因子是 DNA 结合蛋白,至少包括两个不同的结构域:DNA 结合结构域(DNA binding domain) 和转录激活结构域(activation domain)。此外,很多转录因子还包含一个介导蛋白质-蛋白质相互作用的结构域,最常见的是二聚化结构域。
- 转录因子的 DNA 结合结构域
- 锌指(zinc finger) 模体结构:是一类含锌离子的模体。每个重复的“指”状结构含 20 多个氨基酸残基,形成 1 个α-螺旋和 2 个反向平行β-折叠的二级结构。常见的锌指模体中每个β-折叠上有 l个半胱氨酸(Cys) 残基,而α-螺旋上有 2 个组氨酸(His)或半胱氨酸(Cys)残基。这4个氨基酸残基与二价锌离子之间形成配位键 。整个蛋白质分子可有多个这样的锌指重复单位。每一个单位可将其α-螺旋伸入 DNA 双螺旋的大沟内,接触 4 个或更多的碱基。 例如与 GC 盒结合的人成纤维细胞转录因子 SPl 中就有3个锌指重复结构。
- 碱性螺-旋环-螺旋(basic helix-loop-helix, bHLH)模体结构:至少有两个α-螺旋,由一个短肽段形成的环所连接,其中一个α-螺旋的N-端富含碱性氨基酸残基,是与 DNA 结合的结合域。bHLH 模体通常以二聚体形式存在,而且两个α-螺旋的碱性区之间的距离大约与 DNA 双螺旋的一个螺距相近(3.4nm),使两个α-螺旋的碱性区刚好分别嵌入 DNA 双螺旋的大沟内。
- 碱性亮氨酸拉链(basicleucine zipper, bZIP)模体结构:特点是在蛋白质C-末端的氨基酸序列中,每隔6个氨基酸残基是一个疏水性的亮氨酸残基。当 C-末端形成α-螺旋结构时,肽链每旋转两周就出现一个亮氨酸残基,并且都出现在α-螺旋的同一侧。 这样的两个肽链能以疏水力结合成二聚体,形同拉链一样的结构。该二聚体的N-端是富含碱性氨基酸的区域,可以借助其正电荷与DNA骨架上的磷酸基团结合。
- 转录因子的转录激活结构域:不同的转录因子具有不同的转录激活结构域,根据氨基酸的组成特点,转录激活结构域可分为三类。
- 酸性激活结构域(ac心cactivation domain)是一段富含酸性氨基酸的保守序列,常形成带负电荷的β-折叠,通过与TFⅡD的相互作用协助转录起始复合物的组装,促进转录。如酵母转录因子GAL4区的转录激活域。
- 富含谷氨酰胺结构域(glutamine-rich domain)的 N-末端的谷氨酰胺残基含量可高达25%左右,可通过与GC 盒结合发挥转录激活作用。
- 富含脯氨酸结构域(praline-rich domain)的 C-末端的脯氨酸残基含量可高达20%~30%, 可通过与 CAAT 盒结合来激活转录。
4、二聚化是常见的蛋白质-蛋白质相互作用方式 二聚化作用与bZIP的亮氨酸拉链、bHLH的螺旋-环-螺旋结构有关。
以上介绍的各种转录因子的功能结构形式都是最典型、最常见的。此外尚有一些独特的结构形式。
转录起始复合物的组装是转录调控的主要方式
编辑DNA元件与调节蛋白对转录激活的调节最终是由RNA聚合酶活性体现的,其中的关键环节是转录起始复合物的形成。真核生物主要有三种RNA聚合酶,分别负责催化生成不同的RNA分子。其中RNA聚合酶Ⅱ参与转录生成所有mRNA前体及大部分snRNA。参与RNA聚合酶Ⅱ转录起始的DNA调控序列及转录因子要复杂得多,以满足RNA聚合酶Ⅱ转录成千上万种处于不同表达水平的基因的需要。
真核RNA聚合酶Ⅱ不能单独识别、结合启动子,而是先由基本转录因子TFⅡD识别、结合启动子序列,再同其他TFⅡ与RNA聚合酶II经由一系列有序结合形成一个功能性的转录前起始复合物 (transcriptionpreinitiation complex, 。此外,一些诸如转录激活因子(activator)、中介子 (mediator)以及染色质重塑因子(chromatin remodeler)等调节复合体也可参与转录前起始复合物的形成,使RNA聚合酶II得以真正启动mRNA的有效转录。在不同的细胞或阶段,还有一些特异性转录因子通过特定的结合,发挥特异性转录调节作用。
也正是由于这些基本转录因子和特异转录因子决定了RNA聚合酶Ⅱ的活性,这些调节蛋白的浓度与分布将直接影响相关基因的表达。如前所述,特异转录因子的表达具有时间或空间特异性,因此,由它们所参与组成的转录起始复合物也将呈现一种动态变化 。
转录后调控主要影响真核mRNA的结构与功能
编辑真核生物的基因表达调控在转录后层次不同于原核生物。这一方面是由于两者的转录产物的剪接、修饰等成熟加工过程有很大的差异,另一方面是由于真核生物的RNA产物要被运送至细胞质中去执行功能,其稳定性以及其降解过程都可以影响基因表达的最终结果。
mRNA的稳定性影响真核生物基因表达
编辑mRNA是蛋白质生物合成的模板, 因此它的稳定性将直接影响到基因表达最终产物的数量,是转录后对基因表达进行调控的一个重要因素。真核生物mRNA分子的半衰期差别很大,有的可长达数十小时以上, 而有的则只有几十分钟或更短。一般而言,半衰期短的mRNA多编码调节蛋白,因此,这些蛋白质的水平可以随着环境的变化而迅速变化,达到调控其他基因表达的目的。影响细胞内mRNA稳定性的因素很多,主要有下面几点:
1、5'-端的帽结构可以增加mRNA的稳定性 该结构可以使mRNA免于在5'-核酸外切酶的作用下被降解,从而延长了mRNA的半衰期。此外,帽结构还可以通过与相应的帽结合蛋白结合而提高翻译的效率,并参与mRNA从细胞核向细胞质的转运。
2、3'端的 poly(A)尾结构防止mRNA降解 poly(A)及其结合蛋白可以防止3'-核酸外切酶降解mRNA,增加mRNA的稳定性。如果3'-poly(A)被去除,mRNA分子将很快被降解。此外,3'-poly(A)尾结构还参与了翻译的起始过程。实验证明,mRNA的细胞质定位信号有些也位于3'-非翻译区(3'-untranslated region, 3'-UTR)上。组蛋白mRNA没有3'-poly(A)尾的结构,但它的3'-端会形成一种发夹结构,使其免受核酸酶的攻击。 一些mRNA的3'-UTR存在一个约50个核苷酸长的AU富含序列(AU-rich sequence, ARE)区,可以与 ARE结合蛋白结合,促使 poly(A)核酸酶切除 poly(A)尾,使mRNA降解。因此含有ARE区的mRNA通常都不稳定。
RNA无论是在核内进行加工 、由细胞核运至细胞质, 还是在细胞质内停留(至降解),都是通过与蛋白质结合形成核糖核蛋白颗粒(ribonucleoprotein particle , RNP)进行的。mRNA运输、在细胞质内的稳定性等均与某些蛋白质成分有关。
所有类型RNA分子中,mRNA寿命最短。mRNA稳定性是由合成速率和降解速率共同决定的。大多数高等真核细胞mRNA半衰期较原核为长,一般为几个小时。mRNA的半衰期可影响蛋白质合成的量,通过调节某些mRNA的稳定性,即可使相应蛋白质合成量受到一定程度的控制。例如,mRNA5'-端的帽结构和3'-端的尾结构的删除可直接影响mRNA的稳定性。
蛋白质产物也可调节mRNA的降解,如铁转运蛋白受体(transferrin receptor, TfR)mRNA的降解速率受细胞质内某些蛋白质成分的调节,并与mRNA自身结构有关。当细胞内铁足量时,TfRmRNA降解速度加快,致使TfR水平很快下降。当细胞内铁不足时,TfRmRNA稳定性增加,受体蛋白质合成增多。TfRmRNA稳定性的调节取决于mRNA分子中特定的重复序列,它位于3'-UTR,称为铁反应元件(iron response element, IRE)。每个IRE大约为30bp长,可形成柄-环结构,环上有5个特异的核苷酸,并富含 A-U 序列。 当铁浓度高时,A-U富含序列通过目前尚不得知的机制促 进TfRmRNA降解;当铁浓度下降时,一种IRE结合蛋白质 (IRE-binding protein, IRE-BP)通过识别环的特异序列及 柄的二级结构结合IRE。IRE-BP的结合可能破坏了某些机制对TfRmRNA的降解作用,使TfRmRNA的寿命延长。这一发现提示,其他稳定性可调节的mRNA可能也含有与特异蛋白质相互作用的反应元件,致降解速率变慢。
一些非编码小分子RNA可引起转录后基因沉默
编辑与原核基因表达调节一样,某些小分子RNA也可调节真核基因表达。这些RNA都是非编码RNA(non-coding RNA,ncRNA)。除了具有催化活性的RNA(核酶)、核小RNA(snRNA)以及核仁小RNA(snoRNA)以外,还有目前入们广泛关注的非编码RNA,如miRNA、piRNA和siRNA等。
mRNA前体的选择性剪接可以调节真核生物基因表达
编辑真核生物基因所转录出的mRNA前体含有交替连接的内含子和外显子。通常状态下,mRNA前体经过剔除内含子序列后成为一个成熟的mRNA,并被翻译成为一条相应的多肽链。但是,参与拼接的外显子可以不按照其在基因组内的线性分布次序拼接,内含子也可以不完全被切除,由此产生了选择性剪接。选择性剪接的结果是由同一条mRNA前体产生了不同的成熟mRNA,并由此产生了完全不同的蛋白质。这些蛋白质的功能可以完全不同,显示了基因调控对生物多样性的决定作用。值得指出的是,被切除的内含子是否具有功能目前成为研究的热点。有学者认为:内含子是在进化中出现或消失的,其功能可能是有利于物种的进化选择。例如,细菌丢失了内含子,可以使染色体变小和复制速度加快。真核生物保留内含子,则可以产生外显子移动,有利于真核生物在适应环境改变时能合成功能不同而结构上只有微小差异的蛋白质。但也有学者认为内含子具有基因表达涸控的功能。例如,现在已知某些遗传性疾病,其变异是发生在内含子而不在外显子。有些内含子在调 控基因表达的过程中起作用,有些内含子还编码核酸内切酶或含有小分子RNA序列等。
真核基因表达在翻译及翻译后仍可受到调控
编辑蛋白质生物合成过程复杂,涉及众多成分。通过调节许多参与成分的作用可使基因表达在翻译水平以及翻译后阶段得到控制。在翻译水平上,目前发现的一些调节点主要在起始阶段和延长阶段,尤其是起始阶段,如对起始因子活性的调节、Met-tRNAMet与小亚基结合的调节、mRNA与小亚基结合的调节等。其中通过磷酸化作用改变起始因子活性这一点备受关注。mRNA与小亚基结合的调节对某些mRNA的翻译控制也具有重要意义。近年来,包括小分子RNA在内的非编码RNA对基因表达 调控的影响成为新的研究热点。
对翻译起始因子活性的调节主要通过磷酸化修饰进行
编辑- 翻译起始因子eIF-2α的磷酸化抑制翻译起始 蛋白质合成速率的快速变化在很大程度上取决于起始水平,通过磷酸化调节真核起始因子(eukaryotic initiation factor, eIF)的活性对起始阶段有重要的控制作用。eIF-2主要参与起始Met-tRNAiMet的进位过程,其α亚基的活性可因磷酸化(cAMP依赖性蛋白激酶所催化)而降低,导致蛋白质合成受到抑制。如血红素对珠蛋白合成的调节就是由于血红素能抑制cAMP依赖性蛋白激酶的活化,从而防止或减少了eIF-2的失活,促进了蛋白质的合成。在病毒感染的细胞中,细胞抗病毒的机制之一即是通过双链RNA(double-stranded RNA, dsRNA)激活一种蛋白激酶,使eIF-2α磷酸化,从而抑制蛋白质合成的起始。
- eIF-4E及eIF-4E结合蛋白的磷酸化激活翻译起始 帽结合蛋白eIF-4E与mRNA帽结构的结合是翻译起始的限速步骤,磷酸化修饰及与抑制物蛋白的结合均可调节eIF-4E的活性。磷酸化的 eIF-4E与帽结构的结合力是非磷酸化的eIF-4E的4倍,因而可提高翻译的效率。胰岛素及其他一些生长因子都可增加eIF-4E的磷酸化从而加快翻译,促进细胞生长。同时,胰岛素还可以通过激活相应的蛋白激酶而使一些与eIF-4E结合的抑制物蛋白磷酸化,磷酸化后的抑制物蛋白会与eIF-4E解离,激活eIF-4E。
RNA结合蛋白参与对翻译起始的调节
编辑所谓RNA结合蛋白(RNA binding protein, RBP), 是指那些能够与RNA特异序列结合的蛋白质。基因表达的许多调节环节都有RBP的参与,如前述转录终止、RNA剪接、RNA转运、RNA在细胞质内稳定性控制以及翻译起始等。铁蛋白相关基因的mRNA翻译调节就是RBP参与基因表达调控的典型例子。
IRE结合蛋白质(IRE-BP)作为特异RNA结合蛋白,在调节铁转运蛋白受体(TfR)mRNA稳定性方面起重要作用。同时,它还能调节另外两个与铁代谢有关的蛋白质的合成,这两种蛋白质是铁蛋白和σ-氨基-γ-酮戊酸(ALA)合酶。铁蛋白与铁结合,是体内铁的贮存形式,ALA合酶是血红素合成的限速酶。与TfRmRNA不同,IRE位于铁蛋白及ALA合酶mRNA的5'-UTR,而且无A-U富含区,不促进mRNA降解。当细胞内铁浓度低时,IRE-BP处于活化状态,结合 IRE 而阻碍40S小亚基与mRNA5'-端起始部位结合,抑制翻译起始;铁浓度偏高时,IRE-BP不能与IRE结合,两种mRNA的翻译起始可以进行。
对翻译产物水平及活性的调节可以快速调控基因表达
编辑新合成蛋白质的半衰期长短是决定蛋白质生物学功能的重要影响因素。因此,通过对新生肽链的水解和运输,可以控制蛋白质的浓度在特定的部位或亚细胞器保持在合适的水平。此外,许多蛋白质需要在合成后经过特定的修饰才具有功能活性。通过对蛋白质可逆的磷酸化、甲基化、酰基化修饰,可以达到调节蛋白质功能的作用,是基因表达的快速调节方式。
小分子RNA对基因表达的调节十分复杂
编辑1、微RNA (microRNA, miRNA) miRNA是一个大家族,属小分子非编码单链RNA, 长度约22个碱基,由一段具有发夹环结构的前体加工后形成。编码miRNA的基因与编码蛋白质的基因一样,由RNA聚合酶Ⅱ负责催化其转录合成。
它们在细胞内首先形成长度约为数百个碱基的pri-miRNA,经过一次加工后,成为 长度为70~90 个碱基的单链RNA前体(pre-miRNA), 再经过一 种称为Dicer酶的RNA酶进行剪切后形成长20~24nt 的成熟miRNA。这些成熟的miRNA与其他蛋白质一起组成RNA诱导的沉默复合体(RNA-induced silencing complex, RISC), 通过与其靶mRNA分子的3'-UTR互补匹配,促使该mRNA分子的降解或抑制其翻译。
最早被确认的miRNA是1993年在线虫中发现的lin-4。这种单链RNA的表达具有阶段性,通过碱基配对的方式结合到靶mRNA lin-14的3'-UTR,从而抑制lin-14的翻译,但并不影响其转录。2000年,另一个促进线虫幼虫向成虫转变的基因 let-7 被发现,它的转录产物为21个碱基的RNA分子,也具有明显的阶段表达特异性 ,对线虫的发育具有重要的调控作用。
miRNA具有一些鲜明的结构与功能特点:①其长度一般为20~25个碱基,个别也有20个碱基以下的报道;②在不同生物体中普遍存在,包括线虫、果蝇、家鼠、人及植物等;③其序列在不同生物中具有一定的保守性,但是尚未发现动植物之间具有完全一致的miRNA序列;④具有明显的表达阶段特异性和组织特异性;⑤miRNA基因以单拷贝、多拷贝或基因簇等多种形式存在于基因组中,而且绝大部分位于基因间隔区。miRNA的广泛性和多样性提示它们可
能具有非常重要的生物学功能。
2、干扰小RNA(small interfering RNA, siRNA) siRNA 是细胞内的一类双链RNA (dsRNA), 在特定情况下通过一定酶切机制,转变为具有特定长度(21~23个碱基)和特定序列的小片段RNA。siRNA参与RISC组成,与特异 的靶mRNA完全互补结合,导致靶mRNA降解,阻断翻译过程。
siRNA和miRNA都可以介导基因表达抑制,这种作用被称为RNA干扰(RNA interference, RNAi)。
RNAi可通过降解特异mRNA,在转录后水平对基因表达进行调节机制,是生物体本身固有的一种对抗外源基因侵害的自我保护现象。它能识别、清除外源 dsRNA 或同源单链 RNA, 提供了一种防御外源核酸入侵的保护措施。同时,由于外源dsRNA 导入细胞后也可以引起与 dsRNA 同源的 mRNA 降解,进而抑制其相应的基因表达,RN扣又被作为一种新技术广泛应用于功能基因组研究中。通常认为,siRNA 及其介导的 RNAi 具有很高的特异性,但也有报道显示 siRNA 序列中一个或几个碱基的改变并不影响 siRNA 的活性。
siRNA和miRNA都属于非编码小分子RNA,它们具有一些共同的特点:均由Dicer切割产生;长度都在22个碱基左右;都与RISC形成复合体,与mRNA作用而引起基因沉默。
长非编码RNA在基因表达调控中的作用不容忽视
编辑长非编码 RNA(long non-coding RNA, lncRNA) 是一类转录本长度超过 200 个核苷酸的 RNA 分子,一般不直接参与基因编码和蛋白质合成,但是可在表观遗传水平、转录水平和转录后水平调控基因的表达。尽管我们目前对 lncRNA 的种类、数量、功能都不明确,但 lncRNA 在很多生命活动中发挥重要作用,与机体的生理和病理过程均有密切的关系,因此对 lncRNA 的研究成为当今分子生物学前沿研究领域之一。
从上述内容中我们可以看到,蛋白质特别是组蛋白的修饰对基因表达调控的影响虽然显而易见,但是真正的作用机制仍有待揭示。长久以来,人们一直关注着编码 RNA,却突然发现非编码 RNA 也有着重要的作用。因此,全面了解非编码 RNA 的时空表达谱及生物学意义的“转录物组学(transcriptomics)”应运而生。人们也只有在对核酸(DNA 和 RNA) 和蛋白质进行全面深入的研究之后,才有可能破解生命之谜。