生物化学与分子生物学/基因表达调控的基本概念与特点

基因表达调控 - 基因表达调控的基本概念与特点 - 原核基因表达调控 - 真核基因表达调控
原核生物体系和真核生物体系在基因组结构以及细胞结构上的差异使得它们的基因表达方式有所不同。原核细胞没有细胞核,遗传信息的转录和翻译发生在同一空间,并以偶联的方式进行。真核细胞具有细胞核,使得转录和翻译不仅具有空间分布的特征,而且还有时间特异性。尽管如此,原核生物体系和真核生物体系的基因表达调控遵循一些共同的基本规律。

基因表达产生有功能的蛋白质和RNA 编辑

基因表达(gene expression)就是基因转录及翻译的过程,也是基因所携带的遗传信息表现为表型 的过程,包括基因转录成互补的RNA序列,对于蛋白质编码基因,mRNA继而翻译成多肽链,并装配加工成最终的蛋白质产物。在一定调节机制控制下,基因表达通常经历转录和翻译过程,产生具有特异生物学功能的蛋白质分子,赋予细胞或个体一定的功能或形态表型。但并非所有基因表达过程都产生蛋白质。rRNA、tRNA编码基因转录产生RNA的过程也属于基因表达。
不同生物的基因组含有不同数量的基因。细菌的基因组一般约含4000个基因;多细胞生物的基 因达数万个,人类基因组含约2万个蛋白质编码基因。在某一特定时期或生长阶段,基因组中只有小部分基因处于表达状态。例如,大肠杆菌通常只有约5%的基因处于高水平转录活性状态,其余大多数基因不表达或表达水平极低,即生成很少的RNA或蛋白质。基因表达水平的高低不是固定不变的。例如,平时与细菌蛋白质生物合成有关的延长因子编码基因表达十分活跃,而参与DNA损伤修复有关的酶分子编码基因却极少表达;当有紫外线照射引起DNA损伤时,这些修复酶编码基因的表达就变得异常活跃。可见,生物体中具有某种功能的基因产物在细胞中的数量会随时间、环境而变化。

基因表达具有时间特异性和空间特异性 编辑

所有生物的基因表达都具有严格的规律性,即表现为时间特异性和空间特异性。生物物种愈高级基因表达规律愈复杂愈精细,这是生物进化的需要。基因表达的时间、空间特异性由特异的基因启动子(序列)和(或)调节序列与调节蛋白相互作用决定。

时间特异性是指基因表达按一定的时间顺序发生 编辑

按功能需要,某一特定基因的表达严格按一定的时间顺序发生,这就是基因表达的时间特异性(temporal specificity)。如噬菌体病毒或细菌侵入宿主后,呈现一定的感染阶段。随感染阶段发展、生长环境变化,这些病原体以及宿主的基因表达都有可能发生改变。有些基因开启,有些基因关闭。例如,霍乱弧菌在感染宿主后,44种基因的表达上调,193种基因的表达受到抑制,而相伴随的是这些细菌呈现出高传染状态。编码甲胎蛋白(α-fetoprotein, α-AFP)的基因在胎儿肝细胞中活跃表达,因此合成大量的甲胎蛋白;在成年后这一基因的表达水平很低,故几乎检测不到AFP。但是,当肝细胞发 生转化形成肝癌细胞时,编码 AFP 的基因又重新被激活,大量的AFP被合成。因此,血浆中AFP的水平可以作为肝癌早期诊断的一个重要指标。
多细胞生物从受精卵发育成为一个成熟个体,经历很多不同的发育阶段。在每个不同的发育阶 段,都会有不同的基因严格按照自己特定的时间顺序开启或关闭,表现为与分化、发育阶段一致的时间性。因此多细胞生物基因表达的时间特异性又称阶段特异性(stage specificity)。

空间特异性是指多细胞生物个体在特定生长发育阶段,同—基因在不同的组织器官表达不同 编辑

在多细胞生物个体某一发育、生长阶段,同一基因产物在不同的组织器官表达水平也可能不同。在个体生长、发育过程中,一种基因产物在个体的不同组织或器官表达,即在个体的不同空间出现,这就是基因表达的空间特异性(spatial specificity)。如编码胰岛素的基因只在胰岛的β细胞中表达,从而指导生成胰岛素;编码胰蛋白酶的基因在胰岛细胞中几乎不表达,而在胰腺腺泡细胞中有高水平的表达。基因表达伴随时间或阶段顺序所表现出的这种空间分布差异,实际上是由细胞在器官的分布所决定的,因此基因表达的空间特异性又称细胞特异性(cell specificity)或组织特异性(tissue specificity)。
同一个体内不同器官、组织、细胞的差异性的基础是特异的基因表达或称为差异基因表达(differential gene expression)。细胞的基因表达谱(gene expression profile), 即基因表达的种类和强度决定了细胞的分化状态和功能。换言之,在个体内决定细胞类型的不是基因本身,而是基因表达模式(gene expression pattern)。

基因表达的方式存在多样性 编辑

不同种类的生物遗传背景不同,同种生物不同个体生活环境不完全相同,不同的基因功能和性质也不相同。因此,不同的基因对生物体内、外环境信号刺激的反应性不同。有些基因在生命全过程中持续表达,有些基因的表达则受环境影响。基因表达调控 (regulation of gene expression)就是指细胞或生物体在接受内、外环境信号刺激时或适应环境变化的过程中在基因表达水平上作出应答的分子机制,即位于基因组内的基因如何被表达成为有功能的蛋白质(或 RNA),在什么组织表达,什么时候表达,表达多少等。按照对刺激的反应性,基因表达的方式或调节类型存在很大差异。

有些基因几乎在所有细胞中持续表达 编辑

有些基因产物对生命全过程都是必需的或必不可少的。这类基因在一个生物个体的几乎所有细胞中待续表达,不易受环境条件的影响,或称基本表达。这些基因通常被称为管家基因 (house-keeping gene)。例如,三羧酸循环是一中枢性代谢途径,催化该途径各阶段反应的酶的编码基因就属这类基因。管家基因的表达水平受环境因素影响较小,而是在生物体各个生长阶段的大多数或几乎全部组织中持续表达,或变化很小。我们将这类基因表达称为基本(或组成性)基因表达(constitutive gene expression)。基本基因表达只受启动子和 RNA 聚合酶等因素的影响,而基本不受其他机制调节。但实际上,基本基因表达水平并非绝对“一成不变” ,所谓“ 不变”是相对的。

有些基因的表达受到环境变化的诱导和阻遏 编辑

与管家基因不同,另有一些基因表达很容易受环境变化的影响。随外环境信号变化,这类基因的表达水平可以出现升高或降低的现象。
在特定环境信号剌激下,相应的基因被激活,基因表达产物增加,即这种基因表达是可诱导的。可诱导基因(inducible gene) 在一定的环境中表达增强的过程称为诱导 (induction)。例如,在有 DNA损伤时,修复酶基因就会在细菌体内被激活,导致修复酶反应性地增加。
相反,如果基因对环境信号应答时被抑制,这种基因称为可阻遏基因(repressible gene) 。可阻遏基因表达产物水平降低的过程称为阻遏(repression)。例如,当培养基中色氨酸供应充分时,细菌体内与色氨酸合成有关的酶编码基因表达就会被抑制。这类基因的调控序列通常含有针对特异刺激的反应元件。
诱导和阻遏是同一事物的两种表现形式,在生物界普遍存在,也是生物体适应环境的基本途径。乳糖操纵子机制是认识诱导和阻遏表达的经典模型。

生物体内不同基因的表达受到协调调节 编辑

在生物体内,一个代谢途径通常是由一系列化学反应组成,需要多种酶参与;此外,还需要很多其他蛋白质参与作用物在细胞内、外区间的转运。这些酶及转运蛋白等的编码基因被统一调节,使参与同一代谢途径的所有蛋白质(包括酶)分子比例适当,以确保代谢途径有条不紊地进行。在一定机制控制下,功能上相关的一组基因,无论其为何种表达方式,均需协调一致、共同表达,即为协同表达 (coordinate expression) 。这种调节称为协同调节(coordinate regulation)。基因的协调表达体现在生物体的生长发育全过程。
生物体通过协调调节不同基因的表达以适应环境、维持生长和增殖。生物体所处的内、外环境是在不断变化的。所有生物的所有活细胞都必须对内、外环境的变化作出适当反应,以使生物体能更好地适应变化着的环境状态。生物体这种适应环境的能力总是与某种或某些蛋白质分子的功能有关。细胞内某种功能蛋白质分子的有或无、多或少的变化则由编码这些蛋白质分子的基因表达与否、表达水平高低等状况决定。通过一定的程序调控基因的表达,可使生物体表达出合适的蛋白质分子,以便更好地适应环境,维持其生长。
原核生物、单细胞生物调节基因的表达就是为适应环境、维持生长和细胞分裂。例如,当葡萄糖供应充足时,细菌中与葡萄糖代谢有关的酶编码基因表达增强,其他糖类代谢有关的酶基因关闭;当葡萄糖耗尽而有乳糖存在时,与乳糖代谢有关的酶编码基因则表达,此时细菌可利用乳糖作为碳源,维持生长和增殖。高等生物也普遍存在适应性表达方式。经常饮酒者体内醇氧化酶活性较高即与相应基因表达水平升高有关。
在多细胞生物,基因表达调控的意义还在于维待细胞分化与个体发育。在多细胞个体生长、发育的不同阶段,细胞中的蛋白质分子种类和含量变化很大;即使在同一生长发育阶段,不同组织器官内 蛋白质分子分布也存在很大差异,这些差异是调节细胞表型的关键。例如,果蝇幼虫(蛹)最早期只有一组“母本效应基因(maternal effect gene)”表达,使受精卵发生头尾轴和背腹轴固定,以后有三组“分节基因”顺序表达,控制蛹的“分节”发育过程,最后这些“节”分别发育为成虫的头、胸、翅膀、肢 体、腹及尾等。高等哺乳类动物的细胞分化,各种组织、器官的发育都是由一些特定基因控制的。当某种基因缺陷或表达异常时,则会出现相应组织或器官的发育异常。

基因表达受调控序列和调节分子共同调节 编辑

一个生物体的基因组中既有携带遗传信息的基因编码序列,也有能够影响基因表达的调控序列(regulatory sequence)。一般说来,调控序列与被调控的编码序列位于同一条 DNA 链上,也被称为顺式作用元件 (cis-acting element) 或顺式调节元件 (cis-regulator element, CRE)。还有一些调控基因远离被调控的编码序列,实际上是其他分子的编码基因,只能通过其表达产物来发挥作用。这类调控基因 产物称为调节蛋白(regulatory protein) 。调节蛋白不仅能对处于同一条 DNA 链上的结构基因的表达进行调控,而且还能对不在一条 DNA链上的结构基因的表达起到同样的作用。因此,这些蛋白质分子又被称为反式作用因子(trans-acting factor)。这些反式作用因子以特定的方式识别和结合在顺式作用元件上,实施精确的基因表达调控。还有一类调控基因的产物为调节 RNA,这些 RNA分子以不同的作用方式对基因表达进行精细调节。
作为反式作用因子的调节蛋白具有特定的空间结构,通过特异性地识别某些DNA序列与顺式作用元件发生相互作用。例如,DNA双螺旋结构的大沟是调节蛋白最容易与DNA序列发生相互作用的部位。真核生物基因组结构比较复杂,使得有些调节蛋白不能直接与DNA相互作用,而是首先形成蛋白质-蛋白质的复合物,然后再与DNA结合参与基因表达的调控。蛋白质-DNA以及蛋白质-蛋白质的相互作用是基因表达调控的分子基础。

基因表达调控呈现多层次和复杂性 编辑

无论是原核生物还是真核生物,基因表达调控体现在基因表达的全过程中,即在RNA转录合成和蛋白质翻译两个阶段都有控制其表达的机制。因此基因表达的调控是多层次的复杂过程,改变其中任何环节均会导致基因表达的变化。
首先,遗传信息以基因的形式贮存于 DNA 分子中,基因拷贝数越多,其表达产物也会越多,因此基因组 DNA的部分扩增(amplification) 可影响基因表达。在多细胞生物,某一特定类型细胞的选择性扩增可能就是通过这种机制使某种或某些蛋白质分子高表达的结果。为适应某种特定需要而进行的 DNA重排(DNA rearrangement), 以及 DNA 甲基化(DNA methylation) 等均可在遗传信息水平上影响基因表达。
其次,遗传信息经转录由 DNA 传递给 RNA 的过程,是基因表达调控最重要、最复杂的一个层次。在真核细胞,初始转录产物需经转录后加工修饰才能成为有功能的成熟 RNA,并由细胞核转运至细胞质,对这些转录后加工修饰以及转运过程的控制也是调节某些基因表达的重要方式,例如:对mRNA 的选择性剪接、RNA 编辑等。近年来,以 miRNA为代表的非编码 RNA对基因表达调控的作用也日益受到重视,使我们可以在一个新的层面上理解基因表达调控。
蛋白质生物合成即翻译是基因表达的最后一步,影响蛋白质合成的因素同样也能调节基因表达。并且,翻译与翻译后加工可直接、快速地改变蛋白质的结构与功能,因而对此过程的调控是细胞对外环境变化或某些特异刺激应答时的快速反应机制。 总之,在遗传信息传递的各个水平上均可进行基因表达调控。
尽管基因表达调控可发生在遗传信息传递过程的任何环节,但发生在转录水平,尤其是转录起始水平的调节,对基因表达起着至关重要的作用,即转录起始是基因表达的基本控制点。