细胞生物学/细胞分化的分子基础
基因组的活动模式
编辑基因的选择性表达是细胞分化的普遍规律
编辑细胞分化的实质是细胞的特化,即分化的细胞表达特异性蛋白(保持特化特征)。人们在认识细胞分化机制中,曾根据少数分化细胞的染色体丢失现象而错误地认为细胞分化的本质是源于遗传信息的丢失或突变。后来大量的实验证明,细胞分化过程中一般并不伴有基因组的改变。比较著名的实验,如体细胞核移植实验,即将动物体细胞的核移植到去核的卵细胞或受精卵的细胞质中,然后观察重组的卵细胞(有新的细胞核)是否能够发育成为成体,如此相继克隆出爪蟾、多莉羊等动物,证明了细胞分化并不是由于基因丢失或永久性地失去活性造成的,维持发育所需要的基因并没有发生不可逆的改变,当体细胞核暴露于卵细胞质中之后,它的作用就如同一个受精卵的细胞核基因一样。此外,细胞转分化现象的发现,以及细胞融合实验等也表明细胞分化过程中一般不发生基因组的改变。
大量研究表明,多细胞生物个体发育与细胞分化过程中,其基因组DNA并不全部表达,而呈现选择性表达,即它们按照一定的时空顺序,在不同细胞和同一细胞的不同发育阶段发生差异表达(differential expression)。这就导致了所谓的奢侈蛋白(luxury protein)即细胞特异性蛋白质的产生,如红细胞中的血红蛋白、皮肤表皮细胞中的角蛋白、肌细胞的肌动蛋白和肌球蛋白等。编码奢侈蛋白的基因称奢侈基因(luxury gene) , 又称“组织特异性基因(tissue-specific gene)”,是特定类型细胞中为其执行特定功能蛋白质编码的基因。不同奢侈基因的选择性表达赋予了分化细胞的不同特征。当然,一个分化细胞的基因表达产物不仅仅是奢侈蛋白,也包含由持家基因表达的持家蛋白。持家基因(house-keeping gene), 也被称为管家基因,是生物体各类细胞中都表达,为维持细胞存活和生长所必需的蛋白质编码的基因,如细胞骨架蛋白、染色质的组蛋白、核糖体蛋白、以及参与能矗代谢的糖酵解酶类的编码基因等。一些简单的实验便可证明细胞分化的本质。例如,鸡的输卵管细胞合成卵清蛋白,胰岛细胞合成胰岛素,成红细胞合成β-珠蛋白,这些细胞都是在个体发育过程中逐渐产生的。用相应的基因制作探针,对三种细胞总的DNA的限制性酶切片段进行Southern杂交实验。结果显示,上述三种细胞的基因组DNA中均存在卵清蛋白基因、胰岛素基因和β-珠蛋白基因。然而用同样的三种基因片段作探针,对这三种细胞中提取的总RNA进行Northern杂交实验,结果表明,输卵管细胞中只有卵清蛋白mRNA,胰岛素细胞只有胰岛素mRNA,成红细胞只有β-珠蛋白mRNA。因此,细胞分化的本质是基因的选择性表达,一些基因处于活化状态,同时另一些基因被抑制而不活化。
基因组改变是细胞分化的特例
编辑早期的研究显示,一些分化的细胞例如果蝇的卵巢滤泡细胞,在其分化过程中基因组发生了量的变化,表现为特定基因的选择性扩增;在果蝇的其他一些细胞,像卵巢滋养细胞、唾液腺细胞和马尔皮基氏管细胞的发育过程中,还呈现出基因组扩增现象,染色体( DNA)多次复制,形成多倍体(polyploid)和多线体(polyteny)。
与上述情况相反,一些细胞在分化过程中则发生遗传物质(染色质或染色体)的丢失。典型的例子是来源于对马蛔虫(Ascaris equorum )发育过程的研究。在马蛔虫个体发育中,只有生殖细胞得到了完整染色体,而体细胞中的染色体只是部分染色体片段,其余的染色体丢失了。在其他的一些例子中,还可观察到完整的染色体或完整的核丢失。例如在摇蚊发育中,许多体细胞丢失了最初40条染色体中的38条;而哺乳动物(除骆驼外)的红细胞以及皮肤、羽毛和毛发的角化细胞则丢失了完整的核。
在脊椎动物和人类免疫细胞发育研究中发现,执行抗体分泌功能的B淋巴细胞分化的本质是由于编码抗体分子的基因发生了重排。在B淋巴细胞分化期间,胚细胞DNA通过体重组(somatic recombination), 使DNA序列中不同部位的部分基因片段连接在一起,组成产生抗体mRNA的DNA序列,从而产生多种多样的抗体分子。
基于以上事例,人们对细胞分化的机制曾提出过一些假说,如基因扩增、DNA 重排和染色体丢失等。但这些现象并不是细胞分化的普遍规律。
胞质中的细胞分化决定因子与传递方式
编辑母体效应基因产物的极性分布决定了细胞分化与发育的初始命运
编辑一些研究提示,成熟的卵细胞中储存有20000~50000种RNA,其中大部分为mRNA。这些mRNA直到受精后才被翻译为蛋白质。其中部分mRNA在卵质中的分布不均,如爪蟾未受精卵中,有些mRNA特异地分布于动物极,有些则分布在植物极,它们在细胞初始发育命运的决定中起重要作用。通常将这些在卵质中呈极性分布、在受精后被翻译为在胚胎发育中起重要作用的转录因子和翻译调节蛋白的mRNA分子称为母体因子。编码母体因子的基因谓之母体效应基因(maternal effect gene),也称“母体基因(maternal gene), 即在卵子发生过程中表达,表达产物(母体因子)存留于卵子中,受精后通过这些母体因子影响胚胎发育的基因。
在果蝇中,母体效应基因得到了比较深入的研究。果蝇和一般的脊椎动物有所不同,其母体效应基因预先决定了子代未来的相互垂直的前-后轴和背-腹轴。例如果蝇bicoid 基因的mRNA,在未受精时,它定位于卵母细胞的一端,即将来发育为胚胎的前端。受精后bicoid mRNA被翻译为蛋白质,因有限的扩散,建立了BICOID蛋白梯度:BICOID蛋白沿胚胎前-后轴呈浓度梯度分布,越靠近胚胎的前端,其浓度越高。BICOID蛋白含有一个螺旋-转角-螺旋结构域(helix-turn-helix domain), 它与卵前部区域的胚胎细胞核染色质DNA结合(果蝇的早期胚胎为多个细胞核共存于一个细胞质中的合胞体),高浓度的BICOID蛋白启动了头部发育的特异性基因的表达,而低浓度的BICOID蛋白则与形成胸部的特异性基因表达有关。
胚胎细胞分裂时胞质的不均等分配影响细胞的分化命运
编辑在胚胎早期发育过程中,细胞质成分是不均质的,胞质中某些成分的分布有区域性。当细胞分裂时,细胞质成分被不均等地分配到子细胞中,这种不均一性胞质成分可以调控细胞核基因的表达,在一定程度上决定细胞的早期分化。例如在果蝇感觉器官的发育过程中,细胞命运的决定物之一是numb基因编码的转录因子。该转录因子蛋白在感觉性母细胞的胞质中呈非对称分布,以致细胞在第一次分裂时只有一个子细胞中含有numb蛋白,这个子细胞在第二次分裂时产生了神经元及鞘层细胞,而缺乏numb蛋白的细胞则分化为支持细胞。numb蛋白对神经元及鞘层细胞的形成是必需的。在缺乏numb蛋白的胚胎中,那些本应该发育成神经元和鞘层细胞的细胞却发育成为外层的支持细胞。
基因选择性表达的转录水平调控
编辑在多细胞生物个体发育过程中,基因的表达具有严格的时间和空间(或组织)特异性。在不同分化类型的细胞中,基因的表达差异很大。某个基因在一类细胞中激活而在另一种细胞中却相反。那么,是什么因素决定了分化细胞中的特异性基因表达呢?研究表明,细胞分化的基因表达调控主要发生在转录水平。调节基因转录的因素有很多,这里主要介绍在细胞分化过程中基因表达调控的特点。
基因的时序性表达
编辑某一特定基因表达严格按照一定的时间顺序发生,这称为基因表达的时间特异性(temporal specificity)。从受精卵到组织、器官形成的各个不同发育阶段,都会有不同的基因严格按照自己特定的时间顺序开启或关闭,表现为分化、发育阶段一致的时间性,也称为阶段特异性(stage specificity)。关于基因时序性表达的机制,人们在血红蛋白的表达和形成过程中得到了较深入的研究。
表达血红蛋白是红细胞分化的主要特征。脊椎动物的血红蛋白由2条α-珠蛋白链和2条β-珠蛋白链组成。α-珠蛋白和β-珠蛋白基因分别定位于不同染色体上,它们都由一个基因簇(基因家族)构成。在哺乳动物,每个家族的不同成员都在发育的各个时期被表达,这样,在胚胎、胎儿和成体中分别生成不同的血红蛋白。人β-珠蛋白基因簇包括五个基因——ε、Cγ、Aγ、δ和β,这些基因在发育的不同时期表达:ε在早期胚胎的卵黄囊中表达;Cγ和Aγ在胎儿肝脏中表达;δ和B基因在成人骨髓红细胞前体细胞中表达。所有这些基因的蛋白质产物都与由α-珠蛋白基因编码的α-珠蛋白结合,从而在发育的三个时期中分别形成有不同生理特性的血红蛋白。
在个体发育过程中依次有不同的β-珠蛋白基因的打开和关闭,这与β-珠蛋白基因簇上游的基因座控制区(locus control region, LCR)有关。LCR最初是应用DNase Ⅰ消化实验鉴定的。在成体,只有红细胞(前体细胞)中的LCR对DNase I敏感。对DNase I如此敏感意味着在该区域的染色质没有被紧密包裹,转录因子易于接近DNA。β-珠蛋白基因簇中每个基因的有效表达,除受到每个基因5'端上游的启动子和调控位点及基因下游(3'端)的增强子控制之外,还将受到远离β-珠蛋白基因簇上游的LCR的严格制约。LCR距离ε基因的5'末端约10OOObp以上。研究发现,LCR可使任何与它相连的β-家族基因呈高水平表达,即使β-珠蛋白基因本身距离它约50OOObp, LCR也能指导转基因小鼠中整个β-珠蛋白基因簇的顺序表达。有研究者认为,LCR区和珠蛋白基因启动子之间的DNA呈袢环状,这样,结合到LCR的蛋白能够比较容易地与结合到珠蛋白基因启动子上的蛋白发生相互作用。例如,在胚胎的卵黄囊细胞中,LCR将与c基因的启动子相互作用,在胎肝中则与两个γ基因启动子相互作用,最后在骨髓来源的红细胞中,与β基因启动子相互作用。
在LCR区域中含有分别为300bp左右的4个“核心”控制区,其中的每个区都有与少数几个特异性转录因子的结合位点,如转录因子NF-E2和在红细胞中高水平表达的GATA-1。
基因的组织细胞特异性表达
编辑在个体发育过程中,同一基因产物在不同的组织器官中表达多少是不一样的。一种基因产物在个体的不同组织或器官中表达,即在个体的不同空间出现,这就是基因表达的空间特异性(spatial specificity)。不同组织细胞中不仅表达的基因数量不相同,而且基因表达的强度和种类也各不相同,这就是基因表达的组织特异性。一般地,发育中基因的转录要求激活因子结合于基因的调控区(control region, 启动子区和其他能调节基因表达的DNA位点)。与基因表达调控区相结合的转录因子可区分为通用转录因子和组织细胞特异性转录因子两大类,前者是指为大量基因转录所需要并在许多细胞类型中都存在的因子;后者则是为特定基因或一系列组织特异性基因表达所需要,并在一个或很少的几种细胞类型中存在的因子。
通过替换组织特异性(表达)基因的调控区实验就可证明组织特异性转录因子的存在。例如,在小鼠中弹性蛋白酶仅在胰腺中表达,而生长激素只在脑垂体中形成,将人生长激素基因的蛋白编码区连接于小鼠弹性蛋白酶基因的调控区之后,再将此重组的DNA 注射到小鼠受精卵中,使其整合到基因组中,在由此发育而来的转基因小鼠的胰腺组织中可检测到人生长激素,表明胰腺组织中的特异转录因子通过作用于弹性蛋白酶基因调控区,启动了胰腺细胞表达人生长激素。
迄今已鉴定出一些组织特异性转录因子,如在红细胞中表达的血红蛋白的EFI因子、在胰岛中表达的胰岛素的Isl-Ⅰ因子、在骨骼肌中表达的肌球蛋白的MyoD Ⅰ因子等。通常情况下,细胞特异性的基因表达是由于仅存于那种类型细胞中的组织细胞特异性转录因子与基因的调控区相互作用的结果。
应该指出的是,在个体发育或细胞分化期间被激活的基因通常有复杂的调控区。一个转录因子是否影响特定基因的活动取决于许多因素,除了基因的调控区是否含有该转录因子的结合位点之外,转录因子的转录活性还受到转录因子调节蛋白的严格制约。在调控区上不同转录调节因子(转录因子和转录因子调节蛋白)的相互作用决定了基因是否被激活。
细胞分化过程中基因表达调控的复杂性
编辑动物受精卵第一次卵裂后的裂球,在个体发育中通过细胞分裂产生大量多代各种成体细胞,祖细胞与分化细胞的先后连续的宗系关系被称为细胞谱系(cell lineage)。在特定谱系细胞形成过程中,转录因子(或转录调节蛋白)比较普遍的作用方式是:①一个表达的转录因子能同时调控几个基因的表达,表现为同时发生的某些基因的激活和某些基因的关闭;②组合调控(combinatory control), 即转录起始受一个基因调节蛋白的组合而不是单个基因调节蛋白调控的现象。这两种转录水平的调控方式在细胞分化过程中起重要作用。
1、一个关键基因调节蛋白的表达能够启动特定谱系细胞的分化 在个体发育过程中,一个关键基因调节蛋白的表达能够引发一整串下游基因的表达。这种调控方式表现为某些基因的永久性关闭和一些基因的持续性激活,同时作为转录因子的基因产物本身起正反馈调节蛋白作用。这样一来,维持一系列细胞分化基因的活动只需要激活基因表达的起始事件,即特异地参与某一特定发育途径的起始基因。该基因一旦打开,它就维持在活化状态,表现为能充分的诱导细胞沿着某一分化途径进行,从而导致特定谱系细胞的发育。具有这种正反馈作用的起始基因通常称为细胞分化主导(或主控)基因(master control gene)。例如,在哺乳动物的成肌细胞向肌细胞分化过程中,myoD 基因起重要作用。myoD在肌前体细胞和肌细胞中表达,它的表达将引起某一级联反应,包括MRF4、myogenin基因的顺序活化,导致肌细胞分化。myoD、MRF4和myogenin都编码一个含有碱性螺旋-环-螺旋(bHLH)的DNA结合域的转录因子。一般将myoD基因视为肌细胞分化的主导基因。有趣的是,经myoD基因转染的成纤维细胞以及其他一些类型的细胞也能够转分化为肌细胞。研究资料也表明myf-5 具有myoD 的类似功能。在正常情况下,myoD 的表达对myf-5 的表达有抑制效应,Myf-5蛋白能补偿MyoD功能的缺失。
单个基因调节蛋白不仅在特定谱系细胞的分化过程中起重要作用,而且还能触发整个器官的形成。这种结果来自于对果蝇、小鼠和人类眼器官发育的研究。在眼发育过程中,有一个基因调节蛋白(在果蝇中称为Ey, 在脊椎动物中称为Pax-6)很关键,如果在适当的情况下表达,Ey能触发形成的不只是一种类型细胞,而是由不同类型细胞组成的在三维空间中正确组织起来的整个器官(眼)。
2、一些基因调节蛋白的组合能产生许多类型的细胞 组合调控的一个条件是许多基因调节蛋白必须能共同作用来影响最终的基因转录速率。不仅每个基因拥有许多基因调节蛋白来调控它,而且每个基因调节蛋白也参与调控多个基因。虽然有些基因调节蛋白对单个细胞类型特异(如myoD ),但大多数基因调节蛋白存在于多种类型细胞,在体内多个部位和发育期间多次打开。
3、同源异形框基因的时空表达确定了机体前-后轴结构的分化与发育蓝图 1983年,瑞士Gehring实验室的工作人员在研究绘制果蝇触角足复合体(Antennapedia complex, Antp, 昆虫中对胸部和头部体节的发育具有调节作用的基因群)基因外显子图谱过程中发现,Antp cDNA不仅与Antp基因编码区杂交,也与同一染色体上相邻的fiz(fushitarazu, fiz)基因杂交,提示在Antp和如基因中都含有一个共同的DNA片段。随后利用这个DNA片段为探针,相继发现在果蝇的许多同源异形基因(homeotic gene) 中都含有这个相同的DNA片段。序列分析显示这个共同的DNA片段为180bp, 具有相同的开放读码框架,编码高度同源的由60个氨基酸组成的结构单元。后来,这一DNA序列又相继在小鼠、人类、甚至酵母的若干基因中被发现。这个共同的180bpDNA片段被称为同源异形框(homeobox),含有同源异形框的基因谓之同源异形框基因(homeobox gene)。迄今为止,已发现的同源异形框基因有300多种,它们广泛分布于从酵母到人类的各种真核生物中,如果蝇的HOM基因,动物和人类的Hox基因。由同源异形框基因编码的蛋白称为同源异形域蛋白(homeodomain protein)。同源异形域蛋白含有同源异形域(homeodomain)和特异结构域(specific domain), 特异结构域通常位于同源异形结构域的上游,靠近蛋白的N端,而同源异形结构域则靠近蛋白的C端,这两个结构域在其蛋白作为转录因子发挥作用时均起决定性的作用。研究发现,由高度保守的60个氨基酸组成的同源异形结构域,表现为一种拐弯的螺旋-回折-螺旋(HLH)立体结构,其中的9个氨基酸片段(第42~50位)与DNA的大沟相吻合,即它能识别其所控制的基因启动子中的特异序列(应答元件),从而引起特定基因表达的激活或阻抑。
目前认为,HOM或Hox基因产物是一类非常重要的转录调节因子,其功能是将胚胎细胞沿前-后轴分为不同的区域,并决定各主要区域器官的形态建成。例如,果蝇HOM基因的功能是决定一组细胞发育途径的一致性,确保体节或肢芽的典型特点。当HOM基因突变时,可发生同源异形转变(homeosis),即由于与发育有关的某一基因错误表达,导致一种器官生长在错误部位的现象。例如果蝇的第三胸节转变为第二胸节,形成像第二胸节一样的翅膀(双翅膀果蝇)。
果蝇的HOM基因位于3号染色体上,由两个独立的复合体组成,即触角足复合体和双胸复合体(bithorax complex), 含有这两个复合体的染色体区域通常称为同源异形复合体(homeotic complex, HOM-C)。由于进化,果蝇HOM基因在哺乳动物中出现了4次:Hox-A, Hox-B, Hox-C, Hox-D, 分别定位于人的7,17,12和2号染色体;在小鼠则分别定位于6,11,15和2号染色体上。HOM或Hox基因在染色体上的排列顺序与其在体内的不同时空表达模式相对应,即:这些基因激活的时间顺序表现为越靠近前部的基因表达越早,而靠近后部的基因表达较迟;这些基因表达的空间顺序表现为头区的最前叶只表达该基因簇的第一个基因,而身体最后部则表达基因簇的最后一个基因。
染色质成分的化学修饰在转录水平上调控细胞的特化
编辑基因表达的激活,首先需要将致密压缩的染色质或核小体舒展开来,该过程涉及染色质成分的化学修饰, 以及具有酶活性的蛋白复合体参与。染色质成分的化学修饰,包括DNA甲基化和组蛋白修饰等, 都会引起染色质结构和基因转录活性的变化。染色质成分(DNA和组蛋白)的修饰性标记在细胞分裂过程中能够被继承并共同作用决定细胞表型, 因此被称为表观遗传(epigenetics, DNA序列变化以外的可遗传的基因表达改变)。
1、DNA甲基化在转录水平上调控细胞分化的基因表达 在甲基转移酶催化下,DNA分子中的胞嘧啶可转变成5-甲基胞嘧啶,这称为DNA甲基化。甲基化常见于富含CG二核苷酸的CpG岛。甲基化是脊椎动物基因组的重要特征之一,它可以通过DNA复制直接遗传给子代DNA。哺乳动物基因组中约70%~80% 的CpG位点是甲基化的。甲基化主要集中于异染色质区,其余则散在于基因组中。
DNA甲基化对基因活性的影响之一是启动子区域的甲基化。研究表明,甲基化程度越高,DNA转录活性越低,而绝大多数管家基因持续表达,它们多处于非甲基化状态。DNA甲基化参与转录调控的直接证据,来自对基因的活化与胞啼唗甲基化程度的直接观察。例如,在人类红细胞发育中,与珠蛋白合成有关的DNA几乎无甲基化,而在其他不合成珠蛋白的细胞中, 相应的DNA部位则高度甲基化。在胚胎期卵黄囊,ε-珠蛋白基因的启动子未甲基化,而γ-珠蛋白基因的启动子则甲基化, 因此在胚胎期ε-珠蛋白基因开放,γ-珠蛋白基因关闭;至胎儿期,在胎儿肝细胞中与合成胎儿血红蛋白有关的基因,如γ-珠蛋白基因没有甲基化,但在成体肝细胞中相应的基因则被甲基化。这说明在发育过程中,当某些基因的功能完成之后,甲基化可能有助于这些基因的关闭。
DNA甲基化导致基因失活(或沉默)的可能机制是:①甲基化直接干扰转录因子与启动子中特定的结合位点的结合。②甲基化导致的基因沉默可能是由特异的转录抑制因子直接与甲基化DNA结合引起的。人们利用随机甲基化DNA序列作探针进行凝胶阻滞实验,在哺乳动物细胞中找到了与甲基化DNA结合的多个蛋白,如MeCP-1(methyl cytosine binding protein 1)、MeCP-2。③甲基化导致的基因沉默是由染色质结构的改变引起的。研究表明,DNA甲基化只有在染色质浓缩形成致密结构以后才能对基因的转录产生抑制作用。
甲基化作用也与基因组印记(genomic imprinting)有关。哺乳动物细胞是二倍体,含有一套来自父方的基因和一套来自母方的基因。在某些情况下,一个基因的表达与其来源有关,即只允许表达其中之一,这种现象称为基因组印记,与之相关的基因谓之印记基因(imprinted gene)。印记基因在哺乳动物的发育过程中普遍存在。多数情况下来源于父方和母方的等位基因都同时表达,但印记基因仅在特定的发育阶段和特定的组织中表达等位基因中的一个,即在某种组织细胞中, 有些仅从父源染色体上表达, 有些仅从母源染色体上表达。例如编码胰岛素样生长因子2的基因(Igf2 )即是印记基因,来自母本的Igf2 基因拷贝是沉默的。研究资料显示,在小鼠配子生成和胚胎发育早期,印记基因是选择表达还是关闭,其可能机制是在特定发育时期对印记基因的甲基化。
此外,在哺乳动物(雌性)和人类女性的两条X染色体中,其中一条灭活(钝化)的X染色体就与DNA的甲基化有关,去甲基化可以使钝化的X染色体基因重新活化。
2、组蛋白的化学修饰影响基因的转录与细胞分化 在第九章我们讨论了组蛋白的共价化学修饰,如组蛋白的氨基酸残基能够被乙酰化、甲基化、磷酸化、泛素化、sumo化(sumoylation)及糖基化。这些修饰将引起染色质结构改变(即染色质重塑),而导致基因转录或沉默。近年研究表明,组蛋白的化学修饰所引起的染色质结构的动态变化能够影响细胞的分化状态的转变(transition)。例如,在ES细胞向神经元分化过程中,组蛋白的甲基化和乙酰化状态,特别是一些与神经元分化相关的因子(如Mashl、Pax6)的启动子区域组蛋白的修饰状态呈现出明显差异。在果蝇研究中发现,scrawny基因(因突变的成熟果蝇的外观而得名)的编码产物为泛素蛋白酶(ubiquitin protease) , 其功能是通过抑制组蛋白H2B的泛素化而沉默细胞分化关键基因,使果蝇的多个干细胞(生殖干细胞、皮肤上皮和肠道的组织干细胞)维持于未分化状态。在scrawny功能缺失的果蝇突变体,其生殖组织、皮肤和肠道组织中过早失去了它们的干细胞。
3、染色质成分的共价修饰具有时空性 已如上述,基因表达的激活,首先需要将致密压缩的染色质/核小体舒展开来,该过程涉及组蛋白的化学修饰、DNA甲基化,以及具有酶活性的功能蛋白复合体参与。影响染色质结构变化的因素,除组蛋白修饰和DNA甲基化之外,还包括组蛋白组分的改变、染色质重建子(remodeler)和非编码RNA等。这些因素或染色质上的这些标记在细胞分裂过程中能够被继承并共同作用决定细胞的表型,即表观遗传。表观遗传是近些年形成的研究领域,从分子或机制上可将其定义为“在同一基因组上建立的能将不同基因转录和基因沉默模式传递下去的染色质模板变化的总和”。在由单个受精卵发育为多细胞个体(如脊椎动物)过程中,从一个受表观遗传调控的单基因组逐渐演变为存在于200多种不同类型细胞中的多种表观基因组。这种程序性的变化被视为组成了一种“表观遗传密码”,从而使经典遗传密码中所隐藏的信息得到了扩展。可以认为,染色质的共价化学修饰和非共价机制(如组蛋白组分改变、染色质重建子和非编码RNA作用)相互结合促使形成一种染色质状态,使其在细胞的分化和发育过程中能够作为模板。
非编码RNA在染色质重塑中的作用已得到初步阐释。例如,miRNA通过调控染色质状态而发挥转录抑制的机制是,miRNA与蛋白质复合体——RITS(RNA-induced transcriptional silencing)结合,解离后的一条miRNA链将RITS复合体引导至miRNA同源基因处,通过募集组蛋白甲基转移酶,使组蛋白H3的赖氨酸-9发生甲基化,导致异染色质形成,最终抑制基因的转录。
染色质的共价修饰在细胞分化与发育中的作用是目前研究的前沿领域,涉及的机制才刚刚被人们加以阐释。人们在哺乳动物的发育过程中了解到:在生殖细胞发育后期将发生DNA甲基化,包括亲本特异性的基因印记。受精后,雄原核基因组迅速去甲基化,而雌原核基因组则维持不变。受精卵中的雄原核被包装上组蛋白,但其组蛋白上缺乏H3K9me2和H3K27me3,而此时雌原核则具有这些标记。合子细胞基因组后续的去甲基化发生于前着床发育期,直至毅胚期。在囊胚期,内细胞团开始出现DNA甲基化,组蛋白H3K9me2和H3K27me3水平上升;而由滋养外胚层(trophectoderm)发育而来的胎盘则表现出相对较低的甲基化水平。
新近研究发现,增强子在细胞特化中的作用还表现为多个增强子丛(cluster)组合在一起形成超级增强子(super-enhancers)而发挥功能。超级增强子是具有转录活性增强子的一个大簇,富集高密度的关键转录因子(master transcription factors)、辅因子(cofactor)和增强子表观修饰标记(histone modification marks)。在功能上超级增强子能够驱动控制细胞身份(cell identity)基因的表达,可以用来解释细胞类型特异的表达模式。目前已经在哺乳动物细胞中鉴别出超过一百万个控制基因表达的增强子,这些增强子控制着数以万计的基因表达,其中只有数百个超级增强子控制赋予每个细胞特性和功能的大多数关键基因的表达。现有研究资料提示,在发育过程中超级增强子的活性被不断地打开或关闭,旧的超级增强子失活、新的超级增强子活化,驱动了细胞身份的变化。超级增强子对细胞分化的转录调控是一个新兴领域,可以认为,本领域研究的不断深入,将有助于阐明基因表达盘的改变或基因表达水平的临界值与细胞表型特化的关系, 同时也将促进对既往研究中鉴定的基因座控制区(locus control region)、DNase Ⅰ超高敏位点(DNase Ⅰ super-hypersensitive sites)等在调控细胞分化中所起作用的认识。
基因选择性表达的转录后调控
编辑生物体发育和细胞分化的过程,实质上也是特异蛋白质不断合成的过程。在真核生物,基因的表达,也即基因向蛋白质的信息流向,在转录之后,还存在RNA加工、RNA 转运、mRNA降解、蛋白质翻译及蛋白质活性修饰等调控过程,它们均涉及生物体发育和细胞分化。在此仅从RNA剪接和mRNA降解两个方面阐述基因选择性表达的转录后调控在细胞分化中的作用。
1、RNA剪接与细胞分化 RNA剪接对细胞分化的一种调控方式为可变剪接(alternative splicing, 也称选择性剪接),即在同一基因中,其剪接位点和拼接方式可以改变,从而导致一个基因能产生多个具有明显差异的相关蛋白产物。例如,RNA可变剪接能使β-原肌球蛋白(β-tropmyosin)基因编码出骨骼肌细胞和成纤维细胞两种形式的蛋白。β-原肌球蛋白的前体核RNA含有11个外显子,其中外显子1~5、8和9是表达这一基因的所有mRNA共有的,外显子7和10被用于骨骼肌的β-原肌球蛋白合成中,而外显子6和11则被用在成纤维细胞和平滑肌细胞中。
2、非编码RNA与细胞分化 非编码RNA(non-coding RNA)在细胞分化中的作用是近些年被揭示的。哺乳动物基因组中近98%不与蛋白质编码基因相对应。在入类,虽然基因组组成多达约32亿个碱基,但编码蛋白质的基因仅约2万~3万个,其余绝大部分为非编码序列。这些非编码序列是产生微小RNA(microRNA, miRNA)、内源性siRNA(称endo-siRNA)、piRNA(Piwi-interacting RNA)等非编码小RNA, 以及长链非编码RNA(long non-coding RNA, lncRNA)的基础。
非编码小RNA主要在转录后水平调控细胞的分化。小RNA通过与靶基因mRNA 3'端UTR互补结合,抑制靶基因的蛋白质合成或促使靶基因的mRNA降解,从而参与细胞分化与发育的基因表达调控。小RNA在生物体发育中的调控作用,起初是在研究秀丽隐杆线虫(C. elegan )细胞命运的时间控制过程中被发现的:高浓度的转录因子LIN-14可特异性地促进早期幼虫器官的蛋白质合成,但在后续的发育中,尽管体内一直存在lin-14mRNA却检测不到LIN-14蛋白。后来发现在线虫的第一、二龄幼虫期存在一个22nt的miRNA, 即lin-4RNA。Lin-4RNA通过与lin-14mRNA 3'端UTR互补结合,短暂下调LIN-14蛋白水平,促进线虫从第一龄幼虫期向第二龄幼虫期发育。如果lin-4基因突变而失去功能,那么线虫幼虫体内可持续合成LIN1- 4蛋白,使线虫长期停滞在幼虫的早期发育阶段。随后在线虫体内又发现了另一个miRNA——let-7RNA。let-7RNA长为21nt, 存在于线虫的第三、四龄幼虫期及成虫期,其功能是决定线虫从幼虫向成虫的形态转变。后续研究发现,let-7RNA不仅存在于线虫,也存在于脊椎动物和人类。越来越多的研究资料表明,小RNA广泛地存在于哺乳动物,具有高度的保守性。目前在各种生物中已发现数千中miRNA, 大部分miRNA的产生机制和功能尚有待阐明。迄今已鉴定了系列与细胞分化有关的miRNA,如miR-143和miR-145参与调控平滑肌细胞的分化;miR-126特异性表达于内皮细胞,调控血管形成。piRNA与PIWI蛋白家族成员的结合在调节精子成熟发育中起重要作用。非编码小RNA与细胞分化和发育的关系也是目前生物学研究中的热点领域,有待探索的问题很多。
长链非编码RNA与细胞的分化和发育密切相关。细胞中lncRNA的来源极其复杂,有资料显示,哺乳动物基因组序列中4%~9%的序列产生的转录本是lncRNA。lncRNA可通过多种方式调控基因表达,如通过在蛋白编码基因上游启动子区发生转录,干扰下游基因的表达;通过抑制RNA聚合酶Ⅱ或者介导染色质重建,影响下游基因表达;通过与蛋白编码基因的转录本形成互补双链而干扰mRNA的剪接;通过结合到特定蛋白质上,调节相应蛋白的活性。已有研究表明,在细胞分化与发育过程中lncRNA能调控基因组印记和X染色体失活;许多lncRNA在Hox基因座的选择性表达中发挥重要调控作用,它们决定这些基因座染色质结构域中组蛋白甲基化修饰是否会发生、染色质结构是否允许RNA聚合酶转录等。