生物化学与分子生物学/自然界的DNA重组和基因转移
DNA重组和重组DNA技术 -
自然界的DNA重组和基因转移 -
重组DNA技术 -
重组DNA技术在医学中的应用
DNA 重组是两个或两个以上 DNA分子重新组合形成一个 DNA分子的过程;而自然界中的基因转移泛指 DNA 片段或基因在不同生物个体或细胞间的传递过程,其中通过繁殖使 DNA 或基因在亲代和子代间的传递称作基因纵向转移,打破亲缘关系以直接接触、主动摄取或病毒感染等方式使基因在不同生物个体或细胞间、细胞内不同细胞器间的传递称作基因横向(水平)转移。自然界不同物种或个体之间的 DNA 重组和基因转移是经常发生的,这增加了群体的遗传多样性,也通过优化组合积累了有意义的遗传信息。
DNA 重组和基因转移的方式有多种,包括同源重组、位点特异性重组、转座重组、接合、转化和转导等,其中前三种方式在原核和真核细胞中均可发生,后三种方式通常发生在原核细胞。新近研究发现细菌还有一种 DNA 整合机制,称作成簇规律间隔短回文重复 (clustered-regularly interspaced palindromic repeats, CRISPR)/Cas 系统。
同源重组是最基本的DNA重组方式
编辑同源重组(homologous recombination) 是指发生在两个相似或相同DNA分子之间核苷酸序列互换的过程,又称基本重组(general recombination)。在哺乳动物配子发生的减数分裂过程中,同源重组可产生 DNA 序列的新重组,标示着后代的遗传变异;不同种属的细菌和病毒也在水平基因转移中用同源重组互换遗传物质。具有同源序列的两条 DNA 链通过断裂和再连接引起 DNA 单链或双链片段的交换。同源重组的缺陷与人类癌症高度相关,例如,两个相似的抑癌基因 brcal 和 brca2 编码的蛋白质BRCAl 和 BRCA2 与同源重组的发生有关,BRCA2 的功能 是帮助同源重组的起始,缺乏 brcal 和 brca2 的细胞同源重组率减少,对电离辐射的敏感性增加,因此,缺乏 brcal 和 brca2 的个体易于患乳腺癌和卵巢癌等。利用同源重组的原理进行基因敲除或基因敲入(也称基因打靶),是将遗传改变引入靶生物体的一种有效方式。下面主要介绍 Holliday 模式的同源重组,并以细菌的 RecBCD 同源重组作为 Holliday 同源重组的例子。
Holliday模型是最经典的同源重组模式
编辑同源重组作为自然界最基本的 DNA 重组方式,不需要特异 DNA 序列,而是依赖两分子之间序列的相同或相似性。R.Holliday 于1964年提出 Holliday 模型,对于认识同源重组起着十分重要的作用。在这一模型中,同源重组主要经历四个关键步骤: ①两个同源染色体 DNA 排列整齐;②-个DNA 的一条链断裂,与另一个 DNA 对应链连接,在这个过程中形成了十字形结构,称作 Holliday 连接(Holliday junction); ③通过分支移动(branch migration) 产生异源双链 DNA (heteroduplex DNA) , 也称Holliday中间体(inter-mediate); ④将Holliday中间体切开并修复,形成两个双链重组体DNA。Holliday中间体切开方式不同,所得到的重组产物也不同:如果切开的链与原来断裂的是同一条链,重组体含有一段异源双链区,其两侧来自同一亲本DNA,称为片段重组体(patch recombinant); 如果切开的链并非原来断裂的链,重组体异源双链区的两侧来自不同亲本DNA,称为拼接重组体(splice recombinant)。
RecBCD模式是大肠埃希菌的Holliday同源重组
编辑目前对大肠埃希菌(E.coli)的DNA同源重组分子机制了解最清楚。参与细菌 DNA同源重组的酶有数十种,其中最关键的是RecA蛋白、RecBCD复合物和RuvC蛋白。
1、参与细菌RecBCD同源重组的酶 细菌的RecBCD同源重组由以下酶和酶复合物催化完成:
- RecBCD复合物:RecBCD复合物具有三种酶活性,包括依赖ATP的核酸外切酶活性、可被ATP增强的核酸内切酶活性和需要 ATP的解旋酶活性。RecBCD复合物利用ATP水解提供能量,沿着DNA链运动,并以较快的速度将前方DNA 解旋;当遇到Chi (因交换位点的DNA 结构类似于希腊字母Χ而得名)位点(5'-GCTGGTGG-3')时,可在其下游切出3'-端的游离单链,从而使DNA 重组成为可能。
- RecA蛋白:RecA蛋白可结合单链DNA(ssDNA), 形成RecA-ssDNA复合物。在有同源DNA存在时,此复合物可与含同源序列的靶双链DNA相互作用,并将结合的单链DNA插入双链DNA的同源区,与互补链配对,而将同源链置换出来。
- RuvC蛋白:RuvC蛋白有核酸内切酶活性,能专一性识别Holliday连接点,并有选择地切开同源重组体的中间体。
2、E.coli 的RecBCD同源重组过程 E.coli 的RecBCD同源重组过程下: RecBCD复合物识别双链断裂的断裂口平端或近似平端,然后向上游边移行边解链;当遇到Chi位点时,在3'-单链上切开产生单链切口;RecA蛋白催化3'-单链DNA对另一双链DNA的侵入,并与其中的一条链交叉,继而交叉分支移动,待相交的另一链在RecBCD内切酶活性催化下断裂后,由DNA连接酶交换连接缺失的远末端,形成Holliday中间体;此中间体再经 RuvC 切割和DNA连接酶的连接,最后完成重组。
位点特异性重组是发生在特异位点间的DNA整合
编辑位点特异性重组(site specific recombination)是指发生在至少拥有一定程度序列同源性片段间 DNA链的互换过程,也称保守的位点特异性重组(conservative site-specific recombination)。位点特异性重组酶(site-specific recombinase, SSR)通过识别和结合DNA短序列(位点)使DNA片段发生重排。该类重组广泛存在于各类细胞中,起着十分重要的作用,如某些基因表达的调节、发育过程中程序性 DNA重排以及有些病毒和质粒DNA复制循环过程中发生的整合和切除等。以下是位点特异性重组的例子。
λ噬菌体DNA可与宿主染色体DNA发生整合
编辑λ噬菌体DNA的整合是在λ噬菌体的整合酶催化下完成的,是λ噬菌体DNA与宿主染色体DNA特异靶位点之间的选择性整合: λ噬菌体DNA的重组位点att P 与大肠埃希菌基因组DNA的重组位点att B 之间有15bp核心序列相同,在整合酶(Int)和整合宿主因子(IHF)作用下可发生整合,由Xis参与切除过程。通常这种由整合酶催化的DNA整合是十分特异而有效的。逆转录病毒整合酶 可特异地识别、整合逆转录病毒cDNA的长末端重复序列(long terminal repeat, LTR)。
基因片段倒位是细菌位点特异性重组的一种方式
编辑以鼠伤寒沙门菌H抗原编码基因中H片段重组为例。鼠伤寒沙门菌的H抗原有两种,分别为H1和H2鞭毛蛋白。在单菌落的沙门菌中经常出现少数另一种含H抗原的细菌,这种现象称为鞭毛相转变。遗传分析表明,这种抗原相位的改变是由基因中一段995bp的H片段发生倒位所致。 H片段上有两个启动子(P),其一驱动hin 基因表达,另一个驱动H2 和rHl 基因表达,倒位后H2 和rH1 基因不表达。hin 基因编码特异的重组酶,即倒转酶(invertase)Hin, 该酶为同源二聚体,分别结合在两个hix位点上,并由辅因子Fis(factor for inversion stimulation)促使DNA弯曲而将两个hix位点连接在一起,DNA片段经断裂和再连接而发生倒位。rHl 表达产物为Hl阻遏蛋白,当H2 基因表达时, rHl也表达,从而使H1 基因被阻遏;反之,H2 基因不表达时,rH1 也不表达,H1 基因阻遏被解除。
免疫球蛋白基因以位点特异性重组发生重排
编辑免疫球蛋白编码基因V-(D)-J重排及T细胞受体基因V-(D)-J重排都是利用位点特异性重组的原理。
转座重组可使基因位移
编辑转座重组(transpos山onal recombination)或转座(transposition)是指由插入序列和转座子介导的基因移位或重排。
插入序列是最简单的转座元件
编辑插入序列(insertion sequence, IS)是指能在基因(组)内部或基因(组)间改变自身位置的一段DNA序列。通常是转座子的一种,只携带与自身转座有关的编码基因,具有独特的结构特征:两端是反向重复序列(invertedrepeat, IR), 中间是一个转座酶(transposase)编码基因,后者的表达产物可引起IS转座。典型的IS两端各一个9~4lbp的反向重复序列,反向重复序列侧翼连接有短的(4~12bp)、不同的IS所特有的正向重复序列。IS发生的转座有保守性转座(conservative transposition)和复制性转座(duplicative transposition)两种形式,前者是IS从原位迁至新位, 后者是IS复制后的一个复制本迁至新位。
转座子可以在染色体间转座
编辑转座子(transposon, Tn)是指能将自身或其拷贝插入基因组新位置的DNA序列,一般属于复合型转座子 (composite Tn), 即有一个中心区域,两边侧翼序列是插入序列(IS),除有与转座有关的编码基因外,还携带其他基因如抗生素抗性基因等。Tn 普遍存在于原核和真核细胞中,不但可以在一条染色体上移动,也可以从一条染色体跳到另一条染色体上,甚至从一个细胞进入另一个细胞。 Tn 在移动过程中,DNA链经历断裂及再连接的过程,可能导致某些基因开启或关闭,引起插入突变、新基因生成、染色体畸变及生物进化。
原核细胞可通过接合、转化和转导进行基因转移或重组
编辑原核细胞(如细菌)可通过细胞间直接接触(接合作用)、细胞主动摄取(转化作用)或噬菌体传递(转导作用)等方式进行基因转移或重组。
接合作用是质粒DNA通过细胞间相互接触发生转移的现象
编辑接合作用 (conjugation)是指细菌的遗传物质在细菌细胞间通过细胞-细胞直接接触或细胞间桥样连接的转移过程。当细菌通过鞭毛相互接触时,质粒 DNA 就可以从一个细菌转移至另一细菌,但并非任何质粒 DNA 都有这种转移能力,只有某些较大的质粒,如 F 因子(F factor), 方可通过接合作用从一个细胞转移至另一个细胞。F因子决定细菌表面鞭毛的形成,当含有F因子的细菌(F+细菌)与没有 F 因子的细菌(F-细菌)相遇时,在两细菌间形成性鞭毛连接桥,接着质粒双链 DNA 中的一条链会被酶切割,产生单链切口,有切口的单链 DNA 通过鞭毛连接桥向F细胞转移,随后,在两细胞内分别以单链 DNA 为模板合成互补链。
转化作用是受体细胞自主摄取外源 DNA并与之整合的现象
编辑转化作用(transformation)是指受体菌通过细胞膜直接从周围环境中摄取并掺入外源遗传物质引起自身遗传改变的过程,受体菌必须处于敏化状态,这种敏化状态可以通过自然饥饿、生长密度或实验室诱导而达到。例如,当溶菌时,裂解的 DNA 片段作为外源 DNA 被另一细菌(受体菌)摄取,受体菌通过重组机制将 外源 DNA 整合至其基因组上,从而获得新的遗传性状,这就是自然界发生的转化作用。 然而,由于较大的外源 DNA 不易透过细胞膜,因此,自然界发生转化作用的效率并不高,染色体整合概率则更低。
转导作用是病毒将供体 DNA 带入受体并与之染色体发生整合的现象
编辑转导作用(transduction)是指由病毒或病毒载体介导外源 DNA 进入靶细胞的过程。自然界中常见的例子是噬菌体介导的转导,包括普遍性转导(generalizedtransduction)和特异性转导(specialized transduction) , 后者又称为限制性转导(restricted transduction)。
- 普遍性转导的基本过程 当噬菌体在供体菌内包装时,供体菌自身的 DNA 片段被包装入噬菌体颗粒,随后细菌溶解,所释放出来的噬菌体通过感染受体菌而将所携带的供体菌 DNA 片段转移至受体菌中,进而重组千受体菌的染色体 DNA 上。
- 特异性转导的基本过程 当噬菌体感染供体菌后,噬菌体 DNA 以位点特异性重组机制 整合 千供体菌染色体 DNA 上;当整合的噬菌体 DNA 从供体菌染色体 DNA 上切离时,可携带位于整合位点侧翼的 DNA 片段,随后切离出来的噬菌体 DNA 被包装入噬菌体衣壳中;供体菌裂解,所释放出来的噬菌体感染受体菌,继而,携带有供体菌 DNA 片段的噬菌体 DNA 整合于受体菌染色体 DNA 的特异性位点上。 这样,位于整合位点侧翼的供体菌 DNA 片段重组至受体菌染色体 DNA 上。
细菌可通过CRISPR/Cas系统从病毒获得DNA片段作为获得性免疫机制
编辑CRISPR/Cas 系统(CRISPR/Cas system)是原核生物的 种获得性免疫系统,用于抵抗存在于噬菌体 或质粒的外源遗传元件的入侵。关于细菌的 CRISPR/Cas 系统的发现过程可参看数字扩展相关内容。
CRISPR 序列的结构特征
编辑成簇规律间隔短回文重复 (clustered regularly interspaced palindromic repeats, CRISPR) 座 CRISPR loci)是指细菌基因组上成簇排列的、由来自噬菌体 DNA 的间隔序列(spacer)和宿主菌基因组的重组序列所形成的特殊重复序列-间隔序列阵列,与 Gas 基因 (CRISPR-associated gene, Cas gene) 相邻。 CRISPR 存在于已测序的 40% 细菌基因组和 90% 古细菌(archaea)基因组中。
外源DNA可插入宿主基因组的CRISPR座
编辑以噬菌体感染为例。当噬菌体感染宿主菌后,噬菌体DNA进入宿主细胞并复制,复制所产生的 DNA片段可以被宿主细胞的Casl-Cas2复合物捕获。然后,Casl-Cas2复合物将 所捕获的DNA片段插入到宿主基因组CRISPR座位的第一个位点,Casl 在此过程中协调切割-连接反应,即在重复序列5'-端切开,然后与DNA片段的3'-端连接。这种机制在跨越插入的DNA片段两端的重复序列上产生两个单链DNA缺口,最后由DNA聚合酶将缺口封闭。
CRISPR/Cas系统是细菌的获得性免疫机制
编辑CRISPR/Cas系统是指由Cas基因编码的Cas蛋白催化CRISPR形成,以及CRISPR转录产物与Cas蛋白相配合介导入侵DNA切割的机制,并成为细菌抵抗病毒感染的一种获得性免疫机制。根据Cas蛋白的功能可将其分为三型,及Ⅰ型、Ⅱ型和Ⅲ型,其中Ⅱ型CRISPR/Cas9系统是目前应用最多的。
以Ⅱ型CRISPR/Cas9系统为例介绍CRISPR/Cas系统的工作原理:Ⅱ型系统中由重复序列及间隔序列(spacer)组成的CRISPR座位经转录产生CRISPR-RNA(crRNA)前体(pre-erRNA)和 tracrRNA (trans-encoded crRNA); tracrRNA与pre-crRNA的重复序列区互补配对产生局部双链RNA
(dsRNA);RNase Ⅲ识别并切割 dsRNA产生向导crRNA (guide crRNA, gcrRNA);宿主细胞表达的
Cas9核酸酶与gcrRNA结合形成Cas9-crRNA复合物;当含有相同间隔序列的噬菌体或质粒再次入侵时,Cas9-crRNA复合物与入侵DNA上的原间隔序列(protospacer)互补配对形成由protospacer/crRNA 组成的R-环双链结构,Cas9识别并切割R-环,从而在入侵者的基因组上产生切口。Cas9切割的靶序列下游有一个紧邻原间隔序列基序(protospacer-adjacent motif, PAM) , 可能对于Cas9寻找靶序列有一定作用 。CRISPR/Cas9系统是一种细菌防御病毒和质粒攻击的获得性免疫机制,目前已经被开发成一种应用最多的高效率、低脱靶率的基因组编辑(genome editing)技术。