生物化學與分子生物學/自然界的DNA重組和基因轉移
DNA重組和重組DNA技術 -
自然界的DNA重組和基因轉移 -
重組DNA技術 -
重組DNA技術在醫學中的應用
DNA 重組是兩個或兩個以上 DNA分子重新組合形成一個 DNA分子的過程;而自然界中的基因轉移泛指 DNA 片段或基因在不同生物個體或細胞間的傳遞過程,其中通過繁殖使 DNA 或基因在親代和子代間的傳遞稱作基因縱向轉移,打破親緣關係以直接接觸、主動攝取或病毒感染等方式使基因在不同生物個體或細胞間、細胞內不同細胞器間的傳遞稱作基因橫向(水平)轉移。自然界不同物種或個體之間的 DNA 重組和基因轉移是經常發生的,這增加了群體的遺傳多樣性,也通過優化組合積累了有意義的遺傳信息。
DNA 重組和基因轉移的方式有多種,包括同源重組、位點特異性重組、轉座重組、接合、轉化和轉導等,其中前三種方式在原核和真核細胞中均可發生,後三種方式通常發生在原核細胞。新近研究發現細菌還有一種 DNA 整合機制,稱作成簇規律間隔短回文重複 (clustered-regularly interspaced palindromic repeats, CRISPR)/Cas 系統。
同源重組是最基本的DNA重組方式
編輯同源重組(homologous recombination) 是指發生在兩個相似或相同DNA分子之間核苷酸序列互換的過程,又稱基本重組(general recombination)。在哺乳動物配子發生的減數分裂過程中,同源重組可產生 DNA 序列的新重組,標示著後代的遺傳變異;不同種屬的細菌和病毒也在水平基因轉移中用同源重組互換遺傳物質。具有同源序列的兩條 DNA 鏈通過斷裂和再連接引起 DNA 單鏈或雙鏈片段的交換。同源重組的缺陷與人類癌症高度相關,例如,兩個相似的抑癌基因 brcal 和 brca2 編碼的蛋白質BRCAl 和 BRCA2 與同源重組的發生有關,BRCA2 的功能 是幫助同源重組的起始,缺乏 brcal 和 brca2 的細胞同源重組率減少,對電離輻射的敏感性增加,因此,缺乏 brcal 和 brca2 的個體易於患乳腺癌和卵巢癌等。利用同源重組的原理進行基因敲除或基因敲入(也稱基因打靶),是將遺傳改變引入靶生物體的一種有效方式。下面主要介紹 Holliday 模式的同源重組,並以細菌的 RecBCD 同源重組作為 Holliday 同源重組的例子。
Holliday模型是最經典的同源重組模式
編輯同源重組作為自然界最基本的 DNA 重組方式,不需要特異 DNA 序列,而是依賴兩分子之間序列的相同或相似性。R.Holliday 於1964年提出 Holliday 模型,對於認識同源重組起著十分重要的作用。在這一模型中,同源重組主要經歷四個關鍵步驟: ①兩個同源染色體 DNA 排列整齊;②-個DNA 的一條鏈斷裂,與另一個 DNA 對應鏈連接,在這個過程中形成了十字形結構,稱作 Holliday 連接(Holliday junction); ③通過分支移動(branch migration) 產生異源雙鏈 DNA (heteroduplex DNA) , 也稱Holliday中間體(inter-mediate); ④將Holliday中間體切開並修復,形成兩個雙鏈重組體DNA。Holliday中間體切開方式不同,所得到的重組產物也不同:如果切開的鏈與原來斷裂的是同一條鏈,重組體含有一段異源雙鏈區,其兩側來自同一親本DNA,稱為片段重組體(patch recombinant); 如果切開的鏈並非原來斷裂的鏈,重組體異源雙鏈區的兩側來自不同親本DNA,稱為拼接重組體(splice recombinant)。
RecBCD模式是大腸埃希菌的Holliday同源重組
編輯目前對大腸埃希菌(E.coli)的DNA同源重組分子機制了解最清楚。參與細菌 DNA同源重組的酶有數十種,其中最關鍵的是RecA蛋白、RecBCD複合物和RuvC蛋白。
1、參與細菌RecBCD同源重組的酶 細菌的RecBCD同源重組由以下酶和酶複合物催化完成:
- RecBCD複合物:RecBCD複合物具有三種酶活性,包括依賴ATP的核酸外切酶活性、可被ATP增強的核酸內切酶活性和需要 ATP的解旋酶活性。RecBCD複合物利用ATP水解提供能量,沿著DNA鏈運動,並以較快的速度將前方DNA 解旋;當遇到Chi (因交換位點的DNA 結構類似於希臘字母Χ而得名)位點(5'-GCTGGTGG-3')時,可在其下游切出3'-端的游離單鏈,從而使DNA 重組成為可能。
- RecA蛋白:RecA蛋白可結合單鏈DNA(ssDNA), 形成RecA-ssDNA複合物。在有同源DNA存在時,此複合物可與含同源序列的靶雙鏈DNA相互作用,並將結合的單鏈DNA插入雙鏈DNA的同源區,與互補鏈配對,而將同源鏈置換出來。
- RuvC蛋白:RuvC蛋白有核酸內切酶活性,能專一性識別Holliday連接點,並有選擇地切開同源重組體的中間體。
2、E.coli 的RecBCD同源重組過程 E.coli 的RecBCD同源重組過程下: RecBCD複合物識別雙鏈斷裂的斷裂口平端或近似平端,然後向上游邊移行邊解鏈;當遇到Chi位點時,在3'-單鏈上切開產生單鏈切口;RecA蛋白催化3'-單鏈DNA對另一雙鏈DNA的侵入,並與其中的一條鏈交叉,繼而交叉分支移動,待相交的另一鏈在RecBCD內切酶活性催化下斷裂後,由DNA連接酶交換連接缺失的遠末端,形成Holliday中間體;此中間體再經 RuvC 切割和DNA連接酶的連接,最後完成重組。
位點特異性重組是發生在特異位點間的DNA整合
編輯位點特異性重組(site specific recombination)是指發生在至少擁有一定程度序列同源性片段間 DNA鏈的互換過程,也稱保守的位點特異性重組(conservative site-specific recombination)。位點特異性重組酶(site-specific recombinase, SSR)通過識別和結合DNA短序列(位點)使DNA片段發生重排。該類重組廣泛存在於各類細胞中,起著十分重要的作用,如某些基因表達的調節、發育過程中程序性 DNA重排以及有些病毒和質體DNA複製循環過程中發生的整合和切除等。以下是位點特異性重組的例子。
λ噬菌體DNA可與宿主染色體DNA發生整合
編輯λ噬菌體DNA的整合是在λ噬菌體的整合酶催化下完成的,是λ噬菌體DNA與宿主染色體DNA特異靶位點之間的選擇性整合: λ噬菌體DNA的重組位點att P 與大腸埃希菌基因組DNA的重組位點att B 之間有15bp核心序列相同,在整合酶(Int)和整合宿主因子(IHF)作用下可發生整合,由Xis參與切除過程。通常這種由整合酶催化的DNA整合是十分特異而有效的。逆轉錄病毒整合酶 可特異地識別、整合逆轉錄病毒cDNA的長末端重複序列(long terminal repeat, LTR)。
基因片段倒位是細菌位點特異性重組的一種方式
編輯以鼠傷寒沙門菌H抗原編碼基因中H片段重組為例。鼠傷寒沙門菌的H抗原有兩種,分別為H1和H2鞭毛蛋白。在單菌落的沙門菌中經常出現少數另一種含H抗原的細菌,這種現象稱為鞭毛相轉變。遺傳分析表明,這種抗原相位的改變是由基因中一段995bp的H片段發生倒位所致。 H片段上有兩個啟動子(P),其一驅動hin 基因表達,另一個驅動H2 和rHl 基因表達,倒位後H2 和rH1 基因不表達。hin 基因編碼特異的重組酶,即倒轉酶(invertase)Hin, 該酶為同源二聚體,分別結合在兩個hix位點上,並由輔因子Fis(factor for inversion stimulation)促使DNA彎曲而將兩個hix位點連接在一起,DNA片段經斷裂和再連接而發生倒位。rHl 表達產物為Hl阻遏蛋白,當H2 基因表達時, rHl也表達,從而使H1 基因被阻遏;反之,H2 基因不表達時,rH1 也不表達,H1 基因阻遏被解除。
免疫球蛋白基因以位點特異性重組發生重排
編輯免疫球蛋白編碼基因V-(D)-J重排及T細胞受體基因V-(D)-J重排都是利用位點特異性重組的原理。
轉座重組可使基因位移
編輯轉座重組(transpos山onal recombination)或轉座(transposition)是指由插入序列和轉座子介導的基因移位或重排。
插入序列是最簡單的轉座元件
編輯插入序列(insertion sequence, IS)是指能在基因(組)內部或基因(組)間改變自身位置的一段DNA序列。通常是轉座子的一種,只攜帶與自身轉座有關的編碼基因,具有獨特的結構特徵:兩端是反向重複序列(invertedrepeat, IR), 中間是一個轉座酶(transposase)編碼基因,後者的表達產物可引起IS轉座。典型的IS兩端各一個9~4lbp的反向重複序列,反向重複序列側翼連接有短的(4~12bp)、不同的IS所特有的正向重複序列。IS發生的轉座有保守性轉座(conservative transposition)和複製性轉座(duplicative transposition)兩種形式,前者是IS從原位遷至新位, 後者是IS複製後的一個複製本遷至新位。
轉座子可以在染色體間轉座
編輯轉座子(transposon, Tn)是指能將自身或其拷貝插入基因組新位置的DNA序列,一般屬於複合型轉座子 (composite Tn), 即有一個中心區域,兩邊側翼序列是插入序列(IS),除有與轉座有關的編碼基因外,還攜帶其他基因如抗生素抗性基因等。Tn 普遍存在於原核和真核細胞中,不但可以在一條染色體上移動,也可以從一條染色體跳到另一條染色體上,甚至從一個細胞進入另一個細胞。 Tn 在移動過程中,DNA鏈經歷斷裂及再連接的過程,可能導致某些基因開啟或關閉,引起插入突變、新基因生成、染色體畸變及生物進化。
原核細胞可通過接合、轉化和轉導進行基因轉移或重組
編輯原核細胞(如細菌)可通過細胞間直接接觸(接合作用)、細胞主動攝取(轉化作用)或噬菌體傳遞(轉導作用)等方式進行基因轉移或重組。
接合作用是質體DNA通過細胞間相互接觸發生轉移的現象
編輯接合作用 (conjugation)是指細菌的遺傳物質在細菌細胞間通過細胞-細胞直接接觸或細胞間橋樣連接的轉移過程。當細菌通過鞭毛相互接觸時,質體 DNA 就可以從一個細菌轉移至另一細菌,但並非任何質體 DNA 都有這種轉移能力,只有某些較大的質體,如 F 因子(F factor), 方可通過接合作用從一個細胞轉移至另一個細胞。F因子決定細菌表面鞭毛的形成,當含有F因子的細菌(F+細菌)與沒有 F 因子的細菌(F-細菌)相遇時,在兩細菌間形成性鞭毛連接橋,接著質體雙鏈 DNA 中的一條鏈會被酶切割,產生單鏈切口,有切口的單鏈 DNA 通過鞭毛連接橋向F細胞轉移,隨後,在兩細胞內分別以單鏈 DNA 為模板合成互補鏈。
轉化作用是受體細胞自主攝取外源 DNA並與之整合的現象
編輯轉化作用(transformation)是指受體菌通過細胞膜直接從周圍環境中攝取並摻入外源遺傳物質引起自身遺傳改變的過程,受體菌必須處于敏化狀態,這種敏化狀態可以通過自然飢餓、生長密度或實驗室誘導而達到。例如,當溶菌時,裂解的 DNA 片段作為外源 DNA 被另一細菌(受體菌)攝取,受體菌通過重組機制將 外源 DNA 整合至其基因組上,從而獲得新的遺傳性狀,這就是自然界發生的轉化作用。 然而,由於較大的外源 DNA 不易透過細胞膜,因此,自然界發生轉化作用的效率並不高,染色體整合機率則更低。
轉導作用是病毒將供體 DNA 帶入受體並與之染色體發生整合的現象
編輯轉導作用(transduction)是指由病毒或病毒載體介導外源 DNA 進入靶細胞的過程。自然界中常見的例子是噬菌體介導的轉導,包括普遍性轉導(generalizedtransduction)和特異性轉導(specialized transduction) , 後者又稱為限制性轉導(restricted transduction)。
- 普遍性轉導的基本過程 當噬菌體在供體菌內包裝時,供體菌自身的 DNA 片段被包裝入噬菌體顆粒,隨後細菌溶解,所釋放出來的噬菌體通過感染受體菌而將所攜帶的供體菌 DNA 片段轉移至受體菌中,進而重組千受體菌的染色體 DNA 上。
- 特異性轉導的基本過程 當噬菌體感染供體菌後,噬菌體 DNA 以位點特異性重組機制 整合 千供體菌染色體 DNA 上;當整合的噬菌體 DNA 從供體菌染色體 DNA 上切離時,可攜帶位於整合位點側翼的 DNA 片段,隨後切離出來的噬菌體 DNA 被包裝入噬菌體衣殼中;供體菌裂解,所釋放出來的噬菌體感染受體菌,繼而,攜帶有供體菌 DNA 片段的噬菌體 DNA 整合於受體菌染色體 DNA 的特異性位點上。 這樣,位於整合位點側翼的供體菌 DNA 片段重組至受體菌染色體 DNA 上。
細菌可通過CRISPR/Cas系統從病毒獲得DNA片段作為獲得性免疫機制
編輯CRISPR/Cas 系統(CRISPR/Cas system)是原核生物的 種獲得性免疫系統,用於抵抗存在於噬菌體 或質體的外源遺傳元件的入侵。關於細菌的 CRISPR/Cas 系統的發現過程可參看數字擴展相關內容。
CRISPR 序列的結構特徵
編輯成簇規律間隔短回文重複 (clustered regularly interspaced palindromic repeats, CRISPR) 座 CRISPR loci)是指細菌基因組上成簇排列的、由來自噬菌體 DNA 的間隔序列(spacer)和宿主菌基因組的重組序列所形成的特殊重複序列-間隔序列陣列,與 Gas 基因 (CRISPR-associated gene, Cas gene) 相鄰。 CRISPR 存在於已測序的 40% 細菌基因組和 90% 古細菌(archaea)基因組中。
外源DNA可插入宿主基因組的CRISPR座
編輯以噬菌體感染為例。當噬菌體感染宿主菌後,噬菌體DNA進入宿主細胞並複製,複製所產生的 DNA片段可以被宿主細胞的Casl-Cas2複合物捕獲。然後,Casl-Cas2複合物將 所捕獲的DNA片段插入到宿主基因組CRISPR座位的第一個位點,Casl 在此過程中協調切割-連接反應,即在重複序列5'-端切開,然後與DNA片段的3'-端連接。這種機制在跨越插入的DNA片段兩端的重複序列上產生兩個單鏈DNA缺口,最後由DNA聚合酶將缺口封閉。
CRISPR/Cas系統是細菌的獲得性免疫機制
編輯CRISPR/Cas系統是指由Cas基因編碼的Cas蛋白催化CRISPR形成,以及CRISPR轉錄產物與Cas蛋白相配合介導入侵DNA切割的機制,並成為細菌抵抗病毒感染的一種獲得性免疫機制。根據Cas蛋白的功能可將其分為三型,及Ⅰ型、Ⅱ型和Ⅲ型,其中Ⅱ型CRISPR/Cas9系統是目前應用最多的。
以Ⅱ型CRISPR/Cas9系統為例介紹CRISPR/Cas系統的工作原理:Ⅱ型系統中由重複序列及間隔序列(spacer)組成的CRISPR座位經轉錄產生CRISPR-RNA(crRNA)前體(pre-erRNA)和 tracrRNA (trans-encoded crRNA); tracrRNA與pre-crRNA的重複序列區互補配對產生局部雙鏈RNA
(dsRNA);RNase Ⅲ識別並切割 dsRNA產生嚮導crRNA (guide crRNA, gcrRNA);宿主細胞表達的
Cas9核酸酶與gcrRNA結合形成Cas9-crRNA複合物;當含有相同間隔序列的噬菌體或質體再次入侵時,Cas9-crRNA複合物與入侵DNA上的原間隔序列(protospacer)互補配對形成由protospacer/crRNA 組成的R-環雙鏈結構,Cas9識別並切割R-環,從而在入侵者的基因組上產生切口。Cas9切割的靶序列下游有一個緊鄰原間隔序列基序(protospacer-adjacent motif, PAM) , 可能對於Cas9尋找靶序列有一定作用 。CRISPR/Cas9系統是一種細菌防禦病毒和質體攻擊的獲得性免疫機制,目前已經被開發成一種應用最多的高效率、低脫靶率的基因組編輯(genome editing)技術。