生物化學與分子生物學/基因功能研究
基因結構功能分析和疾病相關基因鑑定克隆 -
基因結構分析 -
基因功能研究 -
疾病相關基因鑑定和克隆原則 -
疾病相關基因鑑定克隆的策略和方法
基因的功能就是基因產物的功能,也就是編碼基因的蛋白質功能和非編碼基因RNA的功能,前者是本節討論的重點。非編碼RNA, 如miRNA、lncRNA等所謂的調節RNA功能,最近引起了廣泛的關注,可參考基因表達調控的相關章節內容。基因產物的功能可以從三個不同水平來描述:①生物化學水平,主要描述基因產物參與了何種生化過程,如蛋白激酶、轉錄因子等;②細胞水平,主要論述基因產物在細胞內的定位和參與的生物學途徑,例如,某蛋白質定位於核內,參與DNA的修復過程,有可能並不了解確切的生物化學功能;③整體水平,主要包括基因表達的時空性及基因在疾病中的作用。對人類基因功能的研究是後基因組時代生命科學領域中的重大命題。通過基因功能的研究可以闡明人體細胞的增殖、分化、衰老、死亡和通訊等方面的分子機制,確定人類疾病發生發展及轉歸的機制,進而研發新的診斷技術及治療干預措施,提供藥物開發的靶標分子,是開展精準醫療的基礎。
生物信息學全面了解基因已知的結構和功能
編輯在以往的研究中,已經對大量的基因功能產物的功能有了詳盡的了解,獲得了足夠多的信息,建立了共享資源數據庫,其中最為著名的就是美國的GenBank。這些數據庫是進行基因序列比對,詮釋基因功能的基礎。依據分子進化的理論,核酸或胺基酸序列相似的基因,應表現出類似的功能。這些序列相似的基因稱之為同源基因。基本的方法是基因序列比對分析。
兩個或多個符號序列按字母比較、儘可能確切地反映它們之間的相似和差異,稱為序列比對,又稱序列聯配。通常所講的序列比對包括核酸序列比對和蛋白質序列比對。根據每次參與比對的序列數又可分為雙序列比對和多序列比對。
基因發揮作用的本質是其編碼產物的生物化學功能
編輯人類基因組DNA有3×l09bp,包括2萬個蛋白質編碼基因,決定了人類作為高等動物及其複雜的生物學性狀。編碼基因表達的蛋白質分子包括:轉錄因子,是一類能與基因調控區域專一性結合的蛋白質分子,調控基因表達的時空性;核骨架蛋白質,是由纖維蛋白構成的網架結構,維持細胞核的基本結構;信號分子,一類參與胞內信號轉導的蛋白質分子;酶,是一類生物催化劑,支配着生物的新陳代謝參與營養和能量轉換等許多催化過程,與生命過程關係密切的反應大多是酶催化反應;細胞骨架蛋白質,是由蛋白質與蛋白質搭建的骨架網絡結構,主要作用是維待細胞的一定形態;細胞膜受體,位於細胞質膜上,用於識別和結合小的非脂溶性信號分子;離子通道蛋白質,是橫跨質膜的親水性通道,允許適當大小的離子順濃度梯度通過;轉運體,是一類具有從胞外向胞內轉運物質的蛋白質分子;激素,是一類由分泌細胞合成的信號分子,可調節機體的代謝、生長、發育、繁殖、性別、性慾等重要生命活動;細胞因子,是一類由免疫細胞(如單核、巨噬細胞、T細胞、B細胞、NK細胞等)和某些非免疫細胞(內皮細胞、表皮細胞、纖維母細胞等)經刺激而合成、分泌的一類具有廣泛生物學活性的小分子蛋白質,可調節細胞生長、分化,調控免疫應答;抗體,是一種由漿細胞(效應 B細胞)分泌,被免疫系統用來鑑別與中和外來物質如細菌、病毒等的大型Y形蛋白質;凝血因子,是一類參與血液凝固過程的蛋白質組分;載體蛋白,是血漿中可與一些不溶或難溶於水的物質,以及一些易被細胞攝取或易隨尿 液排出的物質結合的蛋白質;細胞外基質蛋白,是由細胞合成並分泌到細胞外、分布在細胞表面或細胞之間的大分子,主要是膠原蛋白或蛋白聚糖,支持並連接組織結構、調節組織的發生和細胞的生理活動。
在一些情況下,即使對基因的序列、結構和表達模式有清楚的認識,但仍然難以闡明基因所表達的蛋白質的功能。此時通過研究該蛋白質與已知功能蛋白質的相互作用,無疑將非常有助於對該蛋白質功能的了解。例如,某一未知功能的新蛋白質與另一參與RNA剪接的蛋白質存在相互作用,極有可能該蛋白質也參加了RNA的剪接過程。研究蛋白質相互作用的方法包括遺傳學、生物化學和物理學方法。遺傳學方法僅用於如果蠅、酵母等模式生物,而生化和物理的方法可直接用於人類細胞。常用的生化方法是親和層析和免疫共沉澱。常用的高通掀篩查蛋白質間相互作用的方法是酵母雙雜交技術和噬菌體展示技術。
噬菌體展示(phage display)是將外源性DNA插入到噬菌體衣殼蛋白編碼基因中的一種表達克隆技術。重組基因以融合蛋白的形式,摻入病毒顆粒中,展示在噬菌體的表面。融合噬菌體可與表面展示的外源蛋白質相互作用的蛋白質結合,以篩查蛋白質的相互作用。噬菌體展示的缺點在千其本身是一種體外分析系統,另外,只有短肽可以展示在噬菌體表面。噬菌體展示也可用於抗體工程和普通的蛋白質工程。
利用工程細胞研究基因在細胞水平的功能
編輯在細胞水平研究基因功能,除了觀察細胞在實驗條件下該基因表達的改變,更重要的是人為地導入外源基因或干預正常基因的表達,以觀察細胞生物學行為的改變。
採用基因重組技術建立基因高表達工程細胞系
編輯採用基因重組技術,將外源基因導入宿主細胞,使其表達目的基因,進而觀察細胞的生物學特徵改變。根據外源基因在宿主細胞表達的待續時間,可區分為瞬時轉染和穩定轉染細胞。穩定轉染細 胞是一種最常用的細胞水平的轉基因模型,外源基因通過轉基因過程插入到細胞的染色體中,或以游離基因(episome)的形式存在於細胞中穩定表達。穩定表達外源蛋白的轉染細胞可以用作基因功能研究的細胞模型,也可以利用這種方法獲得外源基因產物,目前被廣泛應用於細胞模型的建立。
基因沉默技術抑制特異基因的表達
編輯在細胞水平沉默研究基因的表達,進而觀察基因沉默後細胞的生物學行為改變,是基因功能研究的有力工具。可以利用RNA干擾技術、反義技術以及基因組編輯(genome editing)技術等來實現對特 定基因表達的抑制。其中利用成簇規律間隔短回文重複(clustered regulatory interspaced short palindromic repeat, CRISPR)技術進行基因敲除,近年來發展迅猛並廣泛應用於細胞、動物水平的特定基因沉默。
利用基因修飾動物研究基因在體功能
編輯人類基因組計劃雖然解析了基因序列,但絕大多數基因的功能尚不清楚。因此,利用各種技術手段研究基因的功能將是「後基因組時代」 的主要內容之一。基因功能的確定必須通過實驗來驗證。通常採用基因功能獲得和(或)基因功能缺失的策略,觀察基因在細胞或生物個體中所導致的細胞生 物學行為或個體表型遺傳性狀的變化,從而從正反兩方面對基因的功能進行鑑定。此外,基於正向遺傳學的隨機突變篩選技術也成為揭示基因功能的重要手段。由於基因的功能必須在完整的生物個體及其生命過程中才能得到完整的體現,因此,從整體水平研究基因的功能是必然的選擇。
用功能獲得策略鑑定基因功能
編輯基因功能獲得策略的本質是將目的基因直接導入某一細胞或個體中,使其獲得新的或更高水平的表達,通過細胞或個體生物性狀的變化來研究基因功能。常用的方法有轉基因技術和基因敲入技術。
1、用轉基因技術獲得基因功能 轉基因技術(transgenic technology)是指將外源基因導入受精卵或胚胎幹細胞(embryonic stem cell), 即ES細胞,通過隨機重組使外源基因插入細胞染色體DNA,隨後將受精卵或ES細胞植入假孕受體動物的子宮,使得外源基因能夠隨細胞分裂遺傳給後代。
轉基因動物(transgenic animal)是指應用轉基因技術培育出的攜帶外源基因,並能穩定遺傳的動 物,其製備步驟主要包括轉基因表達載體的構建、外源基因的導入和鑑定、轉基因動物的獲得和鑑定、轉基因動物品系的繁育等。在轉基因動物中,以轉基因小鼠最為常見。建立轉基因小鼠的常用方法有兩種,一是直接將目的DNA顯微注射到受精卵的雄性原核,然後植入假孕母鼠體內,使之發育成幼仔;二是將帶有目的基因的ES細胞注射到囊胚,然後在小鼠體內發育成幼仔。在出生的動物中即含有在一個等位基因的位點進行了DNA整合的小鼠,即轉基因雜合子。經子代雜合子交配,在其後代中可篩選到純合子。
利用轉基因動物模型研究外源基因,能夠接近真實地再現基因表達所導致的結果及其在整體水平的調控規律,把複雜的系統簡單化,具有系統性和獨立性。利用轉基因技術建立的疾病動物模型具有遺傳背景清楚、遺傳物質改變簡單、更自然更接近疾病的真實症狀等優點。
然而,轉基因動物模型仍存在一些亟待解決的問題,如外源基因插入宿主基因組是隨機的,可能 產生插入突變,破壞宿主基因組功能;外源基因在宿主染色體上整合的拷貝數不等;整合的外源基因遺傳丟失而導致轉基因動物症狀的不穩定遺傳等。為解決上述問題,可以在轉基因動物利用組織特異性啟動子實現外源基因的時空特異性表達,或用化學或生物分子作為誘導劑,實現對外源基因表達時間及水平的精確控制。
2、用基因敲入技術獲得基因的功能 基因敲入 (gene knock-in) 是通過同源重組的方法,用某一基因替換另一基因,或將一個設計好的基因片段插入到基因組的特定位點,使之表達並發揮作用。通過基因敲入可以研究特定基因在體內的功能;也可以與之前的基因的功能進行比較;或將正常基因引入基因組中置換突變基因以達到靶向基因治療的目的。
基因敲入是基因打靶(gene targeting) 技術的一種。基因打靶是一種按預期方式準確改造生物遺傳信息的實驗手段。該技術的巧妙之處在於將ES細胞技術和DNA同源重組技術結合起來,實現對染色體上某一基因的定向修飾和改造,從而深入地了解基因的功能。基因打靶的原理如下: ①從小鼠囊胚(受精卵分裂至8個細胞左右即為囊胚,此時受精卵只分裂不分化)分離出未分化的ES細胞;②然後利用細胞內的染色體DNA與導入細胞的外源DNA在相同序列的區域內發生同源重組的原理,用含有篩選標記的打靶載體,對ES細胞中的特定基因實施「打靶」③將「中靶」的ES細胞移植回小鼠囊胚,進而與囊胚一起分化發育成相應的組織和器官,最後產生出具有基因功能改變的「嵌合鼠」。由於「中靶」的ES細胞保持分化的全能性,因此它可以發育成為嵌合鼠的生殖細胞,使得經過定向改造的遺傳信息可以代代相傳。
除基因敲入外,基因打靶還包括基因敲除、點突變、缺失突變、染色體大片段刪除等。基因打靶與轉基因技術均可用於基因功能研究,但兩者的最大區別就是基因打靶能去除和(或)替換生物體內的固有基因,而轉基因技術則未去除或替換固有基因。目前,基因打靶巳成為研究基因功能最直接和最有效的方法之一。
用功能失活策略鑑定基因功能
編輯基因功能失活策略的本質是將細胞或個體的某一基因功能部分或全部失活後,通過觀察細胞生物學行為或個體遺傳性狀表型的變化來鑑定基因的功能。常用的方法主要有基因敲除和基因沉默技術。
1、用基因敲除技術使基因功能完全缺失 基因敲除 (gene knock-out)屬於基因打靶技術的一種,其利用同源重組的原理,在ES細胞中定點破壞內源基因,然後利用ES細胞發育的全能性,獲得帶有預定基因缺陷的雜合子,通過遺傳育種最終獲得目的基因缺陷的純合個體。
然而,基因被完全敲除之後使得表型分析受到很多限制,例如,有些重要的靶基因被敲除後會引起胚胎早期死亡,使得無法分析該基因在胚胎發育晚期和成年期的功能;某些基因在不同的細胞類型中執行不同的功能,完全敲除會導致突變小鼠出現複雜的表型,使研究者很難判斷異常的表型是由一種細胞引起的,還是由幾種細胞共同引起的。為了克服以上不足,條件性基因敲除 (conditional gene knock-out)技術應運而生,該技術可以更加明確地在時間和空間上操作基因靶位,敲除效果更加精確可靠,理論上可達到對任何基因在不同發育階段和不同器官、組織的選擇性敲除。
Cre/loxP 系統的條件敲除的原理:Cre 重組酶屬於位點特異性重組酶,能介導兩個34bp的loxP位點之間的特異性重組,使loxP位點間的序列被刪除。重組酶介導的條件性基因敲除通常需要兩種小鼠,一種是在特定階段、特定組織或細胞中,表達Cre重組酶的轉基因小鼠;另一種是在基因組中引入了 loxP 位點的小鼠,即靶基因或其重要功能域片段被兩個loxP位點錯定的小鼠。兩種小鼠交配後,Cre 基因表達產生的 Cre 重組酶就會介導靶基因兩側的 loxP 間發生切除反應,結果將一個loxP 和靶基因切除。由於可以控制 Cre 重組酶在特定階段、特定組織或細胞中表達,使得 Cre 介導的重組可以發生在特定的階段、組織或細胞中,導致這些組織或細胞中的靶基因在特定的階段被敲除,而其他組織或細胞中因不表達 Cre 而使得靶基因不被敲除。
條件性基因敲除的優勢在於克服了重要基因被敲除所導致的早期致死,並能客觀、系統地研究基 因在組織器官發生、發育以及疾病發生、治療過程中的作用和機制。但這一技術亦存在一些缺點,如費用太高、周期較長,而且許多基因在敲除後,可能是這些基因的功能被其他基因代償,並未產生明顯的表型改變。
2、用基因沉默技術可使基因功能部分缺失 基因沉默策略通常是利用反義技術,在轉錄或翻譯水平特異性阻斷(或封閉)某些基因的表達(即沉默相應基因),然後通過觀察細胞生物學行為或個體遺傳性狀表型的變化來鑑定基因的功能。以下簡要介紹幾種常用的基因沉默技術。
(1)用 RNA 干擾(RNA interference, RNAi) 技術研究基因功能:利用 RNAi 能在短時間內高效特異地抑制靶基因表達的特點,可以很方便地研究基因的功能。用於基因沉默的干擾小 RNA(small interfering RNA, siRNA)既可以在體外進行化學合成或體外轉錄生成,也可以基於具有合適啟動子的載體或轉錄元件,在哺乳類動物或細胞中轉錄生成。
研究者既可以將 siRNA 導入特定細胞,在細胞水平上研究基因的功能;也可以通過轉基因的方法,在動物體內實現特異、穩定、長期地抑制靶基因的表達,從而在整體水平上研究基因的功能。與基因敲除相比,RNAi技術具有簡單、易操作、周期短等優勢,因此已被作為一種簡便和有效的工具而廣泛用於基因功能的研究。然而,該技術可能對靶基因的相似序列發生作用,導致脫靶(off-targeting)效應。
(2) 用 miRNA 技術研究基因功能:儘管 miRNA 的作用機制與 siRNA 類似,但因其可通過與mRNA 不完全互補配對結合而抑制翻譯,故 1 種 miRNA 可沉默多個靶基因,而 siRNA 通常沉默單一基因。目前,miRNA 在基因功能及基因表達調控研究中都得到了廣泛應用。
(3) 用反義 RNA 技術研究基因功能:即通過反義RNA(與 mRNA 互補的一段 RNA 序列)與細胞中的 mRNA 特異性結合,從而抑制相應 mRNA 的翻譯。
(4) 核酶(ribozyme) 技術:天然的核酶通常是單-RNA 分子,具有自剪切作用。另外,核酶也可由兩個 RNA 分子組成,兩者通過互補序列相結合,形成錘頭狀二級結構,並組成核酶的核心序列,進而發揮剪切作用。核酶通過剪切靶 RNA 分子(即破壞靶 RNA 分子)而抑制基因的表達。
用隨機突變篩選策略鑑定基因功能
編輯儘管利用轉基因、基因敲入/敲除、基因沉默等技術,從特定基因的改造到整體動物表型分析的「
反向遺傳學」研究大大推動了功能基因組學的進展,但是也存在明顯的局限性:首先,由於生物體的代償機制,使得基因敲除動物常常觀察不到異常表型;其次,由於「反向遺傳學」只能對已知基因進行研究而人類基因組中尚有90%以上的非編碼序列處於未知狀態;第三,由於「功能缺失」和「功能獲得」小鼠常出現胚胎期死亡,而目前可用於條件性基因改造的啟動子還很少,從而阻礙了特定基因在成體動物中的功能分析;第四,由於一個蛋白質有多個不同的功能域,特定基因在不同位點上的突變可能產生不同的表型,應用單一的「功能缺失」方法,顯然不可能發現這些不同的異常表型。因此,只應用「反向遺傳學」不足以完成功能基因組學的任務,而基於「正向遺傳學」的、從異常表型到特定基因突變的隨機突變篩選策略逐漸受到青睞。
隨機突變篩選策略的第一步是通過物理誘變、化學誘變或生物技術產生大量的基因組 DNA 突變。 其中乙基亞硝基脲(ethyl nitrosourea, ENU) 誘變是近年來發展起來的研究基因功能的新手段。 ENU 是一種化學誘變劑,它通過對基因組 DNA 鹼基的燒基化修飾,誘導 DNA 在複製時發生錯配而產生突變。它主要誘發單鹼基突變,造成單個基因發生突變(雙突變的情況非常少),更接近於人類遺傳性疾病的基因突變情況。同時,ENU的突變效率非常高,可以達到0.2%, 是其他突變手段的 10倍左右。例如,經ENU處理可使雄鼠精子基因組發生點突變,進而使得後代小鼠有可能出現突變表型,經篩選及遺傳試驗即可得到突變系小鼠。通過對突變小鼠的深入研究、對突變基因定位以及位置候選法克隆突變序列,就會得到突變基因的功能信息。
另外,基因捕獲(gene trapping) 技術也是一種產生大規模隨機插入突變的便利手段,對於揭示基因序列所對應的基因功能具有重要的應用價值。基因捕獲技術的基本過程是:將一個含報告基因的 DNA 載體隨機插入基因組,產生內源基因失活突變,通過報告基因的表達,提示插入突變的存在以及內源基因的表達特點。利用基因捕獲可以建立一個攜帶隨機插入突變的ES細胞庫,每一種 ES 細胞克隆中含有不同的突變基因,ES 細胞克隆經囊胚注射發育為基因突變動物模型,通過對動物模型的表型分析鑑定突變基因的功能。基因捕獲技術可節省大量構建特異打靶載體以及篩選基因組文庫的工作和費用,成為可同時對基因的序列、基因的表達以及基因的功能進行研究的高效技術。
隨機突變篩選策略能夠獲得研究基因功能的新材料以及人類疾病的新模型,這種「表型驅動」的 研究模式有可能成為功能基因組學研究最有前景的手段和捷徑之一 。
利用基因編輯技術鑑定基因功能
編輯近幾年來,越來越多專注於基因功能的研究取得了成功,同時,基因功能研究過程中所面臨的諸多技術瓶頸也愈加凸顯,以基因敲除/敲入等技術為中心的試驗愈加不能滿足功能研究與臨床技術轉化的需要。在過去一段時間中,以鋅指核酸酶 (zinc-finger nuclease, ZFN)和轉錄激活樣效應因子核酸酶 (transcription activator-like effector nuclease, TALEN) 技術為代表的序列特異性核酸酶技術,以其能夠高效率地進行定點基因組編輯,在基礎研究、基因治療和遺傳改良等方面展示出了巨大的潛力。然而,由於 ZFN 和 TALEN 技術本身所存在的多種技術瓶頸,這兩種技術並不能實現快速發展並滿足各種科研和臨床需求。令人振奮的是,最新問世的成簇規律間隔短回文重複 (clustered regulatory interspaced short palindromic repeat, CRISPR) 技術擁有其他基因編輯技術無可比擬的優勢。通過不斷的技術改進,CRISPR 技術被認為能夠在活細胞中最有效、最便捷地「編輯」任何基因。同時,基於 CRISPR技術相對較低的實驗成本和高成功率,該技術有望應用於臨床藥物研究與基因治療,並已在目前的商業化和臨床轉化過程中取得了令人矚目的成就。
CRISPR 是一種來自細菌降解入侵的病毒 DNA或其他外源 DNA 的免疫機制。CRISPR 系統共分成 3 類,其中I類和Ⅲ類需要多種 CRISPR相關蛋白質即 Cas 蛋白,共同發揮作用,而Ⅱ類系統只需要 一種 Cas 蛋白即可,因此目前 CRISPR/Cas9 系統應用最為廣泛。
Cas9 蛋白含有兩個核酸酶結構域,可以分別切割 DNA 兩條單鏈。Cas9 首先與 crRNA 及tracrRNA 結合成複合物,然後通過PAM 序列結合 DNA,形成 RNA-DNA 複合結構,進而對目的DNA 雙鏈進行切割,使DNA雙鏈斷裂。優化和改造後的CRISPR/Cas9系統僅包括兩個元素:Cas9 蛋白和 sgRNA (single guide RNA)。CRISPR/Cas9 通過對預設的 DNA 位點進行切割,造成 DNA 雙鏈斷裂(double strand break, DSB), 細胞內的修復機制隨即啟動,主要包括兩種修復途徑:
一是非同源末端連接途徑(non-homologous end joining, NHEJ) , 此修復機制非常容易發生錯誤,導致修復後發生鹼基的缺失或插入,從而造成移碼突變,最終達到基因敲除的目的。 NHEJ 是細胞內主要的 DNA 斷裂損傷修復機制。利用靶向核酸酶可以在受精卵水平高效的實現移碼突變,從而製備基因敲除模式動物。
二是 DNA 斷裂修復途徑為同源介導的修復 (homology-directed repair, HR), 這種基於同源重組的修復機制保真性高,但是發生概率低。在提供外源修復模板的情況下,靶向核酸酶對DNA 的切割可以將同源重組發生的概率提高約1000倍。利用這種機制可以實現基因組的精確編輯,如:條件性基因敲除、基因敲入、基因替換、點突變等。