生物化學與分子生物學/真核基因表達調控
基因表達調控 -
基因表達調控的基本概念與特點 -
原核基因表達調控 -
真核基因表達調控
原核細胞的基因表達調控機制已經十分複雜,與之相比,真核生物的基因組結構要複雜得多,加之個體內細胞間廣泛存在的信號通訊網絡,其基因表達調控的多樣性和複雜性遠非原核生物所能比擬。
真核基因表達特點
編輯多細胞真核生物的基因表達調控具有以下特點:①真核基因組比原核基因組大得多。②原核基因組的大部分序列都為編碼基因,而哺乳類基因組中大約只有10%的序列編碼蛋白質、rRNA、tRNA等,其餘90%的序列,包括大量的重複序列,功能至今還不清楚,可能參與調控。③真核生物編碼蛋白質的基因是不連續的,轉錄後需要剪接去除內含子,這就增加了基因表達調控的層次。④原核生物的基因編碼序列在操縱子中,多順反子mRNA使得幾個功能相關的基因自然協調控制;而真核生物則是一個結構基因轉錄生成一條mRNA, 即mRNA是單順反子(monocistron), 許多功能相關的蛋白質,即使是一種蛋白質的不同亞基也將涉及多個基因的協調表達。⑤真核生物DNA在細胞核內與多種蛋白質結合構成染色質,這種複雜的結構直接影響着基因表達。⑥真核生物的遺傳信息不僅存在於核DNA上,還存在於線粒體DNA上,核內基因與線粒體基因的表達調控既相互獨立又需要協調。
由於真核基因組的這些特點,真核基因表達的調控過程較原核生物要複雜許多。該過程包括了染色質激活、轉錄起始、轉錄後修飾、轉錄產物的細胞內轉運、翻譯起始、翻譯後修飾等多個步驟。在上述過程的每一個環節都可以對基因表達進行干預,從而使得基因表達調控呈現出多層次和綜合協調的特點。但是,轉錄起始的調控是基因表達調控較為關鍵的環節。
染色質結構與真核基因表達密切相關
編輯以染色質形式組裝在細胞核內的DNA所攜帶的遺傳信息表達直接受到染色質結構的制約。當基因被激活時,可觀察到染色質相應區域發生某些結構和性質變化,這些具有轉錄活性的染色質被稱為活性染色質(active chromatin)。
轉錄活化的染色質對核酸酶極為敏感
編輯當染色質活化後,常出現一些對核酸酶(如DNase Ⅰ)高度敏感的位點,稱之超敏位點(hype rsensitive site)。超敏位點通常位於被活化基因的5'-側翼區1kb內,但有時也會在更遠的5'-側翼區或3'-側翼區出現一些超敏位點。這些轉錄活化區域是缺乏或沒有核小體蛋白結合的「裸露」DNA鏈。
轉錄活化染色質的組蛋白發生改變
編輯轉錄活躍區域的染色質中組蛋白的特點是:①富含賴氨酸的H1組蛋白含量降低;②H2A-H2B組蛋白二聚體的不穩定 性增加,使它們容易從核小體核心中被置換出來;③核心組蛋白H3、H4可發生乙醯化、磷酸化以及泛素化等修飾。這些都使得核小體的結構變得鬆弛而不穩定,降低核小體蛋白對DNA 的親和力,易於基因轉錄。
在真核細胞中,核小體是染色質的主要結構單位,四種組蛋白(H2A、H2B、H3和H4各2個分子) 組成的八聚體構成核小體的核心區(core particle), 其外面盤繞着 DNA 雙螺旋鏈。每個組蛋白的氨基端都會伸出核小體外,形成組蛋白尾巴。這些尾巴可以形成核小體間相互作用的紐帶,同時也是發生組蛋白修飾的位點。這些修飾包括對組蛋白中富含的賴氨酸、精氨酸、組氨酸等帶有正電荷的鹼性胺基酸進行的乙醯化、磷酸化和甲基化等修飾過程。
一般來說,乙醯化修飾能夠中和組蛋白尾巴上鹼性胺基酸殘基的正電荷,減弱組蛋白與帶有負電荷的 DNA 之間的結合,選擇性地使某些染色質區域的結構從緊密變得鬆散,有利於轉錄因子與 DNA 的結合,從而開放某些基因的轉錄,增強其表達水平。 而組蛋白甲基化通常不會在整體上改變組蛋白尾巴的電荷,但是能夠增加其鹼性度和疏水性,因而增強其與 DNA 的親和力。乙醯化修飾和甲基化修飾都是通過改變組蛋白尾巴與 DNA 之間的相互作用發揮基因表達調控的功能,而乙醯化修飾和甲 基化修飾的作用往往又是相互排斥的。 組蛋白的磷酸化修飾在細胞有絲分裂和減數分裂期間染色體濃縮以及基因轉錄激活過程中發揮重要的調節作用。
發揮組蛋白共價修飾作用的一些蛋白質分子,如組蛋白乙醯基轉移酶(histone acetyltransferase , HAT)和 組蛋白去乙醯化酶(histone deacetylase, HDAC) , 在 DNA 水平的基因表達調控中具有重要作用。HAT 使組蛋白發生乙醯化,促使染色質結構鬆弛,有利於基因的轉錄,被稱為轉錄輔激活因子(co-activator), 而HDAC 促進組蛋白的去乙醯化,抑制基因的轉錄,被稱為轉錄輔抑制因子(co-repressor) 。
CpG島甲基化水平降低
編輯DNA甲基化是真核生物在染色質水平控制基因轉錄的重要機制。真核基因組中胞嘧啶的第5位碳原子可以在DNA甲基轉移酶(DNA methyltransferase)的作用下被甲基化修飾為5-甲基胞嘧啶,並且以序列CG中的胞嘧啶甲基化更加常見。但是這些甲基化胞嘧啶在基因組中並不是均勻分佈,有些成簇的非甲基化CG存在於整個基因組中,人們將這些GC含量可達60%,長度為300~3000bp的區段稱作CpG島(CpG island)。CpG島主要位於基因的啟動子和第一外顯子區域,約有60%以上基因的啟動子含有CpG島。業已發現處於轉錄活躍狀態的染色質中,CpG島的甲基化程度下降,例如管家基因的CpG島中胞嘧啶甲基化水平較低。CpG島的高甲基化促進染色質形成緻密結構,因而不利
於基因表達。
染色質結構對基因表達的影響可以遺傳給子代細胞,其機制是細胞內存在着具有維持甲基化作用的DNA甲基轉移酶,可以在DNA複製後,依照親本DNA鏈的甲基化位置催化子鏈DNA在相同位置上發生甲基化。這種現象稱為表觀遺傳(epigenetic inheritance)。這種遺傳信息不是蘊藏在DNA序列中,而是通過對染色質結構的影響及基因表達變化而實現的。表觀遺傳對基因表達的調控不僅體現在DNA 甲基化上,組蛋白的乙醯化、甲基化以及非編碼小RNA的調控等都屬於表觀遺傳調控的範疇。
轉錄起始的調節
編輯與原核細胞一樣,轉錄起始是真核生物基因表達調控的關鍵,但是真核生物的基因轉錄起始過程比原核細胞的複雜得多。這是因為真核生物的RNA聚合酶需要與多個轉錄因子相互作用,才能完成轉錄起始複合物的裝配,裝配速度決定着基因表達的水平。
順式作用元件是轉錄起始的關鍵調節部位
編輯絕大多數真核基因調控機制都涉及編碼基因附近的非編碼DNA序列一順式作用元件。順式作用元件是指可影響自身基因表達活性的DNA序列。真核生物基因組中每一個基因都有各自特異的順式作用元件。順式作用元件通常是非編碼序列,但是並非都位於轉錄起始點上游。 根據順式作用元件在基因中的位置、轉錄激活作用的性質及發揮作用的方式,可將真核基因的這些功能元件分為啟動子、增強子、沉默子及絕緣子等。
1、真核生物啟動子結構和調節遠較原核生物複雜 真核生物不同基因的啟動子序列間的一致性不像原核生物那樣明顯,而且RNA聚合酶與DNA的結合需要多種蛋白質因子的相互協調作用。因此,真核生物的啟動子序列要比原核生物的複雜得多、序列也更長。
真核生物啟動子一般位於轉錄起始點上游,為100~200bp 序列,包含有若干具有獨立功能的DNA序列元件,每個元件長7~30bp。啟動子通常含有1個以上的功能組件,其中最具典型意義的就是TATA盒,它的共有序列是TATAAAA。TATA盒是基本轉錄因子TFⅡD的結合位點通常位於轉錄起始點上游-25~-30bp區域,控制轉錄起始的準確性及頻率。除TATA盒外,GC盒(GGGCGG)和CAAT盒(GCCAAT)也是很多基因中常見的功能組件。此外,還發現很多其他類型的功能組件。典型的Ⅱ類啟動子由TATA盒或下游啟動子元件(downstream promoter element, DPE)和起始元件(initiator element, Inr)以及上游調控元件組成。
然而,還有很多啟動子並不含TATA盒,這類啟動子分為兩類:一類為富含GC的啟動子,最初發現於一些管家基因,這類啟動子一般含數個分離的轉錄起始點,並有數個轉錄因子SPl結合位點,對基本轉錄活化有重要作用;另一類啟動子既不含TATA盒,也沒有GC富含區,這類啟動子可有一個或多個轉錄起始點,大多轉錄活性很低或根本沒有轉錄活性,而是在胚胎發育、組織分化或再生過程中受調節。
真核生物主要有三種RNA聚合酶,它們分別結合在三類不同的啟動子上負責轉錄不同的RNA。
2、增強子是—種能夠提高轉錄效率的順式作用元件 增強子的長度大約是200bp,可使旁側的基因轉錄效率提高100倍或更多。增強子也是由若干功能組件組成,有些功能組件既可在增強子中出現,也可在啟動子中出現。這些功能組件是特異轉錄因子結合DNA的核心序列。增強子的核心組件常為8~12bp, 可以單拷貝或多拷貝串聯形式存在。增強子和啟動子常交錯覆蓋或連續。酵母有一種類似高等真核生物增強子樣作用的序列,稱為上游激活序列(upstream activator sequence, UAS) , 其在轉錄激活中的作用方式與增強子類似。增強子的功能及其作用特徵如下:
- 增強子與被調控基因位於同一條DNA鏈上,屬於順式作用元件。
- 增強子是組織特異性轉錄因子的結合部位,當某些細胞或組織中存在能夠與之相結合的特異轉錄因子時方能表現活性。
- 增強子不僅能夠在基因的上游或下游起作用,而且還可以遠距離實施調節作用(通常為14kb), 個別情況下甚至可以調控30kb以外的基因。
- 增強子作用與序列的方向性無關。將增強子的方向倒置後依然能起作用,而方向倒置後的啟動子就不能起作用。
- 增強子需要有啟動子才能發揮作用,沒有啟動子存在,增強子不能表現活性。但增強子對啟動子沒有嚴格的專一性,同一增強子可以影響不同類型啟動子的轉錄。
3、沉默子能夠抑制基因的轉錄 沉默子是一類基因表達的負性調控元件,當其結合特異蛋白因子時,對基因轉錄起阻遏作用,最初在酵母中發現。 已有的證據顯示沉默子與增強子類似,其作用亦不受序列方向的影響,也能遠距離發揮作用,並可對異源基因的表達起作用。
4、絕緣子阻礙其他調控元件的作用 絕緣子最初在酵母中發現,一般位於增強子或沉默子與啟動子之間,與特異蛋白因子結合後,阻礙增強子或沉默子對啟動子的作用。絕緣子還可位千常染色質與異染色質之間,保護常染色質的基因表達不受異染色質結構的影響。絕緣子與增強子類似,發揮作用與序列的方向性無關。
轉錄因子是轉錄起始調控的關鍵分子
編輯真核基因的轉錄調節蛋白又稱轉錄調節因子或轉錄因子(transcription factor, TF)。絕大多數真核轉錄調節因子由其編碼基因表達後進人細胞核,通過識別、結合特異的順式作用元件而增強或降低相應基因的表達。轉錄因子也被稱為反式作用蛋白或反式作用因子。
這些反式作用因子的編碼基因與其作用的靶基因之間不存在結構的關聯,而順式作用元件則是在結構上與靶基因串聯連接在一起。這種來自於一個基因編碼的蛋白質對另一基因的調節作用稱為反式激活或反式抑制作用。真核生物轉錄調控的基本方式就是反式作用因子對順式作用元件的識別與結合,即通過DNA-蛋白質的相互作用實施調控。並不是所有真核轉錄調節蛋白都起反式作用,也有些基因產物可特異識別、結合自身基因的調節序列,調節自身基因的開啟或關閉,這就是順式調節作用。具有這種調節方式的調節蛋白稱為順式作用蛋白。
依據功能特性,可將轉錄因子分為通用轉錄因子(general transcription factor)和特異轉錄因子(special transcription factor)兩大類。
1、通用轉錄因子 這些轉錄因子是 RNA 聚合酶介導基因轉錄時所必需的一類輔助蛋白質,幫助聚合酶與啟動子結合併起始轉錄,對所有基因都是必需的。有人將其視為 RNA 聚合酶的組成成分或亞基,故又稱為基本轉錄因子。通用轉錄因子 TFⅡD 是由 TBP 和 TAFs 組成的複合物。TFⅡD 複合物中不同 TAFs 與 TBP 的結合可能結合不同啟動子,這可以解釋這些因子在各種啟動子中的選擇性活化作用以及對特定啟動子存在不同的親和力。中介子 (mediator) 也是在反式作用因子和 RNA 聚合酶之間的蛋白質複合體,它與某些反式作用因子相互作用,同時能夠促進TFⅡH對 RNA 聚合酶最大亞基的羧基端結構域的磷酸化。有時將中介子也歸類於輔激活因子。通用轉錄因子的存在沒有組織特異性,因而對於基因表達的時空選擇性並不重要。
2、特異轉錄因子 這些轉錄因子為個別基因轉錄所必需,決定該基因表達的時間空間特異性,故稱特異轉錄因子。此類特異因子有的起轉錄激活作用,有的起轉錄抑制作用。前者稱轉錄激活因子(transcription activator), 後者稱轉錄抑制因子(transcription inhibitor)。
轉錄激活因子通常是一些增強子結合蛋白(enhancer binding protein, EBP);多數轉錄抑制因子是沉默子結合蛋白,但也有抑制因子以不依賴 DNA 的方式起作用,而是通過蛋白質-蛋白質相互作用「中和」轉錄激活因子或 TFⅡD, 降低它們在細胞內的有效濃度,抑制基因轉錄。
因為在不同的組織或細胞中各種特異轉錄因子分佈不同,所以基因表達狀態、方式不同。 這些組織特異性的轉錄因子才真正決定着細胞基因的時間、空間特異性表達。特異轉錄因子自身的含量、活性和細胞內定位隨時都受到細胞所處環境的影響,是使環境變化在基因表達水平得到體現的關鍵分子。組織特異性轉錄因子在細胞分化和組織發育過程中具有重要作用。例如,胚胎幹細胞的分化方向在相當大的程度上是由細胞內轉錄因子的種類所決定。闡明各種組織細胞所特有的轉錄因子種類,就有可能控制細胞的分化方向。誘導多能幹細胞(induced pluripotent stem cell, iPS) 的建立說明關鍵轉錄因子可以改變一個細胞的命運。科學家們僅用4種轉錄因子就可以使終末分化的皮膚成纖維細胞轉變成為類似於胚胎幹細胞樣的具有多向分化能力的細胞。
此外,還有與啟動子上游元件如 GC 盒、CAAT 盒等順式作用元件結合的蛋白質,稱為上游因子(up-stream factor) , 如 SPl 結合到 GC 盒上,C/EBP 結合到 CAAT 盒上。這些反式作用因子調節通用轉錄因子與 TATA 盒的結合、RNA 聚合酶與啟動子的結合及起始複合物的形成,從而協助調節基因的轉錄效率。
與遠隔調控序列如增強子等結合的反式作用因子有很多。可誘導因子 (inducible factor) 是與增強子等遠端調控序列結合的轉錄因子。它們能結合應答元件,只在某些特殊生理或病理情況下才被誘導產生,如 MyoD 在肌細胞中高表達,HIF-1 在缺氧時高表達。與上游因子不同,可誘導因子只在特定的時間和組織中表達而影響轉錄。 RNA 聚合酶Ⅱ與啟動子結合併啟動轉錄需要多種蛋白質因子的協同作用。這通常包括:可誘導因子或上游因子與增強子或啟動子上游元件的結合;通用轉錄因子在核心啟動子處的組裝;輔激活因子和(或)中介子在通用轉錄因子或 RNA 聚合酶Ⅱ複合物與可誘導 因子、上游因子之間的輔助和中介作用,以準確地控制基因是否轉錄、何時轉錄。 應該指出的是,上游因子和可誘導因子等在廣義上也可稱為轉錄因子,但一般不冠以 TF 的詞頭而各有自己特殊的名稱。
3、轉錄因子的結構特點 轉錄因子是 DNA 結合蛋白,至少包括兩個不同的結構域:DNA 結合結構域(DNA binding domain) 和轉錄激活結構域(activation domain)。此外,很多轉錄因子還包含一個介導蛋白質-蛋白質相互作用的結構域,最常見的是二聚化結構域。
- 轉錄因子的 DNA 結合結構域
- 鋅指(zinc finger) 模體結構:是一類含鋅離子的模體。每個重複的「指」狀結構含 20 多個胺基酸殘基,形成 1 個α-螺旋和 2 個反向平行β-摺疊的二級結構。常見的鋅指模體中每個β-摺疊上有 l個半胱氨酸(Cys) 殘基,而α-螺旋上有 2 個組氨酸(His)或半胱氨酸(Cys)殘基。這4個胺基酸殘基與二價鋅離子之間形成配位鍵 。整個蛋白質分子可有多個這樣的鋅指重複單位。每一個單位可將其α-螺旋伸入 DNA 雙螺旋的大溝內,接觸 4 個或更多的鹼基。 例如與 GC 盒結合的人成纖維細胞轉錄因子 SPl 中就有3個鋅指重複結構。
- 鹼性螺-旋環-螺旋(basic helix-loop-helix, bHLH)模體結構:至少有兩個α-螺旋,由一個短肽段形成的環所連接,其中一個α-螺旋的N-端富含鹼性胺基酸殘基,是與 DNA 結合的結合域。bHLH 模體通常以二聚體形式存在,而且兩個α-螺旋的鹼性區之間的距離大約與 DNA 雙螺旋的一個螺距相近(3.4nm),使兩個α-螺旋的鹼性區剛好分別嵌入 DNA 雙螺旋的大溝內。
- 鹼性亮氨酸拉鏈(basicleucine zipper, bZIP)模體結構:特點是在蛋白質C-末端的胺基酸序列中,每隔6個胺基酸殘基是一個疏水性的亮氨酸殘基。當 C-末端形成α-螺旋結構時,肽鏈每旋轉兩周就出現一個亮氨酸殘基,並且都出現在α-螺旋的同一側。 這樣的兩個肽鏈能以疏水力結合成二聚體,形同拉鏈一樣的結構。該二聚體的N-端是富含鹼性胺基酸的區域,可以藉助其正電荷與DNA骨架上的磷酸基團結合。
- 轉錄因子的轉錄激活結構域:不同的轉錄因子具有不同的轉錄激活結構域,根據胺基酸的組成特點,轉錄激活結構域可分為三類。
- 酸性激活結構域(ac心cactivation domain)是一段富含酸性胺基酸的保守序列,常形成帶負電荷的β-摺疊,通過與TFⅡD的相互作用協助轉錄起始複合物的組裝,促進轉錄。如酵母轉錄因子GAL4區的轉錄激活域。
- 富含穀氨醯胺結構域(glutamine-rich domain)的 N-末端的穀氨醯胺殘基含量可高達25%左右,可通過與GC 盒結合發揮轉錄激活作用。
- 富含脯氨酸結構域(praline-rich domain)的 C-末端的脯氨酸殘基含量可高達20%~30%, 可通過與 CAAT 盒結合來激活轉錄。
4、二聚化是常見的蛋白質-蛋白質相互作用方式 二聚化作用與bZIP的亮氨酸拉鏈、bHLH的螺旋-環-螺旋結構有關。
以上介紹的各種轉錄因子的功能結構形式都是最典型、最常見的。此外尚有一些獨特的結構形式。
轉錄起始複合物的組裝是轉錄調控的主要方式
編輯DNA元件與調節蛋白對轉錄激活的調節最終是由RNA聚合酶活性體現的,其中的關鍵環節是轉錄起始複合物的形成。真核生物主要有三種RNA聚合酶,分別負責催化生成不同的RNA分子。其中RNA聚合酶Ⅱ參與轉錄生成所有mRNA前體及大部分snRNA。參與RNA聚合酶Ⅱ轉錄起始的DNA調控序列及轉錄因子要複雜得多,以滿足RNA聚合酶Ⅱ轉錄成千上萬種處於不同表達水平的基因的需要。
真核RNA聚合酶Ⅱ不能單獨識別、結合啟動子,而是先由基本轉錄因子TFⅡD識別、結合啟動子序列,再同其他TFⅡ與RNA聚合酶II經由一系列有序結合形成一個功能性的轉錄前起始複合物 (transcriptionpreinitiation complex, 。此外,一些諸如轉錄激活因子(activator)、中介子 (mediator)以及染色質重塑因子(chromatin remodeler)等調節複合體也可參與轉錄前起始複合物的形成,使RNA聚合酶II得以真正啟動mRNA的有效轉錄。在不同的細胞或階段,還有一些特異性轉錄因子通過特定的結合,發揮特異性轉錄調節作用。
也正是由於這些基本轉錄因子和特異轉錄因子決定了RNA聚合酶Ⅱ的活性,這些調節蛋白的濃度與分佈將直接影響相關基因的表達。如前所述,特異轉錄因子的表達具有時間或空間特異性,因此,由它們所參與組成的轉錄起始複合物也將呈現一種動態變化 。
轉錄後調控主要影響真核mRNA的結構與功能
編輯真核生物的基因表達調控在轉錄後層次不同於原核生物。這一方面是由於兩者的轉錄產物的剪接、修飾等成熟加工過程有很大的差異,另一方面是由於真核生物的RNA產物要被運送至細胞質中去執行功能,其穩定性以及其降解過程都可以影響基因表達的最終結果。
mRNA的穩定性影響真核生物基因表達
編輯mRNA是蛋白質生物合成的模板, 因此它的穩定性將直接影響到基因表達最終產物的數量,是轉錄後對基因表達進行調控的一個重要因素。真核生物mRNA分子的半衰期差別很大,有的可長達數十小時以上, 而有的則只有幾十分鐘或更短。一般而言,半衰期短的mRNA多編碼調節蛋白,因此,這些蛋白質的水平可以隨着環境的變化而迅速變化,達到調控其他基因表達的目的。影響細胞內mRNA穩定性的因素很多,主要有下面幾點:
1、5'-端的帽結構可以增加mRNA的穩定性 該結構可以使mRNA免於在5'-核酸外切酶的作用下被降解,從而延長了mRNA的半衰期。此外,帽結構還可以通過與相應的帽結合蛋白結合而提高翻譯的效率,並參與mRNA從細胞核向細胞質的轉運。
2、3'端的 poly(A)尾結構防止mRNA降解 poly(A)及其結合蛋白可以防止3'-核酸外切酶降解mRNA,增加mRNA的穩定性。如果3'-poly(A)被去除,mRNA分子將很快被降解。此外,3'-poly(A)尾結構還參與了翻譯的起始過程。實驗證明,mRNA的細胞質定位信號有些也位於3'-非翻譯區(3'-untranslated region, 3'-UTR)上。組蛋白mRNA沒有3'-poly(A)尾的結構,但它的3'-端會形成一種髮夾結構,使其免受核酸酶的攻擊。 一些mRNA的3'-UTR存在一個約50個核苷酸長的AU富含序列(AU-rich sequence, ARE)區,可以與 ARE結合蛋白結合,促使 poly(A)核酸酶切除 poly(A)尾,使mRNA降解。因此含有ARE區的mRNA通常都不穩定。
RNA無論是在核內進行加工 、由細胞核運至細胞質, 還是在細胞質內停留(至降解),都是通過與蛋白質結合形成核糖核蛋白顆粒(ribonucleoprotein particle , RNP)進行的。mRNA運輸、在細胞質內的穩定性等均與某些蛋白質成分有關。
所有類型RNA分子中,mRNA壽命最短。mRNA穩定性是由合成速率和降解速率共同決定的。大多數高等真核細胞mRNA半衰期較原核為長,一般為幾個小時。mRNA的半衰期可影響蛋白質合成的量,通過調節某些mRNA的穩定性,即可使相應蛋白質合成量受到一定程度的控制。例如,mRNA5'-端的帽結構和3'-端的尾結構的刪除可直接影響mRNA的穩定性。
蛋白質產物也可調節mRNA的降解,如鐵轉運蛋白受體(transferrin receptor, TfR)mRNA的降解速率受細胞質內某些蛋白質成分的調節,並與mRNA自身結構有關。當細胞內鐵足量時,TfRmRNA降解速度加快,致使TfR水平很快下降。當細胞內鐵不足時,TfRmRNA穩定性增加,受體蛋白質合成增多。TfRmRNA穩定性的調節取決於mRNA分子中特定的重複序列,它位於3'-UTR,稱為鐵反應元件(iron response element, IRE)。每個IRE大約為30bp長,可形成柄-環結構,環上有5個特異的核苷酸,並富含 A-U 序列。 當鐵濃度高時,A-U富含序列通過目前尚不得知的機制促 進TfRmRNA降解;當鐵濃度下降時,一種IRE結合蛋白質 (IRE-binding protein, IRE-BP)通過識別環的特異序列及 柄的二級結構結合IRE。IRE-BP的結合可能破壞了某些機制對TfRmRNA的降解作用,使TfRmRNA的壽命延長。這一發現提示,其他穩定性可調節的mRNA可能也含有與特異蛋白質相互作用的反應元件,致降解速率變慢。
一些非編碼小分子RNA可引起轉錄後基因沉默
編輯與原核基因表達調節一樣,某些小分子RNA也可調節真核基因表達。這些RNA都是非編碼RNA(non-coding RNA,ncRNA)。除了具有催化活性的RNA(核酶)、核小RNA(snRNA)以及核仁小RNA(snoRNA)以外,還有目前入們廣泛關注的非編碼RNA,如miRNA、piRNA和siRNA等。
mRNA前體的選擇性剪接可以調節真核生物基因表達
編輯真核生物基因所轉錄出的mRNA前體含有交替連接的內含子和外顯子。通常狀態下,mRNA前體經過剔除內含子序列後成為一個成熟的mRNA,並被翻譯成為一條相應的多肽鏈。但是,參與拼接的外顯子可以不按照其在基因組內的線性分佈次序拼接,內含子也可以不完全被切除,由此產生了選擇性剪接。選擇性剪接的結果是由同一條mRNA前體產生了不同的成熟mRNA,並由此產生了完全不同的蛋白質。這些蛋白質的功能可以完全不同,顯示了基因調控對生物多樣性的決定作用。值得指出的是,被切除的內含子是否具有功能目前成為研究的熱點。有學者認為:內含子是在進化中出現或消失的,其功能可能是有利於物種的進化選擇。例如,細菌丟失了內含子,可以使染色體變小和複製速度加快。真核生物保留內含子,則可以產生外顯子移動,有利於真核生物在適應環境改變時能合成功能不同而結構上只有微小差異的蛋白質。但也有學者認為內含子具有基因表達涸控的功能。例如,現在已知某些遺傳性疾病,其變異是發生在內含子而不在外顯子。有些內含子在調 控基因表達的過程中起作用,有些內含子還編碼核酸內切酶或含有小分子RNA序列等。
真核基因表達在翻譯及翻譯後仍可受到調控
編輯蛋白質生物合成過程複雜,涉及眾多成分。通過調節許多參與成分的作用可使基因表達在翻譯水平以及翻譯後階段得到控制。在翻譯水平上,目前發現的一些調節點主要在起始階段和延長階段,尤其是起始階段,如對起始因子活性的調節、Met-tRNAMet與小亞基結合的調節、mRNA與小亞基結合的調節等。其中通過磷酸化作用改變起始因子活性這一點備受關注。mRNA與小亞基結合的調節對某些mRNA的翻譯控制也具有重要意義。近年來,包括小分子RNA在內的非編碼RNA對基因表達 調控的影響成為新的研究熱點。
對翻譯起始因子活性的調節主要通過磷酸化修飾進行
編輯- 翻譯起始因子eIF-2α的磷酸化抑制翻譯起始 蛋白質合成速率的快速變化在很大程度上取決於起始水平,通過磷酸化調節真核起始因子(eukaryotic initiation factor, eIF)的活性對起始階段有重要的控制作用。eIF-2主要參與起始Met-tRNAiMet的進位過程,其α亞基的活性可因磷酸化(cAMP依賴性蛋白激酶所催化)而降低,導致蛋白質合成受到抑制。如血紅素對珠蛋白合成的調節就是由於血紅素能抑制cAMP依賴性蛋白激酶的活化,從而防止或減少了eIF-2的失活,促進了蛋白質的合成。在病毒感染的細胞中,細胞抗病毒的機制之一即是通過雙鏈RNA(double-stranded RNA, dsRNA)激活一種蛋白激酶,使eIF-2α磷酸化,從而抑制蛋白質合成的起始。
- eIF-4E及eIF-4E結合蛋白的磷酸化激活翻譯起始 帽結合蛋白eIF-4E與mRNA帽結構的結合是翻譯起始的限速步驟,磷酸化修飾及與抑制物蛋白的結合均可調節eIF-4E的活性。磷酸化的 eIF-4E與帽結構的結合力是非磷酸化的eIF-4E的4倍,因而可提高翻譯的效率。胰島素及其他一些生長因子都可增加eIF-4E的磷酸化從而加快翻譯,促進細胞生長。同時,胰島素還可以通過激活相應的蛋白激酶而使一些與eIF-4E結合的抑制物蛋白磷酸化,磷酸化後的抑制物蛋白會與eIF-4E解離,激活eIF-4E。
RNA結合蛋白參與對翻譯起始的調節
編輯所謂RNA結合蛋白(RNA binding protein, RBP), 是指那些能夠與RNA特異序列結合的蛋白質。基因表達的許多調節環節都有RBP的參與,如前述轉錄終止、RNA剪接、RNA轉運、RNA在細胞質內穩定性控制以及翻譯起始等。鐵蛋白相關基因的mRNA翻譯調節就是RBP參與基因表達調控的典型例子。
IRE結合蛋白質(IRE-BP)作為特異RNA結合蛋白,在調節鐵轉運蛋白受體(TfR)mRNA穩定性方面起重要作用。同時,它還能調節另外兩個與鐵代謝有關的蛋白質的合成,這兩種蛋白質是鐵蛋白和σ-氨基-γ-酮戊酸(ALA)合酶。鐵蛋白與鐵結合,是體內鐵的貯存形式,ALA合酶是血紅素合成的限速酶。與TfRmRNA不同,IRE位於鐵蛋白及ALA合酶mRNA的5'-UTR,而且無A-U富含區,不促進mRNA降解。當細胞內鐵濃度低時,IRE-BP處於活化狀態,結合 IRE 而阻礙40S小亞基與mRNA5'-端起始部位結合,抑制翻譯起始;鐵濃度偏高時,IRE-BP不能與IRE結合,兩種mRNA的翻譯起始可以進行。
對翻譯產物水平及活性的調節可以快速調控基因表達
編輯新合成蛋白質的半衰期長短是決定蛋白質生物學功能的重要影響因素。因此,通過對新生肽鏈的水解和運輸,可以控制蛋白質的濃度在特定的部位或亞細胞器保持在合適的水平。此外,許多蛋白質需要在合成後經過特定的修飾才具有功能活性。通過對蛋白質可逆的磷酸化、甲基化、醯基化修飾,可以達到調節蛋白質功能的作用,是基因表達的快速調節方式。
小分子RNA對基因表達的調節十分複雜
編輯1、微RNA (microRNA, miRNA) miRNA是一個大家族,屬小分子非編碼單鏈RNA, 長度約22個鹼基,由一段具有髮夾環結構的前體加工後形成。編碼miRNA的基因與編碼蛋白質的基因一樣,由RNA聚合酶Ⅱ負責催化其轉錄合成。
它們在細胞內首先形成長度約為數百個鹼基的pri-miRNA,經過一次加工後,成為 長度為70~90 個鹼基的單鏈RNA前體(pre-miRNA), 再經過一 種稱為Dicer酶的RNA酶進行剪切後形成長20~24nt 的成熟miRNA。這些成熟的miRNA與其他蛋白質一起組成RNA誘導的沉默複合體(RNA-induced silencing complex, RISC), 通過與其靶mRNA分子的3'-UTR互補匹配,促使該mRNA分子的降解或抑制其翻譯。
最早被確認的miRNA是1993年在線蟲中發現的lin-4。這種單鏈RNA的表達具有階段性,通過鹼基配對的方式結合到靶mRNA lin-14的3'-UTR,從而抑制lin-14的翻譯,但並不影響其轉錄。2000年,另一個促進線蟲幼蟲向成蟲轉變的基因 let-7 被發現,它的轉錄產物為21個鹼基的RNA分子,也具有明顯的階段表達特異性 ,對線蟲的發育具有重要的調控作用。
miRNA具有一些鮮明的結構與功能特點:①其長度一般為20~25個鹼基,個別也有20個鹼基以下的報道;②在不同生物體中普遍存在,包括線蟲、果蠅、家鼠、人及植物等;③其序列在不同生物中具有一定的保守性,但是尚未發現動植物之間具有完全一致的miRNA序列;④具有明顯的表達階段特異性和組織特異性;⑤miRNA基因以單拷貝、多拷貝或基因簇等多種形式存在於基因組中,而且絕大部分位於基因間隔區。miRNA的廣泛性和多樣性提示它們可
能具有非常重要的生物學功能。
2、干擾小RNA(small interfering RNA, siRNA) siRNA 是細胞內的一類雙鏈RNA (dsRNA), 在特定情況下通過一定酶切機制,轉變為具有特定長度(21~23個鹼基)和特定序列的小片段RNA。siRNA參與RISC組成,與特異 的靶mRNA完全互補結合,導致靶mRNA降解,阻斷翻譯過程。
siRNA和miRNA都可以介導基因表達抑制,這種作用被稱為RNA干擾(RNA interference, RNAi)。
RNAi可通過降解特異mRNA,在轉錄後水平對基因表達進行調節機制,是生物體本身固有的一種對抗外源基因侵害的自我保護現象。它能識別、清除外源 dsRNA 或同源單鏈 RNA, 提供了一種防禦外源核酸入侵的保護措施。同時,由於外源dsRNA 導入細胞後也可以引起與 dsRNA 同源的 mRNA 降解,進而抑制其相應的基因表達,RN扣又被作為一種新技術廣泛應用於功能基因組研究中。通常認為,siRNA 及其介導的 RNAi 具有很高的特異性,但也有報道顯示 siRNA 序列中一個或幾個鹼基的改變並不影響 siRNA 的活性。
siRNA和miRNA都屬於非編碼小分子RNA,它們具有一些共同的特點:均由Dicer切割產生;長度都在22個鹼基左右;都與RISC形成複合體,與mRNA作用而引起基因沉默。
長非編碼RNA在基因表達調控中的作用不容忽視
編輯長非編碼 RNA(long non-coding RNA, lncRNA) 是一類轉錄本長度超過 200 個核苷酸的 RNA 分子,一般不直接參與基因編碼和蛋白質合成,但是可在表觀遺傳水平、轉錄水平和轉錄後水平調控基因的表達。儘管我們目前對 lncRNA 的種類、數量、功能都不明確,但 lncRNA 在很多生命活動中發揮重要作用,與機體的生理和病理過程均有密切的關係,因此對 lncRNA 的研究成為當今分子生物學前沿研究領域之一。
從上述內容中我們可以看到,蛋白質特別是組蛋白的修飾對基因表達調控的影響雖然顯而易見,但是真正的作用機制仍有待揭示。長久以來,人們一直關注着編碼 RNA,卻突然發現非編碼 RNA 也有着重要的作用。因此,全面了解非編碼 RNA 的時空表達譜及生物學意義的「轉錄物組學(transcriptomics)」應運而生。人們也只有在對核酸(DNA 和 RNA) 和蛋白質進行全面深入的研究之後,才有可能破解生命之謎。