生物化學與分子生物學/真核生物RNA的合成
RNA的合成 -
原核生物轉錄的模板和酶 -
原核生物的轉錄過程 -
真核生物RNA的合成 -
真核生物前體RNA的加工和降解
真核生物的轉錄過程比原核複雜。真核生物和原核生物的RNA pol種類不同,結合模板的特性不一樣。原核生物RNA pol可直接結合DNA模板,而真核生物RNA pol需與輔因子結合後才結合模板,所以兩者的轉錄起始過程有較大區別,轉錄終止也不相同。真核基因組中轉錄生成的RNA中有20%以上存在反義RNA(antisense RNA), 提示某些DNA雙鏈區域在不同的時間點兩條鏈都可以作為模板進行轉錄。另外,基因組中的基因間區也可以作為模板被轉錄而產生長非編碼RNA等,提示真核基因組RNA生物合成是很廣泛的現象。
真核生物有多種DNA依賴的RNA聚合酶
編輯真核生物至少具有3種主要的RNA pol, 分別是RNA聚合酶Ⅰ(RNA pol Ⅰ)、RNA聚合酶Ⅱ(RNA pol Ⅱ)和RNA聚合酶Ⅲ(RNA pol Ⅲ)。RNA pol Ⅰ位於細胞核的核仁(nucleolus) , 催化合成rRNA的前體,rRNA的前體再加工成28S、5.8S及18S rRNA。
RNA pol Ⅱ在核內轉錄生成前體 mRNA, 然後加工成 mRNA並輸送給胞質的蛋白質合成體系。mRNA是各種RNA中壽命最短、最不穩定的,需經常重新合成。在此意義上說,RNA pol Ⅱ是真核生物中最活躍的RNA pol。RNA pol Ⅱ也合成一些非編碼RNA如長非編碼RNA(long non-coding RNA, lncRNA)微小RNA和 piRNA(與Piwi蛋白相互作用的RNA)。
RNA pol Ⅲ位於核仁外,催化tRNA、5SrRNA和一些核小RNA(small nuclear RNA, snRNA)的合成。
真核細胞的三種RNA pol不僅在功能和理化性質上不同,而且對一種毒蘑菇含有的環八肽(cyclic octapeptide)毒素——α-鵝膏覃鹼(α-amanitine)的敏感性也不同,RNA pol Ⅰ對α-鵝膏覃鹼不敏感;RNA pol Ⅱ對α-鵝膏覃鹼十分敏感;RNA pol Ⅲ對α-鵝膏簟鹼比較敏感。
真核生物RNA pol的結構比原核生物複雜,以上所述三種真核生物的RNA pol都有兩個不同的大亞基和十幾個小亞基。三種真核生物RNA pol都具有核心亞基,與大腸桿菌RNA pol的核心亞基有一些序列同源性。最大的亞基(分子質量160~220kD)和另一大亞基(分子質量128~150kD)與大腸桿菌RNA pol的β'和β亞基有一定同源性。例如,RNA pol Ⅱ由12個亞基組成,其最大的亞基稱為 RBP1。除核心亞基外,3種真核生物RNA pol具有數個共同小亞基。另外,每種真核生物RNA pol各自還有3~7個特有的小亞基。這些小亞基的作用還不十分清楚,但是,每一種亞基對真核生物RNA pol發揮正常功能都是必需的。
RNA pol Ⅱ最大亞基的羧基末端有一段共有序列(consensus sequence), 為Tyr-Ser-Pro-Thr-Ser-Pro-Ser樣的七肽重複序列片段,稱為羧基末端結構域(carboxyl-terminal domain, CTD)。RNApol Ⅰ和RNA pol Ⅲ沒有CTD。 所有真核生物的RNA pol Ⅱ都具有CTD, 只是7個胺基酸共有序列的重複程度不同。酵母RNA pol Ⅱ的 CTD有27個重複共有序列,其中18個與上述7個胺基酸共有序列完全一致;哺乳動物RNA pol Ⅱ的CTD有52個重複基序,其中21個與上述7個胺基酸共有序列完全一致。CTD對於維持RNA pol Ⅱ的催化活性是必需的。體內外實驗都證明,CTD的磷酸化在轉錄起始中起關鍵作用。當RNA pol Ⅱ啟動轉錄後,CTD的許多Ser和一些Tyr殘基是處於磷酸化狀態。
RNA聚合酶Ⅰ、Ⅱ、Ⅲ分別使用不同類型的啟動子,分別為Ⅰ類、Ⅱ類和Ⅲ類啟動子,其中Ⅲ類啟動子又可被分為3個亞型。
染色體上兩個相鄰基因的轉錄方向有的是相同的,有的是不同的。雙向啟動子(bidirectional promoter)是位於兩個相鄰且轉錄方向相反的基因之間的一段DNA序列。近年來在人類等動植物基因組中存在大量的相鄰且轉錄方向相反的基因,被稱為雙向轉錄基因對(bidirectional gene psirs), 也被稱之為「頭對頭」基因對(head-to-head gene pairs)。當這兩個相鄰的「頭對頭」基因轉錄起始位點之間的距離小於1kb左右時,這段基因間DNA序列可稱之為雙向啟動子。根據相反方向基因重疊程度不同,雙向轉錄基因對可分為兩類:基因5'-端不重疊的雙向轉錄基因對和基因5'-端重疊的雙向轉錄基因對。相應的雙向啟動子也分為兩類:啟動子序列重疊的雙向啟動子和啟動子序列不重疊的雙向啟動子。第1類雙向啟動子是真正意義上的雙向啟動子。
真核細胞內還有其他類型的DNA依賴的RNA聚合酶,例如RNA聚合酶Ⅳ(RNA polmerase Ⅳ)在植物中合成小干擾RNA(siRNA); RNA聚合酶Ⅴ(RNA polymerase Ⅴ)在植物中合成的RNA與siRNA介導的異染色質形成有關。真核細胞線粒體的RNA聚合酶屬於單亞基RNA聚合酶蛋白質家族,與上述 RNA聚合酶在結構上非常不同,在此不詳述。
順式作用元件和轉錄因子在真核生物轉錄起始中有重要作用
編輯RNA pol Ⅱ催化基因轉錄的過程,可以分為3個期:起始期(RNA pol Ⅱ和通用轉錄因子形成閉合複合體)、延長期和終止期 ,起始期和延長期都有相關的蛋白質參與。
真核生物的轉錄起始上游區段比原核生物多樣化。轉錄起始時,RNA pol不直接結合模板,其起始過程比原核生物複雜。
與轉錄起始有關的順式作用元件
編輯不同物種、不同細胞或不同的基因,轉錄起始點上游可以有不同的DNA序列,但這些序列都可統稱為順式作用元件(cis-acting element)。順式作用元件包括核心啟動子序列、啟動子上游元件 (upstream promoter elements), 又叫近端啟動子元件(proximal promoter elements)等近端調控元件和增強子(enhancer)等遠隔序列。
轉錄起始點至上游-37bp的啟動子區域是核心啟動子(core promoter)區,是轉錄起始前複合物(prein 山ation com plex, PIC) 的結合位點。真核生物轉錄起始也需要RNA pol對起始區上游DNA序列作辨認和結合,生成起始複合物。 起始點上游多數有共同的TATA序列,稱為Hognest盒或TATA盒(TATA box)。通常認為這就是啟動子的核心序列。 TATA盒的位置不像原核生物上游-35區和-10區那樣典型。某些真核生物基因如管家基因(house-keeping gene)也可以沒有TATA盒。許多RNA pol Ⅱ識別的啟動子具有保守的共有序列:位於轉錄起始點附近的起始子(initiator, Inr)。
啟動子上游元件是位於TATA盒上游的DNA序列,多在轉錄起始點上游約40~200bp的位置,比較常見的是位於-70bp至-200bp的CAAT盒和GC盒。這些元件與相應的蛋白因子結合能提高或改變轉錄效率。
增強子是能夠結合特異基因調節蛋白並促進鄰近或遠隔特定基因表達的DNA序列。增強子距轉錄起始點的距離變化很大,從lOOObp到50 OOObp, 甚至更大,但一般作用於最近的啟動子,在所控基因的上游和下游都可發揮調控作用,但以上游為主。
轉錄因子
編輯RNA pol Ⅱ啟動轉錄時,需要一些稱為轉錄因子(transcription factor, TF)的蛋白質,才能形成具有活性的轉錄複合體。能直接、間接辨認和結合轉錄上游區段DNA或增強子的蛋白質,統稱為反式作用因子(trans-acting factor)。前綴trans-有「分子外」的意義,指的是它們從DNA分子之外影響轉錄過程。反式作用因子包括通用轉錄因子(general trans cription factor)和特異轉錄因子。通用轉錄因子,有時稱為基本轉錄因子(basal trans cription factor) , 是直接或間接結合RNA pol的一類轉錄調控因子。相應於RNA pol Ⅰ、Ⅱ、Ⅲ的TF,分別稱為TF Ⅰ、TFⅡ、TFⅢ。真核生物的TFⅡ又分為TFⅡA,TFⅡB 等,主要的TFⅡ的功能巳清楚。所有的RNA pol Ⅱ都需要通用轉錄因子,這些通用轉錄因子有TFⅡA、TFⅡB、TFⅡD、TFⅡE、TFⅡF、TFⅡH,在真核生物進化中高度保守。
通用轉錄因子TFⅡD不是一種單一蛋白質。它實際上是由TATA盒結合蛋白質(TATA binding protein, TBP)和8~10個TBP相關因子(TEP-associated factor, TAF)組成的複合物。TBP結合一個lObp長度DNA片段,剛好覆蓋基因的TATA盒,而TFⅡD則覆蓋一個35bp或者更長的區域。TBP的分子量為20~40kD, 而TFⅡD 複合物的分子量大約為700kD。TBP支待基礎轉錄但是不是誘導等所致的增強轉錄所必需的。而TFⅡD中的TAFs 對誘導引起的增強轉錄是必要的。有時把TAFs叫做輔激活因子( co-activator)。人類細胞中至少有12種TAF。可以想像TFⅡD 複合物中不同TAFs與TBP的結合可能結合不同啟動子,這可以解釋這些因子對特定啟動子存在不同的親和力和在各種啟動子中的選擇性活化。中介子(mediator)也是在反式作用因子和RNA pol之間的蛋白質複合體,它與某些反式作用因子相互作用,同時能夠促進TFⅡH對RNA pol羧基端結構域的磷酸化。有時把中介子也歸類於輔激活因子。
此外,還有與啟動子上游元件如GC盒、CAAT盒等順式作用元件結合的轉錄因子,稱為上游因子 (upstream factor) , 如SPl結合到GC盒上,C/EBP結合到CAAT盒上。這些轉錄因子調節通用轉錄因子與TATA盒的結合、RNA pol在啟動子的定位及起始複合物的形成,從而協助調節基因的轉錄效率。
特異轉錄因子是在特定類型的細胞中高表達,並對一些基因的轉錄進行時間和空間特異性調控的轉錄因子。與遠隔調控序列如增強子等結合的轉錄因子是主要的特異轉錄因子。例如,屬於特異轉錄因子的可誘導因子(inducible factor)是與增強子等遠端調控序列結合的轉錄因子。它們只在某些特殊生理或病理情況下才被誘導產生的,如MyoD在肌肉細胞中高表達,HIF-1在缺氧時高表達。可誘導因子在特定的時間和組織中表達而影響轉錄。
RNA pol Ⅱ與啟動子結合後啟動轉錄,這需要多種蛋白質因子的協同作用。這通常包括:可誘導因子或上游因子與增強子或啟動子上游元件的結合;輔激活因子和(或)中介子在可誘導因子、上游因子與通用轉錄因子RNA pol Ⅱ複合物之間起中介和橋梁作用;通用轉錄因子和RNA pol Ⅱ在啟動子處組裝成轉錄起始前複合物。因子和因子之間互相辨認、結合,以準確地控制基因是否轉錄、何時轉錄。上游因子和可誘導因子等在廣義上也稱為轉錄因子,但一般不冠以 TF 的詞頭而各有自己特殊的名稱。
轉錄起始前複合物
編輯真核生物RNA pol不與 DNA 分子直接結合,而需依靠眾多的轉錄因子。首先是 TFⅡD 的 TBP 亞基結合 TATA, 另一 TFIID 亞基 TAF 有多種,在不同基因或不同狀態轉錄時,不同的 TAF 與 TBP 進行搭配。在 TFⅡA 和ⅡB 的促進和配合下,形成ⅡD-ⅡA-ⅡB-DNA複合體。
具有轉錄活性的閉合複合體形成過程中,先由 TBP 結合啟動子的 TATA 盒,這時 DNA 發生彎曲,然後 TFⅡB 與 TBP 結合,TFⅡB 也能與 TATA 盒上游鄰近的 DNA 結合。TFⅡA 不是必需的,其存在時能穩定已與 DNA 結合的 TFⅡD-TBP 複合體,並且在 TBP 與不具有特徵序列的啟動子結合時(這種結合比較弱)發揮重要作用。TFⅡB可以結合RNA pol Ⅱ。TFⅡB-TBP複合體再與由RNA pol Ⅱ和TFⅡF組成的複合體結合。TFⅡF的作用是通過和RNA pol Ⅱ
一起與TFIIB相互作用,降低RNA pol Ⅱ與DNA的非特異部位的結合,來協助RNA pol Ⅱ靶向結合啟動子。最後是TF ⅡE和TFⅡH加入,形成閉合複合體,裝配完成,這就是轉錄起始前複合物。
TFⅡH具有解旋酶(helicase)活性,能使轉錄起始點附近的DNA雙螺旋解開,使閉合複合體成為開放複合體啟動轉錄。TFⅡH還具有激酶活性,它的一個亞基能使RNA pol Ⅱ的CTD磷酸化。還有一種使CTD磷酸化的蛋白質是周期蛋白依賴性激酶9(cyclin-dependent kinase 9, CDK9) , 是正性轉錄延長因子(positive transcription elongation factor, P-TEFb)複合體的組成部分,對RNA pol Ⅱ的活性起正性調節作用。CTD磷酸化能使開放複合體的構象發生改變,啟動轉錄。這時TFⅡD、TFⅡA和TFⅡB 等就會脫離轉錄起始前複合物。當合成一段含有30個左右核苷酸的RNA時,TFⅡE和TFⅡH釋放,RNA pol Ⅱ進入轉錄延長期。在延長階段,TFⅡF仍然結合RNA pol Ⅱ, 防止其與DNA的結 合。CTD磷酸化在轉錄延長期也很重要,而且影響轉錄後加工過程中轉錄複合體和參與加工的酶之間的相互作用。
少數幾個反式作用因子和搭配啟動特定基因的轉錄
編輯上述的是典型而有代表性的RNA pol Ⅱ催化的轉錄起始。RNA pol Ⅰ、RNA pol Ⅲ的轉錄起始與此大致相似。不同基因轉錄特性的研究已廣泛開展,並發現數以百計、數量還在不斷增加的轉錄因子。人類編碼蛋白質的基因估計有2萬個左右,為了保證轉錄的準確性,不同基因的轉錄起始需要不同的轉錄因子來參與,這是可理解的。轉錄因子是蛋白質,也需要基因為它們編碼。一般認為,數個反式作用因子(主要是可誘導因子和上游因子等轉錄因子)之間互相作用,再與基本轉錄因子、RNA pol搭配而有針對性地結合、轉錄相應的基因。可誘導因子和上游因子常常通過輔激活因子或中介子與基本轉錄因子、RNA pol結合,但有時可不通過它們而直接與基本轉錄因子、RNA pol結合。 轉錄因子的相互辨認結合,恰如兒童玩具七巧板那樣,搭配得當就能拼出多種不同的圖形。人類基因雖數以萬計,但需要的轉錄因子可能幾百個就能滿足表達不同類型基因的需要。目前不少實驗都支持這一理論。用生物信息學估算人類細胞中大約有2000種編碼DNA結合蛋白的基因,約占基因總數的10%。其中大部分可能是反式作用因子。
真核生物RNA轉錄延長過程不與翻譯同步
編輯真核生物轉錄延長過程與原核生物大致相似,但因有核膜相隔,沒有轉錄與翻譯同步的現象。真核生物基因組DNA在雙螺旋結構的基礎上,與多種組蛋白組成核小體(nucleosome)高級結構。RNA pol前移處處都遇上核小體。RNA聚合 酶(500kD,14nmx13nm)和核小體組蛋白八聚體(300kD,6nmxl6nm)大小差別不太大。轉錄延長可以觀察到核小體移位 和解聚現象。用含核小體結構的DNA片段作模板,在酶、底物存在及合適反應條件下進行轉錄,能夠觀察到核小體移位。在試管內(in vitro)轉錄實驗中以DNA酶對DNA進行水解,從DNA電泳圖像觀察到約200bp及其倍數的階梯形電泳條帶。這種階梯形電泳條帶證明了核小體在轉錄過程中存在,提示轉錄過程中核小體只是發生了移位。但在培養細胞的體內(in vivo)轉錄實驗中觀察到,組蛋白中含量豐富的精氨酸發生了乙醯化,該修飾降低正電荷。核小體組蛋白與DNA的結合是靠鹼性胺基酸提供正電荷和核苷酸磷酸根上的負電荷來維繫的。據此推論:核小體在轉錄過程中可能發生一時性解聚並重新裝配。
真核生物的轉錄終止和加尾修飾同時進行
編輯真核生物的轉錄終止,是和轉錄後修飾密切相關的。真核生物 mRNA有多聚腺苷酸[poly(A)]尾巴結構,是轉錄後才加進去的,因為在模板鏈上沒有相應的多聚胸苷酸(poly dT)。轉錄不是在poly(A)的位置上終止,而是超出數百個乃至上千個核苷酸後才停止。已發現在可讀框的下游,常有一組共同序列AATAAA,再下游還有相當多的GT序列。這些序列稱為轉錄終止的修飾點。
轉錄越過修飾點後,前體mRNA在修飾點處被切斷,隨即加入poly(A)尾及5'-帽子結構。下游的RNA雖繼續轉錄,但很快被RNA酶降解。因此有理由相信,帽子結構是保護RNA免受降解的,因為修飾點以後的轉錄產物無帽子結構,很快被降解。
RNA pol缺乏具有校讀(proofreading)功能的3'→5'核酸外切酶活性,因此轉錄發生的錯誤率比複製發生的錯誤率高,大約是十萬分之一到萬分之一。因為對大多數基因而言,一個基因可以轉錄產生許多RNA拷貝,而且RNA最終是要被降解和替代的,所以轉錄產生錯誤RNA對細胞的影響遠比複製產生錯誤DNA對細胞的影響小。