生物化學與分子生物學/RNA的空間結構與功能
核酸的結構與功能-
核酸的化學組成以及一級結構 -
DNA的空間結構與功能 -
RNA的空間結構與功能 -
核酸的理化性質
一般而言,RNA是DNA的轉錄產物。和DNA一樣,RNA在生命活動中發揮着重要的作用。RNA可以分為編碼RNA(coding RNA)和非編碼RNA(non-coding RNA)。編碼RNA是那些從基因組上轉錄而來、其核苷酸序列可以翻譯成蛋白質的RNA,編碼RNA僅有信使RNA(messenger RNA, mRNA)一種。非編碼RNA不編碼蛋白質。非編碼RNA可以分為兩類。一類是確保實現基本生物學功能的RNA, 包括轉運RNA(transfer RNA, tRNA)、核糖體RNA(ribosomal RNA, rRNA)、端粒RNA、信號識別顆粒(signal recognition particle, SRP) RNA等,它們的豐度基本恆定,故稱為組成性非編碼RNA(constitutive non-coding RNA)。另一類是調控性非編碼RNA(regulatory non-coding RNA), 它們的豐度隨外界環境(應激條件等)和細胞性狀(成熟度、代謝活躍度、健康狀態等)而發生改變,在基因表達過程中發揮重要的調控作用。
RNA 通常以單鏈形式存在,較長的RNA可以通過鏈內的鹼基互補配對形成局部的雙螺旋二級結構以及複雜的高級結構。RNA的種類、豐度、大小和空間結構要比DNA複雜得多,這與它的功能多樣性密切相關。
mRNA是蛋白質生物合成的模板
編輯20世紀40年代,科學家發現細胞質內蛋白質的合成速度與RNA水平相關。1960年,F. Jacob和J. Monod等人用放射性核素示蹤實驗證實,一類大小不一的RNA才是細胞內合成蛋白質的真正模板。後來這類RNA被證明是在核內以DNA為模板的合成產物,然後轉移至細胞質內。這類RNA被命名為信使RNA(mRNA)。
在生物體內,mRNA的豐度最小,僅占細胞RNA總重量的2%~5%。但是mRNA的種類最多,約有105個之多,而且它們的大小也各不相同。mRNA的平均壽命也相差甚大,從幾分鐘到幾小時不等。在真核細胞中,細胞核內新生成的mRNA初級產物被稱為核不均一RNA (heterogeneous nuclear RNA, hnRNA)。hnRNA在細胞核內合成後,經過一系列的轉錄後修飾,剪接成為成熟mRNA, 最後被轉運到細胞質中。
- 真核細胞mRNA的5'-端有帽結構
大部分真核細胞mRNA的5'-端都有一個反式7-甲基鳥嘌呤-三磷酸核苷(m7Gppp)的起始結構,被稱為5'-帽結構(5'-cap structure)。5'-帽結構是鳥苷酸轉移酶將鳥嘌呤三磷酸核苷加到轉錄後的mRNA的5'-端,形成了一個5'-5'三磷酸鍵,使mRNA的5'-端不再具有磷酸基團。5'-帽結構下游的第一個和第二個核苷酸中C-2'的羥基通常也會被甲基化成為甲氧基戊糖,由此產生數種不同的帽結構。原核生物mRNA沒有這種特殊的5'-帽結構。
真核生物mRNA的5'-帽結構可以與一類稱為帽結合蛋白(cap binding protein, CBP) 的分子結合形成複合體。這種複合體有助於維持mRNA的穩定性,協同mRNA從細胞核向細胞質的轉運,以及在蛋白質生物合成中促進核糖體和翻譯起始因子的結合。
- 真核生物和有些原核生物mRNA的3'-端有多聚腺苷酸尾的結構
真核生物mRNA的3'-端是一段由80~250個腺苷酸連接而成的多聚腺苷酸結構,稱為多聚腺苷酸尾或多聚(A)尾[poly(A)-tail]結構。多聚(A)尾結構是在mRNA轉錄完成以後加入的,催化這一反應的酶是多聚腺苷酸聚合酶。在細胞內,多聚(A)尾結構與poly(A)結合蛋白[ poly(A)-binding protein, PABP]結合,大約每20個腺苷酸結合一個PABP分子。目前認為,這種3'-多聚(A)尾結構和5'-帽結構共同負責mRNA從細胞核向細胞質的轉運、維持mRNA的穩定性以及翻譯起始的調控。去除3'-多聚(A)尾和5'帽結構可導致細胞內的mRNA的迅速被降解。有些原核生物mRNA的3'-端也有這種多聚(A)尾結構,雖然它的長度較短,但是同樣具有重要的生物學功能。
- 真核生物細胞核內的hnRNA經過一系列的修飾和剪接成為成熟的mRNA
比較hnRNA和成熟mRNA發現,前者的長度遠遠大於後者。細胞核內的初級轉錄產物hnRNA含有許多交替相隔的外顯子(exon)和內含子(intron)。外顯子是構成mRNA的序列片段,而內含子是非編碼序列。在hnRNA向細胞質轉移的過程中,內含子被剪切掉,外顯子連接在一起。再經過加帽和加尾修飾後,hnRNA成為成熟mRNA。
- mRNA的核苷酸序列決定蛋白質的胺基酸序列
一條成熟的真核mRNA包括5'-非翻譯區、編碼區和3'-非翻譯區。從成熟mRNA的5'-帽結構到核苷酸序列中第一個AUG(即起始密碼子)之間的核苷酸序列被定義為5'-非翻譯區(5'-untranslated region, 5'-UTR)。從這個AUG開始 ,每三個連續的核苷酸組成一個遺傳密碼子( genetic codon), 每個密碼子編碼一個胺基酸,直到由三個核苷酸(UAA, 或UAG, 或UGA)組成的終止密碼子。由起始密碼子和終止密碼子所限定的區域定義為mRNA的編碼區,也稱可讀框(open reading frame, ORF)。該區域是編碼蛋白質多肽鏈的核苷酸序列。從mRNA可讀框的下游直到多聚A尾的區域稱為3'-非翻譯區(3'-untranslated region, 3'-UTR)。這些非翻譯區通過與調控因子或非編碼RNA的相互作用調控蛋白質生物合成 。
tRNA是蛋白質合成中胺基酸的載體
編輯轉運RNA(transfer RNA, tRNA)作為蛋白質合成的底物——胺基酸的載體參與蛋白質合成,為合成中的多肽鏈提供活化的胺基酸。tRNA占細胞RNA總重量的15%左右。已知的tRNA都是由74~95個核苷酸組成的。tRNA具有穩定的空間結構。
- tRNA含有多種稀有鹼基
稀有鹼基(rarebase)是指除A、G、C和U外的一些鹼基,包括雙氫尿嘧啶(dihydrouracil, DHU)、假尿嘧啶核苷(pseudouridine, Ψ)和甲基化的嘌呤(m7G、m7A)等。正常的嘧啶核苷是雜環的N-1原子與戊糖的C-1'原子連接形成糖苷鍵,而假尿嘧啶核苷則是雜環的C-5原子與戊糖的C-1'原子相連。tRNA中的稀有鹼基佔所有鹼基的10%~20%。tRNA分子中的稀有鹼基均是轉錄後修飾而成的。
- tRNA具有特定的空間結構
tRNA存在着一些核苷酸序列,能夠通過鹼基互補配對的原則,形成局部的鏈內的雙螺旋結構。在這些局部的雙螺旋結構之間的核苷酸序列不能形成互補的鹼基對則膨出形成環狀或襻狀結構。這樣的結構稱為莖環(stem-loop)結構或髮夾(hairpin)結構。由於這些莖環結構的存在,tRNA的二級結構呈現出酷似三葉草(cloverleaf)的形狀。位於兩側的髮夾結構含有稀有鹼基,分別稱為DHU環和TΨC環;位於上方的莖稱為胺基酸臂(amino acid arm), 亦稱接納莖;位於下方的髮夾結構則稱為反密碼子環(anticodon loop)。此外,在反密碼子環與TΨC環之間還有一個可變臂。不同tRNA的可變臂的長短不一,從幾個到十幾個核苷酸數不等。除可變臂和DHU環外,其他部位的核苷酸數目和鹼基對具有高度保守性。X射線晶體繞射圖分析表明,所有的tRNA都具有相似的倒「L」形的空間結構。穩定tRNA的三級結構的力是某些鹼基之間產生的特殊氫鍵和鹼基堆積力。
- tRNA的3'-端連接着胺基酸
所有tRNA的3'-端都是以CCA三個核苷酸結束的,氨醯-tRNA合成酶將胺基酸通過酯鍵連接在腺嘌呤A的C-3'原子上,生成了氨醯-tRNA, 從而使tRNA成為了胺基酸的載體。只有連接在tRNA的胺基酸才能參與蛋白質的生物合成。tRNA所攜載的胺基酸種類是由tRNA的反密碼子(anticodon)所決定的。有的胺基酸只有一種tRNA, 而有的胺基酸有幾種tRNA作為載體,以適應mRNA上密碼子簡併性的需求。
- tRNA的反密碼子能夠識別mRNA的密碼子
tRNA的反密碼子環由7~9個核苷酸組成,居中的3個核苷酸通過鹼基互補配對的關係識別mRNA上的密碼子,因此被稱為反密碼子。密碼子與反密碼子的結合使tRNA能夠轉運正確的胺基酸參與蛋白質多肽鏈的合成。例如,攜帶酪氨酸的tRNA反密碼子是-GUA-, 可以與mRNA上編碼酪氨酸的密碼子-UAC-互補配對。在蛋白質合成中,氨醯-tRNA的反密碼子依靠鹼基互補的方式辨認mRNA的密碼子,將其所攜帶的胺基酸正確地轉遞到合成中的多膚鏈上。
以rRNA為主要成分的核糖體是蛋白質合成的場所
編輯核糖體RNA(ribosomal RNA, rRNA)是細胞中含量最多的RNA, 約佔RNA總重量的80%以上。rRNA有確定的種類和保守的核苷酸序列。rRNA與核糖體蛋白(ribosomal protein)共同構成核糖體(ribosome), 它將蛋白質生物合成所需要的mRNA、tRNA以及多種蛋白質因子募集在一起,為蛋白質生物合成提供了必需的場所。
原核細胞有三種rRNA,依照分子量的大小分為5S、16S和23S(S是大分子物質在超速離心沉降中的沉降系數)。它們與不同的核糖體蛋白結合分別形成了核糖體的大亞基(large subunit)和小亞基(small subunit)。真核細胞的四種rRNA也利用相類似的方式構成了真核細胞核糖體的大亞基和小亞基。
人們已經完成了rRNA的核苷酸測序,並解析了它們的空間結構。rRNA的二級結構有許多莖環結構。這些莖環結構為核糖體蛋白結合和組裝在rRNA上提供了結構基礎。 原核細胞16S rRNA的二級結構也有眾多相類似的莖環結構。
將純化的核糖體蛋白和rRNA在試管內混合,它們就可以自動組裝成具有活性的大亞基和小亞基。大亞基和小亞基進一步組裝成核糖體。大小亞基的結合區域的溝槽是mRNA的結合部位。核糖體有三個重要的部位,它們分別是A位:結合氨醯-tRNA的氨醯位(aminoacyl site);P位:結合肽醯-tRNA的肽醯位(peptidyl site);和E位:釋放已經卸載了胺基酸的tRNA的排出位(exit site)。
組成性非編碼RNA是保障遺傳信息傳遞的關鍵因子
編輯除tRNA和rRNA外,真核細胞中還有其他類型的組成性非編碼RNA。這些RNA作為關鍵因子參與了RNA的剪接和修飾、蛋白質的轉運以及調控基因表達。
- 催化小RNA 催化小RNA也稱為核酶(ribozyme), 是細胞內具有催化功能的一類小分子RNA統稱,具有催化特定RNA降解的活性,在RNA合成後的剪接修飾中具有重要作用。
- 核仁小RNA (small nucleolar RNA, snoRNA) snoRNA定位於核仁,主要參與rRNA的加工。tRNA的核糖C-2'的甲基化過程和假尿嘧啶化修飾都需要snoRNA的參與。
- 核小RNA (small nuclear RNA, snRNA) snRNA參與了真核細胞mRNA的成熟過程。一個snRNA與大約20種蛋白質組成了細胞的核小核糖核蛋白(small nuclear ribonucleoprotein, snRNP) 。由於它們富含尿嘧啶,故命名為U-snRNA。研究比較清楚的snRNA有U1、U2、U4、U5、U6和U7。它們的作用是識別hnRNA上的外顯子和內含子的接點,切除內含子。這些snRNA的5'-端有一個與mRNA相類似的5'-帽結構。
- 胞質小RNA(small cytoplasmic RNA, scRNA) scRNA存在細胞質中,與蛋白質結合形成複合體後發揮生物學功能。例如,SRP-RNA與六種蛋白質共同形成信號識別顆粒(signal recognition particle, SRP), 引導含有信號肽的蛋白質進入內質網進行合成。
調控性非編碼RNA參與了基因表達調控
編輯調控性非編碼RNA按其大小分為非編碼小RNA(small non-coding RNA, sncRNA)、長非編碼RNA(long non-coding RNA, lncRNA)和環狀RNA(circular RNA, circRNA)。雖然這一類RNA通常不編碼蛋白質,但是它們仍然表現出了許多重要的生物學功能:轉錄調控、RNA剪切和修飾、mRNA的翻譯、蛋白質的穩定和轉運、染色體的形成和結構穩定等,因此,在胚胎發育、組織分化、信號轉導、器官形成等基本的生命活動中以及在疾病(如腫瘤、神經性疾病等)的發生和發展進程中都有非編碼RNA的參與。
非編碼小RNA的特徵和作用
編輯通常認為,sncRNA的長度小千200nt。sncRNA包括微RNA(microRNA, miRNA)、干擾小RNA (small interfering RNA, siRNA)和piRNA。
微RNA是近年來研究較多的內源性sncRNA,它在真核生物中大量存在,長度在20~25nt之間。在細胞核中,編碼miRNA的基因由RNA聚合酶Ⅱ轉錄生成長度約為幾千個鹼基的初級轉錄本pri-miRNA。在細胞核內,pri-miRNA在蛋白質複合體(400~500kD)的作用下經過了第一次的加工。這個蛋白質複合體由Drosha和Pasha兩個蛋白質組成,它們分別是RNase Ⅲ蛋白和雙鏈RNA結合蛋白。pri-miRNA在Drosha的作用下被加工成含有60~70nt具有髮夾結構的miRNA前體 (pre-miRNA)。pre-miRNA在RanGTP/Exportin-5轉運蛋白的協助下從核內轉運到細胞質中。在細胞質中,pre-miRNA被RNase Ⅲ酶家族中的成員Dicer所識別,並通過對莖環結構的剪切和修飾,在細胞質內形成大約20個鹼基對長的miRNA: miRNA*雙鏈。 這種miRNA:miRNA*雙鏈與Argonaute家族蛋白形成RNA誘導的沉默複合體,其中的miRNA*被降解,miRNA則被保留在miRISC 中,最終形成成熟的單鏈miRNA。
微 RNA 對基因表達的調控作用表現在轉錄後水平上,主要是通過兩種機制下調靶基因的表達。這兩種機制的選擇主要取決於 miRNA 與靶基因 mRNA 序列的互補程度。 如果 miRNA 與靶基因mRNA 完全互補,miRNA 將與靶基因 mRNA 的可讀框中的序列形成完全互補的 RNA 雙鏈,miRISC 將雙鏈中的 mRNA 降解,沉默基因轉錄後的表達。如果 miRNA 與靶基因 mRNA 不完全互補,則 miRNA將與靶基因 mRNA 的 3'-非翻譯區的序列形成非完全互補的雜交雙鏈,miRISC 緊緊地結合在雜交雙鏈上,特異性地抑制基因表達。 miRNA 參與了細胞的生長、分化、衰老、凋亡、自噬、遷移、侵襲等多種過程。
siRNA 有內源性和外源性之分,內源性 siRNA 是由細胞自身產生的。外源性 siRNA 來源於外源入侵的基因表達的雙鏈 RNA , 經 Dicer 切割所產生的具有特定長度 (21~23bp)和特定序列的小片段 RNA。這些 siRNA 可以與 AGO 蛋白結合,並誘導這些 mRNA 的降解。 siRNA 還有抑制轉錄的功能。利用這一機製發展起來的 RNA 干擾( RNA interference, RNAi) 技術是用來研究基因功能的有力工具。
piRNA 是從哺乳動物生殖細胞中分離得到的一類長度約為 30nt 的小 RNA。這類小 RNA 與 PIWI蛋白家族成員結合才能發揮其調控作用,故稱為piRNA(piwi interacting RNA)。 piRNA 主要存在哺乳動物生殖細胞和幹細胞中,通過與 PIWI 蛋白家族成員結合形成 piwi 複合物來調控基因沉默。
長非編碼RNA的特徵和作用
編輯長非編碼 RNA 是一類長度為 200~100 000 個核苷酸的 RNA 分子。它們不編碼任何蛋白質。以前它們被認為是基因組轉錄過程中的「噪聲」而被忽略掉,現在越來越多的證據表明它們是一類具有特殊功能的 RNA 。
lncRNA 由 RNA 聚合酶Ⅱ轉錄生成,經剪切加工後,形成具有類似於 mRNA 的結構。 lncRNA 有 poly(A) 尾巴和啟動子,但序列中不存在可讀框。 lncRNA 可以來源於蛋白質編碼基因、假基因以及蛋白質編碼基因之間的 DNA 序列。 lncRNA 定位於細胞核內和細胞質內。 lncRNA 具有強烈的組織特異性與時空特異性,不同組織之間的 lncRNA 表達量不同,同一組織或器官在不同生長階段,lncRNA表達量也不同。
lncRNA 的作用機制有以下幾種:
- 結合在編碼蛋白質的基因上游啟動子區,干擾下游基因的表達;
- 抑制 RNA 聚合酶Ⅱ或者介導染色質重構以及組蛋白修飾,影響下游基因的表達;
- 與編碼蛋白質基因的轉錄本形成互補雙鏈,干擾 mRNA 的剪切,形成不同的剪切形式;
- 與編碼蛋白質基因的轉錄本形成互補雙鏈,在 Dicer 酶的作用下產生內源性 siRNA;
- 與特定蛋白質結合,lncRNA 轉錄本可調節相應蛋白質的活性;
- 作為結構組分與蛋白質形成核酸蛋白質複合體;
- 結合到特定蛋白質上,改變該蛋白質的細胞定位;
- 作為小分子 RNA(如 miRNA、piRNA)的前體分子。
由此可見,lncRA 具有調控的多樣性,可從染色質重塑、轉錄調控及轉錄後加工等多個層面上實現對基因表達進行調控。
長非編碼 RNA 與人類疾病的發生密切相關,現已得知,包括癌症以及退行性神經疾病在內的多種嚴重危害人類健康的重大疾病都與長鏈非編碼 RNA 的序列和空間結構的異常、表達水平的異常、與結合蛋白相互作用的異常等密切相關。
環狀RNA的特徵和作用
編輯2012 年,美國科學家在研究人體細胞的基因表達時,首次發現了環形 RNA 分子。 截至目前,人們已經在哺乳動物轉錄組中發現了數以千計的環狀 RNA,這似乎表明環狀 RNA 而非線性 RNA 分子是更普遍的現象。環狀RNA是一類特殊的RNA分子。與傳統的線性RNA不同,circRNA分子呈封閉環狀結構,沒有5'-端和3'-端,因此不受RNA外切酶的影響,表達更穩定,不易降解。已知的circRNA分子或來自外顯子,或兼有外顯子和內含子的部分。circRNA幾乎完全定位於細胞核中。circRNA具有序列的高度保守性,具有一定的組織、時序和疾病特異性。由於circRNA的首尾連接,沒有尾巴,因此circRNA容易在傳統的分離過程被丟棄掉。這是為什麼以前circRNA一直沒有被發現的主要原因。
小鼠、人類和斑馬魚的各個組織都可以表達circRNA分子,這些circRNA分子富含miRNA的結合位點,在細胞中起到 miRNA 海綿(miRNA sponge)的作用,通過結合miRNA,進而解除miRNA對其靶基因的抑制作用,升高靶基因的表達水平,產生相應的生物學效應,這一作用機制被稱為競爭性內源 RNA (competing endogenous RNA, ceRNA)機制。通過與疾病關聯的miRNA相互作用,circRNA在疾病中發揮着重要的調控作用。這說明circRNA很可能就是一類新的調控性內源競爭性RNA,從而使得環狀RNA在作為新型臨床診斷標記物的開發應用上具有明顯優勢。