細胞生物學/基因表達的調控
細胞內遺傳信息的傳遞及調控 -
基因及其結構 -
基因轉錄和轉錄後加工 -
蛋白質的生物合成 -
基因表達的調控 -
基因的信息傳遞與醫學
遺傳信息(基因信息)由DNA轉錄為RNA、再由RNA翻譯為蛋白質,通常稱為基因的表達。基因表達的實質是通過基因的轉錄和翻譯,產生具有特異生物學功能的蛋白質分子,賦予細胞或個體一定的功能或形態表型。基因的表達受到嚴密和精確的調控,以適應環境、維持生長和發育的需要。遺傳信息傳遞過程中任何環節的改變均會導致基因表達的變化,基因表達的涸控可發生在遺傳信息傳遞的各個階段。基因表達的調控一般表現為正性調控(pos山ve regulation)和負性調控(negative regulation),前者使基因表達量增加,後者則是使基因表達量減少。在介紹基因的表達調控之前,首先了解一下基因表達的特點。
基因表達的一般特點
編輯同一個體所有細胞都具有相同的基因組,攜帶個體生存、發育、活動和繁殖所需要的全部遺傳信息。但生物基因組的遺傳信息(基因)不是同時全部都表達出來,即使是極其簡單的生物(如最簡單的病毒),其基因組所含的全部基因也不是以同樣的強度同時表達。
基因表達具有時間性和空間性
編輯基因表達具有嚴格的時間和空間特異性,這是由基因的啟動子等調控序列與調節蛋白相互作用決定的。
例如,病原體侵入宿主後呈現一定的感染階段,隨感染階段的發展、生長環境的變化,有些基因開啟,有些基因關閉。按照功能需要,某一特定基因表達嚴格按照一定的時間順序發生,這稱為基因表達的時間特異性(temporal specificity)。多細胞生物從受精卵到組織、器官形成的各個不同發育階段,都會有不同的基因嚴格按照自己特定的時間順序開啟或關閉,表現為分化、發育階段一致的時間性,也稱為階段特異性(stage specificity)。
在個體某一發育、生長階段,同一基因產物在不同的組織器官中表達多少是不一樣的。一種基因產物在個體的不同組織或器官中表達,即在個體的不同空間出現,這就是基因表達的空間特異性(spatial specificity)。不同組織細胞中不僅表達的基因數量不相同,而且基因表達的強度和種類也各不相同,這就是基因表達的組織特異性(tissue specificity)。例如肝細胞中涉及編碼鳥氨酸循環酶類的基因表達水平高於其他組織細胞,合成的某些酶(如精氨酸酶)為肝臟所特有。
基因表達有組成性表達和可誘導/阻遏表達兩種方式
編輯- 組成性表達 組成性表達(constitutive expression)是指不太受環境變動而變化的一類基因表達。其中某些基因表達產物是細胞或生物體整個生命過程中都持續需要且必不可少的,這類基因稱為管家基因(housekeeping gene), 這些基因中大多是在生物個體的不同組織細胞、甚至在同一物種的細胞中都是持續表達的,可以看成是細胞基本的基因表達。組成性基因表達也不是一成不變的,其表達強弱是受一定機制調控的。
- 適應性表達 適應性表達(adaptive expression)指環境的變化容易使其表達水平變動的一類基因表達。應環境條件變化基因表達水平增高的現象稱為誘導(induction), 這類基因被稱為可誘導的基因(inducible gene) ; 相反,隨環境條件變化而基因表達水平降低的現象稱為阻遏(repression), 相應的基因被稱為可阻遏的基因(repressible gene)。
改變基因表達的情況以適應環境,在原核生物、單細胞生物中尤其顯得突出和重要,因為這些細胞的生存環境經常會有劇烈的變化。例如,周圍有充足的葡萄糖,細菌就可以利用葡萄糖作為能源和碳源,不必更多去合成利用其他糖類的酶類;當外界沒有葡萄糖時,細菌就要適應環境中存在的其他糖類(如乳糖、半乳糖、阿拉伯糖等),開放能利用這些糖的酶類基因,以滿足生長的需要。即使是內環境保持穩定的高等哺乳類動物,也經常要變動基因的表達來適應環境。例如,與適宜溫度下生活相比較,在冷或熱環境下適應生活的動物,其肝臟合成的蛋白質圖譜就有明顯的不同;長期攝取不同的食物,體內合成代謝酶類的情況也會有所不同。
原核基因的表達調控
編輯相對於真核細胞,原核細胞的基因表達調控機制比較簡單,研究得較為深入。轉錄調控是原核生物基因表達調控的關鍵步驟。原核生物大多數基因表達調控是通過操縱子機制實現的。操縱子(operon)由結構基因和表達調控元件組成,是原核細胞中最常見的表達調控單位。操縱子機制在原核基因表達調控中具有普遍意義。
原核基因表達調控最典型的代表是大腸桿菌(E. coil)乳糖操縱子(lac operon)調控模式。在此,以乳糖操縱子為例說明原核基因的表達調控機制。
大腸桿菌乳糖代謝相關基因組成乳糖操縱子。大腸桿菌的乳糖操縱子含LacZ 、LacY 和LacA 三個結構基因,分別編碼β-半乳糖苷酶(β-galactosidase)、β-半乳糖苷通透酶(permease)和β-半乳糖苷乙醯轉移酶(transacetylase), 此外還有一個操縱序列Olac、一個啟動序列Plac及一個調節基因LaeI。LaeI編碼一種阻遏蛋白(repressor), 後者與O1ac序列結合,使操縱子受阻遏而處於關閉狀態。在啟動子P1ac上游還有一個分解(代謝)物激活蛋白(catabolite activator protein, CAP)的結合位點,其主要作用是增強乳糖操縱子的轉錄活性。由Plac序列、Olac序列和CAP結合位點共同構成乳糖操縱子的調控區,三個酶的編碼基因都由同一調控區調節,實現基因產物的協調表達。
大腸桿菌在沒有乳糖的環境中生存時,乳糖操縱子處於阻遏狀態。LacI在其自身的啟動子控制下,表達產生阻遏蛋白,阻遏蛋白與操縱序列Olac結合,阻礙了RNA聚合酶與啟動子plac的結合,阻止了基因的轉錄啟動。當有乳糖存在時,乳糖受β-半乳糖苷酶的催化轉變為半乳糖,半乳糖與阻遏蛋白結合,使其構象改變,失去與Olac的親和力,與Olac解離,基因轉錄開放。該機制很好地解釋了單純乳糖存在時,細菌是如何利用乳糖作碳源的。然而細菌生長環境是複雜的,例如有葡萄糖或葡萄糖/乳糖共同存在時,細菌首先利用葡萄糖才是最節能的。這時,葡萄糖的存在使細菌內的cAMP濃度降低,阻礙cAMP與CAP結合,抑制乳糖操縱子轉錄(因為只有與cAMP結合的CAP才能結合到Plac上游的CAP結合位點),使細菌只能利用葡萄糖。
真核基因的表達調控
編輯真核細胞的基因表達調控要比原核細胞複雜得多。由於核膜的存在,真核細胞基因的轉錄與蛋白質的翻譯分別在細胞內不同的區域進行。真核細胞基因表達調控可以在轉錄水平、RNA加工水平、RNA轉運水平、mRNA降解水平、翻譯水平和蛋白質活性水平上進行。對大多數基因來說,轉錄水平是最重要的控制點。此外,在某些細胞中DNA水平的變化如染色質上基因拷貝數的變化、DNA重排、DNA甲基化等也會影響基因的表達。
轉錄水平調控是真核細胞基因表達的主要控制點
編輯轉錄水平調控主要是對基因表達轉錄起始的調節。真核基因具有複雜的調控區,它包括啟動子區和其他能調節基因表達的轉錄因子和基因調節蛋白結合位點。影響基因表達的各種因子通過與DNA調控區的結合而增強或抑制基因的表達。真核細胞中存在多種基因表達調節蛋白,它們能促進或抑制基因的轉錄,有些基因表達調節蛋白是特異性的DNA結合蛋白,它們能夠和靶基因相鄰的DNA序列結合;還有一些基因表達調節蛋白雖然不能直接與DNA結合,但它們可通過與其他基因表達調節蛋白的相互作用調控基因轉錄。通常將基因表達調節蛋白稱做反式作用因子(trans-acting factor), 將它們所識別的DNA序列叫做順式作用元件(cis-acting element)。具體地講,順式作用元件是對基因表達有調節活性的DNA序列,其活性只影響與其自身同處在一個DNA分子上的基因,這種DNA序列一般不編碼蛋白質,多位於基因旁側或內含子中。基因表達的調節是通過反式作用因子與順式作用元件相互作用而實現的。
1、順式作用元件是能夠調控基因表達的特殊DNA序列 根據順式作用元件在基因組中的位置、轉錄激活作用的性質及發揮作用的方式,可將真核基因的順式作用元件分為啟動子、增強子(enhancer)和沉默子(silencer)。
啟動子是決定細胞基因轉錄起始、能被RNA聚合酶所識別並結合的特異性DNA序列,它是基因準確和有效地進行轉錄所必需的結構。
增強子是一種能增強真核細胞某些啟動子功能的調節序列,不具有啟動子的功能,但能增強或提高啟動子的活性。增強子在DNA雙鏈中沒有5'與3'固定的方向性,作用不受序列方向性的限制。增強子在所調控基因的上游或下游均可發揮作用,但大多位於上游;下游內含子中,乃至下游最後一個外顯子以外的序列也可含有增強子。增強子在距離啟動子相對較遠(距啟動子數kb至數十kb)時也能發揮作用。增強子一般有組織或細胞特異性,但對啟動子的影響無嚴格的專一性。基因重組實驗證明,同一增強子可影響不同類型的啟動子,真核生物增強子也可影響原核生物的啟動子。
在順式作用元件中還存在一種與增強子作用相反的沉默子。沉默子是基因表達的負性調控元件。當特異蛋白因子與其結合時,對基因轉錄起阻遏作用。沉默子最早在酵母中發現,後來在T淋巴細胞的T抗原受體基因的轉錄和重排中也證實了這種負調控順式元件的存在。目前對這種在基因轉錄降低或關閉中起作用的序列研究還不多,但從已有的例子來看,沉默子的作用可不受序列方向的影響,能遠距離發揮作用,並可對異源基因的表達起作用。
2、反式作用因子通過順式作用元件調控基因的表達 真核基因表達的調節蛋白又稱轉錄調節因子或轉錄因子。絕大多數真核轉錄調節因子由它的編碼基因表達後,通過與特異的順式作用元件的識別、結合(即DNA-蛋白質相互作用)反式激活另一基因的表達。RNA聚合酶和轉錄因子就是反式作用因子。能直接結合DNA序列的反式作用因子是少數,但不同的反式作用因子之間可以相互作用,因而目前認為多數轉錄因子是通過蛋白質-蛋白質間作用與DNA序列聯繫並影響轉錄效率的,轉錄因子之間或轉錄因子與DNA的結合都會引起DNA構象的變化,從而調節轉錄。
作為蛋白質的轉錄因子從功能上分析其結構,可包含有不同區域:①DNA結合域(DNA binding domain): 多由60~100個胺基酸殘基構成的幾個亞區組成。其他一些不與DNA直接結合的轉錄因子沒有DNA結合域,但能通過轉錄激活域直接或間接作用千轉錄複合體而影響轉錄效率。②轉錄激活域(activating domain): 常由30~100個胺基酸殘基組成,該結構域包含富含酸性胺基酸、富含穀氨醯胺、富含脯氨酸等不同種類。③連接區:即連接上兩個結構域的部分。
與DNA結合的轉錄因子大多以二聚體形式起作用,其DNA結合域常見有以下幾種:①鋅指結構(zinc finger),是最常見的DNA結合域,它由約23個胺基酸殘基組成,其中的半胱氨酸和組氨酸通過配位鍵與鋅原子結合這樣形成一個以鋅原子為中心的「指」狀結構,稱為鋅指結構。鋅指結構的N-末端形成β-片層,C-末端形成α-螺旋,α-螺旋能夠與DNA大溝相結合。一個轉錄因子中常常含有多個串聯重複的鋅指結構,如與GC盒結合的轉錄因子SP1中就含有3個重複的鋅指結構,這些鋅指結構中的3個α-螺旋恰好等於DNA大溝的一圈。②螺旋-轉角-螺旋(helix-turn-helix, HTH),這類結構域通常由3個α-螺旋結構組成,其中一個螺旋與DNA大溝結合,另兩個螺旋則位於其上面起穩固作用。例如,參與大腸桿菌乳糖操縱子調控的CAP蛋白以及真核細胞中的同源異形結構域(homeodomain)蛋白中就含有HTH結構域。③螺旋-環-螺旋(helix-loop-helix, HLH), 這類結構至少有兩個α-螺旋,螺旋間由短肽段形成的環連接,兩個具有HLH結構的轉錄因子以二聚體形式相連,兩個較長的α-螺旋剛好能夠嵌入DNA的大溝。例如,參與肌細胞生成的轉錄因子MyoD蛋白就含有HLH結構域。④亮氨酸拉鏈(leucine zipper), 該結構的特點是蛋白質分子的肽鏈上每隔6個胺基酸就有一個亮氨酸殘基,結果導致這些亮氨酸殘基都在α-螺旋的同一個方向出現,兩個這樣的α-螺旋肽鏈單體就能通過亮氨酸殘基以疏水鍵結合形成二聚體。該二聚體另一端的肽段形成"Y"形的結構(富含鹼性胺基酸殘基)與DNA大溝結合。在肝、小腸上皮、脂肪細胞和某些神經細胞中有稱為C/EBP(CCAAT/enhancer-binding protein)家族成員的一類蛋白質能夠與CAAT盒結合,其特徵就是能形成具有亮氨酸拉鏈的二聚體結構。
總之,反式作用因子能夠通過識別啟動子、啟動子附近和增強子等順式作用元件中的特異靶序列並與之結合(即蛋白質-DNA相互作用),以及通過蛋白質-蛋白質的相互作用,最終影響RNA聚合酶活性,從而對基因表達發揮正調控或負調控作用。通常把發揮正調控作用的反式作用因子稱為轉錄激活蛋白(activator)。
3、真核細胞的阻遏蛋白 真核細胞中除存在發揮正性調控作用的轉錄激活蛋白之外,還有一類阻遏蛋白(repressor, 也稱抑制子)也參與了真核細胞基因表達的負性調控。與原核細胞中起同樣作用的分子一樣,真核阻遏蛋白通過與特定的DNA序列結合而抑制轉錄。其中,某些阻遏蛋白通過干擾其他轉錄因子與DNA的結合來發揮抑制作用,例如,在轉錄起始位點附近結合的阻遏蛋白可以阻止RNA聚合酶或通用轉錄因子與啟動子的相互作用;另一些阻遏蛋白則通過與轉錄激活蛋白競爭結合DNA分子中的調控序列發揮作用,這些阻遏蛋白含有和激活蛋白相同的DNA結合域,但是阻遏蛋白沒有轉錄激活域,無法激活轉錄。這類阻遏蛋白抑制基因轉錄的實質是:通過阻止激活蛋白與啟動子或增強子的結合,抑制轉錄。
另一類阻遏蛋白,稱為活性阻遏蛋白(active repressor), 與那些僅僅干擾激活蛋白結合的阻遏蛋白不同,它們雖然也有DNA結合域,但主要靠功能結構域通過蛋白質-蛋白質的相互作用來抑制轉錄,例如果蠅的Krüppel 基因,其表達的蛋白質即為活性阻遏蛋白。Krüppel蛋白中除了含有一個能夠與DNA結合的鋅指結構域之外,還存在一個獨立的抑制結構域,Krüppel蛋白與DNA結合後,依賴其抑制結構域與特定的轉錄激活蛋白、中介蛋白或通用轉錄因子相互作用而抑制轉錄。
阻遏蛋白對基因轉錄的調控作用擴展了人們對真核細胞基因表達調控機制的認識。阻遏蛋白一個重要的功能可能是抑制組織特異性基因在不適當細胞中的表達。例如,免疫球蛋白基因的增強子中含有阻遏蛋白的結合位點,該位點與阻遏蛋白的結合有助於抑制非淋巴細胞中免疫球蛋白的表達,確保免疫球蛋白的組織特異性表達。
4、染色質通過結構重塑調控基因的轉錄 染色質是高度有序的緊密結構,限制了轉錄因子對DNA的接近和結合,控制着真核細胞基因的轉錄。基因表達激活首先需要將緻密壓縮的染色質/核小體舒展開來,該過程涉及具有酶活性的功能蛋白複合體參與,通過調整核小體結構,中和組蛋白鹼性胺基酸殘基上的正電荷來減弱組蛋白與DNA(攜負電荷)間的結合,從而降低相鄰核小體間的聚集,增加轉錄因子的進入,最終促進基因轉錄。這種染色質結構的動態變化過程通常稱為染色質重塑(chromatin remolding)。染色質重塑是基因表達調控的主要方式之一。目前認為引起染色質重塑的方式主要有以下兩種:
(1)依賴ATP的物理性修飾:即以ATP水解釋放的能量,使組蛋白和DNA的構象發生局部改變。該過程主要通過依賴ATP的染色質重塑複合體或染色質重建子(remodeler)來完成,這些複合體是一種以ATP酶為催化中心的多種蛋白亞基複合體,如SWI/SNF複合體,能夠被DNA結合的激動子(activator, 也稱基因活化蛋白)或抑制子(repressor) 招募至啟動子部位,借ATP水解的能量移動核小體的位置使DNA 序列暴露或被掩蓋,而參與基因表達調控。
(2)組蛋白共價化學修飾:最初,染色質上的組蛋白被認為僅僅是維繫染色質或染色體結構的組成成分,現在人們認識到,組蛋白的結構是動態變化的,這種變化影響了染色質結構的構型,從而調節基因的表達。組蛋白結構的改變源於組蛋白中被修飾的胺基酸。
核小體的核心組蛋白(H2A、H2B、H3和H4)是一類小分子量的強鹼性蛋白,它們均由球狀結構域(外周被146bp大小DNA包繞)和從核小體表面伸出的位於蛋白N-端的「組蛋白尾巴」組成。近些年研究表明,組蛋白特別是H3和H4尾部的胺基酸殘基能夠被化學修飾,包括組蛋白的乙醯化(acetylation)、甲基化(methylation)、磷酸化(phosphorylation)、泛素化(ubiquitination)、sumo 化(sumoylation)、多聚ADP核糖基化[poly(ADP-ribosyl)ation]等。組蛋白中被修飾胺基酸的種類、位置和修飾類型以及各種修飾在時間、空間上的組合與生物學功能的關係被稱為組蛋白密碼(histone code), 它決定了染色質轉錄活躍或沉默的狀態。
組蛋白修飾導致基因轉錄或沉默的機制與其引起的染色質重塑密切相關。組蛋白N-端尾部的胺基酸修飾直接影響了核小體的結構,進而影響到轉錄起始複合體是否易於同啟動子部位的DNA結合。在此以組蛋白常見的修飾方式——組蛋白乙醯化為例,說明組蛋白修飾影響基因轉錄的機制。組蛋白乙醯化多發生於H3和H4 胺基酸的賴氨酸殘基。在組蛋白乙醯基轉移酶(histone acetyltransferase, HAT, 也稱乙醯化酶)作用下,於組蛋白N-端尾部的賴氨酸加上乙醯基,稱為組蛋白乙醯化。組蛋白N端的賴氨酸殘基乙醯化會移去正電荷,降低組蛋白和DNA之間的親和力,使得RNA聚合酶和通用轉錄因子容易進入啟動子區域。因此,在大多數情況下,組蛋白乙醯化有利於基因轉錄。低乙醯化的組蛋白通常位於非轉錄活性的常染色質區域或異染色質區域。一些組蛋白可以快速地乙醯化,然後又去乙醯化,使得組蛋白結合基因的表達受到精確地調控。組蛋白的去乙醯化由組蛋白去乙醯化酶(histone deacetylase, HDAC)催化完成,組蛋白去乙醯化則抑制轉錄。其具體機制是:基因激活因子結合於特定上游激活序列(UAS)並招募組蛋白乙醯化酶,催化附近的組蛋白乙醯化,促進基因激活;而結合於上游抑制序列(URS)的轉錄抑制因子則招募組蛋白去乙醯化酶,催化附近的組蛋白去乙醯化,抑制轉錄。
5、DNA甲基化修飾程度影響基因表達水平 真核DNA分子中的胞嘧啶鹼基約有5%被甲基化修飾為5-甲基胞嘧啶。胞嘧啶鹼基的甲基化修飾常發生在基因上游調控序列的CpG(島)富含區。處於活性染色質區、呈現轉錄活性狀態的基因的CpG序列一般總是低甲基化的;而不表達或處於低表達水平的基因的CpG序列則總是高甲基化的。實際上, DNA胞嘧啶的甲基化與去甲基化修飾是一個動態的過程,在真核基因的表達調控中發揮着重要作用。DNA甲基轉移酶(DNA methyltransferase, DNMT)催化甲基與胞啼唗的共價結合,而去甲基化酶(demethylase)則負責去除5-甲基胞嘧啶上的甲基。
6、非編碼RNA能夠調節基因轉錄 近年來的研究顯示,除了轉錄調節蛋白以外,一些非編碼RNA分子,如miRNA等小RNA和長鏈非編碼能調控基因的轉錄。相對於長鏈非編碼RNA, 人們對小RNA(miRNA)的作用機制有較多的認識。在miRNA發揮轉錄抑制作用時,miRNA與另一種蛋白質複合體RITS(RNA-induced transcriptional silencing)複合體結合,解離後的一條miRNA鏈將RITS複合體引導至同源基因處(很可能是通過鹼基配對結合於同RNA聚合酶Ⅱ結合的mRNA上),然後,RITS複合體通過募集組蛋白甲基轉移酶,使組蛋白H3的賴氨酸-9發生甲基化,導致異染色質形成,最終抑制基因的轉錄。
RNA加工水平調控的主要途徑是剪接
編輯以外顯子和內含子為單元的基因結構形式是真核細胞基因結構的特點,人類的大多數基因中都含有內含子。多數真核細胞的mRNA前體分子經剪接去除內含子後僅形成一種成熟的mRNA, 並經過翻譯生成一條相應的多肽鏈,這種RNA剪接方式稱為常規剪接(constitutive splicing)。但許多高等真核細胞的mRNA前體不止含有一個內含子,在特定條件下,剪接發生在兩個內含子之間,即某個內含子的5'端與另一個內含子的3'端進行剪接時,就會刪除這兩個內含子及其中間的全部外顯子或內含子,這稱為RNA可變剪接(alternative splicing)。由此,一個基因的mRNA前體經過可變剪接可以產生多種不同的蛋白質,或形成一組相似的蛋白質家族。
mRNA前體的剪接由被稱為剪接體的核酸-蛋白質複合物完成,該複合物主要包括snRNA及富含絲氨酸和精氨酸的相關蛋白。剪接首先是剪接體識別mRNA前體剪接位點,剪接位點的選擇受許多順式作用元件和反式作用因子的調控。反式作用因子可以通過識別正性或負性的順式作用元件對不同的剪接位點進行選擇。此外,剪接體中的剪接因子也參與了對選擇性剪接的調控。
真核細胞基因表達的翻譯水平調控與起始因子磷酸化密切相關
編輯真核細胞翻譯水平調節點主要在翻譯起始階段和延長階段,尤其是起始階段。如起始因子活性的調節、Met-tRNAMet與核糖體小亞基結合的調節、mRNA與小亞基結合的調節等。其中通過磷酸化作用改變起始因子活性這一點備受關注。蛋白質合成速率的快速變化很大程度上取決於起始水平,通過磷酸化調節起始因子活性對起始階段有重要的控制作用。如eIF-2α亞單位的磷酸化可以阻礙eIF的正常運行,從而抑制蛋白質合成的起始。eIF-2α亞單位的磷酸化由特異蛋白激酶催化。在病毒感染的細胞中,細胞抗病毒機制之一即是通過雙鏈RNA(double-stranded RNA, dsRNA)激活一種蛋白激酶,使eIF-2α磷酸化,從而抑制蛋白質合成的起始。
此外,mRNA的5'UTR(非翻譯區)與3'UTR 在翻譯過程中能夠相互依賴、協同作用提高翻譯效率。一些蛋白質能夠識別mRNA的3'UTR , 通過干擾3'poly-A尾與5'端帽的聯絡而減少翻譯的起動。