生物化学与分子生物学/蛋白质的分子结构
蛋白质的结构与功能-
蛋白质的分子组成 -
蛋白质的分子结构 -
蛋白质结构与功能的关系 -
蛋白质的理化性质
蛋白质分子是由许多氨基酸通过肽键相连形成的生物大分子。人体内具有生理功能的蛋白质大都是有序结构,每种蛋白质都有其一定的氨基酸种类、组成百分比、氨基酸排列顺序以及肽链空间的特定排布位置。因此由氨基酸排列顺序及肤链的空间排布等所构成的蛋白质分子结构,才真正体现蛋白质的个性,是每种蛋白质具有独特生理功能的结构基础。由于参与蛋白质生物合成的氨基酸有20种,且蛋白质的分子量均较大,因此蛋白质的氨基酸排列顺序和空间位置几乎是无穷尽的,足以为人体多达数以万计的蛋白质提供各异的氨基酸序列和特定的空间结构,使蛋白质完成生命所赋予的数以千万计的生理功能。
1952年丹麦科学家L.Linderstrom建议将蛋白质复杂的分子结构分成4个层次,即一级、二级、三级、四级结构,后三者统称为高级结构或空间构象(conformation)。蛋白质的空间构象涵盖了蛋白质分子中的每一原子在三维空间的相对位置,它们是蛋白质特有性质和功能的结构基础。但并非所有的蛋白质都有四级结构,由一条肽链形成的蛋白质只有一级、二级和三级结构,由2条或2条以上肽链形成的蛋白质才有四级结构。
氨基酸的排列顺序决定蛋白质的一级结构
编辑在蛋白质分子中,从N-端到C-端的氨基酸排列顺序称为蛋白质的一级结构。化学键包括肽键和二硫键。
研究蛋白质一级结构的意义:
- 一级结构是蛋白质构象的基础,包含了形成特定的构象所需的全部信息。
- 一级结构是蛋白质生物活性的分子基础。
- 众多遗传病的分子基础是基因突变,导致其所表达的蛋白质的一级结构发生改变。
- 研究蛋白质的一级结构可以阐明生物进化史,不同物种之间的同源蛋白质之间的一级结构越相似,物种之间的进化关系就越近。
牛胰岛素是第一个被测定一级结构的蛋白质分子,由英国化学家F.Sanger于1953年完成,因此他于1958年获得诺贝尔化学奖。胰岛素有A和B二条多肽链,A链有21个氨基酸残基,B链有30个氨基酸残基。如果把氨基酸序列(amino acid sequence)标上数码,应以氨基末端为1号,依次向羧基末端排列。牛胰岛素分子中有3个二硫键,1个位于A链内,称为链内二硫键,由A链的第6位和第11位半胱氨酸的琉基脱氢而形成,另2个二硫键位于A、B 两链间, 称为链间二硫键。
体内种类繁多的蛋白质,其一级结构各不相同,一级结构是蛋白质空间构象和特异生物学功能的基础。然而,随着对蛋白质结构研究的深入,已认识到蛋白质一级结构并不是决定蛋白质空间构象的唯一因素。
目前已知一级结构的蛋白质数量已相当可观,并且还以更快的速度增加。国际互联网有若干重要的蛋白质数据库(updated protein database), 例如EMBL(European Molecular Biology Laboratory Data Library)、Genbank(Genetic Sequence Databank)和PIR(Protein Identification Resource Sequence Database)等,收集了大量最新的蛋白质一级结构及其他资料,为蛋白质结构与功能的深入研究提供了便利。
多肽链的局部有规则重复的主链构象为蛋白质二级结构
编辑蛋白质的二级结构(protein secondary structure)是指蛋白质分子中某一段肽链的局部空间结构,也就是该段肽链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链的构象。肽链主链骨架原子即N(氨基氮原子)、Cα(α-碳原子)和 C(羰基碳原子)3个原子依次重复排列。蛋白质的二级结构主要包括α-螺旋、β-折叠、β-转角、Ω环和无规则卷曲。由于蛋白质的分子量硕大,因此,一个蛋白质分子可含有多种二级结构或多个同种二级结构,而且在蛋白质分子内空间上相邻的2个以上的二级结构还可协同完成特定的功能。
参与肽键形成的6个原子在同一平面上
编辑20世纪30年代末,L.Pauling和R.B.Corey 应用X-射线衍射技术研究氨基酸和寡肽的晶体结构,其目的是要获得一组标准键长和键角,以推导肽的构象,最终提出了肽单元(peptide unit) 概念。
参与肽键的6个原子Cα1、C 、0、N、H、Cα2位于同一平面,Cα1和Cα2在平面上所处的位置为反式(trans)构型,此同一平面上的6个原子构成了所谓的肽单元。
其中肽键(C—N)的键长为0.132nm, 该键长介于C-N的单键长(0.149nm)和双键长(0.127nm)之间,所以有一定程度双键性能,不能自由旋转。而Cα分别与N和C(羰基碳)相连的键都是典型的单键,可以自由旋转,N与Cα的键角以Φ表示,Cα与C的键旋转角度以ψ表示。也正由于肽单元上Cα原子所连的两个单键的自由旋转角度,决定了两个相邻的肽单元平面的相对空间位置。
α-螺旋结构是常见的蛋白质二级结构
编辑Pauling和Corey根据实验数据提出了两种肽链局部主链原子的空间构象的分子模型,称为α-螺旋(α-helix)和B折叠(β-pleated sheet), 它们是蛋白质二级结构的主要形式。在α-螺旋结构中,多肽链的主链围绕中心轴作有规律的螺旋式上升,螺旋的走向为顺时针方向,即所谓右手螺旋,其ψ为-47°,φ为-57°,氨基酸侧链伸向螺旋外侧。每3.6个氨基酸残基螺旋上升一圈(即旋转360°),螺距为0.54nm。α-螺旋的每个肽键的N—H和第四个肽键的羰基氧形成氢键,氢键的方向与螺旋长轴基本平行。
一般而言,20种氨基酸均可参与组成α-螺旋结构,但是Ala、Glu、Leu和Met比Gly、Pro、Ser及Tyr更常见。在蛋白质表面存在的α-螺旋,常具有两性特点,即由3至4个疏水氨基酸残基组成的肽段与由3~4个亲水氨基酸残基组成的肽段交替出现,致使α-螺旋的一侧为疏水性氨基酸,另一侧为亲水性氨基酸,使之能在极性或非极性环境中存在。这种两性α-螺旋可见于血浆脂蛋白、多肽激素和钙调蛋白激酶等。肌红蛋白和血红蛋白分子中有许多肽链段落呈α-螺旋结构。毛发的角蛋白、肌组织的肌球蛋白以及血凝块中的纤维蛋白,它们的多肽链几乎全长都卷曲成α-螺旋。数条α-螺旋状的多肽链可缠绕起来,形成缆索,从而增强其机械强度,并具有可伸缩性(弹性)。
β-折叠使多肽链形成片层结构
编辑β折叠与α螺旋的形状截然不同,呈折纸状。在β-折叠结构中多肽链充分伸展,每个肽单元以Cα为旋转点,依次折叠成锯齿状结构,氨基酸残基侧链交替地位于锯齿状结构的上下方。所形成的锯齿状结构一般比较短,只含5~8个氨基酸残基。一条肽链内的若干肽段的锯齿状结构可平行排列,分子内相距较远的两个肽段可通过折叠而形成相同走向,也可通过回折而形成相反走向。走向相反时,两个反平行肽段的间距为 0.70nm, 并通过肽链间的肽键羰基氧和亚氨基氢形成氢键,来稳固β-折叠结构,蚕丝蛋白几乎都是β-折叠结构,许多蛋白质既有α-螺旋又有β-折叠结构。
β-转角和Ω环存在于球状蛋白质中
编辑β-转角(β-turn)常发生于肽链进行180°回折时的转角上,呈U形倒转。β-转角通常由4个氨基酸残基组成,其第一个残基的羰基氧(O)与第四个残基的氨基氢(H)可形成氢键。β-转角的结构较特殊,第二个残基常为脯氨酸,其他常见残基有甘氨酸、天冬氨酸、天冬酰胺和色氨酸。有2种类型的β-转角,分别是转角Ⅰ和转角Ⅱ。Ⅰ型β转角和Ⅱ型β转角非常相似,只是其中肽键的二面角ψ和φ角有所不同。Ⅱ型β转角的第3个残基往往是甘氨酸。
Ω环是存在于球状蛋白质中的一种二级结构。这类肽段形状象希腊字母Ω,所以称Ω环。Ω环这种结构总是出现在蛋白质分子的表面,而且以亲水残基为主,在分子识别中可能起重要作用。
氨基酸残基的侧链影响二级结构的形成
编辑蛋白质二级结构是以一级结构为基础的。一段肽链其氨基酸残基的侧链适合形成α-螺旋或β-折叠,它就会出现相应的二级结构。例如一段肽链有多个谷氨酸或天冬氨酸残基相邻,则在pH7.0时这些残基的游离羧基都带负电荷,彼此相斥,妨碍α-螺旋的形成。同样,多个碱性氨基酸残基在一肽段内,由于正电荷相斥,也妨碍α-螺旋的形成。此外天冬酰胺、亮氨酸的侧链很大,也会影响α-螺旋形成。脯氨酸的N原子在刚性的五元环中,其形成的肽键N原子上没有H, 所以不能形成氢键,结果肽链走向转折,不形成α-螺旋。形成β-折叠的肽段,氨基酸残基的侧链要比较小,能容许两条肽段彼此靠近。
多肽链进一步折叠成蛋白质三级结构
编辑三级结构是指整条肽链中全部氨基酸残基的相对空间位置
编辑蛋白质三级结构(protein tertiary structure)是指整条肽链中全部氨基酸残基的相对空间位置,也就是整条肽链所有原子在三维空间的排布位置。
已知球状蛋白质的三级结构有某些共同特征,如折叠成紧密的球状或椭球状;含有多种二级结构并具有明显的折叠层次,即一级结构上相邻的二级结构常在三级结构中彼此靠近并形成超二级结构,进一步折叠成相对独立的三维空间结构;以及疏水侧链常分布在分子内部等。
肌红蛋白是由153个氨基酸残基构成的单一肽链蛋白质,含有 1 个血红素辅基。肌红蛋白分子中α-螺旋占75%, 构成A至H8个螺旋区,两个螺旋区之间有一段柔性连接肽,脯氨酸位于转角处。由于侧链R基团的相互作用,多肽链缠绕,形成一个球状分子(4.5nm×3.5nm×2.5nm), 球表面主要有亲水侧链,疏水侧链位于分子内部。 蛋白质三级结构的形成和稳定主要靠次级键如疏水键、盐键、氢键和范德华力(van der Waals force)等。
结构模体可由2个或2个以上二级结构肽段组成
编辑结构模体(structural motif)是蛋白质分子中具有特定空间构象和特定功能的结构成分。一个模体总有其特征性的氨基酸序列,并发挥特殊的功能。
一般而言,常见的结构模体可以有以下几种形式:
- α-螺旋-β-转角(或环)-α-螺旋模体(见于多种DNA结合蛋白);
- 链-β-转角-链(见于反平行β-折叠的蛋白质);
- 链-β-转角-α-螺旋-β-转角-链模体(见于多种α-螺旋/β-折叠蛋白质)。
在这些结构模体中,β-转角常为含3~4个氨基酸残基的片段;而环(loop)为较大的片段,常连接非规则的二级结构。
在许多蛋白质分子中,可由2个或2个以上具有二级结构的肽段在空间上相互接近,形成一个有规则的二级结构组合,称为超二级结构,此概念由M.G.Rossman于1973年提出。目前已知的二级结构组合有αα、βαβ、ββ等几种形式。研究发现,α-螺旋之间、β-折叠之间以及α-螺旋与β-折叠之间的相互作用,主要是由非极性氨基酸残基参与的。
亮氨酸拉链(leucine zipper)是出现在DNA结合蛋白和其他蛋白质中的一种结构模体。当来自同一个或不同多肽链的两个两用性的α-螺旋的疏水面(常含有亮氨酸残基)相互作用形成一个圈对圈的二聚体结构,亮氨酸有规律地每隔6个氨基酸就出现一次,亮氨酸拉链常出现在真核生物DNA结合蛋白的C-端,往往与癌基因表达调控功能有关。
在许多钙结合蛋白分子中通常有一个结合钙离子的模体,它由螺旋-环-螺旋(helix-loop-helix)三个肽段组成,在环中有几个恒定的亲水侧链,侧链末端的氧原子通过氢键而结合钙离子。近年发现的锌指(zinc finger)结构也是一个常见的模体例子,它由1个α-螺旋和2个反平行的β-折叠三个肽段组成,具有结合锌离子功能。该模体的N-端有1对半胱氨酸残基,C-端有1对组氨酸残基,此4个残基在空间上形成一个洞穴,恰好容纳1个Zn2+。由于Zn2+可稳固模体中的α-螺旋结构,使此α-螺旋能镶嵌于DNA的大沟中,因此含锌指结构的蛋白质都能与DNA或RNA结合。可见结构模体的特征性空间构象是其特殊功能的结构基础。
结构域是三级结构层次上具有独立结构与功能的区域
编辑分子量较大的蛋白质常可折叠成多个结构较为紧密且稳定的区域,并各行其功能,称为结构域(domain)。大多数结构域含有序列上连续的100~200个氨基酸残基,若用限制性蛋白酶水解,含多个结构域的蛋白质常分解出独立的结构域,而各结构域的构象可以基本不改变,并保持其功能。超二级结构则不具备这种特点。因此,结构域也可看作是球状蛋白质的独立折叠单位,有较为独立的三维空间结构。
例如,由2个亚基构成的3-磷酸甘油醛脱氢酶,每个亚基由2个结构域组成,N-端第1~146个氨基酸残基形成的第一个结构域能与NAD+结合,第二个结构域(第147~333氨基酸残基)与底物3-磷酸甘油醛结合。有些蛋白质各结构域之间接触较紧密,从结构上很难划分,因此,并非所有蛋白质的结构域都明显可分。
蛋白质的多肽链须折叠成正确的空间构象
编辑理论上讲,如果蛋白质的多肽链随机折叠,可能产生成于上万种可能的空间构象。而实际上,蛋白质合成后,在一定的条件下,可能只形成一种正确的空间构象。除一级结构为决定因素外,还需要在一类称为分子伴侣(molecular chaperone)的蛋白质辅助下,合成中的蛋白质才能折叠成正确的空间构象。只有形成正确的空间构象的蛋白质才具有生物学功能。
含有两条以上多肽链的蛋白质可具有四级结构
编辑体内许多功能性蛋白质含有两条或两条以上多肽链。每一条多肽链都有其完整的三级结构,称为亚基(subunit),亚基与亚基之间呈特定的三维空间排布,并以非共价键相连接。蛋白质分子中各个亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质四级结构(protein quaternary structure)。
在四级结构中,各亚基间的结合力主要是氢键和离子键。在2个亚基组成的四级结构蛋白质中,若亚基结构相同,称之为同二聚体(homodimer),若亚基分子不同,则称之为异二聚体(heterodimer), 多个亚基可以此类推。对于2个以上亚基构成的蛋白质,单一亚基一般没有生物学功能,完整的四级结构是其发挥生物学功能的保证。
成人血红蛋白的α亚基和β亚基分别含有141个和146个氨基酸。两种亚基的三级结构颇为相似,且每个亚基都可结合l个血红素(heme)辅基。4个亚基通过8个离子键相连,形成血红蛋白四聚体,具有运输O2和CO2的功能。但每一个亚基单独存在时,虽可结合氧且与氧亲和力增强,但在体内组织中难于释放氧,失去了血红蛋白原有的运输氧的作用。
蛋白质可依其组成结构或功能进行分类
编辑除氨基酸外,某些蛋白质还含有其他非氨基酸组分。因此根据蛋白质组成成分可分成单纯蛋白质和结合蛋白质,前者只含氨基酸,而后者除蛋白质部分外,还含有非蛋白质部分,为蛋白质的生物学活性或代谢所依赖。结合蛋白质中的非蛋白质部分被称为辅基,绝大部分辅基是通过共价键方式与蛋白质部分相连。构成蛋白质辅基的种类也很广,常见的有色素化合物、寡糖、脂质、磷酸、金属离子甚至分子量较大的核酸。细胞色素c(cytochrome c, Cyt c)是含有色素的结合蛋白质,其铁卟啉环上的乙烯基侧链与蛋白质部分的半胱氨酸残基以硫醚键相连,铁卟啉中的铁离子是细胞色素c的重要功能位点。免疫球蛋白是一类糖蛋白,作为辅基的数支寡糖链通过共价键与蛋白质部分连接。
蛋白质还可根据其形状分为纤维状蛋白质和球状蛋白质两大类。一般来说,纤维状蛋白质形似纤维,其分子长轴的长度比短轴长10倍以上。纤维状蛋白质多数为结构蛋白质,较难溶于水,作为细胞坚实的支架或连接各细胞、组织和器官的细胞外成分,如胶原蛋白、弹性蛋白、角蛋白等。大量存在于结缔组织中的胶原蛋白就是典型的纤维状蛋白质,其长轴为300nm, 而短轴仅为1.5nm。球状蛋白质的形状近似于球形或椭球形,多数可溶于水,许多具有生理学功能的蛋白质如酶、转运蛋白、蛋白质类激素、代谢调节蛋白、基因表达调节蛋白及免疫球蛋白等都属于球状蛋白质。
随着蛋白质结构与功能研究的不断深入,发现体内氨基酸序列相似而且空间结构与功能也十分相近的蛋白质有若干,即产生了“蛋白质家族(protein family)”这一概念。属于同一蛋白质家族的成员,称为同源蛋白质(homologous protein)。人们通过对蛋白质家族成员的比较,可得到许多物种进化的重要证据。在体内还发现,2个或2个以上的蛋白质家族之间,其氨基酸序列的相似性并不高,但含有发挥相似作用的同一模体结构,通常将这些蛋白质家族归类为超家族(superfamily)。这些超家族成员是由共同祖先进化而来的一大类蛋白质。