1、糖组学(glycomics)的背景及研究意义20世纪末,继基因组学、蛋白质组学之后,糖组学也日益受到人们关注。顾名思义,糖组学是对糖链组成及其功能研究的一门新学科,是基因组学的后续和延伸,具体内容包括研究糖与糖之间、糖与蛋白质之间、糖与核酸之间的联系和相互作用,其主要研究对象为聚糖。丰富多样的聚糖覆盖了生物有机体的所有细胞,不仅体现细胞的类型和状态,也参与了许多生物学行为,如细胞发育、分化、肿瘤转移、微生物感染、免疫反应等;聚糖还体现生物和分子的进化作用,如糖酵解、生物合成的保守性以及核糖的起源等。示例:糖链的生物学功能(1)糖链在糖蛋白新生肽链折叠和缔合中的作用研究表明:糖蛋白N-糖链在参与新生肽的折叠,维持蛋白质正确构象时起重要作用。红细胞血凝素,如N-糖链缺乏,则不能折叠呈三聚体(2)糖链影响糖蛋白的分泌和稳定性免疫球蛋白如缺乏N-糖链则不能分泌到胞外而留在内质网中(3)糖链参与分子识别和细胞识别血清中很多蛋白质式含有以唾液酸残基为末端的N-糖链糖蛋白,称唾液酸糖蛋白,如免疫球蛋白、蛋白质激素,载体蛋白等。如被唾液酸酶降解与肝细胞膜上的去唾液酸糖蛋白受体结合胞吞作用并降解●与血浆中老蛋白的清除有关●与精卵识别有关受精是精子与卵子的融合。哺乳动物的卵子外面有一层透明的糖蛋白外衣,称透明带(zonepellucida,ZP)。透明带由ZP-1、ZP-2和ZP-3三种糖蛋白组成,受精中起主要作用的是ZP-3,连接在ZP-3上的O-GalNAc糖链能被精子表面上的凝集素受体识别(有物种特异性)。O-GalNAc糖链的非还原端是一个α一连接的半乳糖残基,它可能在精卵识别中起关键作用。●与细胞粘着有关细胞粘着(celladhesion)是进化中随着多细胞生物出现的必然现象。多细胞生物中细胞有相互识别而聚集成细胞群的能力——细胞粘着。细胞群或组织(tissue)中细胞与细胞之间充满着由糖蛋白(胶原蛋白、纤连蛋白、层粘蛋白)、蛋白聚糖、透明质酸等组成的胞外基质(extracellularmatrix,ECM)。在整个生物体中,ECM形成一个连续的主体网络结构,所有的细胞都交织或浸泡在这一网状基质中,网络中细胞一细胞粘着,细胞一ECM粘着都是通过有关的膜内在蛋白质(integralmembraneprotein)完成的。这些膜蛋白称细胞粘着分子(celladhesionmolecule,CAM)或粘着蛋白,包括整联蛋白(integrin),钙粘着蛋白(cadher--in)免疫球蛋白超家族(Igsuperfamily),血管地址素(vescularaddressin)选择蛋白(selectin)等。CAM绝大多数都是含N一糖链的糖蛋白.例如整联蛋白是由α一和β一亚基组成的异二聚体,两个亚基上有多个N一糖基化位点。去糖链的整联蛋白完全失去与纤连蛋白的粘着能力。(4)糖链影响糖蛋白的生物学活性●糖链与酶活性糖链在酶的新生肽链折叠、转运和保护等方面普遍起作用。但糖链与成熟酶活性的关系因酶而异。有些酶除去糖链活性不受影响,如UDP-葡糖醛酸酶、酵母羧肽酶等。有些酶的活力依赖其糖链的存在,如溶酶体β一葡糖苷酶除去糖链后只有免疫活性而而完全没有酶活力。●糖链与激素活性糖蛋白激素主要有腺垂体促激素类包括FSH(促卵泡激素),LH(促黄体生成激素)和TSH(促甲状腺激素)以及胎盘绒毛膜促性腺激素和肾脏红细胞生成素(erytlmpoietin,EPO)等。FSH、LH和TSH均由α亚基和β亚基组成,两个亚基都有N一糖链。糖链呈高度不均一性,例如LH和TSH中精链的外链末端有些为SO4--4GalNAcβ1,有些为Siaα2→3Galβ1→,而FSH中的糖链都是以Siaα2→3Galβ1→为末端的。已经证明,带有SO4--4GalNAcβ1→末端结构的激素对受体的亲和力比带有Siaα2→3Galβ1→末端的激素高,但在体内的半寿期前者比后者短,因为在肝脏网状细胞表面有特异结合SO4--4GalNAcβ1→为末端的糖链的受体,而Sia为末端的糖链则必须经唾液酸酶水解除去Sia从而暴露Gal后才能被半乳糖结合受体识别并清除。●糖链与IgG活性每分子IgG均含糖链约三条,几乎全部N一糖链都是复杂型,非还原末端残基为Sia或Gal(去Sia),少数为GlcNAc(去Sia-Gal),IgG的N-糖链多达30余种,呈高度不均一性。如IgG的N一糖链缺失外链Gal(这种糖链称G0糖链)后,可成为一种自身抗原,被免疫系统识别而产生自身抗体。后者能与带有Go糖链的IgG生成免疫复合体,沉积于关节腔内,引起炎症。这种免疫复合体是由带Go糖链的IgGFc段(作为抗原)和带末端Sia的IgG(作为抗体)Fab段结合而成,实际上是IgG的自身聚合物。类风湿性关节炎、红斑狼疮等都是一种与IgG的糖链结构改变有关的自身免疫病(autoimmunedisease)。类风湿关节炎总之毫无疑问,如果试图深入了解生命的复杂规律,就必须有“基因组-蛋白质组-糖组”的整体观念,这样才有可能揭示自身全部基因功能,从而进一步深入研究疾病的发病机制,有效控制疾病的发生、发展及预后,以及筛选疾病、预测诊断标记物和开发新的药物靶标。2、糖组学的研究策略糖组学的研究远较基因组学、蛋白质组学复杂。目前糖组学关注的焦点是糖蛋白,为了更好地与蛋白质组学相关联,将研究对象锁定为糖肽。研究核心策略为:(1)分析单物种生物所产生的所有聚糖;(2)以糖肽为研究对象确认编码糖蛋白的基因;(3)结合有效的理化和生化性质,研究糖蛋白糖链的性质。研究的重点在于:(1)编码糖蛋白的基因;(2)实际糖基化的位点;(3)聚糖结构;(4)糖基化的作用。主要分为三大部分:结构糖组学、功能糖组学以及生物信息学;其中结构糖组学主要包括“糖捕获”技术、前沿亲和层析技术等,功能糖组学主要包括微阵列技术等。3、糖组学研究技术进展1)结构糖组学根据与糖链连接方式不同,蛋白质主要有N-连接和O-连接两种糖基化形式:前者是糖链与蛋白Asn-XXX-Ser/Thr序列子(XXX为除脯氨酸以外的氨基酸)中Asn残基上的—NH2相连;后者则是糖链与蛋白Ser/Thr残基上的—OH相连。N-连接和O-连接糖蛋白主要定位于细胞膜表面,也可以分泌型蛋白的形式存在。此外,糖蛋白还有GPI锚定蛋白和近年来在细胞核和细胞质发现的O-GlcNAc(N-乙酰氨基葡萄糖)修饰蛋白两种存在形式。A、N-糖链●N-糖链的共同结构花式:核心五糖Glc-葡萄糖;Gal-半乳糖;Man-甘露糖;Fru-果糖Rib-核糖;Fuc-岩藻糖;Sia-唾液酸;GlcA-葡糖酸GlcUA-糖醛酸;GlcNAc—N-乙酰葡萄糖胺;GalNAc—N-乙酰半乳糖胺;NeuNAc—N-乙酰神经氨酸●N-糖链的分类★复杂型N-糖链的分支B、O-糖链特点:与N-糖链相比结构简单,但连接形式多。几种糖蛋白的寡糖链小结糖链结构信息包括糖链的单糖组成、异头碳构型、糖苷键的连接位置和糖残基的序列分析等内容。糖蛋白糖链的结构分析包括糖蛋白的提取分离、糖链释放和糖链结构鉴定等多个步骤。(1)糖蛋白的提取和分离纯化糖蛋白多定位于细胞表面,属于膜蛋白,水溶性不好,其有效提取是糖组学糖链结构研究的瓶颈之一。目前常采用先制备质膜,然后用CHAPS等去污剂释放或TritonX-114相分离、有机溶剂萃取等方法提取糖蛋白。获得的糖蛋白主要采用透析、超滤、电泳和层析等方法来分离纯化,其中由几种不同类型凝集素亲合柱组成的序列凝集素亲合层析(seriallectinaffinitychromatography,SLAC)法是较好的方法。●SLAC研究发现,植物凝集素是一类能选择性地结合糖链的糖结合蛋白。利用这种特性可以特异性地富集某种糖蛋白/糖链。用于纯化糖蛋白/糖链的植物凝集素主要有刀豆凝集素(concanavalinA,ConA)、麦胚凝集素(wheatgermagglutinin,WGA)、豌豆外源凝集素(pealectin)、植物血凝素(phytohaemagglutinin-E4,E4-PHA)和网孢盘菌凝集素(Aleuriaaurantialectin,AAL)等。单一一种凝集素并不能够富集细胞中所有的糖蛋白/糖链,因此科学家们在上世纪80年代发明了一种被称作连续凝集素亲和色谱(seriallectinaffinitychromatography,SLAC)的方法来分离同一细胞中的各种糖蛋白/糖链。这种方法是将不同的凝集素亲和柱串联排列,样品混合物依次经过这些亲和柱,这样就可将不同的糖蛋白/糖链富集在不同的柱中,提高了糖蛋白/糖链的回收效率和混合糖蛋白/糖链的分离效果。Thelectinstestedrecognizethefollowingresidues:β-D-galactosyl[Ricinuscommunisagglutinin120,(RCA-1)andpeanutagglutinin,(PNA)];α-D-galactosyl[Griffoniasimplicifoliaagglutinin(GSA)];α-D-mannosylα-D-glucosyl[concanavalinA(ConA)andLensculinarisagglutinin(LcH)];N-acetyl-andN-glycolylneuraminicacid[Limaxflavusagglutinin(LFA)andLimuluspolyphemusagglutinin(LPA)];N-acetyl-glucosaminylandsialyl[wheatgermagglutinin(WGA)];N-acetyl-D-galactosaminyl[Helixpomatiaagglutinin(HPA)andDolichosbiflorusagglutinin(DBA)]andα-L-fucosyl[Ulexeuropeusagglutinin(UEA-1)].(2)糖链的释放纯化后的糖蛋白样品即可进行糖链释放。糖链释放一般有化学释放和酶释放两种方法。化学法主要有肼解法和β-消除法,前者可释放糖蛋白的N-糖链和O-糖链,目前已实现仪器自动化。但因该法反应条件剧烈,肼解后需对糖链进行乙酰化复原处理,而且蛋白部分已经破坏,无法进行有关糖基化位点的研究。酶法释放糖蛋白糖链因方法简单,条件温和,能够提供有关糖链残基组成、排列顺序和糖苷键的α或β构型等信息,目前应用较广。较常用的释放N-糖链的特异蛋白酶有N-糖肽酶F(PNGaseF)和N-糖肽酶A(PNGaseA),二者具有很好的互补性,常联合使用。而PNGaseF因广谱性好,也常单独使用。对于特异释放糖蛋白O-糖链的酶,目前发现的较少,且广谱性不强。(3)糖链的分离纯化A、层析法柱层析是分离纯化糖蛋白糖链的常规方法,由分离机制不同可以有离子交换、分子筛、正相和反相等不同形式。一般常压和低中压柱层析所需样品量较大,而高效液相层析(HPLC)因上样量少、灵敏度高、重现性好、更加快速和自动化,是目前微量糖链分析的首选。不同结构的糖链在不同HPLC上的层析行为是不同的。为了更充分、更准确地分离分析糖链混合物,可将几种不同类型的HPLC组合成多维HPLC(MD-HPLC),如离子交换HPLC、正相HPLC、反相HPLC组合就构成了3D-HPLC。为达到最大分离效率,各维之间的分离模式应是各自独立的,而且高维的分离速度应快于低维的分离速度,以避免已分开组分的重新混合。前沿亲合层析(FAC)是近年来新兴的利用亲合层析技术定量分析两生物分子间结合程度的研究工具,具有简单、经济、准确和可操作性强等优点。在糖蛋白糖链结构研究中,FAC常应用凝集素微柱来分离纯化和富集浓缩特定糖蛋白,而多元凝集素微柱的组合可以实现糖链的结构解析。Hirabayashi等将13种半乳凝素制成FAC微柱,观察了它们与41种2-AP标记糖链间的特异结合情况。结果表明半乳