第5章蛋白质组学原理与方法系统生物学的定义Hood(2004)定义:系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系,并通过计算生物学建立数学模型来定量描述和预测生物功能、表型和行为的学科。“系统生物学”(systemsbiology)一词,检索美国NIH的PubMed文献库最早出现在ZieglgansbergerW和TolleTR于1993年发表的一篇神经系统疾病研究的论文摘要中。SystemsBiology:FromOmicstoMathematicModels●蛋白质组学研究背景●蛋白质组学的概念及原理●蛋白质组学研究方法蛋白质分离策略与方法蛋白质分析鉴定方法蛋白质组学研究的定量方法●蛋白质组学与蛋白质序列分析●结构蛋白质组学●蛋白质芯片与功能蛋白质组学本章主要内容5.1背景基因数量有限性和基因结构的相对稳定性vs生命现象的复杂性和多变性从genomics到proteomics基因组时代→后基因组时代研究重点的转移及其标志—功能基因组学的主要任务mRNA水平的基因表达研究取得进展,但是mRNA与蛋白质间的相关系数仅为0.4~0.5蛋白质自身特点难以从DNA和mRNA水平得到解答对蛋白质的数量、结构、性质、相互关系和生物学功能进行全面深入的研究已成为生命科学研究的迫切需要和重要任务。5.1背景蛋白质组是澳大利亚学者Williams和Wilkins于1994年首先提出,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指proteinsexpressedbyagenome,即“一个细胞或一个组织基因组所表达的全部蛋白质”5.1背景对应于基因组的所有蛋白质构成的整体,不是局限于一个或几个蛋白质同一基因组在不同细胞、不同组织中的表达情况各不相同在空间和时间上动态变化着的整体蛋白质组是:5.2蛋白质组学的概念及原理蛋白质组学(proteomics)指应用各种技术手段来研究蛋白质组的一门新兴科学,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成份、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律5.2蛋白质组学的概念及原理5.2蛋白质组学的概念及原理●了解某种特定的细胞、组织或器官制造的蛋白质种类●明确各种蛋白质分子是如何形成类似于电路的网络的●描绘蛋白质的精确三维结构,揭示其结构上的关键部位,如与药物结合且决定其活性的部位5.2蛋白质组学的概念及原理蛋白质组学研究可以:SS1S2S3S4S5PinI2I3I1E4E3E2E1PoutEnvironmentalInputs(C,N,pH,pO2,PO4,etc.)GlobalRegulatoryCircuitryMorphology,proteinsecretion,transport,osmolarity,etc.MICROBIA各国政府支持,国际著名研究和商业机构加盟:1996年澳大利亚建立了世界上第一个蛋白质组研究中心(AustraliaProteomeAnalysisFacility,APAF)美国国立癌症研究院(NCI)投资1000万美元建立肺、直肠、乳腺、卵巢肿瘤蛋白质组数据库NCI和FDA共同投资数百万美元建立癌症不同阶段的蛋白质组数据库英国建立三个蛋白质组研究中心对已完成或即将完成全基因组测序的生物体进行蛋白质组研究5.2蛋白质组学的概念及原理1997年召开了第一次国际“蛋白质组学”会议1998年在美国旧金山召开了第二届国际蛋白质组学会议1999年1月在英国伦敦举行了应用蛋白质组会议Celera公司投资上亿美元独自启动了全面鉴定和分类汇总人类组织、细胞和体液中的蛋白质及其异构体,构建新一代蛋白质表达数据库5.2蛋白质组学的概念及原理我国于1998年启动了蛋白质组学研究,在中科院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会2003成立了中国人类蛋白质组组织(CHHUPO),并分别于2003、2004和2005年召开了中国蛋白质组学首届、第二届及第三届学术大会,2004年10月在中国北京召开了第三届国际蛋白质组学会议5.2蛋白质组学的概念及原理十一五期间,科技部已将疾病蛋白质组研究列入我国“973”计划项目和“863”计划项目;国家自然科学基金委员会也将“蛋白质组研究”列为重点项目我国在鼻咽癌、白血病、肝癌和肺癌蛋白质组研究方面取得了较大的进展人类第一个组织、器官的“人类肝脏蛋白质组计划”5.2蛋白质组学的概念及原理PilotHubofEncyclopedicalproteomIX(PHOENIX)12个亿,每年2亿蛋白质组研究更为复杂和困难:蛋白质数目大大超过基因数目蛋白质随时间和空间而变化5.3蛋白质组学研究方法发展高通量、高灵敏度、高准确性的研究技术平台是现在乃至相当一段时间内蛋白质组学研究中的主要任务5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法蛋白质组表达模式(expressionprofile)主要是研究和解析蛋白质组的组成成分支撑技术主要有:·双向凝胶电泳(2-DE→蛋白质分离·以质谱为代表的蛋白质鉴定技术·生物信息学分析→数据库及解析注释ProteinsampleImageanalysisProteiningelProteinonmembraneProteininsolution2-DPAGEExcisionBlottingElutionPartialdegradationPeptidemixtureMassofproteinN-terminalsequenceMSEdmandegradationPeptidemassfingerprintPeptidesequenceMS/MSdataDatabasesearchingNovelorpreviouslystudiedproteinCharacterizationofpost-translocationmodifications蛋白质组的分析流程5.3.1.1样品制备通常可采用细胞或组织中的全蛋白质组分进行蛋白质组分析也可以进行样品预分级,即将细胞或组织中的全体蛋白质分成不同部分,提高低丰度蛋白质的上样量和检测灵敏度,分别进行研究5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法(1)样品预分级的主要方法蛋白质溶解性:可溶性蛋白、非溶性蛋白等蛋白质定位:膜蛋白、核蛋白等蛋白质细胞器定位:线粒体、高尔基体、叶绿体等5.3.1.1样品制备5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法临床样本都是各种细胞或组织混杂,而且状态不一,如肿瘤中癌变的上皮类细胞总是与血管、基质细胞等混杂。5.3.1.1样品制备5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法(2)组织水平上的蛋白质组样品制备例如:激光捕获显微切割(lasercapturemicro-dissection,LCM),可直接在显微镜下从组织切片中精确分离特定的细胞或细胞群5.3.1.1样品制备5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法(2)组织水平上的蛋白质组样品制备(1)双向凝胶电泳即two-dimensionalelectrophoresis(2-DE):是利用蛋白质的等电点和分子量,结合凝胶化学特性,分离各种蛋白质的方法。1975年首先由O’Farrell等创立5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法(2)双向凝胶电泳原理5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法第一向在高压电场下对蛋白质进行等电聚焦(IEF),然后在第一向垂直方向上进行第二向SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)SDS:钠十二烷基硫酸盐(3)双向凝胶电泳—第一向IEF电泳5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法固相pH梯度(IPG)等电聚焦:可以克服载体两性电解质阴极漂移等缺点;可以随意精确设定的pH梯度。尤其可在较窄的pH范围内进行第二轮分析,大大提高了分辨率及重复性(4)双向凝胶电泳—第二向SDS-PAGE电泳5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法垂直板电泳水平超薄胶电泳(3)双向凝胶电泳的特点5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法可分离10~100kD分子量的蛋白质高灵敏度和高分辨率便于计算机进行图像分析处理与质谱分析匹配(4)双向凝胶电泳技术的缺点5.3.1.2蛋白质分离策略与方法5.3.1蛋白质组表达模式研究方法5.3蛋白质组学研究方法极酸、极碱性蛋白质,疏水性蛋白质,极大蛋白质、极小蛋白质以及低丰度蛋白质用此种技术难于有效分离水平超薄胶电泳胶内酶解过程费时、费力,难于与质谱联用实现自动化Casestudy:产氢细菌的蛋白质组学分析1mm(a)C(b)C(c)0.1µmCMCWPPPHB(d)产氢细菌EthanoligenensharbineseYUAN-3YUAN-3TW-1X-29B49No.ProteinsSpeciesMWmatchedscore1putativeprotease,insulinasefamilyPhotobacteriumprofundumSS910559814752conservedhypotheticalproteinChromohalobactersalexigensDSM30432826710813AGR_C_259pAgrobacteriumtumefaciensC582932210764RibosomalproteinL10Arthrobactersp.FB242003667453-isopropylmalatedehydratase,smallsubunitSilicibacterpomeroyiDSS-3217446746UvrCproteinMycoplasmaagalactiae6109714867COG2373:Largeextracellularalpha-helicalproteinRalstoniaeutrophaJMP134215326207789hypotheticalproteinlpl1153LegionellapneumophilaLens1685668110Bacitracinsynthetase2(BA2)Includes:ATP-dependentlysineadenylase(LysA)(Lysineactivase);ATP-dependentD-ornithineadenylase(D-OrnA)(D-ornithineactivase)298147177811PutativeGntR-familytranscriptionalregulatorSinorhizobiummeliloti10212944788212Cry1BaBacillusthuringiensis1989567313N-acetylglucosamine-6-phosphate2-epimerase/N-acetylglucosamine-6-phosphataseChromobacteriumviolaceumATCC124724219097414hypotheticalproteinThaueraaromatica4864588015COG0745:ResponseregulatorsconsistingofaCheY-likereceiverdomainandawinged-helixDNA-bindingdomainLactobacillusgasseri2788787516stageIVsporulationproteinAClostridiumtetaniE885642797517hypothetica