蛋白质组学简介2011-04-11生命是什么?基因组(genome=gene+chromosome):生物体所拥有的全套染色体上的全部基因转录组(transcriptome=transcript+genome):一种细胞、组织或生物体完整基因组所对应的全套mRNA蛋白质组(Proteome=PROTEins+genOME):一个基因组、一种生物或一种细胞/组织所表达的全套蛋白质代谢组(metabonome=metabolite+genome)一种细胞、组织或生物体所产生的所有代谢产物。组学组学基因组所有能找到的基因转录组所有行动自由自在的信使们(超过100000)蛋白质组国王所有子民和他所有的战马(一支军队:估计1000000)代谢组所有前述的这些大分子遭天罚后的少数幸存者(只有一小撮,估计仅有2000个)蛋白质组(proteome)Proteome=PROTEins+genOME,意思是Proteinsexpressedbyagenome(基因组表达的所有蛋白质)。一个基因组、一种生物或一种细胞/组织所表达的全套蛋白质蛋白质组学(Proteomics)基因组学(genomics):是研究生物基因组和如何利用基因的一门科学。蛋白质组学:研究细胞、组织或生物体蛋白质组成及其变化规律的科学同基因组学一样,蛋白质组学不是一个封闭的、概念化的、稳定的知识体系,而是一个领域。是研究基因组DNA序列与基因功能之间的桥梁一、WhyProteomics?蛋白质(protein)生理功能的执行者和生命现象的直接体现者“生命体的生长发育、遗传变异、认知与行为、进化与适应性等一切生命科学问题的奥秘,都可以而且必须从蛋白质与其他生物分子的相互作用中找到证据和答案。蛋白质科学是研究生物体蛋白质的时空分布、结构、功能及其相互作用方式的科学,旨在揭示生命活动的本质和规律,是理解生命现象和开启人类健康大门的金钥匙。”——饶子和院士,《蛋白质研究展望》1.WhyProteomics?人类基因组学的发展及存在问题生物技术的发展计算机科学和生物信息学的发展1.1人类基因组学的进展humangenomeproject,HGP1990年正式启动(计划15年)2001年2月12日,六国科学家联合在学术期刊上发表人类基因组“工作框架图”及初步分析结果。2003年4月14日,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。1.大量新基因数据基因编码的蛋白质功能?2.mRNA丰度和蛋白丰度的区别mRNA丰度和蛋白丰度相关性不好3.蛋白质合成之后,还要经历翻译后的加工修饰一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。4.包容了数千甚至数万种蛋白质的细胞是如何运转的?这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调的?1.1人类基因组学存在问题复杂的相互作用网络基因组研究来回答?!从整体水平上探讨细胞蛋白质的组成及其活动规律后基因组时代post-genome:functional基因组与蛋白质组之间的关系1.2生物技术的发展高分辨率高灵敏度大规模化图4.采用一步法制备的cos7细胞蛋白质的2-DE图椭圆形区域内的蛋白斑点在图3各图间和图4中分布有些相似;矩形区域内的蛋白斑点表示随裂解液溶解性能提高而出现的蛋白质;三角形区域内的蛋白斑点表示可完全溶解于水溶液中的蛋白质;Mr×10-3-14-20-30-43-67-94pI3pI10(NL)测序技术的迅速发展1.3计算机科学和生物信息学的发展海量数据的存储、管理、共享数据知识,如何将这些数据变为生物学知识?……生命科学研究重心的转移基因组学生物功能的整体研究(蛋白质组学)Science291:1221,2001Nowit’stimeforproteomics机遇和挑战机遇:基因组计划的快速进行,大量基因序列和EST的确定为蛋白质的快速鉴定提供了良好的基础。挑战:从单一蛋白质的研究转变到细胞和组织的整体蛋白质研究,在理论和技术上提出了挑战。2.发展历程(1)2.发展历程(2)2.发展历程(2)二、蛋白质组学基本内容HGP里程碑遗传连锁图(geneticmap):通过计算连锁的遗传标记之间重组频率而确定它们相对距离物理图(physicalmap):获得分布于整个基因组的30000个序列标签位点(sequencetaggedsite,STS),并在此基础上构建覆盖每条染色体的大片段DNA克隆序列图转录图:获得大量基因转录本即信使核糖核酸(mRNA)的序列以及人类基因的表达序列标签(expressedsequencetag,EST)1.HPP里程碑两谱:蛋白表达谱、修饰谱两图:蛋白连锁图、亚细胞定位图三库:样本库、抗体库、数据库2.主要解决问题基本生物学问题Post-translationalmodificationProtein-proteininteractionGenome-Transcriptome-Proteome临床应用问题Diseasemarker-diagnosisDrugtarget-therapy三、基本研究方法及策略1.蛋白质组研究整体技术的特点规模化通量化自动化2.技术目标(要求)有效分离准确鉴定合理分析蛋白质组学研究的手段蛋白质组研究的核心──用于分离的双向电泳(2-DE)蛋白质组技术的支柱———鉴定技术(Identification)蛋白质组研究的百科全书———数据库(database)3.蛋白质组学研究方案表达蛋白质组(expressingproteomics)比较蛋白质组(comparativeproteomics)功能蛋白质组(functionalproteomics)3.1表达谱研究的技术流程图蛋白质样品的制备双向电泳图像分析转印至膜上的蛋白凝胶中的蛋白溶液中的蛋白混合肽蛋白质质量N端测序肽序列质谱数据肽指纹图数据搜索新的或已知蛋白蛋白转录后修饰的鉴定WhatisdifferentialproteomicsDifferentialproteomicsisthequalitativeandquantitativecomparisonofproteomesunderdifferentconditionstofurtherunravelbiologicalprocessesortofindbiomarkers.是功能蛋白质组学,疾病蛋白质组学,临床蛋白质组学,毒理蛋白质组学的基本模式。相对于全景式组成蛋白质组学而言其研究规模较小而生物学意义更具体,是目前应用最广的蛋白质组学研究模式。3.2差异蛋白组学的研究策略基于2DE的差异蛋白质组学分析技术流程:ESI-MS/MSMAIDI-TOF图像分析确定差异点差异蛋白质质谱分析数据处理与生物信息学分析数据搜寻蛋白质鉴定条件A:样品条件B:样品3.3功能蛋白质组学研究策略ESI-MS/MS四、蛋白质组学研究的难点蛋白质组学的多样性蛋白质的种类确定蛋白质组的动态性蛋白质组的时空性技术屏障五、蛋白质组学应用及研究进展研究领域的拓展与深入研究方法及技术的创新和改进数据库和分析技术的发展1、研究领域的拓展与深入紧密围绕蛋白质组结构、功能等与人类疾病的关系这一主题,详细论述了人类重大疾病的蛋白质组学研究状况与发展前景。其中包括实体肿瘤蛋白质组学研究、血液系统疾病蛋白质组学研究、神经系统蛋白质组学研究、心血管系统蛋白质组学研究、传染病蛋白质组学研究、衰老蛋白质组学研究,以及临床蛋白质组学研究等。疾病蛋白组学医学科学领域发展的重要前沿12345发现和鉴定了生理状况下大量重要组织蛋白质疾病过程中重要标志物建立疾病不同阶段蛋白质组数据库疾病早期诊断预后参数模型模型的大规模现场验证合临床应用疾病蛋白质组学“疾病系统生物学”的提出以及在蛋白质组学研究中应用,“ClinicalProteomics”、“Proteomics-ClinicalApplications”等的国际专业学术刊物的先后发行,标示着疾病蛋白组学已成为医学科学领域发展的重要前沿。蛋白质不仅是多种致病因子对机体作用最重要的靶分子,而且也成为大多数药物的药靶乃至直接的药物。一项科学统计表明:在90年代中期,全世界制药业用于找寻新药的药靶共483个,它们主要是蛋白质(受体占45%,酶占28%等);而当时全世界正在使用的药物总数大约有2000种,其中85%都是针对上述483种药靶。2.研究方法及技术的创新和改进双向荧光差异凝胶电泳(differenceingelelectrophoresis,DIGE)技术同位素亲和标签(Isotopecoded-affinitytags,ICAT)技术基于质谱的非标记定量技术2.1胶内差别电泳(differenceingelelectrophoresis,DIGE)2-DDifferenceGelElectrophoresis(DIGE)Imageanalysis:DataquantificationImageanalysis:OverlayimagesProteinextract1Labelwithfluor1Proteinextract2Labelwithfluor2Separateby2DPAGEMixlabeledextractsImagegelExcitationWavelength1Excitationwavelength2Analysisofdifference细胞培养中稳定同位素标记氨基酸(StableIsotopeLabelingByAminoAcidsInCellCulture,SILAC)2.2同位素亲和标签Isotopecoded-affinitytags,ICAT利用化学修饰使离子具有某种特征,从而易于辨别常用18O标记法,标示y系列离子一种体外标记稳定同位素的相对定量方法素标记的亲和标签(ICAT)试剂结构图头部是和巯基反应的基团,使试剂共价结合在蛋白质侧链上;中间的连接部分是同位素标记接头,分为两种:一种带8个H(d0),一种带8个D(d8);尾部是亲和标记的生物素,用于分离标记的蛋白质或多肽。2.3基于质谱的非标记定量技术基于一级质谱信息肽段峰强度(Massspectralpeakintensity)峰面积(Peakarea)液相色谱保留时间(LCretentiontime)基于二级质谱信息肽段总次数(Peptidehits或Spectralcounts)所鉴定肽段的离子价位(Ioncountsofidentifiedpeptides)3.数据库及分析软件PIRPIRSWISS-PROTSWISS-PROTTrEMBLUniProt数据库和软件六、我国蛋白质组学研究概况中国蛋白质组研究中心人肝脏蛋白质组任务连锁图表达谱修饰谱定位图数据库抗体库样本库思考题1.掌握蛋白质组学的概念和科学目标2.了解蛋白质组学的主要研究方法及其特点3.了解蛋白质组学分类及其研究策略