1蛋白质组学概论及数据分析蛋白质组和蛋白质组学蛋白质组(PROTEOME)1994年由Williams和Wilkins提出:TheentirePROTEinpopulationexpressedbyagenOMEorbyacellortissuetype蛋白质组学(proteomics)研究蛋白质组的科学3•CataloguingProteomics•Proteincatalogue--whatproteinsarethereinacell,tissue,organelle,etc.•Expressionproteomics:•analysisofdifferentialproteinexpression•Functionalproteomics:•posttranslationalmodifications•protein-protein,protein-ligandinteractions•sequence-structure-functionrelationships蛋白质组学蛋白质组研究中的样品制备•细胞或组织中的全蛋白质组分•样品预分级---------将细胞或组织中的全体蛋白质分成不同部分,分别进行研究。样品预分级的主要方法•蛋白质溶解性:可溶性蛋白、非溶性蛋白等•蛋白质定位:膜蛋白、核蛋白等•蛋白质细胞器定位:线粒体、高尔基体、叶绿体等样品预分级主要作用在于提高低丰度蛋白质的上样量和检测灵敏度。6蛋白质组研究中的样品分离凝胶电泳(1Dgel、2-DE)色谱技术(液相色谱、毛细管电泳)71DGel1DGel•Strengths:•Simple•Inexpensivesampleprep•Membraneproteins•HighMWproteins(100kDa)•Limitations:•Limitedresolution•LowMWProteins(7kDa)•NotQuantitative92-DE•Firstdimension:isoelectricpoint(isoelectricfocusing)•Seconddimension:molecularweight(SDSgelelectrophoresis)双向凝胶电泳的基本步骤1、样品制备(溶解、变性、还原、去除杂质)2、第一相等点聚焦3、第二相SDS-PAGE4、蛋白质的检测5、图谱数据化分析2DE的优点1.一次可分离上千种10~100kD分子量的蛋白质2.高灵敏度和高分辨率3.便于计算机分析处理可进行蛋白质定位、等电点、分子量的鉴定以及蛋白质的定量;可建立蛋白质数据库;不同的图谱可进行比较和分析4.与分析鉴定方法相匹配电泳后样品可以转移到PVDF膜上进行N或C端的序列分析直接进行蛋白质胶内或膜上酶解与质谱分析匹配。2-DE的缺点极酸、极碱性蛋白质,疏水性蛋白质,极大蛋白质、极小蛋白质以及低丰度蛋白质用此种技术难于有效分离。胶内酶解过程费时、费力,难以与质谱联用实现自动化。132DE14DIGE15多维色谱16•Strengths:•Reducessamplecomplexity•Lowabundanceproteins•Membraneproteins•AllMWProteins•Flexible(differentcolumncombinations)•Canautomate•Limitations:•Complexsetup•Nofasterthan2Dgels•Computerintensive•NotQuantitative•Reproducibility多维色谱17ProteomicsWorkflow质谱仪器的组成数据及供电系统┏━━━━┳━━━━━╋━━━━━━┓进样系统离子源质量分析器检测接收器┗━━━━━╋━━━━━━┛真空系统电子轰击电离ElectronImpactIonization,EI化学离子化ChemicalIonization,CI场电离FieldIonizationFD场解吸FieldDesorptionFD快原子轰击FastAtomBombardment,FAB基质辅助激光解析电离Matrix-AssistedLaserDesorptionIonization,MALDI电喷雾电离ElectrosprayIonization,ESI大气压化学电离AtmosphericPressureChemicalIonization,APCI表面增强激光解吸电离SurfaceEnhancedLaserDesorptionandIonization,SELDI离子源质量分析器磁质量分析器(MagneticSectorAnalyzer)飞行时间质谱仪(timeofflight,TOF)四极质量分析器(quadrupolemassanalyzer)离子阱(iontrap)傅立叶变换离子回旋共振质谱仪(Fouriertransformioncyclotronresonance,FT-ICR)质谱仪的主要技术指标质量范围:质谱仪所检测的单电荷离子的质荷比范围分辨率(R):质谱仪分开相邻两离子质量的能力。质量精确度:生物分析物质量的测量值与实际分子量的接近程度(用百万分率表示,ppm)扫描速度:离子检测速度即质谱仪获取数据的速度R=m/mm为质谱仪可分辨的相邻两峰的质量差m为可分辨的相邻两峰的平均质量蛋白的组成蛋白的表达水平蛋白的翻译后修饰蛋白的相互作用proteomics质谱能够告诉我们什么?蛋白的功能基于质谱的蛋白质组学实验流程肽质量指纹谱法(PMF)PeptideMassFingerprint肽段碎片离子鉴定法(PFI)PeptideFragmentIdentification质谱测定蛋白质序列方法从头测序法denovoPMF如何产生ProteinAacedfhsakdfqeasdfpkivtmeeewendadnfekqwfeProteinBacekdfhsadfqeasdfpkivtmeeewenkdadnfeqwfeProteinCacedfhsadfqekasdfpkivtmeeewendakdnfeqwfeSequenceMass(M+H)TrypticFragments4842.054842.054842.05acedfhsakdfgeasdfpkivtmeeewendadnfekgwfeacekdfhsadfgeasdfpkivtmeeewenkdadnfeqwfeacedfhsadfgekasdfpkivtmeeewendakdnfegwfeProteinAacedfhsakdfqeasdfpkivtmeeewendadnfekqwfeProteinBacekdfhsadfqeasdfpkivtmeeewenkdadnfeqwfeProteinCacedfhsadfqekasdfpkivtmeeewendakdnfeqwfeSequenceMass(M+H)MassSpectrum4842.054842.054842.05PMF如何产生构建理论上PMF数据库ProteinAacedfhsakdfqeasdfpkivtmeeewendadnfekqwfeProteinBacekdfhsadfqeasdfpkivtmeeewenkdadnfeqwfeProteinCacedfhsadfqekasdfpkivtmeeewendakdnfeqwfeSequenceDBCalc.TrypticFragsMassListacedfhsakdfgeasdfpkivtmeeewendadnfekgwfeacekdfhsadfgeasdfpkivtmeeewenkdadnfeqwfeacedfhsadfgekasdfpkivtmeeewendakdnfegwfe1007.4251(A-1)1112.4894(A-2)2098.8909(A-3)538.2296(A-4)450.2017(B-1)1740.7500(B-2)1407.6462(B-3)1300.5116(B-4)1526.6211(C-1)664.3300(C-2)1593.7101(C-3)1114.4416(C-4)实验(MALDI)Spectrum698209811991007538450m/zAbundance实验谱图vs.理论谱图QueryMassesDatabaseMassListResults450.2017(B)538.2296(A)664.3300(C)1007.4251(A)1112.4894(A)1114.4416(C)1300.5116(B)1407.6462(B)1526.6211(C)1593.7101(C)1740.7501(B)2098.8909(A)450.2201538.2296698.31001007.53911199.49162098.99092Unknownmasses1hitonB3hitsonAConcludethequeryproteinisA基于PMF鉴定蛋白质•实验质谱图谱•蛋白酶或酶切位点•已知蛋白质数据库•修饰位点及基团质量•图谱匹配质量判断•质量误差阈值(100ppm=1000.0±0.1Da)•常用软件(Prowl,ProFound,Mascot,PepIdent)•预测蛋白pI和质量,预判蛋白在胶内位置Challenge1:质量非唯一性Gly+Gly=114.043-Asn=114.043Ala+Gly=128.059-Gln=128.059-Lys=128.095Gly+Val=156.090-Arg=156.101Ala+Asp=Glu+Gly=186.064-Trp=186.079Ser+Val=186.100-Trp=186.079uLeu=Ile=113.084Challenge2:酶切不完全ProteinAacedfhsakdfqeasdfpkivtmeeewendadnfekqwfeSequenceTrypticFragments(nomissedcleavage)acedfhsak(1007.4251)dfgeasdfpk(1183.5266)ivtmeeewendadnfek(2098.8909)gwfe(538.2296)TrypticFragments(1missedcleavage)acedfhsak(1007.4251)dfgeasdfpk(1183.5266)ivtmeeewendadnfek(2098.8909)gwfe(538.2296)acedfhsakdfgeasdfpk(2171.9338)ivtmeeewendadnfekgwfe(2689.1398)dfgeasdfpkivtmeeewendadnfek(3263.2997)PMF鉴定法优点•使用2DE-MALDI-TOF,费用低廉•所鉴定蛋白质序列必须已知•不适用于3种蛋白以上的混合物•灵敏度不高,肽段缺失导致没有结果•精确性不高•2DE中只有大约40%的点能得到鉴定利用串联质谱技术,选择某一质荷比的肽段进行MS/MS分析,将产生的碎片离子的数据进行数据库检索,实现蛋白质的鉴定肽段碎片离子鉴定m/z:质量电荷比蛋白质组学串联质谱数据分析流程APNDFNLK蛋白质组学串联质谱数据分析流程v1-lettercodeAveragemassAlanineA71.08ArginineR156.19AsparagineN114.10AsparticacidD115.09CysteineC103.14GlutamicacidE129.12GlutamineQ128.13GlycineG57.05HistidineH137.14LeucineL113.16LysineK128.17MethionineM131.19PhenylalanineF147.18ProlineP97.12SerineS87.08ThreonineT101.10SelenocysteineU150.03Try