实习5:蛋白质组学数据分析系统生物学平台浙江加州国际纳米技术研究院(ZCNI)zjuzwy@gmail.com张维一华大颂莫凡毛瑞芳1.蛋白质组学质谱分析背景介绍2.蛋白质组学数据库检索软件GPM(X!tandem)3.蛋白质组学数据统计分析软件TPP课程内容:蛋白质组学质谱分析背景介绍TandemMS蛋白质组学质谱分析背景介绍m/z:质量电荷比蛋白质组学质谱分析背景介绍粘贴蛋白序列:PGYRNNVVNTMRLWSAKAPNDFNLKDFNVG选择“Onlythefollowingselectionofenzymesandchemicals”,并选择胰酶Trypsin酶切点击Perform蛋白质组学质谱分析背景介绍APNDFNLKv1-lettercodeAveragemassAlanineA71.08ArginineR156.19AsparagineN114.10AsparticacidD115.09AsnorAspBCysteineC103.14GlutamicacidE129.12GlutamineQ128.13GluorGlnZGlycineG57.05HistidineH137.14IsoleucineI113.16LeucineL113.16LysineK128.17MethionineM131.19PhenylalanineF147.18ProlineP97.12SerineS87.08ThreonineT101.10SelenocysteineU150.03TryptophanW186.21TyrosineY163.18ValineV99.13蛋白质组学质谱分析背景介绍具体数值,对应后页中离子质量蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍蛋白质组学质谱分析背景介绍???面对如此多的质谱谱图和理论图谱我们将如何进行比对目前人类已知蛋白大约有6万8千种平均每种蛋白长度为500个氨基酸平均每种蛋白可以胰切成50个肽段平均每个肽段有10种可能打碎情况每一种可能情况产生一张理论图谱平均一次质谱实验有3000次扫描每一次扫描产生一张质谱谱图蛋白质组学数据库检索软件GPM(X!tandem)GPM(X!tandem)SEQUESTMascot类型免费开源软件商业软件商业软件数据输入DTA,PKL,MGFRAW,DTAMGF,DTAmzXML,mzDATA速度快较慢较慢并行运算支持(PVM,MPI)支持(PVM)支持(MPI)蛋白质组学数据库检索软件X!Tandem优点:•运算速度快•免费,并行集群计算成本低•开源可自行修改代码缺点:•应用范围尚不广泛•后期统计软件接口尚未成熟蛋白质组学数据库检索软件硬件要求:当前主流电脑配置即可胜任小规模数据检索SlavenodesMasternodeNetworkswitchingDownloadGPM:蛋白质组学数据库检索软件蛋白质组学数据库检索软件数据库、结果程序等核心内容运行程序质谱原始数据解压缩:C:/ZCNI_tranning/X!tandem/数据库目录蛋白质组学数据库检索软件输出结果目录数据库参数工作流程:1.将*.raw文件转变为*.mzXML文件(练习文件为肝癌蛋白质组学数据)2.编辑参数3.运行GPM中的X!Tandom4.查看结果5.使用自己的数据库蛋白质组学数据库检索软件1.将*.raw文件转变为*.mzXML文件开始运行输入“cmd”开启命令行窗口Download:=69281&use_mirror=jaist&filename=ReAdW_2006Nov01.exe&403003882.编辑参数双击打开Onespectrum:搜索一个质谱数据Onedirectory:搜索多个质谱数据,放于一个文件夹中,然后压缩成一个rar文件谱Simple:仅简单的设置一级肽指纹图谱相关参数Advanced:设置搜索二级图谱所有参数Upload:查看以前的搜索!!点击advanced选择搜索二级谱选择程序X!Tandem选择需要搜索的质谱数据DTA,PKL,MGF,mzData,mzXMLorTandemBIOML选择数据库数据检索输出阀值搜索的离子为b离子与y离子二级谱中片段离子理论与实际差异最大允许值一级谱中片段离子理论与实际差异最大允许值(|M-M0|/M0)X106(ppm)M为离子质量的实测值;M0为离子质量的理论值;氨基酸残基的修饰完全修饰潜在的修饰氧化,磷酸化等等57.0340415.99492快速搜索可能的修饰蛋白酶解时所使用的酶(胰酶)非特异性酶切漏切3.运行程序点击运行运行界面4.查看结果结果可靠性的统计指标以及强度蛋白的覆盖率蛋白检索号对应肽断总数蛋白分子质量唯一对应肽断数5.替换数据库下载蛋白数据库存放到本文件夹(所使用fasta数据库为所研究种属的蛋白数据库,可从下载得到)用记事本打开参考文献:://thegpm.org/GPM/gpm_install_faq.html蛋白质组学数据统计分析软件Trans-ProteomicsPipeline(TPP)Trans-ProteomicPipeline(TPP)是用于LC/MS/MS蛋白质组学数据分析的软件.TPP包含一系列蛋白质鉴定和定量分析的模块,能够对经Sequest数据库搜索引擎得到的结果进行筛选过滤,从而达到蛋白质鉴定和测序的目的.蛋白质组学数据统计分析软件Trans-ProteomicPipeline(sashimi)蛋白质组学数据统计分析软件蛋白质组学数据统计分析软件sp|P02754|LACB_BOVINBETA-LACTOGLOBULINPRECURSOR(BETA-LG)(ALLERGENBOSD5)-Bostaurus(Bovine).MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDAQSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDALNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCLVRTPEVDDEALEKFDKALKALPMHIRLSFNPTQLEEQCHITPEVDDEALEK:p=0.96PTPEGDLEILLQK:p=0.81LSFNPTQLEEQCHI:p=0.65P=1–(1-0.81)(1-0.96)(1-0.65)=0.99蛋白质组学数据统计分析软件TPP的安装与配置从http://tools.proteomecenter.org/TPP.php上下载并安装windows版本TPP软件。TPP_Setup_v4_2_JETSTREAM_rev_0.exe。安装过程中选择附带安装Apache(安装TPP4.2要求系统已安装ActivePerl-5.8.8.*以上版本,可从网站上下载)。安装完成后,将会生成TPP的图标安装完后,桌面上生成了TPP和Cygwin的图标使用TPP点击桌面上的TPPWebTools,将会出现TPP的登陆界面.TPP的登陆界面UserName:guestPassword:guestTPPWebInterface的欢迎界面样本数据分析准备工作:1.确保C盘至少1G的空闲的硬盘空间.2.将数据文件ZCNI_No1(含.dta和.out文件)至ZCNI_No6和质谱RAW文件ZCNI_No1.RAW至ZCNI_No6.RAW,以及Sequest参数文件sequest.param放到目录:C:\Inetpub\下3.将数据库文件ipi.HUMAN.fasta放到目录:C:\database中操作流程1.将质谱RAW文件转换成mzXML文件;2.以Sequest结果文件和mzXML文件转换成xml文件;3.运行PeptideProphet,得到pepXML文件;4.以上步得到的pepXML文件运行ProteinProphet,得到最终结果;1.将RAW转换成mzXML文件点击AnalysisPipeline,选择mzXML,在SpecifyRAWInputFile(s)toconverttomzXML中点击AddFiles,添加要转成mzXML的RAW文件选择目录ZCNI_training选择所有的RAW文件选择目录ZCNI_training选择所有的RAW文件RAW转成mzXML文件2.由.out文件整合成pepXML文件点击“AnalysisPipeline”,然后点击pepXML,出现如图所示的界面.pepXML界面在File(s)toconverttopepXML点击addfiles选择ZCNI_training选择sequest的参数文件•其他参数选择默认,点击下面的Convert!下的ConverttoPepXML,即可以将文件夹中的所有.out文件整合成pepXML文件3.运行PeptideProphet点击AnalysisPipeline,选择AnalyzePeptidesPeptideProphet界面选择所有需要运行PeptideProphet的pepXML文件选择RUNPeptideProphet,其他参数为默认.点击RUNXinteract,即可作PeptideProphet分析.PeptideProphet分析运行PeptideProphet的结果可通过IE打开.PeptideProphet处理结束经PeptideProphet处理后的结果可用浏览器打开.在IE里面输入:可以看到结果为:4.运行ProteinProphet点击AnalysisPipeline,选择AnalyzePeptidesProteinProphet界面点击AddFiles选择经PeptideProphet后生成的interact.xml文件•其他为默认,点击RunProteinProphet!其它参数为默认,点击RunProteinProphet,即可运行ProteinProphet程序运行ProteinProphet运行ProteinProphet完成后生成的interact-prot.shtml文件可由IE打开.经ProteinProphet分析得到的结果可由IE打开,在IE中输入可以看到经ProteinProphet后的结果为:7.数据的过滤筛选和将结果保存成Excel文件在minprobability填上0.9,选择exportToexcel,然后点击Filter/Sort/DiscardCheckedentries,即可将结果过滤并生成Excel文件.过滤筛选后生成的excel文件结果编号蛋白索引号蛋白可信度唯一对应肽段数对应肽段总数过滤筛选后生成的excel文件ThankYou!