生物信息学-PowerPointPresentatio

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Bioinformatics,2008-2009,Semester1,USTC生物信息学第九章结构生物信息学Bioinformatics,2008-2009,Semester1,USTC本章内容提要1.蛋白质的结构与功能2.蛋白质结构的数据库、结构分类以及可视化3.蛋白质二级结构预测4.蛋白质三级结构预测Bioinformatics,2008-2009,Semester1,USTC1.蛋白质的结构与功能蛋白质的结构–主要由一级序列所决定蛋白质的功能–主要由三级结构所决定球蛋白(Globularproteins):疏水的内核&亲水的表面膜蛋白(Membraneproteins):特定的疏水表面亚稳态(marginallystable):折叠之后的蛋白质无序性(Intrinsicallydisordered):许多蛋白质必须与其他蛋白质结合后才能够获得稳定的结构因此,预测蛋白质的结构和功能非常的困难Bioinformatics,2008-2009,Semester1,USTC蛋白质结构的四个基本层面Bioinformatics,2008-2009,Semester1,USTC一级和二级结构1.一级结构氨基酸的线性序列氨基酸残基之间连接的共价键2.二级结构氨基酸残基局部空间内的排列短程的、非共价的相互作用周期性的结构模式:-helix,b-sheet,loops,coilsBioinformatics,2008-2009,Semester1,USTC-helix1.蛋白质中最多的二级结构2.平均长度:10个氨基酸残基(10A0)长度范围:5-40aa每一圈:3.6个aa通过氢键(~per4aa)稳定结构通常在内核的表面,疏水残基向内,亲水残基向外Bioinformatics,2008-2009,Semester1,USTChelix通过氢键稳定结构C=blackO=redN=blueBioinformatics,2008-2009,Semester1,USTCR-侧基分布在helix的外侧Bioinformatics,2008-2009,Semester1,USTChelices:氨基酸偏好Ala,Glu,Leu,Met:出现频率高Pro,GlyTyr,Ser:出现频率低Bioinformatics,2008-2009,Semester1,USTCb-Strands&Sheets1.一般不单独出现,成对或多个出现2.b链通过氢键连接,稳定结构3.相互作用的部分通过短的/长的loop连接4.平行或反平行的bsheetBioinformatics,2008-2009,Semester1,USTC反平行的b-sheetBioinformatics,2008-2009,Semester1,USTC平行的b-sheetBioinformatics,2008-2009,Semester1,USTC混合的b-SheetsBioinformatics,2008-2009,Semester1,USTCLoops1.连接-helix和b-sheet2.长度和三级结构不定3.在蛋白质结构的表面4.受点突变的影响小5.柔性好,构象变化余地大6.带电荷、极性的氨基酸比例高7.倾向成为活性位点Bioinformatics,2008-2009,Semester1,USTCCoils无序性(Intrinsicallydisordered):介导蛋白质-蛋白质之间的相互作用Bioinformatics,2008-2009,Semester1,USTC三级和四级结构三级结构肽链折叠成三维的空间结构二级结构在空间上的排布长程的、共价与非共价的相互作用四级结构多个肽链在空间上的排布Bioinformatics,2008-2009,Semester1,USTC超二级结构1.StructuralMotifs:超二级结构或二级结构的组合2.Domains:Motifs的组合Bioinformatics,2008-2009,Semester1,USTC一些常见的结构性motifs1.Helix-turn-helix:e.g.,DNAbinding2.Helix-loop-helix:e.g.,Calciumbinding3.b-hairpin:2adjacentantiparallelstrandsconnectedbyshortloop4.Greekkey:4adjacentantiparallelstrands5.bb:2parallelstrandsconnectedbyhelixBioinformatics,2008-2009,Semester1,USTCH-T-HH-L-HBioinformatics,2008-2009,Semester1,USTCb-hairpinBioinformatics,2008-2009,Semester1,USTCGreekkeyBioinformatics,2008-2009,Semester1,USTCBeta-alpha-betaBioinformatics,2008-2009,Semester1,USTCDomains:Motifs的组合Bioinformatics,2008-2009,Semester1,USTC一个或多个domainsBioinformatics,2008-2009,Semester1,USTC六种蛋白质的结构类型(1)Domains:螺旋束通过loops连接(2)bDomains:主要是反平行b片,两对b片形成sandwich结构(3)bDomains:螺旋连接的平行的b片(4)bDomains:螺旋和b片各自形成单独的结构(5)Multidomain(b):包含多种domains(6)Membrane&cell-surfaceproteinsBioinformatics,2008-2009,Semester1,USTC-domainstructures:4-helixbundlesBioinformatics,2008-2009,Semester1,USTCUp-and-downsheetsandbarrelBioinformatics,2008-2009,Semester1,USTCGreekkeymotifsBioinformatics,2008-2009,Semester1,USTCbDomainsTIMbarrelRossmanfoldBioinformatics,2008-2009,Semester1,USTC2.蛋白质结构数据库、结构分类以及可视化1.蛋白质结构的数据库:PDB,MMDB,MSD2.蛋白质结构的分类:SCOP,CATH,DALI/FSSP3.蛋白质结构的可视化:Cn3D,Rasmol/RaswinBioinformatics,2008-2009,Semester1,USTC蛋白质结构的数据库1.PDB(ProteinDataBank):蛋白质结构数据库2.MMDB(MolecularModelingDatabase):分子模拟数据库=structure3.MSD(MolecularStructureDatabase):大分子的相互作用和结合位点(RCSB)Bioinformatics,2008-2009,Semester1,USTCMMDBBioinformatics,2008-2009,Semester1,USTCMSDBioinformatics,2008-2009,Semester1,USTC蛋白质结构的分类1.SCOP(StructuralClassificationofProteins):folds,superfamilies,andfamilies2.CATH(ClassificationbyClass,Architecture,Topology&Homology)3.DALI/FSSP:蛋白质三级结构的比较DALIserverDALIDatabase(foldclassification)蛋白质结构的可视化RasWinCn3DBioinformatics,2008-2009,Semester1,USTC3.蛋白质二级结构预测1.Chou-Fasmanpredictions:Empirical2.Garnier,OsguthorpeandRobson(GOR):HMM3.DavidT.Jones:PSSM4.Frishman,Argos:Nearestneighbormethods5.SujunHua:SupportvectormachineBioinformatics,2008-2009,Semester1,USTCChou-Fasman1.预测三种主要的二级结构:-helix,b-sheet,Coils2.训练数据:15个已知构象的蛋白质结构,共2473个氨基酸残基3.定义:蛋白质构象参数(proteinconformationalparameters):氨基酸残基在二级结构中的重要性Pα,Pβ,PcBioinformatics,2008-2009,Semester1,USTC氨基酸在各种二级结构中的频率InnerHelix:IncludedinHelixBioinformatics,2008-2009,Semester1,USTCPα,Pβ,Pc的计算20jiffPBioinformatics,2008-2009,Semester1,USTCPα&Pβ-helixb-sheetBioinformatics,2008-2009,Semester1,USTC经验规则与预测性能1.规则一:对于给定一个6aa的片段,Pα均值1.03,并且Pα的均值Pβ的均值,则判定为α-Helix2.规则二:对于给定一个6aa的片段,Pβ的均值1.05,并且Pβ的均值Pα的均值,则判定为β-sheet3.预测性能:准确性~50-60%;对于β-sheet性能较差Bioinformatics,2008-2009,Semester1,USTC准确性~65%Garnier,OsguthorpeandRobson(GOR):HMMBioinformatics,2008-2009,Semester1,USTCDavidT.Jones:PSSMPSIPRED:PSSM+NeuralNetwork准确性76.5%~78.3%Bioinformatics,2008-2009,Semester1,USTCFrishman,Argos:Nearestneighbormethods准确性~72%Bioinformatics,2008-2009,Semester1,USTCSujunHua:Supportvectormachine准确性~76.2%Bioinformatics,2008-2009,Semester1,USTC4.蛋白质三级结构预测

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功