生物大分子的计算机模拟方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物大分子的计算机模拟生物大分子的计算机模拟生物大分子的计算机模拟方法蛋白质三维结构的模建核酸结构的模拟生物大分子的计算机模拟方法量子力学分子力学分子动力学量子力学量子力学是微观世界物质运动的普遍规律一个分子体系的状态可以用Schrodinger方程来表示,通过求解Schrodinger方程可以得到分子体系的结构和性质量子力学方法的特点:计算结果精确度高,限于计算机的计算能力,能够计算的体系小从头计算方法:100个原子;半经验计算:1000-10,000个目前,生物大分子体系还不能用量子力学方法模拟分子力学分子力学是一种近似处理方法忽略电子的运动,将体系的势能看作是原子核位置的函数力场:分子体系的势能函数分子的势能=键伸缩能+键角扭曲能+扭转势能+非键相互作用项函数形式和参数力场是经验的特点:能够计算含有大量原子的体系简单有效,目前应用得最广泛分子力学描述的原子间相互作用分子动力学分子动力学是建立在牛顿力学基础上的一种分子模拟方法将分子体系的运动看作是在势能面中质点的运动,求解运动方程可得到体系中所有原子的轨迹,从轨迹中可计算得到各种性质特点:可以搜索很大的构象空间,模拟时间在纳秒级应用分子模型的动力学变化研究大分子体系低能构象的模建X射线晶体学和NMR中的结构优化第一节生物大分子的计算机模拟生物大分子的计算机模拟方法蛋白质三维结构的模建核酸结构的模拟蛋白质三维结构的模建模建(modeling)蛋白质结构的基本概念蛋白质结构预测的从头计算同源和比较模建方法蛋白质折叠类型识别法蛋白质二级结构预测蛋白质结构预测方法准确性的评估应用实例模建(modeling)蛋白质的三维结构模建是从氨基酸序列出发理论预测蛋白质的三维结构基本假设:Anfinsen原理模建研究的意义中心法则的延伸—第二遗传密码蛋白质结构测定的速度远远落后于序列测定的速度,使理论预测的方法成为一种迫切的需要到2001年12月,已知的蛋白质序列接近60万条,而测定了三维结构的蛋白质仅为16917个蛋白质三维结构的测定已经成为生命科学发展的“瓶颈”蛋白质结构的基本概念蛋白质的二级结构单元a螺旋b折叠股(b-strand)和b折叠片(b-sheet)环(loop)b-转角(b-turn)蛋白质的结构可以通过旋转键的扭角来确定主链扭角:f,y,w侧链扭角:c1,c2,…描述蛋白质结构的扭角NHONHfywc1c2蛋白质结构预测的从头计算从头计算法(abinitio)搜索分子的构象空间,找到最合适的构象基本假设:天然构象=能量最低构象(?)搜索构象空间的方法蛋白质的简化模型特点:不依赖于已知的结构模式,是一种普适的解决方法,目前尚处于探索阶段同源和比较模建方法根据蛋白质结构的相似性,以已知蛋白质的结构为模板构建未知蛋白质的三维结构在进化过程中蛋白质三维结构的保守性远大于序列的保守性,当两个蛋白质的序列同源性/相似性高于35%时,一般情况下它们的三维结构基本相同同源模建方法是目前最常被采用的也是最成功的结构预测方法主要步骤确定模板确定未知蛋白质与已知结构蛋白质的序列比对确定结构保守性的主链结构片断构建结构变化的区域侧链模建用能量计算的方法进行结构优化同源和比较模建方法影响同源模建质量的因素序列相似性大小(插入和删除片断)30%序列比对的准确性序列比对(sequencealignment)将两个或多个序列之间的相似区域和保守性位点对齐以分析它们的相似程度在同源模建中非常重要,影响结构预测的准确性程序:BLAST序列比对的实例Score=233bits(593),Expect=4e-61Identities=118/251(47%),Positives=162/251(64%),Gaps=9/251(3%)Query:29IGIYKWHYSGLNRWHGAGSTADFQKIIQERCDTYTQTIRPGSRSRNCQAIRQAFMSAFIS88+G+WS+G+TI+RCTYT++PR+++C+IFSAF+SSbjct:40VGVLTWRQSSM------GATDHVSAIVLGRCLTYTRNMHPELRNQDCKKILNTFTSAFVS93Query:89KDPCKATKEDYNSLINLAPPTVPCGQQVFWSKTKELAHEYAK-RRRLMTLEDTLLGYLAD147KDPCTKEDYLI+LTVPC++FWS++KELAH+Y++++TLEDTLLGY+ADSbjct:94KDPCNITKEDYQPLIDLVTQTVPCNKTLFWSRSKELAHQYSGIQKEMFTLEDTLLGYIAD153同源和比较模建方法互联网上的同源模建服务器SWISS-MODEL蛋白质折叠类型识别法蛋白质的折叠模式是有限的自然界中蛋白质家族的数目大约为23100个,现有的蛋白质结构分属600个家族,其中折叠模式只有约300种估计蛋白质的折叠模式的总数在几百到一千种蛋白质折叠类型识别法:又名穿针引线法(threading)针对那些没有明显的同源性但又采取类似结构的蛋白质将一个序列与蛋白质折叠库中的所有结构类型进行匹配,找出最接近的一种需要构建非重复的蛋白质折叠模式库常用的程序THREADER:~jones/蛋白质折叠类型识别网站:蛋白质三维结构的模建模建(modeling)蛋白质结构的基本概念蛋白质结构预测的从头计算同源和比较模建方法蛋白质折叠类型识别法蛋白质二级结构预测蛋白质结构预测方法准确性的评估应用实例蛋白质二级结构预测概况二级结构预测的方法统计方法:Chou-Fasman方法,GOR方法,神经网络方法,最近邻居方法物理化学方法:Lim方法,Cohen方法机器学习方法:基于多重序列比对的二级结构预测,PSIPRED方法二级结构预测的准确度单序列:~60%,应用多重序列比对的:65-85%二级结构的在线预测PHD算法:GOR算法:蛋白质结构预测方法准确性的评估评估的必要性CASP(CriticalAssessmentofTechniquesforProteinStructurePrediction)项目网址:1994年,CASP1,35个小组,100个预测2000年,CASP4,160个小组,11136个预测应用实例计算机模拟用于研究蛋白质的折叠机理能在不同分辨率水平上提供丰富的信息模拟的时间尺度在纳妙级目前只能用于小肽片断小蛋白的折叠时间在20us,最短1us1998年,Collman对HP-36的分子动力学模拟使用由256个CPU构成的超级并行计算级CrayT3E模拟时间1微秒计算时间长达两个半月得到了与NMR结构有一定类似性的结构,并观察到蛋白质折叠的中间体HP-36的分子动力学模拟第一节生物大分子的计算机模拟生物大分子的计算机模拟方法蛋白质三维结构的模建核酸结构的模拟核酸结构的模拟用分子动力学方法模拟核酸溶液结构应用实例1983年,首次研究,tRNAphe的模拟2001年,端粒酶抑制剂与DNA相互作用的模拟生物大分子的模拟研究对于现代药物设计的意义基于结构的药物设计要求知道药物靶标的结构目前大多数药物靶标的结构是未知的计算机模拟研究对于了解靶标结构、设计先导化合物提供了强有力的帮助

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功