如何用MEGA5.0以及Clustalx1.83构建进化树分析解析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

用MEGA5.1和Clustalx1.83构建进化树组员:汤宏赤曾伟董明右构建进化树的意义进化树:用来表示物种之间的进化关系,又称“系统树”、“系谱树”。根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系。意义:研究从单细胞有机体到多细胞有机体的生物进化过程,而且可以粗略估计现存的各类种属生物的分歧时间。通过蛋白质的分子进化树分析,为从分子水平研究物种进化提供了新的手段,可以比较精确的确定某物种的进化地位。构建进化树的基本步骤:1、核酸序列的获取:数据库查询、测序2、序列比对:BLAST、ClustalX、ClustalW2等。3、进化树分析:MEGA、PAUP4.0、Phylip、NETWORK4.11、SplitsTree4、TCS1.8等。参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16SrDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。3、使用clustalx1.83进行序列比对MEGA简要介绍MEGA是有亚利桑那州立大学生命科学学院的SudhirKumar教授主持开发和维护的一款免费的构建进化树软件。主要功能:序列比对、格式转换、数据修订、距离计算、系统树重建和可行度评估等全套功能,能对DNA、mRNA、氨基酸序列及遗传距离进行系统发生分析,目前最新版本为MEGA5.1。MEGA5.1主界面ClustaX主界面核酸序列的获取保存文件并命名XXXXAGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGgi|289469964|gb|GU388381.1|AcinetobactertandoiistrainDSM1497016SribosomalRNAgene,partialsequenceACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA……合并文件点击File/loadsequences,将整理好的*.txt序列文件导入clustalx1.83,如图接着点击Alignment/DoCompleteAligment程序自动运行,得出结果,自动输出*.aln和*.dnd为后缀的两个文件,并自动存入你*.txt文件所在的文件夹内。序列比对也可以直接用MEGA来做。4、运行程序MEGA5.0,如下图所示:点击:File导入Clustal程序得到的*.aln文件。再点File/ConverttoMEGAFormat,打开转换文件对话框,从目的文件夹中选中Clustal对比分析后所产生的*.aln文件,转换为*.meg文件。转换时一路确认相关界面。最后查看meg序列文件最后是否正常,命名新文件存盘保存*.meg文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。5、关闭转换窗口,回到主窗口,现在从File中打开刚才保存的*.meg文件。如果为核酸序列,选择“Nucleotidesequence”,点击“OK”,得到以下图示。选择默认的Standard,点击OK后,如图所示。点击程序中的,可以得到下图在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可。序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。常用的构树方法1、邻接法:是居于最小进化原理经常被使用的一种算法,它不检查素有可能的拓扑结构,同时给出拓扑结构和分支长度。可以通过确定距离最近的成对分类单位来使系统树的总距离达到最小。优点是重建的树相对准确,假设少,计算速度快,只得一棵树,而缺点是在将序列上的所有位点等同对待,且所分析序列的进化距离不能太大。2、最大简约法:是居于形态特征分类的需要发展起来的,优点是该法无需引入处理核苷酸或者氨基酸替代时所必须的假设,对分析某些特殊的分子数据(如插入序列和插入/缺失)等特别有用,在分析的序列位点上没有回复突变或平行突变,并且在被检查的序列位点树很大时,也恩呢该获得正确的系统树。3、最大似然法:该法是考虑到每个位点出现残基的似然性,将每个位置所有可能出现的残基替换概率进行累加,产生特定位点的似然性。该法是与进化事实吻合最好的建树算法,其缺点是计算强度非常大,耗时。4、贝叶斯法:保留了最大似然法的基本原理,又引进了马尔科夫链的蒙特卡洛方法,来模拟演化树的较晚期可能性分布,并使计算时间大大缩短。(1)phylogeny→UPGMA具体构建过程如下参数的设置:点击,选择该菜单中的Construct/testNeighbor-Joiningtree,选择前面转换得到的*meg文件,得到下图对下图的参数进行设置:说明:系统进化树的测试方法TestofPhylogeny,通常要选择Bootstrapmethod,也可以选择不进行测试;重复次数No.ofbootstrapReplications——通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。一般选择500或1000。Model/Method——通常选择Kimura2-parameter。设定完成,点compute,开始计算得到进化树构建的结果。如下图所示;该窗口中有两个属性页,一个是原始树Originaltree,一个是bootstrap验证过的一致树Bootstrapconcensustree。树枝上的数字表示bootstrap验证中该树枝可信度的百分比。得到构建的进化树后可以对该进化树进行优化。(本文参考网友的文章,同Mega的其它版本使用基本相同,在此表示感谢。以下进化树的优化部分直接引用)(1)利用该软件可得到不同树型,如下图所示:除此之外,还可以有多种树型,根据需要来选择。2)显示建树的相关信息:点击图标i。3)点击优化图标,可进行各项优化:􀀹Tree栏中,可以进行树型选择:rectangulartree/circletree/radiationtree。每种树都可以进行长度,宽度或角度等的设定􀀹Branch:可对树枝上的信息进行修改。􀀹Lable:可对树枝的名字进行修改。􀀹Scale:标尺设置􀀹Cutoff:cutoffforconsensustree。一般为50%。9、进化树的分类优化􀀹Placerootonbranch:可以来回转换。􀀹Flipsubtree:180度翻转分枝,名字翻转180度。􀀹Swabsubtree:交换分枝,名字不翻转。􀀹Compress/expandsubtree与Setdivergenttime:可以把同一分枝的基因压缩或扩展。点击Compress/expandsubtree后,在要压缩的分枝处点击,出现以下界面,在name/caption中输入文件名(例如),其他还有很多的选项,设置好了,点击OK。所得到的结果,可以在压缩和扩展之间转换。10.调整进化树根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在PHOTOSHOP中修改等。完成后的进化树应包含充足的信息。

1 / 44
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功