如何用MEGA5.0和Clustalx1.83构建进化树MEGA是一个关于序列分析以及比较统计的工具包,从3.1版本到后来的4.0版本一直都广为大家熟悉,现在推出了Mega5.0版本。功能比以前多有改进。现主要介绍使用Mega5.0构建系统进化树的方法。供大家参考。用MEGA构建进化树有以下步骤:1、测序:将克隆扩增测序得到的16SrDNA序列进行测序。2、NCBI上做Blast找到相似度最高的几个序列,确定一下你分离的细菌大约属于哪个科哪个属,如果相似度达到百分之百那基本可以确定你分离得到的就是Blast到的那个,然后寻找相似性最高的细菌,通常把该属的序列(Fasta格式文件)下载下来,或点击GenBank登录号,复制FSATA格式,整合在一个*.txt文档中(单独建立一个文件夹存放,后面的很多文件会自动装入该文件夹),如XXXXAGGCTTAACACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGgi|289469964|gb|GU388381.1|AcinetobactertandoiistrainDSM1497016SribosomalRNAgene,partialsequenceACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA……参考序列选择注意事项:1、不选非培养(unclutured)微生物为参比;2、不选未定分类地位的微生物,最相近的仅作参考;c,在保证同属的前提下,优先选择16SrDNA全长测序或全基因组测序的种;d,每个种属选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。3、使用clustalx1.83进行序列比对打开压缩文件clustalx1.83,运行其中的clustalx.exe文件,如图:点击File/appendsequences,将整理好的*.fasta序列文件导入clustalx1.83,如图接着点击Alignment/DoCompleteAligment程序自动运行,得出结果,自动输出*.aln和*.dnd为后缀的两个文件,并自动存入你*.txt文件所在的文件夹内。序列比对也可以直接用MEGA来做。4、运行程序MEGA5.0,如下图所示:点击:File导入Clustal程序得到的*.aln文件。再点File/ConverttoMEGAFormat,打开转换文件对话框,从目的文件夹中选中Clustal对比分析后所产生的*.aln文件,转换为*.meg文件。转换时一路确认相关界面。最后查看meg序列文件最后是否正常,命名新文件存盘保存*.meg文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。5、关闭转换窗口,回到主窗口,现在点面板上的“Openafile”打开刚才的*.meg文件。如果为核酸序列,选择“Nucleotidesequence”,点击“OK”,得到以下图示。选择默认的Standard,点击OK后,如图所示。点击程序中的,可以得到下图在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标,可对所选择的序列进行编辑,完成后点击close即可。序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。构建进化树的算法两类主要方法简要说明:独立元素法(discretecharactermethods)是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。距离依靠法(distancemethods)是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(MaximumParsimonymethods)和最大可能性法(MaximumLikelihoodmethods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。(1)phylogeny→UPGMA(2)用Bootstrap构建进化树,MEGA的主要功能就是做Bootstrap验证的进化树分析,Bootstrap验证是对进化树进行统计验证的一种方法,可以作为进化树可靠性的一个度量。各种算法虽然不同,但是操作方法基本一致。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说,最大简约性法适用于符合以下条件的多序列:i所要比较的序列的碱基差别小,ii对于序列上的每一个碱基有近似相等的变异率,iii没有过多的颠换/转换的倾向,iv所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。具体构建过程如下参数的设置:点击,选择该菜单中的Construct/testNeighbor-Joiningtree,选择前面转换得到的*meg文件,得到下图对下图的参数进行设置:说明:系统进化树的测试方法TestofPhylogeny,通常要选择Bootstrapmethod,也可以选择不进行测试;重复次数No.ofbootstrapReplications——通常设定至少要大于100比较好,随机数种子可以自己随意设定,不会影响计算结果。一般选择500或1000。Model/Method——通常选择Kimura2-parameter。设定完成,点compute,开始计算得到进化树构建的结果。如下图所示;该窗口中有两个属性页,一个是原始树Originaltree,一个是bootstrap验证过的一致树Bootstrapconcensustree。树枝上的数字表示bootstrap验证中该树枝可信度的百分比。得到构建的进化树后可以对该进化树进行优化。(本文参考网友的文章,同Mega的其它版本使用基本相同,在此表示感谢。以下进化树的优化部分直接引用)(1)利用该软件可得到不同树型,如下图所示:除此之外,还可以有多种树型,根据需要来选择。2)显示建树的相关信息:点击图标i。3)点击优化图标,可进行各项优化:Tree栏中,可以进行树型选择:rectangulartree/circletree/radiationtree。每种树都可以进行长度,宽度或角度等的设定Branch:可对树枝上的信息进行修改。Lable:可对树枝的名字进行修改。Scale:标尺设置Cutoff:cutoffforconsensustree。一般为50%。9、进化树的分类优化Placerootonbranch:可以来回转换。Flipsubtree:180度翻转分枝,名字翻转180度。Swabsubtree:交换分枝,名字不翻转。Compress/expandsubtree与Setdivergenttime:可以把同一分枝的基因压缩或扩展。点击Compress/expandsubtree后,在要压缩的分枝处点击,出现以下界面,在name/caption中输入文件名(例如),其他还有很多的选项,设置好了,点击OK。所得到的结果,可以在压缩和扩展之间转换。10.调整进化树根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在PHOTOSHOP中修改等。完成后的进化树应包含充足的信息。参考网友的进化树完成图如下: