系统发育分析之BI篇(By+Raindy)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

FujianAgricultureandForestryUniversity系统发育分析Phylogenetic Analysis2013.09RAINDYOK@QQ.COM生信系列(Mrbayes篇)特点:基于进化模型的统计推论法,具有完整而坚实的数学和统计学基础,可以处理复杂而接近实际情况的进化模型,可以将现有的系统发育知识整合或体现在先验概率中,通过后验概率直观反映出各分支的可靠性而不需要通过自举法检验。缺点:对进化模型比较敏感,BI法中指定的每个氨基酸的后验概率建立在许多假说条件下,在现实中可能不成立。适用:大或复杂的数据集。贝叶斯法(Bayesianinference,BI)BI简介多序列比对保守区选择进化模型选择系统发育树构建Clustalx/MEGA/MAFFTGblock0.91bModelTest/MrModeltest/JmodelTest/ProTestMrbayes3.2BI树查看及美化Figtreev1.4.0饱和度检测饱和未饱和不适合建树适合建树DAMBE建树流程多重序列比对MAFFT/Clustalx/ClustalWClustalW(Codons)、Muscle(codons)1st详见本人相关的教程《Clustalx多重比对图解教程(ByRaindy)》《MAFFT多重序列比对图解教程(ByRaindy)》,此处不再赘述。MAFFTDOS界面ClustalxGUI界面ClustalW(Codons)inMEGA序列保守区的选择Gblock0.91b2nd在线提交:=gblocks=gblocks提交上步多重比对后的序列蓝色为保守区序列参数信息昀终得到的保守区序列在MEGA中导出为PAUP专用的nex格式替换饱和检测DAMBE3rd•PAUP软件验证替换饱和:在PAUP中分别计算p距离和GTR+I+G距离,然后在Excel中做散点图。如果散点分别在y=x直线上,就说明没达到饱和;如果GTR+I+G距离p距离,就说明饱和了。本法操作比较繁琐,详见《TheMitochondrialGenomeoftheHouseCentipedeScutigeraandtheMonophylyVersusParaphylyofMyriapods》一文。•DAMBE 软件验证替换饱和:若ISSISS.c且p=0.0000(极其显著),说明序列替换未饱和,适合建树!较前一方法,DAMBE法操作更为简单,推荐使用。核苷酸替代模型的选择MrMTGui、PAUP、ModelTest、MrModelTest4th『RunPAUP』选择得到的*.scores文件以MrModelTest为例『Selectfile…』『MrModelTest』选择nexus文件,计算后得到*.scores文件详见《图解核苷酸替代模型的选择(ByRaindy)》一文1运行PAUP2选择*.nex文件PAUP自动计算各模型的scores值34计算完毕,得到scores文件,不建议直接运行(否),建议先保存(Savescores)。保存*.scores文件576在运行Mrmodeltest前,先通过“Selectfile”选择上步保存的.scores文件MrModeltest运行得到两个不同标准的结果:hLRT和AIC会出现两个运行结果,一个是hLRT得出的结果,另一个是AIC给出的结果。8模型参数在运行Mrbayes前,需要在模型参数基础添加上其他相关脚本Beginmrbayes;outgroupseqnamelsetnst=6rates=gamma;prsetstatefreqpr=fixed(equal);mcmngen=2000000aprintfreq=1000samplefreq=100bnchains=4savebrlens=yesfilename=P_combined;sumtfilename=P_combined.tburnin=2000c;end;蓝色部分为上步得到的模型参数,在此基础上补充其他运行脚本;a共运行代数,抽样数=运行代数/抽样频率;b每100代生成的树及参数记录在一个文件中;c为舍弃的样本数,一般为树总数的25%MrBayesblock参考脚本(完整)外群(outgroup),直接输入序列中对应的外群名称MrBayes建树Mrbayes3.25th运行Mrbayes,输入exe*.nex回车即可0.0133660.01运行Mrbayes后,注意观察Averagestandarddeviationofsplitfrequencies后面的值:当这个值0.01时,说明两次运行的结果差异较大,可以输入“y”需要继续运行,代数可以根据需要输入,如:继续运行10万代,则输入100000;当这个值0.01时,说明两次运行的结果差异显著,可以输入“n”终止运行;0.0086940.01运行结束后,可以输入quit命令退出程序;BI 建树查看及美化Figtree1.2.4/Treegraph6th用Figtree1.2.4/Treegraph打开*.nex.con.tree查看美化,本文不再赘述。基于pipo基因氨基酸序列重建的Potyvirus贝叶斯树分支节点上的数值为后验概率(50%),蓝色显示的为PVY分离物(含本研究的20个分离物)PVYCP基因核苷序列基于贝叶斯法重建的系统发育树分支节点上的数值为后验概率(>0.50),粗体加框显示的为本研究14个省(直辖市)分离物在重建贝叶斯树过程中,建立4个马尔可夫链,以随机树为起始树,共运行2,000,000代,每100代抽样1次。舍弃25%老化样本后,根据剩余的样本构建一致树,并计算后验概率(Posteriorprobability)。TuMV作为外群(outgroup)MrBayesblock设置请根据下列方法的描述,写出MrBayes脚本数据不稳定时,可以在lset中修改ngammacat值,默认为4,可以修改为8或16,但运行强度增大建树前,使用MAFFT软件对建树的64条蛋白质序列进行多重序列比对,利用ProtTest3.0选择昀优化的蛋白质进化模型——JTT(Jones,Taylor,Thornton)+F模型,使用Mrbayes3.04b软件重建Potyvirus贝叶斯系统发育树。在重建贝叶斯树过程中,建立4个马尔可夫链,以随机树为起始树,共运行4000000代。每100代抽样1次,舍弃25%老化样本后,根据剩余的样本构建一致树,并计算后验概率(Posteriorprobability)。MrBayesblock设置请根据下列方法的描述,写出MrBayes脚本[1].高芳銮,沈建国,史凤阳,方治国,谢联辉,詹家绥.我国马铃薯Y病毒的检测及CP基因的分子变异.中国农业科学,2013.PDF版下载:[2]高芳銮,沈建国,史凤阳,常飞,谢联辉,詹家绥.马铃薯Y病毒pipo基因的分子变异及结构特征分析.遗传,2013.PDF版下载:=PDF&id=21105注:建树相关数据,可以访问网盘()示例数据目录下的ChinaCP.nex;范例参考Whenappliedtoshorteralignments,GBLOCKSoftenhasanunwantedeffectontopologyandbootstrapvaluesoftheestimatedphylogenies-theexclusionofsomanycolumnsfromthefinalanalysisbytheprogramsimplyremovingtoomuchinformationfromtheanalysis.However,forlongeralignments,itcanbeshownthatithasapositiveeffect.Gblock应用《系统发育分析图解教程》之BI篇E-mail:raindy@fafu.edu.cnorraindyok@qq.comNetdisk::

1 / 39
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功