实验三.系统发育分析软件的使用分子系统发育分析•系统发育分析研究是研究物种进化和系统分类的一种方法,研究对象为携带遗传信息的生物大分子序列,采用特定的数理统计算法来计算生物间的进化关系。并用系统进化树,即一种类似树枝状得图形来概括生物间的这种亲缘关系。分子系统发育分析•系统发育进化树(Phylogenetictree)用一种类似树状分支的图形来概括各种生物之间的亲缘关系。•系统进化树的主要构成:结点(node):每个结点表示一个分类单元(属、种群)。进化分枝(Clade):是指由同一生物进化而来的单一系统群。实体抽象为节点,实体间的进化关系抽象为连接分子系统发育的核心为构建系统发育进化树人猩猩狒狒外群分支长度根进化支结点系统进化树(1)系统发育进化树示例进化拓扑结构:进化树中不同枝的拓扑图形。根:所有分类的共同祖先。结点:表示一个分类单元。进化支:两种以上生物(DNA序列)及其祖先组成的树枝。进化分支:进化关系的图形表示进化分支长度:用数值表示的进化枝的变化程度(遗传距离)距离标尺:生物体或序列之间差异的的数字尺度。外群:与分析序列相关的生物序列且具有较远的亲缘关系距离标尺一个单位结点多序列比对(自动比对,手工校正)选择建树方法建立进化树进化树评估系统发育树重建分析步骤•1.距离法(distance)适用序列有较高相似性时•2.最大简约法(maximumparsimony,MP)适用序列有很高相似性时•3.最大似然法(maximumlikelihood,ML)–可用于任何相关序列集合1.基于序列距离特征2+3基于序列离散特征•计算速度:–距离法最大简约法最大似然法系统发育树重建的基本方法系统发育树重建分析过程直系同源序列合理的外群点阵法动态规划法字串法系统发育树构建的相关软件•ClustalX(序列比对软件)•Modeltest&MrModeltest(碱基替换模型筛选软件)•PHYLIP•MEGA•PHYML•PAUP•BEAST•Figtree(树形显示软件)•TreeView(树形显示软件)系统发育树构建软件•构建NJ树,可以用PHYLIP或者MEGA•构建MP树,可以使用PHYLIP或者MEGA•构建ML树可以使用PHYML,速度快,同时构建ML树还可以用PHYLIP,•贝叶斯的算法以MrBayes为代表,不过速度比较慢关于系统发育分析的更多知识请参阅:•实例讲解下面的内容将教大家如何来构建自己的系统进化树。首先我们需要回忆一个很重要的问题,什么是Fasta格式?在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的第一行是由大于号“”或分号“;”打头的任意文字说明(习惯常用“”作为起始),用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。•构建我们自己的Fasta文件Fasta文件是直接可以从数据库中下载得到的,但是根据实际要求的不同,有时候我们需要自己构建Fasta文件。如果您已近有了想用来构建进化树的序列,您可以如右图所示构建自己的文件,文件的保存格式是:文件名.txt•实例讲解下面我们以版纳病毒为例,构建系统进化树。首先我们要下载我们所需的序列。•实例讲解文件下载完之后,这里我们采用事先准备好的序列。将Fasta文件直接用ClustalX1.83打开•实例讲解在进行多序列比对之前我们需要对软件进行一些设置1.选择Alignment标签2.选择OutputformatoptionsPHYLIP软件:PHYLIPMEGA软件:FASTA点击DoCompleteAlignment,选择保存路径之后点击ALIGN,。•实例讲解•实例讲解序列比对结束后,比对结果自动跳出。在保存的路径,获取预设的保存格式。Bannavirus.FASTABannavirus.phy•MEGA(MolecularEvolutionaryGeneticsAnalysis)该软件是由Kumar等编写的进行分子进化遗传分析的免费软件包,能对DNA、mRNA、氨基酸序列及遗传距离进行系统发生分析。在建树方法上,提供了目前最常用的UPGMA,ML,NJ及MP法,对所获得树也可进自举值检验及标准误估计可靠性检验。优点为:简单易用最新版本下载/地址为:http:/•实例讲解_MEGA软件构建系统进化树•实例讲解下一步我们将介绍如何用MEGA构建我们的进化树,首先请大家用MEGA软件将我们之前保留的Fasta文件打开这时候会有两个窗口,选择File标签--ConvertfileformattoMega.菜单栏工具条•实例讲解选择File标签--ConvertfileformattoMega.当给出相应的文件路径之后点击ok显示文件已经转化为MEGAFormat,点击OK.将文件保存,牢记路径•实例讲解点击,载入MEGA格式的分析序列•实例讲解选择数据类型,在本次测试中我们用的是核苷酸序列。根据实际的情况我们这里选择YES选项•实例讲解下一步进入建树的最后阶段在Plylogeny中选择建树方法,这里我们选择NJ法。参数设置好之后点击compute.蛋白质序列一般选择PoissonCorrection(泊松校正),对于核苷酸序列一般采用P-distance模型•实例讲解根据Mega的计算最终我们得到了序列中的进化关系。如果结点的BootstrapValue70我们认为这个分支是可靠的BANNAchBJ9575YN6YN0556LN0684LN0688LN0689JKT6969JKT6423JKT7043LNVNE971294100811008899681000.05优化图标优化选项栏•第一步:双击打开PART2,SEQBOOT,•SEQBOOT生产随机样本的程序。•按路径输入刚才生成的*.PHY文件;为了避免输入路径的繁琐,可以直接将文件COPY至PART2文件夹中。•第二步:点击回车,出现参数设置页面。设定适当参数;输出outfile文件。Randomnumberseed:进化树进行抽样时从第几棵树开始。•第二步:设置参数后,输入Y。出现Randomnumberseed设置提示行。将抽样过得序列转换•DNADIST