Mothur软件用于OTU分析或序列分型(sequence type,ST)

ww7210
1 ℃
2020-02-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

Mothor分析atpD过程记录2012-11-22Mothur软件分析OTU或将序列归为不同的种类，见相似性部分（前半部分，第2到15张ppt），或按是否完全一样来分(最后的4张ppt)。1.用Mothur确定OTU•也就是将序列相似性97%的定为一个OTU。如果按PlosOne上提出的三个基因的相似性为准（如下），那么就能定出OTU了。ZhangYM,TianCF,SuiXH,ChenWF,ChenWX(2012)RobustMarkersReflectingPhylogenyandTaxonomyofRhizobia.PLoSONE7(9):e44936.如何在dos环境下运行mothur？•(1)文件准备：将目标序列保存为fasta格式；•(2)将mothur.exe与x.fasta放在同一文件目录下：•(3)打开mothur，注意在英文输入法下打开mothur，否则会造成程序不响应。(4)调用dist.seqs指令，产生距离矩阵；•输入完后按enter•calc以不同方式处理gap:onegap指把所有把对偶排列中出现的所有连续缺失的碱基当做一个•gap;nogap按实际缺失的碱基数对待；默认为onegap;•countends:用以处理末端gap的罚分，=F,指对末端gap不罚分；=T指对末端gap进行罚分；•cutoff：OTU的分界阈值•Output:lt(指lowtriangle)或square,指输出距离矩阵为下三角还是矩形•运行之后产生一个输出文件：•注意文件格式：xxx.phylip.dist，该文件位于同一个目录下，见下页。生成的文件：atpD_Aligned-fasta.phylip.dist•说明：与Mega5中形成的距离值类似。用记事本打开生成的文件：atpD_Aligned-fasta.phylip.dist，如下，为距离值•（5）读入距离矩阵，用cluster进行OTU聚类(PS:mothur的早期版本此处要用read.dist先读入距离矩阵，最新版本将其与cluster指令整合在一起)•Method有三种选择：回车，屏幕显示如下结果：(7)输出OTU的分类结果，用bin.seqs指令xxx.phylip.fn.0.01.fasta文件对应于序列相似为99%的OTU(cutoff=0.01);xxx.phylip.fn.0.03.fasta文件对应于序列相似为97%的OTU(cutoff=0.03)[这个上面的输出中没有，是举个例子，来自于原始的文件]用记事本打开atpD_Aligned-fasta.phylip.fn.unique文件，即可看出将每个序列归到不同的种类里去，即OTU。从中可看出，12个序列共有7个OTU。这与Mega5中聚树结果是一致的。给出独特的序列：7个OTU，99%相似性以上的：5个OUT，输出的文件见相应的名字。打开文件如下，将序列归类，与前面的一致，但是没有了序列，只有序列号名字。如果为unique，则表示某一个序列与其它的全一样，或全不一样。并将其中一个序列定为代表序列，如atpD_15644。•或如下，有0.01，则将99%以上相似性的序列归到一起。并将其中一个序列定为代表序列，如atpD_15644。这张片子在我处理的数据中没有，因为没有低于97%的序列，因此没有出现这种情况。一篇博士论文中提到的Unique.seq也应与前面的原理一样。可以试着做一下。•测试成功！见下面的片子！使用unique.seqs分析独特的序列类型•在Mothur中输入：Unique.seqs(fasta=XXX.fasta)，回车。即能计算出来。如我分析的atpD序列，共12个序列，产生7个独特的序列。并产生两个文件。两个文件的内容见下页。输入的命令产生的结果，12条序列，7个独特的序列产生的两个文件，打开后见下页。新生成的文件•文件格式为xxx.names和xxx.unique.fas，如上图所示。打开文件•第一个文件（上图）将序列归类，并给出代表菌株；第二个文件（下图）将代表序列给了出来。•谢谢！