Mothor分析atpD过程记录2012-11-22Mothur软件分析OTU或将序列归为不同的种类,见相似性部分(前半部分,第2到15张ppt),或按是否完全一样来分(最后的4张ppt)。1.用Mothur确定OTU•也就是将序列相似性97%的定为一个OTU。如果按PlosOne上提出的三个基因的相似性为准(如下),那么就能定出OTU了。ZhangYM,TianCF,SuiXH,ChenWF,ChenWX(2012)RobustMarkersReflectingPhylogenyandTaxonomyofRhizobia.PLoSONE7(9):e44936.如何在dos环境下运行mothur?•(1)文件准备:将目标序列保存为fasta格式;•(2)将mothur.exe与x.fasta放在同一文件目录下:•(3)打开mothur,注意在英文输入法下打开mothur,否则会造成程序不响应。(4)调用dist.seqs指令,产生距离矩阵;•输入完后按enter•calc以不同方式处理gap:onegap指把所有把对偶排列中出现的所有连续缺失的碱基当做一个•gap;nogap按实际缺失的碱基数对待;默认为onegap;•countends:用以处理末端gap的罚分,=F,指对末端gap不罚分;=T指对末端gap进行罚分;•cutoff:OTU的分界阈值•Output:lt(指lowtriangle)或square,指输出距离矩阵为下三角还是矩形•运行之后产生一个输出文件:•注意文件格式:xxx.phylip.dist,该文件位于同一个目录下,见下页。生成的文件:atpD_Aligned-fasta.phylip.dist•说明:与Mega5中形成的距离值类似。用记事本打开生成的文件:atpD_Aligned-fasta.phylip.dist,如下,为距离值•(5)读入距离矩阵,用cluster进行OTU聚类(PS:mothur的早期版本此处要用read.dist先读入距离矩阵,最新版本将其与cluster指令整合在一起)•Method有三种选择:回车,屏幕显示如下结果:(7)输出OTU的分类结果,用bin.seqs指令xxx.phylip.fn.0.01.fasta文件对应于序列相似为99%的OTU(cutoff=0.01);xxx.phylip.fn.0.03.fasta文件对应于序列相似为97%的OTU(cutoff=0.03)[这个上面的输出中没有,是举个例子,来自于原始的文件]用记事本打开atpD_Aligned-fasta.phylip.fn.unique文件,即可看出将每个序列归到不同的种类里去,即OTU。从中可看出,12个序列共有7个OTU。这与Mega5中聚树结果是一致的。给出独特的序列:7个OTU,99%相似性以上的:5个OUT,输出的文件见相应的名字。打开文件如下,将序列归类,与前面的一致,但是没有了序列,只有序列号名字。如果为unique,则表示某一个序列与其它的全一样,或全不一样。并将其中一个序列定为代表序列,如atpD_15644。•或如下,有0.01,则将99%以上相似性的序列归到一起。并将其中一个序列定为代表序列,如atpD_15644。这张片子在我处理的数据中没有,因为没有低于97%的序列,因此没有出现这种情况。一篇博士论文中提到的Unique.seq也应与前面的原理一样。可以试着做一下。•测试成功!见下面的片子!使用unique.seqs分析独特的序列类型•在Mothur中输入:Unique.seqs(fasta=XXX.fasta),回车。即能计算出来。如我分析的atpD序列,共12个序列,产生7个独特的序列。并产生两个文件。两个文件的内容见下页。输入的命令产生的结果,12条序列,7个独特的序列产生的两个文件,打开后见下页。新生成的文件•文件格式为xxx.names和xxx.unique.fas,如上图所示。打开文件•第一个文件(上图)将序列归类,并给出代表菌株;第二个文件(下图)将代表序列给了出来。•谢谢!