CCA一、概述基于对应分析发展的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。主要用来反映菌群与环境因子之间的关系。RDA是基于线性模型,CCA是基于单峰模型。分析可以检测环境因子、样品、菌群三者之间的关系或者两两之间的关系。RDA或CCA选择原则:先用species-sample资料做DCA分析,看分析结果中Lengthsofgradient的第一轴的大小,如果大于4.0,就应选CCA;如果在3.0-4.0之间,选RDA和CCA均可;如果小于3.0,RDA的结果要好于CCA。二、图的解释二、/allwegene3/project/16s/20180307/180305_M03506_0115_000000000-BMW49-025/LMMIXAA800083-14/AWGT18020201-NJ/all/clean_tag/fa/project/distribution/allwegene3/project/16s/20180307/180305_M03506_0115_000000000-BMW49-025/LMMIXAA800083-14/AWGT18020201-NJ/all/clean_tag/fa/project/distribution做法标准输入:环境因子和样本的数据(注意:样本不是分组),示例如下(表格1env.xls):样本和关注的种属或otu(topn)丰度的数据,以属水平top20为例(表格2genus.xls):注意:(1)第一列为样本名称,与上图一致。(源文件相比相对丰度5.result.txt需按行求和排序取top20,转置后成下表)(2)由于之后导入软件直接显示出的名称会过短,使得不同种属名称不易区分,故在属和种的表格输入前需要标注123等数字区分。(3)需要将g__和s__等标识去掉。(一)软件版1.导入数据将上述两个表格导入软件Wcanolmp中,具体方法:打开软件Wcanolmp,将表格2选中复制到excel的粘贴板中,选择save保存,如图:输入保存的文件名称genus如下图即为保存成功。表格1保存方式如上图。最后分别得到属或种或otu和环境因子的dta文件。2模型选择打开canocoforwindows软件,选择File—Newproject如下点击下一步,选择物种所在位置,输入solutionfilename名称,点击下一步直到最后。点击analyze,出现下图,选择savelog则保存下图:选取上图中Lengthsofgradient行中最大的数字进行判定。若小于为3RDA;若大于4为CCA;3和4之间CCA和RDA均可。确定完模型后,点击File—Newproject,选择如下:点击下一步。选择上面生成的物种和环境因子文件,在solution中输入输出文件名称,此示例中为rda模型。选择下一步。选择RDA,一直点击下一步。输入输出文件的名字,点击保存。点击Analyze,然后savelog.贡献率为species-environment第一贡献率为79.2%,第二个贡献率为90.2%-79.2%=11%,第三贡献率为94.5-90.2=4.2%,四贡献率为97.6-94.5=3.1%点击CanoDraw键可以直接打开软件,修改project里的apearrance里的name。选择保存。保存后在横轴的菜单栏里选择Create。若想得到两者之间的关系则选择BiplotsandJoint,显示如下图。根据自己的需求选择Speciesandenvvariables(物种和环境因子),Speciesandsamples(物种和样本),Samplesandenv(环境因子和样本)若想得到环境因子,物种,样本三者的关系则选择Create—Triplots—withEnvironmentvariables。下面以环境因子,物种,样本三者的关系为例。如下图所示:下面需要对上图进行进一步调整。调整原则:图形上重合的标注需要手动移动开,超出边框的字移动进来字体大小适中,菌名,环境因子名称样本名称显示完整。图中圆圈代表样本,1-12分别是表图例可以移动到图形右侧,或用画图软件另生成图例(具体方法略)。点击右键选择selectsuchlike,selectsimilar后选中按F5来选择相应的字体和大小。选择changtext来改变标注内容。调整后示例如下:图形的保存选择File–Export保存为png和metafile各一张。