多变量分析(MultivariateAnalysis)—CANOCO5.0应用强烈推荐原版说明书:Leps,J.andP.Smilauer,MultivariateanalysisofecologicaldatausingCANOCO.2003:CambridgeUniversityPress.193-193.提纲1为什么需要排序?2排序的含义3CANOCO5.0使用1为什么需要排序?当考察植物或动物群落沿着一系列环境条件下的变化情况,我们经常发现在不同条件的群落不仅物种组成变化很大,而且这些变化往往具有连续性和可预测性。通过排序分析,我们可以认识群落格局,也可以将排序轴跟我们已知的环境条件联系起来,看是否代表某一环境梯度。当然,也许我们必须用统计手段来检验排序轴到底是否真能代表环境因子的梯度。1为什么需要排序?线性回归多变量分析—排序1相关分析是研究两组变量之间的相关性是主成分分析和因子分析的进一步发展;是偏最小二成回归的理论基础;把两组变量之间的相关变为研究两个新变量之间的相关,同时不抛弃原来变量的信息;两组变量的个数和性质可以是不同的。2结构方程模型是路径分析和因子分析的进一步发展直接/间接效应,评估不可测变量数据要求多变量正态,模型不容易收敛2排序2.1定义Ordinationorgradientanalysis,inmultivariateanalysis,isamethodcomplementarytodataclustering,andusedmainlyinexploratorydataanalysis(ratherthaninhypothesistesting).Ordinationordersobjectsthatarecharacterizedbyvaluesonmultiplevariables(multivariateobjects)sothatsimilarobjectsareneareachotheranddissimilarobjectsarefartherfromeachother.Suchrelationshipsbetweentheobjects,oneachofseveralaxes(oneforeachvariable),arethencharacterizednumericallyand/orgraphically.(维基百科)排序一词是由苏联学者Ramensky于1930年提出来的,所谓排序就是把一个地区内所调查的群落样地,按照相似度来排定各样地的位序,从而分析各样地之间的相互关系。排序分为两类。一是群落排序,用植物群落本身属性(如种的出现与否,种的频度、盖度等),排定群落样地的位序,称为连接排序,又称间接梯度分析或者组成分析。另一类排序是利用环境因素的排序,称为直接排序,又称为直接梯度分析或者梯度分析,即以群落生境或其中某一生态因子的变化,排定样地生境位序。2.2分类主成分分析Principalcomponentsanalysis(PCA)多维排列non-metricmultidimensioalscaling(N-MDS)对应分析Correspondenceanalysis(降趋势对应分析DCA,典范对应分析CCA)Bray-Curtis相异度分析冗余分析Redundancyanalysis物种响应环境梯度模型(线性,单峰,去趋势单峰模型)2.3名词解释①响应变量responsevariable:相当于因变量,又称物种数据②解释变量explanatoryvariables:相当于自变量,又称环境变量,经常分为主环境变量和协环境变量。③典范轴/约束性轴canonicalaxis:受到自变量与因变量约束的坐标轴。④蒙特卡洛检验MonteCarlomethods:检验是否显著⑤简单效应与边界效应simple/conditionaleffect⑥前向选择forwardselection:剔除自变量的多重共线性3CANOCO5.0使用影响群落,土壤湿度、养分、酸碱度等影响因素是什么?解释率?重要程度?。。。1.数据导入准备(物种数据+环境数据);导入;物种数据转化(模型中有对应模块,不需要提前转化。log变换确保物种数据大于0;物种数据不同量纲时需进行中心化与标准化)2.分析步骤新建分析;选择数据;选择分析方法(梯度长度3线性,4单峰);数据转化;选择关注点。3.作图双标图步骤-以冗余分析RDA为例1,数据准备,最好在一个excel文件中准备两个sheet表格,一个是物种变量数据,一个是环境变量数据,注:行数应该一样即样方数一样。2,打开canoco5.0软件,数据导入:File-Importproject-fromExcel打开数据导入对话框导入物种数据(同时兼容可以导入5.0之前的数据格式,若环境变量有名义性(分类)变量字符,无需转化,5.0版可以识别)。Date-Addnewtable-ImportfromExcel继续导入环境变量数据.1File处导入数据,2导入的变量性质,物种数据(因变量)还是环境自变量数据。3对这个表格的命名,可以随意填,但不能为空,可以用默认的4数据类型选择,若有缺失值用missing.5导入了一个表格后,才能打开Data步骤-以冗余分析RDA为例3新建RDA分析New-…StandardAnalyses中选择Constrained分析打开约束性分析对话框。可以剔除不需要的环境变量。选择排序方法,CANOCO自动计算了梯度长度,并推荐了排序方法,本例是0.6,小于3,所以推荐的RDA。1新建分析,选择所需要的数据,因为RDA是约束性分析所以物种与环境数据都需要,选择关注的物种数据。2选择约束性分析3根据梯度长度0.63选择线性模型RDA。4物种数据Log变化,然后因为物种数据量纲不一致,选择中心化与标准化处理。步骤-以冗余分析RDA为例1是对约束轴显著性的检验2是前向选择,选择这个会打开前向选择对话框,通过自变量Conditionaleffect效应从大到小人工选择。3能够得到变量simple(即marginal)与conditionaleffect解释率。4随机置换检验设定,一般默认吧步骤-以冗余分析RDA为例数据结果1数据汇总,包括样方即采样点106个,响应变量物种变量2个,环境变量17个2方法汇总,采用的RDA分析,其中环境变量对响应变量总解释率59.1%,调整后的R2是51.2%。4坐标轴解释率5坐标轴累积解释率步骤-以冗余分析RDA为例1默认会自动生成一个物种-环境变量双标图。2可以通过菜单栏Graph-Showattributeeditor打开图片编辑来编辑对话框。3右击图片,Describecontent有如何解释图中含义。谢谢!仅供参考