SPSS操作—方差分析方差分析由英国统计学家R.A.Fisher在1923年提出,为纪念Fisher,以F命名,故方差分析又称F检验。三种变异•总变异:全部观察值大小各不相等,其变异就称为总变异(totalvariation)。用SST表示•组间变异:由于各组处理不同所引起的变异称为组间变异(variationbetweengroups)。它反应了处理因素对不同组的影响,同时也包括了随机误差。用SS组间表示•组内变异:每个处理组内部的各个观察值也大小不等,与每组的样本均数也不相同,这种变异称为组内变异(variationwithingroups)。组内变异只反映随机误差的大小,如个体差异、随机测量误差等。因此,又称为误差变异。用SS组内表示方差分析中的多重比较•目的:–如果方差分析判断总体均值间存在显著差异,接下来可通过多重比较对每个水平的均值逐对进行比较,以判断具体是哪些水平间存在显著差异。•常用方法备选:–LSD法:t检验的变形,在变异和自由度的计算上利用了整个样本信息。–Duncan新复极差测验法–Tukey固定极差测验法–Dunnett最小显著差数测验法等•实现手段:–方差分析菜单中的“Posthoctest…”按钮实例-多重比较步骤一:同one-wayANOVA步骤二:选“Posthoctest”勾选多重比较的方法(如LSD、duncan法确定显著性水平continuePostHocTest方差分析的思路:将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异,构造出反映各部分变异作用的统计量,在此基础上,构建假设检验统计量,以实现对总体参数的推断。检验假设:H0:三个组的总体均数相同;H1:三个组的总体均数不全相同;方差分析步骤单因素方差分析•也称有一维方差分析,对二组以上的均值加以比较。•检验由单一因素影响的一个(或几个相互独立的)分析变量由因素各水平分组的均值之间的差异是否有统计意义。•并可以进行两两组间均值的比较,称作组间均值的多重比较,还可以对该因素的若干水平分组中哪些组均值不具有显著性差异进行分析,即一致性子集检验。•步骤Analyze→Comparemeans→One-wayANOVAOne-Way过程•One-Way过程:单因素简单方差分析过程。在CompareMeans菜单项中,可以进行单因素方差分析(完全随机设计资料的多个样本均数比较和样本均数间的多重比较,也可进行多个处理组与一个对照组的比较)、均值多重比较和相对比较,用于。•One-WayANOVA过程要求:因(分析)变量属于正态分布总体,若因(分析)变量的分布明显的是非正态,应该用非参数分析过程。对被观测对象的实验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用RepeatedMeasure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。•analyze→comparemeans→one-wayANVOA响应变量因素Contrasts:线性组合比较。是参数或统计量的线性函数,用于检验均数间的关系,除了比较差异外,还包括线性趋势检验Contrasts可以表达为:a1u1+a2u2+···+akuk=0;满足a1+a2+···+ak=0。式中ai为线性组合系数,ui为总体均数,k为分类变量的水平数•Polynomial(多项式比较):均值趋势的检验有5种多项式:Linear线性、Quadratic二次、Cubic三次、4th四次、5th五次多项式•Coefficients:为多项式指定各组均值的系数。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由根据研究的需要输入。•如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。•例如,当k=4时,即有A、B、C、D4个处理组,如果只将B组和D组比较,则线性组合系数依次为0、-1、0、-1;如果C组与其他3组的平均水平比较,则线性组合系数依次为-1、-1、3、-1,余类推。线性组合系数要按照分类变量水平的顺序依次填入Coefficients框中。均值的多项式比较•可以同时建立多个多项式。一个多项式的一级系数输入结束,激活Next按钮,单击该按钮后Coefficients框中清空,准备接受下一组系数数据。•如果认为输入的几组系数中有错误,可以分别单击Previous或Next按钮前后翻找出错误的一组数据。单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后击Change按钮,在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激活Remove按钮;单击该按钮将选中的系数清除。PostHoc(均数的多重比较选项)•进行多重比较是对每两个组的均值进行如下比较:MEAN(i)-MEAN(j)≥4.6625×RANGE×SQRT(1/N(i)+1/N(j));其中i、j分别为组序号,MEAN(i)、MEAN(j)分别为第i、j组均值,N(i)、N(j)分别为第i、j组中的观测数。各组均值的多重比较方法的算法不同RANGE值也不同。方差相等时可选择的比较方法方差不等时可选择的比较方法与对照组的配对比较用t检验完成各组均值的配对比较•LSD(最小显著差异法):用t检验完成各组均值间的配对比较。在变异和自由度的计算上利用了整个样本信息。对多重比较误差率不进行调整;(此法最敏感)•Bonferroni(修正最小显著差异法):用t检验完成各组均值间的配对比较,但通过设置每个检验的误差率来控制整个误差;(应用较多)•Sidak(斯达克法):计算t统计量进行多重配对比较,可以调整显著性水平,比Bonferroni法的界限要小•Scheffe(谢弗检验法):对所有可能的组合进行同步进入的配对比较,这些选择可以同时选择若干个,以便比较各种均数比较方法的结果;•R-E-G-WF(赖安-艾耶-盖F法):用F检验进行多重比较检验,显示一致性子集表;•R-E-G-WQ(赖安-艾耶-盖Q法):正态分布范围进行多重配对比较;显示一致性子集表;•S-N-K(SNK法):用studentrange分布进行所有各组均值间的比较;(应用较多)•Tukey(图基法):固定极差测验法,用student-range统计量进行所有组间均值的配对比较,将所有配对比较误差率作为实验误差率;•Tukey’s-b(图基s-b法):用studentrange分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值;•Duncan(邓肯法):新复极差测验法,指定一系列的的Range值,逐步进行计算比较得出结论;•Hochberg’sGT2(霍耶比GT2法):用正态最大系数进行多重比较•Gabriet(盖比理法):用正态标准系数进行配对比较,在单元数较大时,这种方法较自由;•Waller-Duncan(瓦尔-邓肯法):用t统计量进行多重比较检验。使用贝耶斯接近;•Dunnett(邓尼特法):最小显著差数测验法,进行各组与对照组的均值,默认的对照组是最后一组;选定此方法后,激活下面的ControlCatetory参数框,展开小菜单,选择对照组•Tamhane‘sT2(塔海尼T2法):t检验进行配对比较;•Dunnett’sT3(邓尼特T3法):正态分布下的配对比较;•Games-Howell(盖门-霍威尔法):各组均值的配对比较,该方法较灵活;•Dunnett’C(邓尼特C法):正态分布下的配对比较。常用的多重比较方法的适用性•LSD(LeastsignificantDifference):存在明确对照组,进行验证性研究;两均数间的比较是独立的•T(Tukey)方法:如果事先未计划未计划多重比较,在方差分析得到由统计学意义的F值之后,有需要进行任意两组之间的比较,且各组样本数相同•S(Scheffe)方法:多个均值间的比较,且各组样本数不相同•SNK(Student-Newman-Keul)方法:两两比较次数不多常用的方法有LSD,Scheffe法,SNK法,Turky法,Duncan法和Bonferroni法等。其中LSD法最敏感,Scheffe法不敏感,SNK法和Bonferroni法应用较多。Options(输出统计量的选择)•Descriptive复选项,要求输出描述统计量。选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95%可信区间;•Fixandrandomeffects:输出固定效应模型的标准差、标准误和95%可信区间与随机效应模型的标准误和95%可信区间;•Homogeneityofvariance复选项,要求进行方差齐次性检验,并输出检验结果。•Brown-Forsythe:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。•Welch:检验各组均数相等,当不能确定方差齐性检验时,该统计量优于F统计量。•Meanplot复选项,即均数分布图,横轴为分类变量,纵轴为反应变量的均数线图;•MissingValues栏中,选择缺失值处理方法。①Excludecasesanalysisbyanalysis选项,对含有缺失值的观测量根据缺失值是因变量还是自变量从有关的分析中剔除。②Excludecaseslistwise选项对含有缺失值的观测量从所有分析中剔除饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6实例-单因素方差分析各处理重复数不等的方差分析用四种饲料喂养19头猪比较,四种饲料是否不同。实例-单因素方差分析•第一栏:方差来源•第二栏:离均差平方和•第三栏:自由度•第四栏:均方(第二栏与第三栏之比)•第五栏:F值(组间均方与组内均方之比)•第六栏:F值对应的概率即P值ANOVAWEIGHT20538.7036846.233157.467.000652.1591543.47721190.8618BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.实例-单因素方差分析(结果输出)存在问题与解决方法•本例只考虑了猪体重的增加量,对其均值进行了比较。但实际工作中的问题往往不是这样简单,例如是否应该考虑每头猪的进食量对体重增加的影响,去除这个影响比较猪体重的增加会对饲料比较得出更切合生产实际的结论。这个问题应该使用ANOVA过程的协方差分析功能去解决。•使用系统默认值进行单因素方差分析只能得出是否有显著性差异的结论,本例数据量少,哪两组之间差别最大,哪种饲料使猪体重增加更快,几乎是可以看出来的。•实际工作中往往需要两两的组间均值比较。这就需要使用One-wayANOVA进行单因素方差分析时使用选择项从而获得更丰富的信息,使分析更深入。例题进一步分析•用4种饲料喂猪,共19头猪分为四组,每组用一种饲料。一段时间后称重。猪体重增加数据如下。比较四种饲料对猪体重增加的作用有无不同;并比较A、C饲料效应和与B、D效应和之间是否有显著性差异。饲料ABCD133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6指定多项式系数•1.0×mean1-1.0×mean2-1.0×mean3+1.0×mean4检验饲料对使猪体重增加的效应,A、D饲料效应和与B、C饲料效应和之间是否有显著性差异;•1.0×mean1-1.0×mean2+1.0×mean3-1.0×mean4检验A、C饲料效应和与B、D效应和之间是否有显著