-33-第五章方差分析方差分析是由费歇尔(R.A.Fisher)提出的,它与t检验相比优越之处在于可以同时检验多个平均数之间的差异,并且可以解释几个因素水平之间的交互作用。如教学效果受教法、教材、学生接受能力等诸多因素的影响,要研究这些因素对教学效果的影响程度、分析它们之间交互作用的大小,t检验方法就无能为力了,而方差分析正是为解决这类问题提供的一种有效的方法。方差分析分为单因素、多因素方差分析、协方差分析、多元方差分析、重复试验设计的方差分析与方差成分分析。方差分析的内容较多,一般在基本统计中介绍单因素方差分析,其他方法介绍得较少,而本章主要介绍这些方法。第一节方差分析的基本概念1.常用术语1.1因变量试验中要观测的量,即所要考察的结果。1.2因素影响因变量的指标,也称为自变量。1.3水平因素在试验时所分的等级或因素不同的状态,可能是数量的,如年龄,也可能是分类的,如性别。1.4主效应试验中由一个因素的不同水平引起的差异。1.5简单效应一个因素的水平在另一个因素的某个水平上的差异。1.6处理效应试验的总变异中由自变量引起的差异,主效应、简单效应、交互作用均为处理效应。1.7交互作用当一个因素的水平在另一个因素的不同水平上变化趋势不一致时,称两个因素之间存在着交互作用。或者:若一个因素A对因变量的影响与另一个因素B取什么水平有关,就称因素A与因素B之间存在着交互作用,即除了因素A与B单独的作用外,它们的不同水平的组合对因变量产生的作用。注:当两个因素A与B之间的交互作用的方差很小、比误差项的方差还小时,可以-34-认为A与B之间无交互作用,相应的平方和只不过是误差的一种反映,可将该项与误差项合并,相应的自由度也合并,以提高分析的精度。2.基本假设2.1正态分布2.2变异的同质性,即各个组的变异是相等的:σ12=σ22=……σk2以两个总体为例说明,所用统计量为:S12F=S22一般情况下无差异。2.3独立性指试验中一个被试的观测值应该独立于其他被试的观测值。3.样本含量样本中所包含的个体数称为样本含量,用n表示。统计分析在于探讨统计规律,因此,n最好取大一些,若试验研究设计得好,有严密的试验控制,每组受试者至少15人,最好在30人以上。第二节单因素方差分析对于影响一个因变量的众多因素,若仅使一个因素发生变化,而使其他因素均保持不变(或控制在一定范围内),分析这一因素对因变量的影响是否显著,属于单因素方差分析问题。1.方法介绍设因素A有m个水平,在每一水平下做k次(每一水平下的次数可以不等,通常用ki表示)试验,用S总表示所有数据与总平均数的总的离差平方和,它可以分解为:S总=SA+SeSA称为组间平方和,反映了因素A的各个不同水平所引起的差异,即主效应;Se称为组内平方和,反映了试验过程中随机误差的大小,即随机效应。对给定的显著性水平α,比较F与Fα,若FFα,则认为因素A对因变量的影响是显著的;否则,影响不显著。F的计算公式为:SA/(m-1)F=Se/[m(k-1)]其中,SA、Se分别为组间平方和、组内平方和,m为水平个数,k为试验次数。2.SPSS软件操作步骤选择“Analyze”→“CompareMeans”→“One-WayANOVA”项,弹出如图5.2.1的对话框。-35-图5.2.1单因素方差分析对话框2.1DependentList框存放因变量。2.2Factor框存放自变量。2.3Contrasts按钮图5.2.2Contrasts对话框⑴Polynomial项激活“Degree”,用于均值的多项式比较。Linear:一阶,即线性;Quadratic:二阶;Cubic:三阶;4th:四阶;5th:五阶。⑵Coefficients框在该框中输入多项式各组均值的系数,单击“Add”按钮追加、单击“Change”按钮改变、单击“Remove”按钮删除。一组系数输入结束,按“Next”按钮,进行下一组的输-36-入,需要查看、修改前面输入的系数时按“Previous”按钮。因素分几个水平输入几个系数。⑶CoefficientTotal项显示每组系数的总和。2.4PostHoc按钮指定一种多重比较的检验方法。若经方差分析所得结论为无显著性差异,则只需对该结果进行分析,否则,要进行多重比较。因为有显著性差异是针对因素的所有水平这一整体而言的,并不能判定各水平两两之间的差异均显著。那么,究竟哪些水平之间的差异显著、哪些水平之间的差异不显著呢?需要进行多水平之间的比较,即多重比较。图5.2.3PostHoc对话框⑴EqualVariancesAssumed项方差齐性时选用该项。该项的方法较多,实际问题中可根据需要选择,最常用的有以下几种方法。①LSD用t检验完成组间成对均值的比较。②Scheffe用F检验进行均值间的配对比较。③S-N-K用t检验进行均值间的配对比较。④Tukey用学生化极差统计量进行所有组间均值的配对比较。⑵EqualVariancesNotAssumed项-37-方差非齐性时选用该项。⑶Significancelevel框改变显著性水平,常用的有0.05或0.01。2.5Options按钮图5.2.4Options对话框⑴Statistics项选择输出的统计量。①Descriptive输出样本含量、平均数、标准差、标准误、最大值、最小值、各组每个因变量的95%的置信区间。②Fixedandrandomeffects输出固定与随机效应模型的标准差、95%的置信区间等结果。③Homogeneity-of-variance输出方差齐性检验结果。④Brown-Forsythe以“Brown-Forsythe”为统计量,检验各组的均值是否相等。⑤Welch以“Welch”为统计量,检验各组的均值是否相等。⑵Meansplot项输出均数分布图。⑶MissingValues项选择缺失值的处理方法。①Excludecasesanalysisbyanalysis删除要进行检验的数据中含有缺失值的数据。②Excludecaseslistwise删除所有含有缺失值的数据。3.应用举例-38-例5.2.1为了探讨不同教法对英语教学效果的影响,将一个班分成3组,接受3种不同的教法,试问不同的教法之间是否存在着差异。表5.2.13组学生英语成绩第一组第二组第三组78.0061.0080.0072.0072.0070.0066.0065.0076.0069.0066.0072.0070.0062.0072.00因变量:英语成绩;自变量:教法;3种水平:3种不同的教法。这是一个单因素3水平的试验。将3个水平的数据按列输入(变量为x),第二列标明数据的水平(变量为a)。选择“Analyze”→“CompareMeans”→“One-WayANOVA”项,将变量x移入“DependentList”框、变量a移入“Factor”框。按“PostHoc”按钮,在“EqualVariancesAssumed”中选择“Scheffe”与“Tukey”方法,取“Significancelevel”的默认值0.05。按“Options”按钮,在“Statistics”中选择“Descriptive”项,输出样本含量、平均数、标准差、标准误、最大值、最小值、各组每个变量的95%的置信区间,选择“Homogeneity-of-variance”,输出方差齐性检验结果,选择“Meansplot”,输出均数分布图。计算结果如下。表5.2.2平均数标准差等结果DescriptivesNMeanStd.DeviationStd.Error95%ConfidenceIntervalforMeanMinimumMaximumLowerBoundUpperBound1.00571.0004.472142.0000065.447176.552966.0078.002.00565.2004.324351.9339159.830670.569461.0072.003.00574.0004.000001.7888569.033378.966770.0080.00Total1570.0675.470271.4124267.037373.096061.0080.00表中列出了每组人数、平均数、标准差、标准误、95%的置信区间、最小值、最大值。表5.2.3方差齐性检验结果TestofHomogeneityofVariancesLeveneStatisticdf1df2Sig.0.0072120.993P=0.9930.10,方差齐性。表5.2.4方差分析结果ANOVASumofSquaresdfMeanSquareFSig.-39-(离差平方和)(均方)BetweenGroups(组间)200.1332100.0675.4880.020WithinGroups(组内)218.8001218.233Total(总和)418.93314P=0.020.05,各教法之间的差异显著。若差异不显著,说明各种教法的效果基本一样,实际教学中,可选择一种较为简单的方法。表5.2.5多重比较结果DependentVariable:X(I)A(J)AMeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBoundTukeyHSD1.002.005.80002.700620.122-1.404913.00493.00-3.00002.700620.526-10.20494.20492.001.00-5.80002.700620.122-13.00491.40493.00-8.8000*2.700620.017-16.0049-1.59513.001.003.00002.700620.526-4.204910.20492.008.8000*2.700620.0171.595116.0049Scheffe1.002.005.80002.700620.142-1.728213.32823.00-3.00002.700620.556-10.52824.52822.001.00-5.80002.700620.142-13.32821.72823.00-8.8000*2.700620.022-16.3282-1.27183.001.003.00002.700620.556-4.528210.52822.008.8000*2.700620.0221.271816.3282*Themeandifferenceissignificantatthe0.05level.两种多重比较方法的结果:在0.05显著性水平下,教法2与教法3之间的差异显著,而教法1与教法2、教法1与教法3之间的差异不显著。表5.2.6多重比较齐次性(均衡)子集结果ANSubsetforalpha=0.0512TukeyHSD2.00565.20001.00571.000071.00003.00574.0000Sig.0.1220.526Scheffe2.00565.20001.00571.000071.00003.00574.0000Sig.0.1420.556Meansforgroupsinhomogeneoussubsetsaredisplayed.aUsesHarmonicMeanSampleSize=5.000.该表是表5.2.5的另一种表达形式,给出了差异不显著的结果。-40-A3.002.001.00MeanofX76747270686664图5.2.5均值分布图由图可以看出各组均数的分布情况。第三节双因素方差分析实际问题中,影响试验结果的因素往往不只一个,而是多个,这就需要进行多因素方差分析。本节介绍双因素方差分析,其基本思想是:若某一因素的几个水平能引起试验的结果差别较大,该因素认为是重要的;结果相近,该因素认为是不重要的。通过进行双因素方差分析,可以检验两个因素对试验结果的影响是否显著、哪个因素是主要的以及它们之间有无交互作用等。