——单因素方差分析实习12连续变量的统计推断(二)学习目标掌握单因素方差分析的方法原理了解单因素方差分析的适用条件能用SPSS进行单因素方差分析主要内容单因素方差分析的方法原理单因素方差分析的适用条件单因素方差分析的分析实例均数间的多重比较单因素方差分析的目的检验某一个影响因素的差异是否会给观察变量带来显著影响。多个样本,均数的比较不能用两两t检验。例如:考察不同产地的汽车的耗油量是否不同;考察不同疗法的效果是否不同;考察不同的推销策略是否对推销额产生显著影响。两个概念:因素和水平考察不同产地的汽车的耗油量是否不同,在这个问题中,产地就是因素(Factor),美国、欧洲、日本就是这个因素的3个水平(Level)或3个组。方差分析就是考察不同水平的总体均数是否不同。方法原理因素水平样本观测值1y11y12…y1n12y21y22…y2n2……kyk1yk2…yknk方法原理方差分析是基于变异分解的原理进行的,在单因素方差分析中,整个样本的变异(样本观测值之间的差异)由如下两个部份构成:总变异(SST)=组内变异(SSW)+组间变异(SSB)222..11111(..)()(..)iinnkkkijijiiiijijiyyyynyy总变异=随机变异+处理因素导致的变异方法原理当H0:u1=u2=…=uk成立时,组间变异与组内变异均由随机误差构成,值应当接近。F=组间变异测量指标/组内变异测量指标,则F的值应当接近1。否则,F值将会偏离1,并且各组间的不一致程度越强,F值越大。组间差异远远大于组内差异,说明处理因素的影响的确存在,如果两者相差无几,则说明该影响不存在。方法原理原假设H0:u1=u2=…uk备择假设H1:k个总体均数不全相同检验统计量与P值得出结论1,/(1)/()(1,)BkNkWBWSSkFSSNkMSFkNkMS检验统计量1,()kNkPPFF值样本观测量适用条件本质上和t检验的情况类似独立性:严格要求,但一般都没问题。正态性:Box和Anderson等人的研究表明,方差分析对于正态性的要求是稳健的。当正态性得不到满足时,方差分析的结论并不会受到太大的影响。方差齐性:在各组间样本含量相差不太大时,方差轻微不齐仅会对方差分析的结论有少许影响。一般而言,只要最大/最小方差之比小于3,分析结果都是稳定的。样本量不能过于悬殊。分析实例在汽车资料cars.sav中,变量mpg的含义为每加仑汽油可以行驶的里程数,可以把它简单理解为耗油量。现希望比较产自美国、欧洲、日本的汽车,考察其每公里耗油量有无差异。对适用条件的检查正态性:直方图、箱图等方差齐性:假设检验方差分析表的阅读描述统计量方差齐性检验样本均数图TestofHomogeneityofVariancesMilesperGallon.1062394.900LeveneStatisticdf1df2Sig.ANOVAMilesperGallon7984.95723992.47997.969.00016056.41539440.75224041.372396BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.P值大于0.05,不拒绝H0,故认为三个总体方差相同P值小于0.05,故拒绝H0,认为三个总体均值不相同检验的结果是三个总体均值不相同,借助于此图,就可明白各样本均值的大小关系!这种差别能否推广至总体呢?均数间的多重比较(两两比较)上述分析只是回答了“多个均数间是否有差异?”这个问题,但是具体是哪些均数存在差异,并没有给出答案。上例中,到底是三者之间均有差别?还是某一组与其他两组有区别?均数间的多重比较(两两比较)多重比较的两种类型计划好的(PlannedComparisons):在收集数据之前便决定了要通过多重比较来考察多个组与某个特定组间的差别或者某几个特定组间彼此的差别。这种情况应该是对数据有了一定的了解。“对比”对话框非计划好的(UnplannedComparisons,Post-hocComparisons):在方差分析得到有统计学意义的F值后才有必要进行,是一种探索性的分析。“两两比较”对话框均数间的多重比较(两两比较)均数间的多重比较几种常用的多重比较方法LSD法:即最小显著差法(Least-Significance-DifferenceMethod),是最灵敏一种方法。适用于计划好的两两比较。Scheffe法:多用于进行比较的两组间样本含量不等时。Dunnett法:常用于多个试验组与一个对照组间的比较。均数间的多重比较分析实例cars.sav中,通过方差分析,知道各国所生产的汽车的油耗是有差别的。可以通过多重比较,看看差别到底怎样。这是一个非计划的多重比较,用“两两比较”对话框,因为样本量相差较大,选择Scheffe方法。均数间的多重比较结论:美国汽车油耗均数和欧洲汽车油耗均数相比,因为P值小于0.05(甚至小于0.01),故在显著性水平a为0.05(甚至0.01)条件下有显著性差异。美国汽车油耗均数和日本汽车油耗均数相比,因为P值小于0.05(甚至小于0.01),故在显著性水平a为0.05(甚至0.01)条件下有显著性差异。日本汽车油耗均数和欧洲汽车油耗均数相比,因为P值大于0.05,故在显著性水平a为0.05条件下没有显著性差异。MultipleComparisonsDependentVariable:MilesperGallonScheffe-7.763*.864.000-9.89-5.64-10.322*.825.000-12.35-8.307.763*.864.0005.649.89-2.5591.048.052-5.13.0210.322*.825.0008.3012.352.5591.048.052-.025.13(J)CountryofOriginEuropeanJapaneseAmericanJapaneseAmericanEuropean(I)CountryofOriginAmericanEuropeanJapaneseMeanDifference(I-J)Std.ErrorSig.LowerBoundUpperBound95%ConfidenceIntervalThemeandifferenceissignificantatthe.05level.*.均数间的多重比较事先计划的比较u1、u2、u3分别表示美产、欧产、日本汽车耗油量,欲检验u1与u2、u2与u3是否有显著性差异。H0:u1=u2H0’:u2=u3转换为:H0:a1u1+a2u2+a3u3=0,a1=1,a2=-1,a3=0H0’:b1u1+b2u2+b3u3=0,b1=0,b2=-1,b3=1结论:美国汽车油耗均数和欧洲汽车油耗均数相比,因为P值小于0.05,故在显著性水平a为0.05条件下有显著性差异。欧洲汽车油耗均数和日本汽车油耗均数相比,因为P值小于0.05,故在显著性水平a为0.05条件下有显著性差异。ContrastCoefficients1-100-11Contrast12AmericanEuropeanJapaneseCountryofOriginContrastTests-7.76.864-8.985394.0002.561.0482.442394.015-7.76.900-8.627106.562.0002.561.0562.423140.226.017Contrast1212AssumeequalvariancesDoesnotassumeequalvariancesMilesperGallonValueofContrastStd.ErrortdfSig.(2-tailed)练习练习THEEND