第六章方差分析方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。方差分析主要用于:1、均数差别的显著性检验,2、分离各有关因素并估计其对总变异的作用,3、分析因素间的交互作用,4、方差齐性检验。第一节SimpleFactorial过程6.1.1主要功能调用此过程可对资料进行方差分析或协方差分析。在方差分析中可按用户需要作单因素方差分析(其结果将与第五章第四节相同)或多因素方差分析(包括医学中常用的配伍组方差分析);当观察因素中存在有很难或无法人为控制的因素时,则可对之加以指定以便进行协方差分析。返回目录返回全书目录6.1.2实例操作[例6-1]下表为运动员与大学生的身高(cm)与肺活量(cm3)的数据,考虑到身高与肺活量有关,而一般运动员的身高高于大学生,为进一步分析肺活量的差异是否由于体育锻炼所致,试作控制身高变量的协方差分析。运动员大学生身高肺活量身高肺活量184.9167.9171.0171.0188.0179.0177.0179.543003850410043004800400054004000168.7170.8165.0169.7171.5166.5165.0165.034504100380033003450325036003200187.0187.0169.0188.0176.7179.0183.0180.5179.0178.0164.0174.0480048004500478037005250425048005000370036004050173.0169.0173.8174.0170.5176.0169.5176.3163.0172.5177.0173.03950400041503450325041003650395035003900345038506.1.2.1数据准备激活数据管理窗口,定义变量名:组变量为group(运动员=1,大学生=2),身高为x,肺活量为y,按顺序输入相应数值,建立数据库,结果见图6.1。图6.1原始数据的输入6.1.2.2统计分析激活Statistics菜单选ANOVAModels中的SimpleFactorial...项,弹出SimpleFactorialANOVA对话框(图6.2)。在变量列表中选变量y,点击钮使之进入Dependent框;选分组变量group,点击钮使之进入Factor(s)框中,并点击DefineRange...钮在弹出的SimpleFactorialANOVA:DefineRange框中确定分组变量group的起止值(1,2);选协变量x,点击钮使之进入Covariate(s)框中。图6.2协方差分析对话框点击Options...框,弹出SimpleFactorialANOVA:Options对话框。系统在协方差分析的方法(Method)上有三种选项:1、Unique:同时评价所有的效应;2、Hierarchical:除主效应外,逐一评价各因素的效应;3、Experimental:评价因素干预之前的主效应。本例选Unique方法,之后点击Continue钮返回SimpleFactorialANOVA对话框,再点击OK钮即可。6.1.2.3结果解释在结果输出窗口中可见如下统计数据:先输出肺活量总均数和两组的肺活量均数,总均数为4033.25,运用员组均数为4399.00,大学生组为3667.50。接着协方差分析表明,混杂因素X(身高)两组间是有差异的(F=10.679,P=0.002),控制其影响后,两组间肺活量的差别依然存在(F=9.220,P=0.004),故可以认为两组间肺活量的均数在消除了身高因素的影响之后仍有差别,运动员的肺活量大于大学生,即体育锻炼会提高肺活量。最后系统输出公共回归系数,bc=36.002,该值可用于求修正均数:Yi'=Yi-bc(Xi-X)本例为Y运动员'=4399.00-36.002×(178.175-174.3325)=4260.6623Y大学生'=3667.50-36.002×(170.49-174.3325)=3805.8377YbyGROUPTotalPopulation4033.25(40)GROUP124399.003667.50(20)(20)YbyGROUPwithXUNIQUEsumsofsquaresAlleffectsenteredsimultaneouslySumofMeanSigSourceofVariationSquaresDFSquareFofFCovariates163076311630762.63510.679.002X163076311630762.63510.679.002MainEffects140784711407847.0959.220.004GROUP140784711407847.0959.220.004Explained698168523490842.56822.860.000Residual564999237152702.496Total1263167839323889.16740caseswereprocessed.0cases(.0pct)weremissing.CovariateRawRegressionCoefficientX36.002返回目录返回全书目录第二节GeneralFactorial过程6.2.1主要功能调用此过程可对完全随机设计资料、配伍设计资料、析因设计资料、正交设计资料等等进行多因素方差分析或协方差分析。返回目录返回全书目录6.2.2实例操作[例6-2]下表为三因素析因实验的资料,请用方差分析说明不同基础液与不同血清种类对钩端螺旋体的培养计数的影响。基础液(A)血清种类(B)兔血清浓度(C)胎盘血清浓度(C)5%8%5%8%缓冲液64812461398909114418771671184583085344110305786696431002蒸馏水1763124113812421144718831896192692070984857493310241092742自来水58010261026830178912151434165111261176128012126855465955666.2.2.1数据准备激活数据管理窗口,定义变量名:基础液为base,血清种类为sero,血清浓度为pct,钩端螺旋体的培养计数为X,按顺序输入相应数值,建立数据库。6.2.2.2统计分析激活Statistics菜单选ANOVAModels中的GeneralFactorial...项,弹出GeneralFactorialANOVA对话框(图6.3)。在对话框左侧的变量列表中选变量x,点击钮使之进入DependentVariable框;选要控制的分组变量base、sero和pct,点钮使之进入Factor(s)框中,并分别点击DefineRange钮,在弹出的GeneralFactorialANOVA:DefineRange对话框中确定各变量的起止值,本例变量base的起止值为1、3,变量sero的起止值为1、2,变量pct的起止值为1、2。之后点击OK钮即可。图6.3析因方差分析对话框6.2.2.3结果解释在结果输出窗口中,系统显示48个观察值进入统计,三个因素按其各自水平共产生12种组合。分析表明,模型总效应的F值为10.55,P值0.001,说明三因素间存在有交互作用。单因素效应和交互效应导致的组间差别比较结果是:单因素组间比较:A:基础液(BASE)F=4.98,P=0.012,说明三种培养基培养钩体的计数有差别;B:血清种类(SERO)F=61.265,P0.001,说明两种血清培养钩体的计数有差别;C:血清浓度(PCT)F=3.49,P=0.070,说明两种血清浓度培养钩体的计数无差别。两因素构成的一级交互作用:A×B:基础液(BASE)×血清种类(SERO)F=5.16,P=0.011,交互作用明显;B×C:血清种类(SERO)×血清浓度(PCT)F=15.96,P0.001,交互作用明显;A×C:基础液(BASE)×血清浓度(PCT)F=0.78,P=0.465,交互作用不明显。三因素构成的二级交互作用:A×B×C:基础液(BASE)×血清种类(SERO)×血清浓度(PCT)F=6.75,P=0.003,交互作用明显。48casesaccepted.0casesrejectedbecauseofout-of-rangefactorvalues.0casesrejectedbecauseofmissingdata.12non-emptycells.1designwillbeprocessed.-------------------------------------UnivariateHomogeneityofVarianceTestsVariable..XCochransC(3,12)=.34004,P=.036(approx.)Bartlett-BoxF(11,897)=1.69822,P=.069-------------------------------------******AnalysisofVariance--design1******TestsofSignificanceforXusingUNIQUEsumsofsquaresSourceofVariationSSDFMSFSigofFWITHIN+RESIDUAL2459233.753668312.05BASE679967.382339983.694.98.012PCT238713.021238713.023.49.070SERO4184873.5214184873.561.26.000BASEBYPCT107005.54253502.77.78.465BASEBYSERO705473.042352736.525.16.011PCTBYSERO1089922.6911089922.715.96.000BASEBYPCTBYSERO922307.372461153.696.75.003(Model)7928262.5611720751.1410.55.000(Total)10387496.3147221010.56R-Squared=.763AdjustedR-Squared=.691返回目录返回全书目录第三节Multivarite过程6.3.1主要功能调用此过程可进行多元方差分析。此外,对于一元设计,如涉及混合模型的设计、分割设计(又称列区设计)、重复测量设计、嵌套设计、因子与协变量交互效应设计等,此过程均能适用。返回目录返回全书目录6.3.2实例操作[例6-3]甲地区为大城市,乙地区为县城,丙地区为农村。某地分别调查了上述三类地区8岁男生三项身体生长发育指标:身高、体重和胸围,数据见下表,问:三类地区之间男生三项身体生长发育指标的差异有无显著性?学生编号甲地区乙地区丙地区身高体重胸围身高体重胸围身高体重胸围123456789101112131415161718192021222324252627282930119.80121.70121.40124.40120.00117.00118.10118.80124.20124.90124.70123.00125.30124.20127.40128.20126.10128.70129.50126.90126.50128.20131.40130.80133.90130.40131.30130.20136.00141.0022.6021.5019.1021.8021.4020.1018.8022.0021.3024.0023.3022.5022.9