第四章方差分析analysisofvarianceANOVA温州医学院环境与公共卫生学院叶晓蕾yexiaolei2多个样本均数比较的方差分析完全随机设计资料随机区组设计资料拉丁方设计资料交叉设计资料多因素试验的方差分析析因设计正交设计嵌套设计裂区设计重复测量设计的方差分析yexiaolei3多个均数比较方差分析差别无统计学意义结束差别有统计学意义说明至少有两组间总体均数不同两两比较多个均数比较方差分析差别无统计学意义结束差别有统计学意义说明至少有两组间总体均数不同两两比较多个均数比较的基本思路yexiaolei4一.方差分析的基本思想例某医师用A、B和C三种方案治疗婴幼儿贫血患者,治疗一个月后,血红蛋白的增加克数如下表,问三种治疗方案对婴幼儿贫血的疗效是否相同?yexiaolei5ABC2420203618112517614103261903424-12345ΣΣXi18210848338(ΣX)ni76821(N)2618622.8()ΣXi2505420506087712(ΣX2)三种方案治疗后血红蛋白增加量(g/L)iXXyexiaolei6EETMSMSF组内组间若无处理效应,则F≈1,若存在处理效应,则F>>1。F值多大才有意义,要根据组间自由度(1)和组内自由度(2)查F界值表作出判断。全部观察值之间的变异——总变异。MS总或MST各组内部各观察值之间的变异——组内变异。反映随机误差(E)大小。MS组内或MSe各组均数之间的变异——组间变异。反映处理因素(T)和随机误差(E)大小。MS组间或MSTRyexiaolei7把全部观察值的变异按设计的要求分成几个部分,每部分与特定的因素相联系,其中某部分由随机误差造成,通过比较可能由某因素所致的变异与随机误差,即可了解该因素对测定结果有无作用。yexiaolei8在H0成立的情况下,统计量F值的分布称为F分布。F值服从自由度ν组间=k-1,ν组内=N-k的F分布,组内组间,F,则P>α,不拒绝H0;当F≥组内组间,FP≤α,拒绝H0,接受H1。,则F<由F界值表查出在某一α水准下F分布的单尾界值Fα,当即F~F(ν组间,ν组内)。求得F值后,可通过查F界值表,即可得P值,作出统计推断结论,故方差分析又称F检验。yexiaolei9(1)独立性(independence)(2)正态性(normality)(3)方差齐性(homogeneity)用途与应用条件:用途两个或多个均数的比较;分析两个或多个研究因素的交互作用;回归方程的线性假设检验;等。应用条件yexiaolei10二.完全随机设计的方差分析——单因素方差分析(one-wayANOVA)完全随机设计=成组设计=单因素设计是最常见的一种考察单因素两水平或多水平的实验设计方法。本方案是将受试对象随机分配到实验组和对照组,通过比较分析回答研究假设的问题。yexiaolei11(一)完全随机设计资料方差分析中变异的分解总变异组间变异组内变异(MS总)(MS组内)(MS组间)SSMSyexiaolei12ginijijTiXXSS12即观察值Xij与总均数的离均差平方和XgiiiTRXXnSS12即各组均数与总均数的离均差平方和iXXginijiijeiXXSS12即观察值Xij与组均数的离均差平方和iX组内组间总SSSSSS1N总1g组间gN组内组内组间总yexiaolei13(二)完全随机设计资料方差分析的计算NXCginjiji211yexiaolei141.H0:μ1=μ2=……=μgH1:μ1、μ2、……μg不等或不全相等α=0.052.计算F值:(1)求基础数据(2)求离均差平方和SS(3)求自由度(4)列方差分析表3.确定P,作出统计推断结论(三)完全随机设计资料方差分析的步骤:yexiaolei15求离均差平方和SS:ginjijiCXSS81.227119.544077122总19.54402133822NXCginjiji81.152319.544084861087182222121giinjijCnXSSi组间00.74881.152381.2271组间总组内SSSSSSyexiaolei16201211N总2131k组间18220kN组内yexiaolei17方差分析表来源SSνMSFP组间1523.812761.9118.330.01组内748.001841.56总2271.8120本例SPSS演示P.73例4-2yexiaolei18三.随机区组设计的方差分析——两因素方差分析(two-wayANOVA)随机区组设计=配伍组设计=两因素设计(无重复观察)例:本方案是将受试对象按性质(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)相同或相近配成区组(block),每个区组中的g个受试对象分别随机分配到g个处理组中去。区组因素可以是第二个处理因素,也可以是一种非处理因素。yexiaolei19实验单位区组1区组2随机分组g个水平随机分组g个水平g个水平随机分组g个水平区组ng个水平随机分组图27-2随机区组设计示意图实验单位区组1区组2随机分组g个水平随机分组g个水平g个水平随机分组g个水平区组ng个水平随机分组图27-2随机区组设计示意图实验单位区组1区组2随机分组g个水平随机分组g个水平g个水平随机分组g个水平区组ng个水平随机分组图27-2随机区组设计示意图yexiaolei20eAMSMSF(一)随机区组设计资料方差分析中变异的分解eBMSMSFyexiaolei21随机区组设计方差分析中由于从总变异中多分离出区组间变异,排除了大鼠间因年龄、体重不同等的影响,使误差更能反应随机误差的大小,因而提高了研究的效率。yexiaolei22随机区组设计资料方差分析的计算NXCginjij211yexiaolei23例4-4某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物,以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?yexiaolei24yexiaolei25TestsofBetween-SubjectsEffectsDependentVariable:weight.456a6.0767.964.0053.09213.092323.742.000.2284.0575.978.016.2282.11411.937.004.0768.0103.62415.53314SourceCorrectedModelInterceptblockgroupErrorTotalCorrectedTotalTypeIIISumofSquaresdfMeanSquareFSig.RSquared=.857(AdjustedRSquared=.749)a.yexiaolei26是一种特殊的自身对照设计,首先将条件相近的观察对象配对,再用随机分配的方法决定其中之一先采用处理方法A,然后是处理B;另一研究对象秩序则相反。A、B两种处理先后以同等的机会出现在两个试验阶段中。特点:有3个因素:1个处理因素——处理方法2个控制因素——个体差异,试验阶段四.交叉设计的方差分析(cross-overdesign)yexiaolei2712名病人用A、B两法治疗的血压下降(kPa)病人编号阶段123456789101112阶段合计疗法合计ⅠBBABAAAABBBA3.071.334.401.873.203.734.131.071.072.273.472.4032.0133.61(A)ⅡAABABBBBAAAB2.801.473.733.602.671.602.671.731.471.873.471.7328.8127.21(B)合计5.872.808.135.475.875.336.802.802.544.146.944.1360.8260.821.SS总=SS疗法+SS阶段+SS个体+SS误差2.总=疗法+阶段+个体+误差C2xn2x2x2xxSS)()(总yexiaolei28表5.612名病人用A、B两法治疗的血压下降(kPa)病人编号阶段123456789101112阶段合计疗法合计ⅠBBABAAAABBBA3.071.334.401.873.203.734.131.071.072.273.472.4032.0133.61(A)ⅡAABABBBBAAAB2.801.473.733.602.671.602.671.731.471.873.471.7328.8127.21(B)合计5.872.808.135.475.875.336.802.802.544.146.944.1360.8260.82阶段III3.072.80…………32.0128.81C1281.2801.32SS22阶段C1221.2761.33SS22疗法C1213.480.287.5SS222个体yexiaolei29误差疗法疗法MSMSF误差个体个体误差阶段阶段MSMSFMSMSFyexiaolei30表5.7交叉设计方差分析表来源SSνMSFP个体17.9081111.62804.390.05阶段0.426710.42671.150.05处理1.706711.70674.600.05误差3.7107100.3711总23.752223SPSSyexiaolei31TestsofBetween-SubjectsEffectsDependentVariable:X20.041b131.5424.155.01554.009.901154.1281154.128415.354.000415.3541.000.4271.4271.150.3091.150.1631.70711.7074.599.0584.599.49117.908111.6284.387.01448.260.9053.71110.371177.8802423.75223SourceCorrectedModelInterceptJIEDUANLIAOFABIANHAOErrorTotalCorrectedTotalTypeIIISumofSquaresdfMeanSquareFSig.Noncent.ParameterObservedPoweraComputedusingalpha=.05a.RSquared=.844(AdjustedRSquared=.641)b.yexiaolei32TestsofBetween-SubjectsEffectsDependentVariable:血浆3H-cGMP551799.950a1150163.6321015.972.00010717944.050110717944.050217072.285.000490.0501490.0509.925.014198.4501198.4504.019.080551111.450961234.6061240.195.000395.000849.37511270139.00020552194.95019SourceCorrectedModelInterceptphasetreatpersonErrorTotalCorrectedTotalTypeIIISumofSquaresdfMeanSquareFSig.RSquared=.999(AdjustedRSquared=.998)a.例4-6P.84yexiaolei33五.多个样本均数的两两比较(多重比较)多重比较不宜用前述的t检验