1第三节方差齐性检验2在单因子试验中,r个水平的指标可以用r个正态分布2,iiN,ri,,2,1表示.在进行方差分析时,要求r个方差相等,这时称为方差齐性.而方差齐性不一定自然具有.理论研究表明,当正态性假定不满足时,对F检验影响较小,即F检验对正态性的偏离具有一定的稳健性,而F检验对方差齐性的偏离较为敏感.所以,r个方差的齐性检验就显得十分必要.3所谓方差齐性检验是对如下一对假设作出检验:0H:22221n;(1H:诸2i不全相等.(8.3.1)很多统计学家提出了一些很好的检验方法,这里介绍几个常用的检验,它们是:Hartley检验,仅适用于样本量相等的场合;Bartlett检验,可用于样本量相等或不等的场合,但是每个样本量不得低于5;修正的Bartlett检验,在样本量较小或较大,相等或不等的场合均可使用.下面分别来叙述它们.4一、Hartley检验5当各水平下试验重复次数相等时,即mmmmr21,Hartley提出检验方差相等的检验统计量:2222122221,,,min,,,maxrrSSSSSSH.(8.3.2)它是r个样本方差最大值与最小值之比.这个统计量的分布尚无明显的表达式,但在诸方差相等的条件下,可通过随机模拟方法获得H分布的分位数,该分布依赖于水平数r和样本方差的自由度1mf,因此该分布可记为frH,,其分位数表列于附表10上.6直观上看,当0H成立,即诸方差相等22221r时,H的值应当接近于1,当H的值较大时,诸方差间的差异就大,H愈大,诸方差间的差异就愈大,这时应当拒绝(8.3.1)中的原假设0H.由此可知,对于给定的显著性水平,检验0H的拒绝域为frHHW,11,(8.3.3)其中frH,1为H分布的1分位数.7例8.3.1由四种不同牌号的铁锈防护剂(简称防锈剂),现在要比较其防锈能力.为此,制作40个大小形状相同的铁块(试验样品),然后把它们随机分为四组,每组10件样品.在每一组样品上涂上同一牌号的防锈剂,最后把这40个样品放在一个广场上让其经受日晒、风吹和雨打.经过一段时间后再行观察其防锈能力.由于防锈能力无测量仪器,只能请专家评分.五位受聘专家对评分标准进行讨论,取得共识.样品上无锈迹的评100分,全锈了的评0分.他们在不知牌号的情况下进行独立评分.最后把一个样品的5位专家所给分数的平均值作为该样品的防锈能力.数据列于表8.3.1上.8表8.3.1防锈能力数据及有关计算因子A(防锈剂)1A2A3A4A143.989.868.436.2239.087.169.345.2346.792.768.540.7443.890.666.440.5544.287.770.039.3647.792.468.140.3743.686.170.643.2838.988.165.238.7943.690.863.840.9数据ijY1040.089.169.239.7和iT431.4894.4679.5404.7均值iY43.1489.4467.9540.47组内平方和iQ81.0044.2842.3353.429这是一个重复次数相等的单因子试验.我们考虑用方差分析方法对之进行比较分析,为此,首先要进行方差齐性检验.选取检验统计量2222122221,,,min,,,maxrrSSSSSSH检验的拒绝域为frHHW,11.由于4r,91mf,05.0,查表得31.69,4,95.01HfrH,因此检验的拒绝域为31.61HW.10本例中,四个样本方差的观测值可由8.3.1中诸iQ求出,即00.9900.819121Qs,92.4928.449222Qs,70.4933.429323Qs,94.5942.539424Qs,由此可得统计量H的观测值9149.170.400.9,,,min,,,max2423222124232221ssssssssH.由于31.69149.170.400.9H,因此不拒绝原假设0H,可以认为四个总体方差间无显著性差异.11进一步,我们可用方差分析方法对四种不同型号的防锈剂比较其防锈能力.由表8.3.1的数据可以算出:24104321TTTTT,从而求得三个偏差平方和分别为50.161742112nTYSrimjijT,39Tf;47.159531212nTTmSriiA,3Af;03.221ATeSSS,36ef.把上述各项移到方差分析表上,可继续计算各均方和与F比,具体见表8.3.2.12表8.3.2防锈能力的方差分析表来源平方和自由度均方和F比因子A15953.4735317.82866.09误差e221.03366.14总和T16174.5039若给定显著性水平05.0,查表可得87.236,3,95.01FffFeA,由观测值所得的87.209.866F,故拒绝原假设0H,认为四种防锈剂的防锈能力有显著性差异.13二、Bartlett检验14在单因子方差分析中,设第i个样本方差为:iimjiijiifQYYmSi12211,ri,,2,1,其中im为第i个样本的容量(即试验重复次数),imjiijiYYQ12与1iimf为该样本的偏差平方和及自由度.由于误差平方和riieiriieeSffQfMS1211,它是r个样本方差22221,,,rSSS的(加权)算术平均值.15而相应的r个样本方差的几何平均数记为eGMS,它是erffrffeSSSGMS12222121,其中rnmffriiriie111.由于几何平均值不会超过算术平均值,故有eeMSGMS,其中等号成立当且仅当诸2iS彼此相等,如果诸2iS间的差异愈大,则此两个平均值相差也愈大.16由此可见,当诸总体方差相等时,其样本方差间不应相差较大,从而比值eeGMSMS接近于1.反之,在比值eeGMSMS较大时,就意味着诸样本方差差异较大,从而反映诸总体方差差异也较大.这个结论对此比值的对数也成立.从而检验(8.3.1)表示的一对假设的拒绝域应是dGMSMSWeeln1.(8.3.4)17Bartlett证明了:在大样本场合,eeGMSMSln的某个函数近似服从自由度为1r的2分布.具体是1~lnln2rGMSMSCfBeee,(8.3.5)其中eriiffrC1113111,(8.3.6)而且C通常会大于1.18根据上述结论,可取riiieeSfMSfCB12lnln1,(8.3.7)作为检验统计量,对于给定的显著性水平,检验的拒绝域为1211rBW,(8.3.8)考虑到这里的2分布是近似分布,在诸样本量im均不小于5时使用上述检验是适当的.19例8.3.2茶是世界上最为广泛的一种饮料,但是很少人知其营养价值.任何一种茶叶都含有叶酸,它是一种维他命B.如今已有测定茶叶中叶酸含量的方法.为研究各产地的绿茶的叶酸含量是否有显著性差异,特选四个产地绿茶,其中1A制作了7个样品,2A制作了5个样品,3A与4A各制作了6个样品,共有24个样品,按随机次序测试其叶酸含量(单位:mg),测试结果如表8.3.3所示.20表8.3.3绿茶的叶酸含量数据水平数据重复数和均值组内平方和1A7.96.26.68.68.910.19.671m9.571T8.2783.121Q1A5.77.59.86.18.452m5.372T7.5030.112Q1A6.47.17.94.55.04.063m9.343T5.8203.123Q1A6.87.55.05.36.17.464m1.384T6.3561.54Q24m4.168T77.41eS21首先要对其作方差齐性检验.从表8.3.3中数据可查得83.121Q,30.112Q,03.123Q,61.54Q.61f,42f,53f,54f.从而用公式iiifQS2,可求得14.221S,83.222S,41.223S,12.124S.22再从表8.3.4查得09.2eMS,由(8.3.6),可求得eriiffrC111311120151514161143110856.1.23再由(8.3.7),还可求得Bartett检验统计量的值riiieeSfMSfCB12lnln112.1ln541.2ln583.2ln414.2ln609.2ln200856.11970.0.24对给定的显著性水平05.0,查表得815.7141295.021r.由于815.7970.0B,所以不拒绝原假设0H,可以认为诸水平下的方差间无显著性差异.25平方和计算如下:50.23244.16861.3869.3455.3779.5722222AS,3Af;27.65244.1684.71.62.69.722222TS,23Tf;77.4150.2327.65eS,20ef.26方差分析见表8.3.4表8.3.4绿茶的叶酸含量的方差分析表来源平方和自由度均方和F比因子A23.5037.833.75误差e41.77202.09总和T65.2723若取显著性水平05.0,查表可得10.320,3,95.01FffFeA,由观测值所得的10.375.3F,故拒绝原假设0H,认为四种绿茶的叶酸的平均含量有显著性差异.27三、修正的Bartlett检验28针对样本量低于5时不能使用Bartlett检验的缺点,Box提出修正的Bartlett检验统计量BCAfBCfB12,(8.3.9)其中B与C如(8.3.7)与(8.3.6)所示,且11rf2211Crf,2122fCfA.29在原假设0H:22221n成立下,Box还证明了统计量B的近似分布是F分布21,ffF,对给定的显著性水平,该检验的拒绝域为2111,ffFBW,(8.3.10)其中2f的值可能不是整数,这时可以通过对F分布的分位数表施行内插法得到分位数.30例8.3.3对例8.3.2中的绿茶叶酸含量的数据,我们用修正的Bartlett检验再一次对方差齐性作出检验.在例8.3.2中已经求得0856.1C,970.0B,还可以求得3141f,4.68210856.11422Cf,319.7434.68220856.124.682A,322.00856.1970.09.74330856.1970.04.682B.对给定的显著性水平05.0,在F分布的分位数表上可查得60.2,34.682,395.095.0FF.由于60.2322.0B,所以不拒绝原假设0H,可以认为诸水平下的方差间无显著性差异.