协方差分析•协方差分析是把方差分析与回归分析结合起来的一种统计分析方法。它用于比较一个变量Y在一个或几个因素不同水平上的差异,•(1)但Y在受这些因素影响的同时,还受到另一个变量X的影响,•(2)而且X变量的取值难以人为控制,不能作为方差分析中的一个因素处理。•此时如果X与Y之间可以建立回归关系,则可用协方差分析的方法排除X对Y的影响,然后用方差分析的方法对各因素水平的影响作出统计推断。在协方差分析中,我们称Y为因变量,X为协变量。不能把X作为一种随机因素处理•也许有人会问随机因素的影响也是不能人为控制的,为什么不能把X作为一种随机因素处理呢?这里的差异主要在于作为随机因素处理时虽然每一水平的影响是不能人为控制的,但我们至少可以得到几个属于同一水平的重复,因此可以把它们分别用另一因素的不同水平处理。最后在进行方差分析时,我们才能排除这一随机因素的影响,对另一因素的各水平进行比较。当作随机因素•当我们考虑动物窝别对增重的影响时,一般我们可把它当作随机因素处理,这一方面是由于它不容易数量化,另一方面是同一窝一般有几只动物,可分别接受另一因素不同水平的处理•如果我们考虑试验开始前动物初始体重的影响,这时一般方法是选初始重量相同的动物作为一组,分别接受另一因素的不同水平处理,此时用方差分析也无问题。•但若可供试验的动物很少,初始体重又有明显差异,无法选到相同体重的动物,那就只好认为初始体重X与最终体重Y有回归关系,采用协方差分析的方法排除初始体重的影响,再来比较其他因素例如饲料种类,数量对增重的影响了。••消除初始体重影响的另一种方法是对最终体重与初始体重的差值即y-x进行统计分析。这种方法与协方差分析的生物学意义是不同的。对差值进行分析是假设初始体重对以后的体重增量没有任何影响,而协方差分析则是假设最终体重中包含初始体重的影响,这种影响的大小与初始体重成正比。单因素的协方差分析。•协方差分析的计算是比较复杂的。在本章中我们重点介绍最简单的协方差分析的算法,即一个协变量,统计模型:•在协方差分析中,我们认为每一个因变量的观察值可分解为以下各部分的和:ijijiijxxy..)(i=1,2…a,j=1,2…n。其中yij:第i水平的第j次观察值。xij:i水平的j次观察的协变量取值。:xij的总平均数。:yij的总平均数。:第i水平的效应。β:Y对X的线性回归系数。:随机误差。..xiij•例6.1比较三种猪饲料A1,A2,A3的效果。X为初始重量,Y为增重量,数据见下表。750.131x625.182x000.982y375.253x875.963yA1X1513111212161417Y8583657680918490A2X1716181821221918Y9790100951031069994A3X2224202325273032Y89918395100102105110750.811y875.963y对每一种饲料分别作回归分析Syy1=487.5,Sxy1=110.5,Sxx1=31.5,a1=33.516,b1=3.506,Syy2=184,Sxy2=65,Sxx2=27.875,a2=54.570,b2=2.332,Syy3=566.875,Sxy3=245.375,Sxx3=115.875,a3=43.131,b3=2.118,873.991GeSS431.322GeSS273.473GeSS31577.179iGieGeSSSS)2(nadfGe组内剩余平方和:,其自由度=18•2)检验方差齐性:由于各水平重复数均为8,误差自由度均为6。可选差异最大的作检验1GeSSFmax=99.873/32.431=3.080由于共有3组,因此a=3;各组自由度均为6,因此v=6。查Fmax,临界值表。得:Fmax,0.05(3,6)=8.38Fmax,可认为具有方差齐性。•(3)合并各水平的平方和及交叉乘积和:•Eyy=1238.375,Exy=420.875,Exx=175.25•b*=Exy/Exx=2.402,SSe=Eyy−=227.615xxxyEE/2(4)检验回归线是否平行:H0:b1=b2=b3=b*•SSb=SSe−=48.038GeSS408.218/577.1792/038.4818/2/GebGebSSSSMSMSF查表,F0.95(2,18)=3.55F,∴接受H0,可认为三回归线平行,即有公共回归系数b*。(5)检验回归是否显著:H0:β=081.88)1)18(3/(615.22776.1010/76.1010eReyyRMSSSFSSESS查表,F0.99(1,20)=8.096F,∴差异极显著,X与Y有极显著线性关系,应作协方差分析。(6)把所有数据放在一起,算得:•Syy=2555.958,Sxy=1080.75,Sxx=720.5(7)协方差分析:•SS’e=SSe+SSt0:3210H071.3120/615.2272/)615.227833.934(1,833.934/'2'eeexxxyyyeMSaSSSSFSSSSSSS’e=SSe+SSt查表,F0.99(2,20)=5.849F,∴拒绝H0,各不同饲料增重效果差异极显著。(8)为比较各饲料好坏,计算调整平均数•代入数据,得:.'iy3,2,1..),('.*..ixxbyyiii163.82)25.19375.25(402.2875.96'501.99)25.19625.18(402.2000.98'961.94)25.19750.13(402.2750.81'.3.2.1yyy•从调整后的数据看来,第二种饲料效果最好,第一种稍差,而第三种差得较多。但从调整前的数据看是第二种最好,第三种几乎与第二种相同,而第一种差得多。这种调整前的差异是不正确的,因为它包含了初始体重的影响。第三组初始体重明显偏大,而第一组偏小,这影响了对两种饲料的正确评价。对各调整后的平均数据作统计比较])(1[2...2xxieiyExxnMSS8589.3]25.175/)25.19375.25(8/1[38075.114480.1]25.175/)25.19625.18(8/1[38075.113870.3]25.175/)25.19750.13(8/1[38075.11223222221SSS自由度均为20。先比较和:和.1'y.2'y065.24480.13870.3961.94501.99t查表,得:t0.979(20)=2.086,t0.995(20)=2.845∴差异已接近显著水平,但仍未达到。故应认为第二种饲料近似地与第一种相同。再比较和:.1'y.3'y∴差异极显著。第三种饲料极明显地差于第一种。由于第二种平均值大于第一种,方差小于第一种,故第二种与第三种的差异更大。即第三种极明显地差于其他两种。)20(754.48589.33870.3163.82961.94995.0tt作业6.1为使小麦变矮,增强抗倒伏力,喷洒了三种药物。X为喷药前株高,Y为喷后株高。药物1X293133333740Y112106115117120117药物2X404143464849Y112106110117121114药物3X333437374142Y107112117109120116先作单因素方差分析,再作协方差分析,并对结果加以比较。