1•上一章学习了一个或两个样本平均数的假设测验方法。•本章将介绍2个以上样本平均数的假设测验方法——方差分析。2方差分析第六章3•方差分析:将总变异分解,从而评定各变异在总变异中相对重要性的统计分析方法。•方差分析是科学试验分析中的一个十分重要的工具。方差分析与上章t测验一样,是通过将试验处理的效应与试验误差进行比较,来进行统计推断,只不过这里是采用方差来度量处理引起的变异和误差引起的变异。4第一节方差分析的基本原理平方和与自由度的分解F分布与F测验5总变异处理间变异+误差变异变异方差平方和除以自由度一、自由度和平方和的分解•方差是平方和除以自由度。要将一个试验资料的总变异分解为各个变异,首先必须将总平方和和总自由度分解为各个变异的相应部分。因此,自由度和平方和的分解是方差分析的第一步。•下面用一个例子来说明这一问题。6[例5.1]以A、B、C、D四种药剂处理水稻种子,每处理四个重复,各得4个苗高观察值(cm),试分解其自由度和平方和。药剂苗高观察值总和Ti平均数A182120137218B202426229223C101517145614D2827293211629T=336iy71、总变异把表中的全部观察值作为一个组,根据前面讲过的计算平方和和自由度的公式,可以计算出总变异的平方和和与自由度。60244336322118)()(2222222nkyyyySST其中:nkTnky22)(为矫正数,用C表示。总平方和:8总自由度:DFT=nk-1=4×4-1=1592、处理效应如果没有处理效应,表中各个处理间平均数来度量处理效应。iy从理论上讲均应该相等,因此,可以用iy10CnTSSit2处理间平方和和自由度:1kDFt115047056411656927222222CnTSSit3141kDFt123、误差表中重复间各观察值间,若不存在误差,则各观察值应该相等,由于误差是客观存在的,因而重复间各观察值间必然是有差异的,因此,可以用重复间的差异度量误差:etTetTDFDFDFSSSSSS,13SSe=SST-SSt=602-504=98。DFe=(kn-1)-(k-1)=15-3=1217.8129800.168350422eeetttdfSSsdfSSs14平方和与自由度的分解表2TS变异来源DFSSS2处理间k-1误差kn-k总变异kn-1nkTy22nkTnTi22tTSSSS将上述例子推广到一般,设有k个处理,每个处理有n次重复,则资料共有nk个观察值,其数据分析如下表。2tSse215二、F分布与F测验(一)F分布在一个正态总体中随机抽取两个样本,分别求得其方差2121ssF22s21s22s21s与,将和的比值定义为F,那么F值的分布就是F分布。16按上述方法从正态总体中进行一系列抽样,就可得到一系列的F值而作成一个F分布。F分布是平均数μ=1、取值区间为[0,∞]的一组曲线,是偏态分布曲线,曲线的形状决定于ν1和ν2。F分布一定区间的概率可以从已制成的F值表中查出(附表5,见361页)。表中给出了各种ν1、ν2下右尾概率α=0.05、α=0.01显著水平时的临界F值。17(二)F测验在方差分析中,F测验可用于检测某项变异因素的效应是否存在。所以,在计算F值时,总是将要测验的那一项变异因素作分子,而以误差变异作分母。18[例6.2]测定东方红3号小麦蛋白质含量10次,得方差为S12=1.621,测定农大139小麦的蛋白质含量5次,得方差S22=0.135,两个蛋白质含量的变异差异是否显著?答:比较两个变异是否显著,用F测验。1、提出无效假设:21=222、确定显著水平:a=0.053、进行显著测验:2221ssF=1.621/0.139=12.01查F值表:F0.05=6.00F大于F0.05,差异显著。192ts[例6.3]在例6.1中算得处理间方差=168.00,重复间方差2es=8.17,具有自由度ν1=3,ν2=12。试测验处理间变异与重复间变异差异是否显著?22etH0:22etHA:α=0.052056.2017.800.16822etssF查附表5在ν1=3,ν2=12时F0.05=3.49实得F>F0.05差异显著。21将例6.1和例6.3的分析结果归纳在一起,列出方差分析表如下:变异来源DFSSS2FF0.05处理间变异3504168.0020.563.49误差变异12988.17总变异15602水稻药剂处理苗高方差分析表22上一节对试验数据通过平方和与自由度的分解,将处理方差与误差方差作比较,由F测验推论处理间有显著差异,对有些试验来说方差分析已算告一段落,但对有些试验来说,其目的不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,故需进一步做处理平均数间的比较。一个试验中处理平均数间比较是多重比较。第二节多重比较23最小显著差数法q法新复极差法方法:24一、最小显著差数法最小显著差数法,简称LSD法nsstLSDeyyyySjiji2225[例6.4]试以LSD法测验各种药剂处理的苗高平均数之间的差异显著性。02.2417.82jiyys由附表4,DFe=12时,t0.05=2.179,t0.01=3.055故LSD0.05=2.179×2.02=4.40LSD0.01=3.055×2.02=6.1726处理苗高平均数差异显著性0.050.01D29B23A18C14不同药剂处理水稻苗高平均数比较(LSD法)abccAABBCC27二、q法q测验法(复极差法)是将k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差LSRα值的。nyyqLSRSsSeii228[例6.5]试以q法测验各种药剂处理的苗高平均数之间的差异显著性。43.14/17.8syi查附表7,得到当DFe=12时,p=2,3,4的qα值29LSRα值Pq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.055.397.2244.205.506.017.87处理苗高平均数差异显著性0.050.01D29aAB23bABA18cBCC14cC不同药剂处理水稻苗高平均数比较(q法)30三、新复极差法新复极差法(SSR法),与q法相似。计算LSRα值查的是SSRα值(附表8)而不是q表。SSRyLSRSiLSRα值PSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.6931处理苗高平均数差异显著性0.050.01D29aAB23bABA18cBCC14cC不同药剂处理水稻苗高平均数比较(SSR法)32第三节单向分组资料的方差分析组内观察值数目相等的单向分组资料的方差分析组内又分亚组的单向分组资料的方差分析组内观察值数目不等的单向分组资料的方差分析33一、组内观察值数目相等的单向分组资料的方差分析每组具n个观察值的k组数据的符号表组别观察值(yij,i=1,2,…,k;j=1,2,…,n)总和平均方差1y11y12…y1j…y1nT12y21y22…y2j…y2nT2:::…:…::::iyi1yi2…yij…yinTi:︰︰…:…::︰︰kyk1yk2…ykj…yknTkT=∑y1y2y21s22s2isiyky2ks单向分组资料是指观察值按一个方向分组的资料342tSse22S22etSS2TS35[例]某作物氮肥的盆栽试验,设5个处理,A施用一种氨水,B施用另一种氨水,C施碳酸氢铵,D施尿素,E不施氮肥。每处理重复四次(4盆)(施肥处理的施肥量每盆皆为折合纯氮1.2克),共5×4=20盆,随机放置于同一网室中,作物产量(克/盆)列于表6.11,试测验各处理的差异显著性。iTiy作物氮施肥盆栽试验的产量结果处理观察值A(氨水1)2430282610827.0B(氨水2)272421269824.5C(碳酸氢铵)3128253011428.5D(尿素)3233332812631.5E(不施肥)212216218020.052626.336(1)自由度和平方和的分解总变异自由度DFT=nk-1=5×4-1=19处理间自由度DFt=k-1=5-1=4误差自由度DFe=kn-k=5×4-5=15矫正数8138334552622.)/(nkTC24022130242222.CCySST23014)8098108(2222.C/CnTSSit010123012402...SSe37(2)F测验方差分析变异来源DFSSS2FF0.05F0.01处理间4301.275.3011.19**3.064.89误差15101.06.73总变异19402.2查F表当v1=4,v2=15时,F0.01=4.89,F=11.19F0.01推断:这个试验的处理平均数间是有极显著差异的。38(3)各处理平均数的比较(SSR法)单个平均数的标准误29714736./.ySi根据=15,查SSR表得p=2,3,4,5时的SSR0.05与SSR0.01值,将值分别乘以Si2值,即得值,列于下表,进而进行多重比较。SSRLSRpSSR0.05SSR0.01LSR0.05LSR0.0123.014.173.905.4133.164.374.105.6743.254.504.225.8453.314.584.295.94多重比较时的值计算LSR39施肥效果的显著性处理平均产量差异显著性5%1%尿素31.5aA碳酸氢铵28.5abAB氨水127.0bcAB氨水224.0cBC不施20.0dC推断:根据多重比较结果可知,施用氮肥(A、B、C、D)与不施氮肥有显著差异,且施用尿素、碳酸氢铵、氨水1与不施氮肥均有极显著差异;尿素与碳酸氢铵、碳酸氢铵与氨水1、氨水1与氨水2处理间均无显著差异。40二、组内观察值数目不等的单向分组资料的方差分析若k个处理中的观察值数目不等,分别为n1,n2,…,nk,在方差分析时有关公式因ni不相同而需作相应改变。主要区别点如下:41(1)自由度和平方和的分解DFDFtTetiTDFkDFnDF误差自由度处理间自由度总变异自由度11SSSSnTytTeiitTSSCSSCSS)/2(242(2)多重比较平均数的标准误为:nSseyi02022nseyySji43[例6.11]某病虫测报站,调查四种不同类型的稻田,每块稻田纵卷叶螟的虫口密度列于下表,试问四种不同类型稻田的虫口密度有否显著差异?iTiyyin不同类型稻田纵卷叶螟的虫口密度稻田类型编号ni12345678A1213141515161710214.577B1410111314117312.176C921011121312118010.008D1211109810127210.297T=3272844=7+6+8+7=28总变异自由度DFT=-1=28-1=27稻田类型间自由度DFt=k-1=4-1=3误差自由度DFe=-k=28-4=24ininin89381828)327(2./C11226893818004045121312222...CSST139677288067371022222.C////SSt98129.SSSSSStTe45资料的方差分析变异来源DFSSS2FF0.01处理间396.1332.045.91**4.72误差24129.985.42总变异27226.11F=5.91F0.01,4块麦田的虫口密度间有极显著差异。F测验显著,再作平均数间的比较。需进一步比较。3.0146Syi247单向分