1第二节双因素试验的方差分析2在上一节介绍了单因素试验的方差分析方法.然而在许多问题中,还需对多个因素的影响进行分析.例如,在制定农业增产的生产规划时,对种子品种与肥料类型做出最优选择是首先要解决的问题.实践中常发生这样的情况:采用最优的种子与肥料类型,可能由于搭配得当而获得较高的亩产量.因而不仅需要分别研究不同品种的种子和不同类型肥料对亩产量影响,还需要研究各品种的种子与各类型肥料的不同搭配对亩产量的影响,这便是双因素试验的方差分析要研究的问题.更一般地,对多因素试验的问题还需考虑多因素试验的方差分析.以下我们仅介绍双因素试验的方差分析方法.3设在某项试验中有两个因素A,B在变化.因素A有r个不同的水平rAAA,,,21,因素B有s个不同水平sBBB,,,21.在水平组合jiBA,下的试验结果用ijX表示.4我们假定ijXsjri,,2,1;,,2,1相互独立,且服从正态分布2,ijN,也就是说,我们共有rs个相互独立的正态总体ijX.此外,在假定每个水平组合jiBA,下进行t次独立重复试验,5试验结果用ijkX1,2,,kt表示,我们把试验结果ijkX1,2,,kt看作是取自正态总体2,~ijijNX中的容量为t的样本.将这些数据列成下表6因素B各水平因素A各水平1B2BsB1AtXXX11112111,,,tXXX12122121,,,stssXXX12111,,,2AtXXX21212211,,,tXXX22222221,,,stssXXX22212,,,rAtrrrXXX11211,,,trrrXXX22221,,,rstrsrsXXX,,,217由于ijkX1,2,,kt是取自总体ijX中的样本,则有2,~ijijkNXsjri,,2,1;,,2,1,可将上式改写成如下形式:()()21,2,,;1,2,,;1,2,,~0,ijkijijkijkijkXirjsktNmeeseìï=+===ïïíïïïîLLL各相互独立8为进行统计分析,需将均值ij作适当分解,为此,令risjijrs111,sjijis11,riijjr119ii,ri,,2,1jj,sj,,2,1jiijij,其中称为总平均,i称为因素A的第i个水平iA的效应,j称为因素B的第j个水平jB的效应.10对于ij的上述表示式:jiijij,我们可以改写为jiijijjiij其中ij反映了水平组合jiBA,对试验指标的总效应.11在许多情况下,水平组合jiBA,的这种效应并不等于水平iA的效应i和jB的效应j之和.我们把效应ij减去iA的效应i和jB的效应j所得到差ij称为iA和jB对试验指标的交互作用的效应,简称交互效应.在多因素试验中,通常把因素A与因素B对试验指标的交互效应设想为某一新因素的效应.这个新因素记作BA,称这个新因素A与B的交互作用.12可以证明,011rrrriirii,011ssssjjsjj,0111111rsrsrsrsrsrssjjriirisjijrisjij.13上式可以改写为ijjiij,于是我们得到双因素试验的方差分析模型:.000.,0~,,2,1;,,2,1;,,2,111112risjijsjjriiijkijkijjiijkNtksjriX,,且相互独立,下面我们分两种情况来讨论双因素试验方差分析.14一、无交互作用的双因素试验方差分析15如果因素A与因素B之间不存在交互作用,则0ij,sjri,,2,1;,,2,1,于是jiij即每种水平组合jiBA,下的总体平均值ij可以看成是总平均与各因素水平的效应i,j的简单迭加.16这时为研究因素A,B对试验指标的影响是否显著,只需要对每种水平组合jiBA,作一次试验,即1t的情形.此时,模型可以写成如下形式:2111,2,,;1,2,,~0,.00.ijijijijrsijijXirjsN,且相互独立,上式就是无交互作用的双因素试验方差分析的数学模型.17由上式可知,为判断A对试验指标的影响是否显著,即等价于检验假设0:210rAH.类似地,判断因素B对试验指标的影响是否显著,即等价于检验假设0:210sBH.18为构造检验统计量,我们仿造单因素试验方差分析的做法,记risjijXrsX111,sjijiXsX11,riijjXrX11,19risjijTXXS112其中TS称为总离差平方和,简称为总平方和,也称为总变差平方和.20将TS分解为risjijTXXS112risjjijiijXXXXXXXX112sjjriirisjjiijXXrXXsXXXX1212112risjjjiijrisjijiijXXXXXXXXXXXX111122risjjiXXXX112.21可以证明,上述平方和分解中交叉项均为0.所以BAETSSSS,其中risjjiijEXXXXS112riiAXXsS12sjjBXXrS1222由于iX是水平iA下的所有观察值的平均,所以riiXX12反映了rXXX,,,21之间的差异程度.这种差异是由于因素A的不同水平所引起的,因此AS称为因素A的效应平方和,简称为因素A的平方和.同样的道理,BS称为因素B的效应平方和,简称为因素B的平方和.23又由于BATESSSS这表明ES是从总离差平方和TS中扣除因素A,B的效应平方和AS和BS之后的残量,这一残量反映了随机误差因素的影响,因此ES称为误差平方和.24与单因素试验的方差分析的讨论相类似,可以证明以下结论:①11~22srSE;②当AH0为真时,1~22rSA,而且AS与ES相互独立,从而11,1~111srrFsrSrSFEAA;③当BH0为真时,1~22sSB,而且BS与ES相互独立,从而11,1~111srsFsrSrSFEBB;25为此,选取AF,BF分别作为检验假设AH0,BH0的统计量.按照假设检验的程序,对显著性水平,确定临界值1,11Frrs,1,11Fsrs.当1,11AFFrrs时,拒绝AH0,1,11BFFsrs时,拒绝BH0,26为清楚起见,将上述分析结果汇总成下表,称下表为无交互作用的双因素试验方差分析表.表无交互作用的双因素试验方差分析表方差来源平方和自由度均方F值临界值显著性因素AAS1r1rSSAAAF1,11Frrs因素BBS1s1sSSBBBF1,11Fsrs误差ES11sr11srSSEE总和TS1rs27其中EAEAASSsrSrSF111,EBEBBSSsrSsSF111.为计算方便,常采用下列公式计算各偏差平方和.rsTXSrisjijT2112rsTTsSriiA2121rsTTrSsjjB2121BATESSSS28其中sjijiXT1,riijjXT1,risjijXT1129例1试验某种钢不同的含铜量在各种温度下的冲击值2cmkgm,其实测数据如下表,试在01.0下检验差异性是否显著?表某种钢的铜含量与不同温度下的冲击值表B铜含量A试验温度%2.0%4.0%8.0iT2iT20℃6.106.115.147.3689.13460℃0.71.113.134.3196.98520℃2.48.65.115.2225.50640℃2.43.67.82.1964.368jT268.354874.32072jT67664.1281230464.426130解:AH0:试验温度的各个水平无显著性差异;BH0:铜含量的各个水平无显著性差异.42.1135112risjijX,8.10911risjijXT,4r,3s.所以,75.130348.10942.113522112rsTXSrisjijT,315767.648.10912174.32073112212rsTTsSriiA,74.608.10912164.42614112212rsTTrSsjjB,4333.574.605767.6475.130BATESSSS,32AS自由度:31r,BS自由度:21s,ES自由度:611sr,于是,7707.2364333.535767.6463EAASSF,5376.3364333.525767.6462EBBSSF.33表试验数据方差分析表方差来源平方和自由度均方F值临界值显著性因素A5767.6435256.217707.230.013,69.78F显著因素B74.60237.305378.330.012,610.92F显著误差4333.5690555.0总和75.13011所以,拒绝AH0,认为试验温度的各个水平有显著性差异,拒绝BH0,认为铜含量的各个水平有显著性差异.34二、有交互作用的双因素试验方差分析35在无交互作用时,对因素A,B各水平的每种组合只进行一次试验,即1t.当要考虑因素间的交互作用BA时,在各水平组合下需要做重复试验.设每种水平组合下试验次数均为t1t.此时相对应的数学模型就是前述的公式.36对此模型要检验的假设为0:210rAH.0:210sBH.0:0ijBAH,sjri,,2,1;,,2,1.37为构造检验统计量,我们仍仿造单因素试验方差分析的做法.为此引进下列记号.risjtkijkXrstX1111,tkijkijXtX11,sjri,,2,1;,,2,1,sjtkijkiXstX111,ri,,2,1,ritkijkjXrtX111,sj,,2,1.38总平方和risjtkijkTXXS1112risjtkjiijjiijijkXXXXXXXXXX1112risjjiijsjjriirisjtkijijkXXXXtXXrtXXstXX11212121112BABAESSSS39其中risjjiijBAsjjBriiAr