第四章方差分析方差分析解决的主要问题是什么?单因素方差分析与双因素方差分析原理的相同点与不同点?正交实验设计的基本原理是什么?第四章方差分析[例题]某公司计划引进一条生产线.为了选择一条质量优良的生产线以减少日后的维修问题,他们对6种型号的生产线作了初步调查,每种型号调查4条,结果列于表8-1。这些结果表示每个型号的生产线上个月维修的小时数。试问由此结果能否判定由于生产线型号不同而造成它们在维修时间方面有显著差异?4.1方差分析的基本概念和原理第四章方差分析表4-1对6种型号生产线维修时数的调查结果序号型号1234A型9.58.811.47.8B型4.37.83.26.5C型6.58.38.68.2D型6.17.34.24.1E型10.04.85.49.6F型9.38.77.210.14.1方差分析的基本概念和原理第四章方差分析研究的指标:维修时间记作Y,控制因素是生产线的型号,分为6个水平即A,B,C,D,E,F,每个水平对应一个总体Yi(i=1,2,…,6)。),(~2NY4.1方差分析的基本概念和原理第四章方差分析现在的试验就是进行调查,每种型号调查4台,相当于每个总体中抽取一个容量为4的样本,得到的数据记作yij(i=1,2,…,6;j=1,2,3,4),即为下表数据。计算各样本平均数如下:iy型号ABCDEF9.45.57.95.47.58.8iy表8-24.1方差分析的基本概念和原理第四章方差分析两个总体平均值比较的检验法把样本平均数两两组成对:与,与,…与,与,…,与,共有(15)对。1y2y1y3y1y6y2y3y5y6y26C4.1方差分析的基本概念和原理第四章方差分析即使每对都进行了比较,并且都以0.95的置信度得出每对均值都相等的结论,但是由此要得出这6个型号的维修时间的均值都相等。这一结论的置信度仅是上述方法存在的问题工作量大置信度低将这15对平均数一一进行比较检验4632.0)95.0(154.1方差分析的基本概念和原理第四章方差分析方差分析的基本原理:(1)将数据总的偏差平方和按照产生的原因分解成:(总的偏差平方和)=(由因素水平引起的偏差平方和)+(试验误差平方和)(2)上式右边两个平方和的相对大小可以说明因素的不同水平是否使得各型号的平均维修时间产生显著性差异,为此需要进行适当的统计假设检验.4.1方差分析的基本概念和原理第四章方差分析数学模型和数据结构参数点估计分解定理自由度显著性检验多重分布与区间估计4.2单因素试验的方差分析第四章方差分析在单因素试验中,为了考察因素A的k个水平A1,A2,…,Ak对Y的影响(如k种型号对维修时间的影响),设想在固定的条件Ai下作试验.所有可能的试验结果组成一个总体Yi,它是一个随机变量.可以把它分解为两部分(4-1)iiiY4.2.1数学模型和数据结构第四章方差分析其中:纯属Ai作用的结果,称为在Ai条件下Yi的真值(也称为在Ai条件下Yi的理论平均).是实验误差(也称为随机误差)。(4-2)其中,和都是未知参数(i=1,2,…,k).ii),0(~2Ni),(~2iiNYi24.2.1数学模型和数据结构第四章方差分析假定在水平Ai下重复做m次试验,得到观测值imiiYYY,...,,2112…j…M合计平均A1Y11Y12…Y1j…Y1mT1A2Y21Y22…Y2j…Y2mT2………………………AiYi1Yi2…Yij…YimTi………………………AkYk1Yk2…Ykj…YkmTk1Y2YiYkY表4-34.2.1数学模型和数据结构第四章方差分析表中:(i=1,2,…,k)(4-3)Yij表示在Ai条件下第j次试验的结果,用式子表示就是(i=1,2,…,kj=1,2,…,m)(4-4)注意:每次试验结果只能得到Yij,而(4-4)式中的和都不能直接观测到。mjijiYmY11ijiijYiij4.2.1数学模型和数据结构第四章方差分析为了便于比较和分析因素A的水平Ai对指标影响的大小,通常把再分解为(i=1,2,…,k)(4-5)其中,称为一般平均(GrandMean),它是比较作用大小的一个基点;iiikiik118.2.1数学模型和数据结构第四章方差分析并且称为第i个水平Ai的效应.它表示水平的真值比一般水平差多少。满足约束条件(4-6)可得ii021k;ijiijY0ii=1,2,…,k;j=1,2,…,m4.2.1数学模型和数据结构第四章方差分析要解决的问题找出参数和的估计量分析观测值的偏差k,....,,,212检验各水平效应有无显著差异k,...,,214.2.1数学模型和数据结构第四章方差分析用最小二乘法求参数的估计量,然后寻求的无偏估计量.须使参数的估计值能使在水平Ai下求得的观测值Yij与真值之间的偏差尽可能小。为满足此要求,一般考虑用最小偏差平方和原则,也就是使观测值与真值的偏差平方和达到最小.k,....,,,212k,....,,,21i4.2.2参数点估计第四章方差分析由(4-4)可知,上述偏差平方和令下列各偏导数为零22112)()(iijiijkimjijYYS,0S0iS(i=1,2,…,k)4.2.2参数点估计第四章方差分析由解得(4-7)由解得(4-8)0)(2iijYSYYkmij1ˆ0)(21imjijiYSYYYmimjiji11ˆ4.2.2参数点估计第四章方差分析并由此得的估计量至此,求得参数的估计量(4-9)iiiYˆˆˆiii,,,ˆY,ˆYYiiiiYˆ4.2.2参数点估计第四章方差分析按照上述原则求参数估计量的方法称为最小二乘法,称为最小二乘估计量.我们还可以证明分别是参数的无偏估计量。将和分别用它们的估计量代替,可以得到试验误差的估计量,(4-10)ii,,ii,,ii,,iijijeiijijYYe4.2.2参数点估计第四章方差分析为了由观测值的偏差中分析出各水平的效应,我们研究三种偏差:,和.根据前面参数估计的讨论,它们分别表示,定理(4-11)YYijYYiiijYYijYiij21121211)()()(kimjiijkiikimjijYYYYmYY的估计.和4.2.3分解定理自由度第四章方差分析)()(iijiijYYYYYY222)())((2)()(iijiijiiijYYYYYYYYYY21112)()(YYmYYkiikimji证明:0)(1imjijYY4.2.3分解定理自由度第四章方差分析令则分解定理(8-11)可写成(4-12)2)(YYSijT2)(YYmSiA2()iEijSYYEATSSS4.2.3分解定理自由度第四章方差分析上式中,称为总偏差平方和.称为误差平方和(或组内平方和);称为因素A的效应平方和(或组间平方和),ST的自由度fT=km-1SA的自由度fA=k-1SE的自由度fE=k(m-1)容易看出,自由度之间也有类似于分解定理的关系(4-13)TSESASEATfff4.2.3分解定理自由度第四章方差分析参数假设检验的假设条件观测值(i=1,2,…,k;j=1,2,…,m)相互独立在水平Ai条件下,Yij(j=1,2,…m)服从正态分布N),(2i4.2.4显著性检验第四章方差分析要判断在因素A的k个水平条件下真值之间是否有显著性差异,即检验假设H0:,H1:不全相等相当于检验假设H0:(i=1,2,…,k),H1:αi不全为零k210i4.2.4显著性检验第四章方差分析可以证明当H0为真时,,,(4-16)并且与相互独立.得(4-17)其中和称为均方(MeanSquare).)1(~22kmST),1(~22kSA))1((~22mkSE2AS2ES))1(,1(~)1(/)1/()1(/)1/(22mkkFmkSkSmkSkSFEAEAA)1/(kSA)1(/mkSE4.2.4显著性检验第四章方差分析利用(8-17)式来检验原假设H0是否成立.对于给定的显著水平,可以从F分布表查出临界值再根据样本观测值算出FA的值.当时,拒绝H0,当时,接受H0。)),1(,1(mkkF))1(,1(mkkFFA))1(,,1(mkkFFA4.2.4显著性检验第四章方差分析方差来源平方和自由度均方F比组间(因素A)SAK-1SA/(k-1)组内(实验误差)SEK(m-1)SE/k(m-1)总和ST=SA+SEKm-1---)1(/1/mkSkSFEAA表4-4方差分析表4.2.4显著性检验第四章方差分析下面继续讨论前面6种型号的生产线的例子。根据调查结果,在=0.05的显著水平时,检验这6种型号的生产线在平均维修时间方面有无显著差异?根据实践经验,认为各种型号生产线的维修时间是近似服从正态分布的。作统计假设:6种型号的生产线平均维修时数无显著差异,即H0:αi=0(i=1,2,…,6),H1:αi不全为零4.2.4显著性检验第四章方差分析计算SA及SEkmTmTYYmSikiiA2221)(mTYYYSiijiijE222)(mjijiYT1ijjYTT4.2.4显著性检验第四章方差分析表4-5计算列表台号型号1234TiTi2A型9.58.811.47.837.51406.25358.49B型4.37.83.26.521.8475.24131.82C型6.58.38.68.231.6998.56252.34D型6.17.34.24.121.7470.89124.95E型10.04.85.49.629.8888.04244.36F型9.38.77.210.135.31246.09316.03mjijY127.177iT07.54852iT99.14272ijY4.2.4显著性检验第四章方差分析再将计算结果分别代入SA与SE两式中,得到第一自由度第二自由度55.55467.177407.5485222kmTmTSiA72.56407.548599.142722mTYSiijE5161kfA1836)1(mkfE4.2.4显著性检验第四章方差分析查F分布表得由于,故拒绝H0。该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显著差异的。77.2)18,5(05.0F77.253.3AF方差来源平方和自由度均方F比组间SA55.55511.11组内SE56.72183.15总和ST112.2723---53.315.311.11AF表4-6方差分析表4.2.4显著性检验第四章方差分析q检验法:计算任意两水平的差值,当时,判断与差异显著;当时,判断与差异显著。查多重比较的q表得(8-18)siYY)(si),(EfkqmfSfkqDEE/),(siYYDiYsYsiYYDiYsY4.2.5多重分布与区间估计第四章方差分析区间估计在置信度为的情况下,的置信区间为(8-19)1siDYYDYYsisisi)()(4.2.5多重分布与区间估计第四章方差分析双因素方差分析的类型数据结构离差平方和的分解应用实例4.3双因素方差分析第四章方差分析在实际问题的研究中,有时需要考虑两个因素对实验结果的影响。例如饮料销售,除了关心