01方差分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1方差分析专题单因素试验的方差分析(一)单因素试验在科学试验和生产实践中,影响一事物的因素往往是很多的。例如,在化工生产中,有原料成分、原料剂量、催化剂、反应温度、压力、溶液浓度、反应时间、机器设备及操作人员的水平等因素。每一因素的改变都有可能影响产品的数量和质量。有些因素影响较大,有些较小。为了使生产过程得以稳定,保证优质、高产,就有必要找出对产品质量有显著影响的那些因素。为此,我们需进行试验。方差分析就是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的有效方法。在试验中,我们将要考察的指标称为试验指标。影响试验指标的条件称为因素。因素可分为两类,一类是人们可以控制的(可控因素);一类是人们不能控制的。例如,反应温度、原料剂量、溶液浓度等是可以控制的,而测量误差、气象条件等一般是难以控制的。以下我们所说的因素都是指可控因素。因素所处的状态,称为该因素的水平(见下述各例)。如果在一项试验中只有一个因素在改变称为单因素试验,如果多于一个因素在改变称为多因素试验。例1设有三台机器,用来生产规格相同的铝合金薄板。取样,测量薄板的厚度精确至千分之一厘米。得结果如表9.1所示。表9.1铝合金板的厚度机器Ⅰ机器Ⅱ机器Ⅲ0.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2430.2610.262这里,试验的指标是薄板的厚度。机器为因素,不同的三台机器就是这个因素的三个不同的水平。我们假定除机器这一因素外,材料的规格、操作人员的水平等其它条件都相同。这是单因素试验。试验的目的是为了考察各台机器所生产的薄板的厚度有无显著的差异。即考察机器这一因素对厚度有无显著的影响。例2下面列出了随机选取的、用于计算器的四种类型的电路的响应时间(以毫秒计)。表9.2电路的响应时间类型Ⅰ类型Ⅱ类型Ⅲ类型Ⅳ192016182221152220331819182726154017这里,试验的指标是电路的响应时间。电路类型为因素,这一因素有4个水平。这是一个单因素试验。试验的目的是为了考察各种类型电路的响应时间有无显著差异。即考察电路类型这一因素对响应时间有无显著的影响。例3一火箭使用了四种燃料,三种推进器作射程试验。每种燃料与每种推进器的组合2各发射火箭两次,得结果如下(射程以海里计)。表9.3火箭的射程推进器(B)1B2B3B燃料(A)1A58.256.265.352.641.260.82A49.154.151.642.850.548.43A60.170.939.258.373.240.74A75.858.248.771.55141.4这里,试验的指标是射程,推进器和燃料是因素,它们分别有3个、4个水平。这是一个双因素的试验。试验的目的在于考察在各种因素的各个水平下射程有无显著的差异,即考察推进器和燃料这两个因素对射程是否有显著的差异。本节限于讨论单因素试验,我们就例1来讨论。在例1中,我们在因素的每一水平下进行了独立实验,其结果是一个随机变量。表中数据可看成来自三个不同总体(每个水平对应一个总体)的样本值。将各个总体的均值依次记为1,2,3。按题意需要检验假设3210:H3211,,:H不全相等现在进而假设各总体均为正态变量,且各总体的方差相等,那么这是一个检验同方差的多个正态总体均值是否相等的问题。下面所要讨论的方差分析法,就是解决这类问题的一种统计方法。现在开始讨论单因素试验的方差分析。设因素有s个水平sAAA,,,21,在水平jA(sj,,2,1)下,进行jn(2jn)次独立实验,得到如下表的结果。表9.4水平观察值1A2A…sA11x12xsx121x22xsx2…………11nx22nxsnsx样本均值1x2xsx总体均值12s我们假定:各个水平jA(sj,,2,1)下的样本12,,,jjjnjxxx来自具有相同方差2,3均值分别为j(sj,,2,1)的正态总体),(2jN,j与2未知。且设不同水平jA下的样本之间相互独立。由于),(~2jijNx,即有),0(~2Nxjij,故jijx可看成是随机误差。记ijjijx,则ijx可写成2,1,2,,;1,2,,,~(0,),,ijjijjijijxinjsN各独立(1.1)其中j与2均为未知参数。(1.1)式称为单因素试验方差分析的数学模型。这是本节的研究对象。方差分析的任务是对于模型(1.1),01检验s个总体),(,),,(),,(22221sNNN的均值是否相等,即检验假设sH210:sH,,,:211不全相等。(1.2)02作出未知参数221,,,,s的估计。为了将问题(1.2)写成便于讨论的形式,我们将s,,,21的加权平均值sjjjnn11记为,即sjjjnn11(1.3)其中sjjnn1。称为总平均。再引入sjjj,,2,1,(1.4)此时有02211ssnnn,j表示水平jA下的总体平均值与总平均的差异,习惯上将j称为水平jA的效应。利用这些记号,模型(1.1)可改写成)1.1(,),,0(~,,,2,1;,,2,1,0,21独立各ijijjsjjjijjijNsjninx而假设(1.2)等价于假设40:210sHsH,,,:211不全为零。)2.1(这是因为当且仅当s21时j,即0j,(sj,,2,1)。(二)平方和的分解下面我们从平方和的分解着手,导出假设检验)2.1(的检验统计量。引入总平方和sjniijTjxxS112)((1.5)其中sinjijjxnx111(1.6)是数据的总平均。TS能反映全部试验数据之间的差异,因此TS又称为总变差。又记水平jA下的样本平均值为jx,即jniijjjxnx11(1.7)我们将TS写成sjnijjijsjnijsjnijijsjnijjijsjniijTjjjjjxxxxxxxxxxxxxxS11112112112112))((2)()()()()(注意到上式第三项(即交叉项)sjnijijjsjnijjijjjxxxxxxxx11110)()(2))((2于是我们就将TS分解成为AETSSS,(1.8)其中sjnijijEjxxS112)(,(1.9)21212112)()(xnxnxxnxxSsjjjsjjjsjnijAj(1.10)上述ES的各项2)(jijxx表示在水平jA下,样本观察值与样本均值的差异,这是由随机5误差所引起的。ES叫做误差平方和。AS的各项2)(xxj表示jA水平下的样本平均值与数据总平均的差异,这是由水平jA引起的。AS叫做因素A的效应平方和。(1.8)式就是我们所需要的平方和分解式。(三)ES,AS的统计特性为了引出)2.1(的检验统计量,我们依次来讨论ES,AS的一些统计特性。(1)ES的统计特性将ES写成snisisniiniiExxxxxxS1212221211)()()(21(1.11)注意到jnijijxx12)(是总体),(2jN的样本方差的1jn倍,于是有)1(~)(2212jnijijnxxj因各ijx独立,故(1.11)式中各平方和独立。由2分布的可加性知sjjEnS122)1(~,即)(~22snSE,(1.12)由(1.12)式还可知,ES的自由度为sn。且有2)()(snSEE(1.13)(2)AS的统计特性我们看到sjjjsjnijAxxnxxSj12112)()(是s个变量)(xxnjj(sj,,2,1)的平方和,它们之间仅有一个线性约束条件0)()(11sjjjsjjjjxxnxxnn6故知AS的自由度为1s。再由(1.3),(1.6)及ijx的独立性,知),(~2nNx(1.14)即得221212222122221222122122122)()()()()()()()(nnnnsnnnnnnnnxExDnxExDnxnExEnxnxnESEsjjjsjjjsjjjjsjjjjsjjjjsjjjsjjjA由)1.1(式,知01sjjjn,故有sjjjAnsSE122)1()((1.15)进一步还可以证明AS与ES独立,且当0H为真时)1(~22sSA(1.16)证略。思考:当0H为真时,整个样本来自什么总体?(四)假设检验问题的拒绝域现在我们可以来确定假设检验问题)2.1(的拒绝域了。由(1.15)式知,当0H为真时72)1(sSEA(1.17)即1sSA是2的无偏估计。而当1H为真时,012sjjjn,此时21221)1(snsSEsjjjA(1.18)又由(1.13)式知2)(snSEE(1.19)即不管0H是否为真,snSE都是2的无偏估计。综上所述,分式snSsSFEA1的分子与分母独立,ES的分布与0H无关,分母的数学期望总是2。当0H为真时,分子的数学期望为2,而当1H为真时,由(1.18)式分子的取值有偏大的趋势。故知检验问题)2.1(的拒绝域具有形式ksnSsSFEA1其中k由预先给定的显著性水平确定。由(1.12),(1.16)式及ES与AS的独立性知,当0H为真时,),1(~)()1(122snsFsnSsSsnSsSEAEA由此得检验问题)2.1(的拒绝域为8),1(1snsFsnSsSFEA(1.20)上述分析的结果可排成表9.5的形式,称为方差分析表。表9.5单因素试验方差分析表方差来源平方和自由度均方F比因素AAS1s1sSSAAEASSF误差ESsnsnSSEE总和TS1n表中1sSSAA,snSSEE分别称为AS,ES的均方。思考:当0H为真时,均方的数学期望分别是什么?因此均方又可以称什么?另外,由于在TS中n个变量xxij之间仅满足一个约束条件(1.6),故TS的自由度为1n。例4如上所述,在例1中需要检验假设3210:H3211,,:H不全相等试取05.0,完成这一假设检验。解:表9.6例4的方差分析表方差来源平方和自由度均方F比因素A0.0010533320.0005266732.92误差0.00019200120.00001600总和0.0012453314因92.3289.3)12,2(05.0F,故在水平0.05下拒绝0H,认为各台机器生产的薄板厚度有显著的差异。例5设在例2中的四种类型电路的响应时间的总体均为正态,且各总体的方差相同。又设各样本相互独立。试取05.0,检验各类型电路的响应时间是否有显著差异。解:我们需检验假设43210:H43211,,,:H不全相等表9.7例5的方差分析表9方差来源平方和自由度均方F比因素A318.977777783106.325925933.76误差395.466666671428.24761905总和714.4444444417因76.334.3)14,3(05.0

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功