方差分析和2k因子、3k因子设计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一节:单因素试验的方差分析第二节:双因素试验的方差分析第三节:因子设计的一般概念第四节:2k因子设计第五节:3k因子设计第二讲:方差分析和2k因子、3k因子设计假设:单因素A有a个水平A1,A2,……,Aa,在水平Ai(i=1,2,……,a)下,进行ni次独立试验,得到试验指标的观察值列于下表:我们假定在各个水平Ai下的样本来自具有相同方差σ2,均值分别为μi的正态总体Xi~N(μi,σ2),其中μi,σ2均为未知,并且不同水平Ai下的样本之间相互独立。可以取得下面的线性统计模型:xij=μ+δi+εij,i=1,2,……,a;j=1,2,……,ni,εij~N(0,σ2)其中δi=μi-μ第一节:单因素试验的方差分析方差分析的任务就是检验线性统计模型中a个总体N(μi,σ2)中的各μi的相等性,即有:原假设H0:μ1=μ2=……=μa对立假设H1:μi=μj至少有一对这样的i,j,也就是下面的等价假设:H0:δ1=δ2=……=δa=0H1:δi=0至少有一个i第一节:单因素试验的方差分析总离差平方和的分解:记在水平Ai下的样本均值为样本数据的总平均值为总离差平方和为将ST改写并分解得第一节:单因素试验的方差分析in1jijii.xn1xinjijaiixnx111injijaiTxxS121)()()(2)()()()(.1.112.112.121..1iijnjiainjiijainjiainjiijiaiTxxxxxxxxxxxxSiiii总离差平方和的分解(2):上面展开式中的第三项为0若记SA=SE=则有:ST=SA+SEST表示全部试验数据与总平均值之间的差异SA表示在Ai水平下的样本均值与总平均值之间的差异,是组间差SE表示在Ai水平下的样本均值与样本值之间的差异,是组内差,它是由随机误差引起的。第一节:单因素试验的方差分析injiaixx12.1)(injiijaixx12.1)(自由度的概念:在实际计算中,我们发现在同样的波动程度下,数据多的平方和要大于数据少的平方和,因此仅用平方和来反映波动的大小还是不够的。我们要设法消去数据个数的多少给平方和带来的影响。为此引入了自由度的概念。一个直观的想法是用平方和除以相应的项数,但应把项数加以修正,这个修正的数就叫自由度。ST的自由度为(n-1);SE的自由度为(n-a);SA的自由度为(a-1);均方:MSA=SA/(a-1);MSE=SE/(n-a)第一节:单因素试验的方差分析方差分析:在H0成立的条件下,取统计量F=MSA/MSE~F(a-1,n-a)对于给出的α,查出Fα(a-1,n-a)的值,由样本计算出SA和SE,从而算出F值。从而有如下判断:若FFα(a-1,n-a),则拒绝H0;若FFα(a-1,n-a),则接受H0为了方便计算,我们采用下面的简便计算公式:记i=1,2,……,a,则有第一节:单因素试验的方差分析injijixx1injijaixx11..injijaiTnxxS12..21,aiiiAnxnxS12..2,ATEsss方差分析表:第一节:单因素试验的方差分析例1:(单因素的方差分析)人造纤维的抗拉强度是否受掺入其中的棉花的百分比的影响是有疑问的。现确定棉花百分比的5个水平:15%,20%,25%,30%,35%。每个水平中测5个抗拉强度的值,列于下表。问:抗拉强度是否受掺入棉花百分比的影响(α=0.01)?第一节:单因素试验的方差分析5151..37611...7ijijxx解:设抗拉强度为xij=μi+εij,i,j=1,2,3,4,5.原假设H0:μ1=μ2=μ3=μ4=μ5备选假设H1:μi=μj,至少有一对i,j.这里a=5,ni=5(i=1,2,……,5),n=25ST,SA,SE的自由度分别为24,4,20第一节:单因素试验的方差分析515122222..296.6362537611...77ijijTnxxS512222..2.76.47525376)54...49(51iiiAnxnxS20.16176.47596.636ATESSS94.118476.475AMS06.82020.161EMS解(2):已给出α=0.01,查表得Fα(a-1,n-a)=F0.01(4,20)=4.43这里F=14.764.43=F0.01(4,20)故拒绝原假设H0,接受H1:μi=μj说明棉花的百分比对人造纤维的抗拉强度有影响。第一节:单因素试验的方差分析无交互作用的方差分析:设两因素A,B。A有a个水平A1,A2,……,Aa,B有b个水平,B1,B2,……,Bb,在每一个组合水平(Ai,Bj)下,进行一次无重复试验,得到试验指标的观察值列于下表:设Xij~N(μij,σ2),各xij相互独立。可以取得下面的线性统计模型:xij=μ+αi+βj+εij,i=1,2,……,a;j=1,2,……,b,εij~N(0,σ2),各相互独立,其中μ,αi,,βj,σ2都是未知数第二节:双因素试验的方差分析aibjjiBa110,0对这个线性模型,我们检验如下的假设HA0:α1=α2=……=αa=0HA1:αi=0至少有一个i,HB0:β1=β2=……=βb=0HB1:βj=0至少有一个j第二节:双因素试验的方差分析总离差平方和的分解:记在水平Ai下的样本均值为记在水平Bj下的样本均值为样本数据的总平均值为总离差平方和为将ST改写并分解得记为ST=SA(效应平方和)+SB(效应平方和)+SE(误差平方和)第二节:双因素试验的方差分析bjijixbx1.1aiijjxax1.1aibjijxabx111aibjijTxxS112)(aibjaibjjiijjiTxxxxxxaxxbS11112..2.2.)()()(自由度:ST的自由度为(ab-1);SA的自由度为(a-1);SB的自由度为(b-1);SE的自由度为(a-1)(b-1);均方:第二节:双因素试验的方差分析.)1)(1(,1,1baSMSbSMSaSMSEEBBAA方差分析:在H0成立的条件下,取统计量对于给出的α,查出Fα(a-1,(a-1)(b-1)),Fα(b-1,(a-1)(b-1))的值,由样本计算出F1,F2值。从而有如下判断:若F1Fα(a-1,(a-1)(b-1)),则拒绝HA0,否则就接受;若F2Fα(b-1,(a-1)(b-1)),则拒绝Hbo,否则就接受;为了方便计算,我们采用下面的简便计算公式:第二节:双因素试验的方差分析))1)(1(,1(~))1)(1(,1(~21babFMSMSFbaaFMSMSFEBEABATEbjjBaiiAaibjijTSSSSabxaxSabxbxSabxxS,,,12..2.12..2.112..2方差分析表:第二节:双因素试验的方差分析例2:(双因素无交互作用的方差分析)使用4种燃料,3种推进器作火箭射程试验,每一种组合情况做一次试验,则得火箭射程列在表中,试分析各种燃料(Ai)与各种推进器(Bj)对火箭射程有无显著影响(α=0.05)第二节:双因素试验的方差分析解:设火箭的射程为:xij=μ+αi+βj+εij,i=1,2,3,4,j=1,2,3原假设HA0:α1=α2=α3=α4=0HB0:β1=β2=β3=0备择假设HA1:αi=0,至少一个iHB1:βj=0,至少一个j这里a=4,b=3,ab=12第二节:双因素试验的方差分析73198223851575911134222385126874)204823792432(4112415759126874)1827170215481797(31123111342126874487...582123122222..2.41222222..2.41312222..2BATEjjbiiAijijTSSSSxxSxxSxxS解(2):给出的α=0.05,查出F0.05(3,6)=4.76,F0.05(2,6)=5.14因为F1=0.434.76,F2=0.925.14所以接受原假设HA0,HB0故不同的燃料、不同的推进器对火箭射程均无显著影响。第二节:双因素试验的方差分析有交互作用的方差分析(分析过程略):自由度:ST的自由度为(abn-1);SA的自由度为(a-1);SB的自由度为(b-1);SAxB的自由度为(a-1)(b-1):SE的自由度为ab(n-1);均方:第二节:双因素试验的方差分析)1(,)1)(1(,1,1nabSMSbaSMSbSMSaSMSEEAxBAxBBBAA有交互作用的方差分析(2):简化公式第二节:双因素试验的方差分析AxBBATEaibjBAijAxBbjjBaiiAaibjnkijkTSSSSSSSabnxxnSabnxxanSabnxxbnSabnxxS112...2.12...2..12...2..1112...2,1,1,1,有交互作用的方差分析(3):方差分析表第二节:双因素试验的方差分析为什么要进行因子设计:很多试验包含着两个、三个或更多的因子。对这些因子产生的效果都要进行研究。使用因子设计方法,在每一个完全的试验或试验的多次重复中,各个因子的各个水平的所有可能的组合都要考虑。例如,假若因子A有a个水平,因子B有b个水平。完成全部试验应包含所有的ab个组合。一个因子的效果是由因子水平的改变而引起的反应的变化,经常称为主要效果。第三节:因子设计的一般概念例:设某一试验有两个因子A和B,因子A有两个水平A1,A2,因子B两个水平B1,B2,试验所得数据如表。试考察因子A,B的效果。解:对于第一种情况。因子A的主要效果可看成是在A的第一个水平下的平均反应与在第二个水平下的平均反应之差,即类似地,因子B的主要效果是第三节:因子设计的一般概念212302025240A112402025230B解:对于第二种情况。因子A的主要效果是因子B的主要效果是分别画出这两种情况的图形:交互作用是不能忽视的有时它比因子的作用还大。第三节:因子设计的一般概念12402021250A92502021240B什么是2K因子设计:假设试验中共有k个因子,每个因子都只有两个水平。这些水平可以是数量性的,也可以不是数量性的(如两种操作方法)。这种设计的安排总共有2k个不同的组合,若每种组合下取一个观察值,总观察值共有2K个,因此叫2K因子设计。我们对2K设计作如下假设:1)因子是固定的;2)设计是完全随机的;3)一般都满足正态性假定;4)反应近似于线性;第四节:2k因子设计22设计:这是2k因子设计中最简单的一种设计,每个因子的两个水平可以用“低”和“高”来作一般性的描述。为分析问题方便,我们用A表示因子A的效果,B表示因子B的效果,AB表示交互作用AxB的效果。a表示因子A在高水平、因子B在低水平情况下观察值之和;b表示因子A在低水平、因子B在高水平下的观察值之和;ab表示因子A,B都在高水平情况下观察值之和,l表示因子A,B都在低水平情况下观察值之和。第四节:2k因子设计假设在每一种水平组合下作n次重复观察因子A的平均效果:在B的低水平下为在B的高水平下为总平均效果是这两个数的平均值同理因子B的总平均效果是交互作用AxB的平均效果AB定义如下:它是在B的高水平下与在B的低水平下A的平均效果之差的平均值。][21]}[]{[21balabnlababnAB][1lan][1

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功