两因素方差分析数据收集—区组设计Minitab两因素方差分析区组设计随机化完全区组设计平衡不完全区组设计(BIB设计)Minitab区组把全部试验单元分为若干个组,使得每个组内各试验单元之间的差异尽可能的小,这样的组被称为区组.如何建立区组被称为区组设计.在区组设计中,因子的水平被称为处理.Minitab区组设计的例子例有4种杀虫剂4321,,,AAAA,它们被称为4种处理.为了比较4种杀虫剂对棉田中害虫的杀虫效果高低,特选了20块田,每块1亩.如何安排试验呢?•随机化设计:将20块田随机的均分为4组,分别实施4种处理.其数据分析用单因子方差分析.评论:20块棉田试验单元间总有差异,如害虫多少,植物长势,土地肥沃程度等.这些差别对杀虫效果会带来影响,从而对比较产生干扰.假如此种差异很微小,实施随机化设计是妥当的.假如此种差异不可忽略,就要采取随机化区组设计.Minitab•随机化区组设计:分二步进行.第一步,将20块棉田按差异大小排序,将害虫最多的4块棉田分为第1个区组,将害虫最少的4块棉田分为第5个区组,其它按序入组.第二步,在1个区组内随机的实施一种杀虫剂.区组1区组2区组3区组4区组51A2A4A2A3A3A4A1A3A2A4A1A2A4A1A2A3A3A1A4A特点:每个处理(一种杀虫剂)在每个区组内仅出现一次;每个区组内各种处理也仅出现一次,且其次序是随机的.Minitab例:金属的硬度是用硬度计测定的,硬度计上的杆尖是关键部件.如今要比较四种不同质料的杆尖的差异,如何安排试验?•若每种杆尖要取4个硬度值,按随机化设计需要有16块同类金属.这时存在一个潜在问题,金属试件间在硬度上稍有不同,就会对比较杆尖产生影响.而不同炉钢在硬度上总是有差异的.•只取4块金属试件,在每块试件上每个杆尖各测一次(见图),而测试点可以随机选择.这时一块试件就是一个区组,4个杆尖就是4个处理.这样就完成一个随机化完全区组设计.区组1区组2区组3区组4①②②③③④④①④③①④②①③②图金属试件的随机化区组设计(①②③④表示4种不同杆尖)Minitab随机化区组设计的一般定义设(某因子)有v个处理需要比较,有n个试验单元用于试验.第一步:把n个试验单元均分为k个组(k=n/v),使每个组内的试验单元尽可能相似,这样的组称为区组.第二步:在每个区组内对各试验单元以随机方式实施不同处理.这样的设计称为随机化区组设计.若区组大小=处理个数v,这样的设计称为随机化完全区组设计.若区组大小<处理个数v,这样的设计称为随机化不完全区组设计.以上各种设计都是平衡的,若各区组大小不尽相同,称为不平衡区组设计.Minitab随机化完全区组设计的数据在随机化完全区组设计中一般假定有v个处理和b个区组,共需进行n=v×b次试验,记ijy表示第i个处理在第j个区组内进行试验所得到的观察值.区组处理12…b(处理)和均值111y12y…by11T1T221y22y…by22T2Tv1vy2vy…vbyvTvT(区组)和1B2B…bBvibjijyT11均值1B2B…bBvbTy/其中:T为全部vb个数据的总和,y为总均值.Minitab随机化完全区组设计的统计模型在v个处理和b个区组场合的统计模型如下:bjvibayijjiij,,2,1,,2,,1,其中ijy-第i个处理在第j个区组内的试验结果.-总均值,是待估参数.ia-第i个处理的效应,且满足021vaaa.jb-第j个区组的效应,且满足021bbbb.ij-试验误差,服从),0(2N.2为误差方差.由此可见:),(~2jiijbaNy.效应Minitab参数估计利用最小二乘法,可获得各种效应的最小二乘估计..,,2,1ˆ,,2,1ˆˆbjyBbviyTayjjii,,由此可得各拟合值ijyˆ与残差ije:yBTyyyeyBTbayjiijijijijjijiijˆˆˆˆˆMinitab总平方和分解公式在模型中,全部vb个观察值的总平方和有如下分解式:1)(112vbfyySTvibjijT,vibjjiijbjjviiyBTyyBvyTb1121212)()()(处理平方和:1)(12vfyTbSAviiA,区组平方和:1)(12bfyBvSBbjjB,误差平方和:vibjjiijeyBTyS112)(即有eBATeBATffffSSSS,.注意:设立区组的目的,就是把区组平方和从总平方和分解出来,免其对处理平方和与误差平方和的干扰,从而加强以后判断的准确性.Minitab各平方和的简化计算公式1,2112vb-fvbTySTvibjijT1,222221v-fvbTbTTTSAvA1,222221b-fvbTvBBBSBbB)1)(1(,bv-fSSSSeBATeMinitab平方和的性质•可以证明:平方和的期望分别为,)1)(1()(,)1()(,)1()(2122122bvSEbvbSEabvSEebjjBviiA由此可见,eeefSMS/ˆ2是误差方差的无偏估计.•可以证明:在诸处理效应皆为零时,)1(~/22vSA.在诸区组效应皆为零时,)1(~/22bSB.))1)(1((~/22bvSe,且三者相互独立.•检验诸处理效应皆为零时,所用的检验统计量是eeAAeAfSfSMSMSF//),(~eAffFMinitab•等价于检验如下一对假设:0210vaaaH:中至少有一个不为零:诸iaH1在此假设下,检验统计量为eAMSMSFMinitab随机化完全区组设计的方差分析表随机化完全区组设计的方差分析表来源平方和自由度均方和F比处理vbTTbSviiA21211vfAAAAfSMS/eAMSMSF区组vbTBvSbjjB21211bfBBBBfSMS/——误差BATeSSSS)1)(1(bvfeeeefSMS/总和vbTySvibjijT21121vbfTMinitab例化学制剂对布料有侵蚀作用,会降低布料的抗拉强度.某工程师研究出一种能抗化学制剂的新型布料,为考察其抗侵蚀作用,特选定4种化学制剂和5匹布.考虑到布匹间的差异,特在每匹布的中部切取4段布料组成一个区组,用随机化完全区组设计安排试验.试验数据如下:表试验数据(原始数据-70)区组处理12345iTiT13-131-330.623-242-161.235243-2122.4452752214.2jB1611811-4T=42jB40.254.52.75-1y=2.1Minitab例在化学制剂对布料抗拉强度的试验中,按表上的数据可算得各平方和及其自由度:方差分析表来源平方和自由度均方和F比处理37.8312.614.16区组91.3422.83——误差10.7120.89总和139.819给定显著性水平=0.05,查其临界值49.3)12,3(95.0F,由于F3.49,故拒绝0H,即四种化学制剂对新型布料的抗拉强度的影响有显著差异,还需改进布料设计.试验误差的方差2的估计是89.0ˆ2,94.0ˆ.Minitab注释一.假如不设立区组,则区组平方和并入误差平方和.数据仍然可按单因子方差分析处理,所得方差分析表如下:表把区组从设计中剔除后的不正确分析来源平方和自由度均方和F比处理37.8312.61.97误差102.0166.38总和139.819对给定=0.05,4种处理间没有显著差异.这一错误结论是没有重视区组作用而导致的.所以在试验中,凡是试验单元间有较大差异时,应运用区组概念去减少数据中的误差.Minitab注释二.可以把区组看作另一个因子•我们的注意力总是放在v个处理间是否有显著差异上.区组就象一个垃圾桶,把区组平方和分解出来就可以了.•若还要关注区组平方和的大小,即考察区组间是否存在显著差异,可把区组也看作一个因子.要检验如下一对假设:0210bbbbH:中至少有一个不为零:诸ibH1在此假设下,检验统计量为eBMSMSF•尽管对此检验的合理性存在着争论,但从双因子方差分析看,再一次使用F检验也未尝不可,把检验结果作为一种参考也是有价值的.Minitab注释三.随机效应问题,有三种情况•仅仅处理效应是随机的.•仅仅区组效应是随机的.•处理效应和区组效应都是随机的.这里仅讨论第二种情况,其它情况可作类似讨论.Minitab随机区组效应场合下的统计模型bjvibayijjiij,,2,1,,2,,1,其中ijy-第i个处理在第j个区组内的观察值.-总均值.ia-第i个固定处理的效应,且满足021vaaa.jb-第j个随机区组的效应,诸jb是来正态分布),0(2bN的一个样本,其中2b是区组效应的方差分量.ij-试验误差,ij),0(~2N,诸ij与诸jb相互独立,2是误差的方差.Minitab在上述假设下有bjviaNybiij,...,1,,,2,1),(~22,.其中和诸ia的最小二乘估计是yˆ,viyTaii,,2,1ˆ,方差分量2b与2的无偏估计为vMSMSeBb2ˆ,eMS2ˆ这是因为各平方和的期望值如下:222122)1)(1()()1()1()()1()(bvSEbvbSEabvSEebBviiAMinitab假设检验问题在随机区组效应场合的模型中,常需作如下二个检验.•对固定处理效应要建立的一对假设是:0210vaaaH::1H诸ia不全为零.•对随机区组效应要建立的一对假设是:00211201bbHH::•对0H与1H所用的检验统计量是:eAMSMSF,拒绝域),(1eAffFFW•对01H与11H所用的检验统计量是:eBMSMSF,拒绝域),(1eBffFFWMinitab注释四.多重比较问题•在固定处理效应场合,不论区组效应是否是随机的,只要处理效应间有显著差异,都应对处理效应施行多重比较.所用方法同单因素方差分析,但要注意:随机化完全区组设计中∆把重复数改为区组数b,水平数改为处理数.∆误差自由度ef=)1)(1(bv.Minitab注释五.模型的适合性在随机化完全区组设计场合(不管诸效应中是否有随机的),模型中都有正态性和方差齐性等两个问题.•在缺少重复情况下,对误差方差齐性的检验还缺少方法.只能从产生数据的过程来判断.若数据是在相同的或类似的环境下产生的,常可以认为误差方差近似达到齐性.•关于正态性诊断仍可借助残差分析进行.Minitab