1DOE及Minitab初级知識介绍(中)實驗分析方法DOE2內容提要•极差分析•定性指標定量化•公式評分法•方差分析•回歸分析•殘差分析DOE3极差分析的用法---单指标的分析方法例某炼铁厂为提高铁水温度,需要通过试验选择最好的生产方案经初步分析,主要有3个因素影响铁水温度,它们是焦比、风压和底焦高度,每个因素都考虑3个水平,具体情况见表。问对这3个因素的3个水平如何安排,才能获得最高的铁水温度?DOE4•解:如果每个因素的每个水平都互相搭配着进行全面试验,必•须做试验33=27次。现在我们使用L9(33)正交表来安排试验。DOE5我们按选定的9个试验进行试验,并将每次试验测得的铁水温度记录下来:为了便于分析计算,我们把这些温度值和正交表列在一起组成一个新表。另外,由于铁水温度数值较大,我们把每一个铁水温度的值都减去1350,得到9个较小的数,这样使计算简单。DOE6分析表DOE7解释:K1这一行的3个数分别是因素A,B,C的第1水平所在的试验中对应的铁水温度之和;K2这一行的3个数分别是因素A,B,C的第2水平所在的试验中对应的铁水温度之和;K3这一行的3个数分别是因素A,B,C的第3水平所在的试验中对应的铁水温度之和;k1,k2,k3这3行的3个数,分别是K1,K2,K3这3行中的3个数的平均值;极差是同一列中,k1,k2,k33个数中的最大者减去最小者所得的差。极差越大,说明这个因素的水平改变时对试验指标的影响越大。极差最大的那一列,就是那个因素的水平改变时对试验指标的影响最大,那个因素就是我们要考虑的主要因素.通过分析可以得出:各因素对试验指标(铁水温度)的影响按大小次序应当是C(底焦高度)A(焦比)B(风压);最好的方案应当是C2A3B2。与此结果比较接近的是第9号试验。为了最终确定上面找出的试验方案是不是最好的,可以按这个方案再试验一次,并同第9号试验相比,取效果最佳的方案。DOE8多指标的分析方法----综合平衡法例为提高某产品质量,要对生产该产品的原料进行配方试验。要检验3项指标:抗压强度、落下强度和裂纹度,前2个指标越大越好,第3个指标越小越好。根据以往的经验,配方中有3个重要因素:水分、粒度和碱度。它们各有3个水平。试进行试验分析,找出最好的配方方案。DOE9解:我们选用正交表L9(33)来安排试验。DOE10DOE1102468101214164680246810121446800.511.522.533.5468024681012141.11.31.502468101.11.31.500.511.522.533.51.11.31.5DOE12分析:1)粒度B对抗压强度和落下强度来讲,极差都是最大的,说明它是影响最大的因素,而且以取8为最好;对裂纹度来讲,粒度的极差不是最大,不是影响最大的因素,而且也以取8为最好;2)碱度C对三个指标的极差都不是最大的,是次要的因素。对抗压强度和裂纹度来讲,碱度取1.1最好;对落下强度,取1.3最好,但取1.1也不是太差,综合考虑碱度取1.1;3)水分A对裂纹度来讲是最大的因素,以取9为最好;但对抗压强度和落下强度来讲,水分的极差都是最小的,是影响最小的因素。综合考虑水分取9;最后较好的试验方案是B3C1A2DOE13多指标的分析方法----综合评分法例某厂生产一种化工产品,需要检验两下指标:核酸统一纯度和回收率,这两个指标都是越大越好。有影响的因素有4个,各有3个水平。试通过试验分析找出较好的方案解:这是4因素3水平的试验,可以选用正交表L9(34)。试验结果如表。DOE14总分=4x纯度+1x回收率DOE15分析:1)根据综合评分的结果,直观上第1号试验的分数最高,应进一步分析它是不是最好的试验方案;2)通过直观分析法可以得知,最好的试验方案是A1B3C2D1。A,D两个因素的极差都很大,是对试验影响较大的两个因素;3)分析出来的最好方案,在已经做过的9个试验中是没有的。可以按这个方案再试验一次,看能不能得出比第一号试验更好的结果,从而确定出真正最好的试验方案;综合评分法是将多指标的问题,通过加权计算总分的方法化成一个指标的问题,使对结果的分析计算都比较方便、简单。DOE16直接混合水平分正交析表例某农科站进行品种试验,共有4个因素:A(品种)、B(氮肥量)、C(氮、磷、钾比例)、D(规格)。因素A是4水平的,另外3个因素是2水平的。试验指标是产量,数值越大越好DOE17拟水平法分析表例今有一试验,试验指标只有一个,它的数值越小越好,这个试验有4个因素,其中因素C是2水平的,其余3个因素都是3水平的,试安排试验。解:我们从第1、第2两个水平中选一个水平让它重复一次作为第3水平,这就叫虚拟水平。一般应根据实际经验,选取一个较好的水平。DOE18拟水平法是将水平少的因素归入水平数多的正交表中的一种处理问题的方法。在没有合适的混合水平的正交表可用时,拟水平法是一种比较好的处理多因素混合水平试验的方法。它不仅可以对一个因素虚拟水平,也可以对多个因素虚拟水平。DOE19有交互作用的正交试验设计表•例6:(水平数相同)•我们用一个3因素2水平的有交互作用的例子来说明•某产品的产量取决于3个因素A,B,C,每个因素都有两个水•平。每两个因素之间都有交互作用,试验指标为产量,越高•越好。具体如下:DOE20解:这是3因素2水平的试验。3个因素A,B,C要占3列,它们之间的交互作用AxB,BxC,AxC又占3列。可用正交表L8(27).DOE21分析:从极差大小看,影响最大的因素是C,以2水平为好;其次是AxB,以2水平为好,第3是因素A,以1水平为好,第4是因素B以1水平为好。列出A和B进行组合的几种效果表:从此表可知,A和B的最佳组合为A1B2。AxC和BxC的极差很小,对试验的影响很小,忽略不计。综合分析,最好的方案应是A1B2C2,这与试验4相吻合。1216973.527265.5BAAXBDOE22方差分析•分析变量间相互关系及影响的方法。•可定量地分析出各因素对指标的影响并确定试验误差。•从统计上确定哪个是真正的重要因素。DOE23问题引出先看一个例子:考察温度对某一化工厂产品的產出率的影响,选了五种不同的温度,同一温度做了三次试验,测得结果如下:要分析温度的变化对產出率的影响总平均得率=89.6%DOE24从平均得率来看,温度对得率的影响?1)同一温度下得率產出率并不完全一样,产生这种差异的原因是由于试验过程中各种偶然性因素的干扰及测量误差等所致,这一类误差统称为试验误差;2)两种温度的產出率在不同的试验中的倾向有所差别。如65oC与70oC相比较,第一次65oC比70oC好,而后二次70oC比65oC好。产生这种矛盾的现象也是由于试验误差的干扰。由于试验误差的存在,对于不同温度下得率的差异自然要提出疑问,这差异是试验误差造成的,还是温度的影响呢?DOE251)由于温度的不同引起產出率的差异叫做条件变差;例中的全部15个数据,参差不齐,它们的差异叫做总变差(或总离差)。产生总变差的原因一是试验误差,一是条件变差。2)方差分析解决这类问题的思想是:a.由数据的总变差中分出试验误差和条件变差,并赋予它们的数量表示;b.用条件变差和试验误差在一定意义下进行比较,如两者相差不大,说明条件的变化对指标影响不大;反之,则说明条件的变化影响是很大的,不可忽视;c.选择较好的工艺条件或确定进一步试验的方向;DOE26变差的数量表示:有n个参差不齐的数据x1,x2,…,xn,它们之间的差异称为变差。如何给变差一个数量表示呢?1)一个最直观的想法是用这n个数中最大值与最小值之差,即极差来表达,用R记之;2)变差平方和,以S记之。S是每个数据离平均值有多远的一个测度,它越大表示数据间的差异越大。21)(xxSniiniixnx11其中变差平方和DOE27对变差平方和的进一步讨论:例:测得某高炉的六炉铁水含碳量为:4.59,4.44,4.53,4.52,4.72,4.55,求其变差平方和。043484.0)558.455.4()558.472.4()558.452.4()558.453.4()558.444.4()558.459.4(222222S558.4635.27)55.472.452.453.444.459.4(61xDOE28对变差平方和的进一步讨论(2):我们看到S的计算是比较麻烦的,原因是计算x时有效位数增加了因而计算平方时工作量就大大增加。另外,在计算x时由于除不尽而四舍五入,在计算S时,累计误差较大。为此常用以下公式:043483.0)55.4...44.459.4(61)55.4...44.459.4(2222S对于前面的例子DOE29自由度自由度的提出:例2:在上例的基础上在同样的工艺条件下又测了四炉铁水,它们是:4.60,4.42,4.68,4.54,加上原来的六炉共十炉,求其变方和。平均数与过去的结果是相近的,但平方和是显著地变大了。我们要设法消除数据个数的多少给平方和带来的影响。一个直观的想法是用平方和除以相应的项数,但从数学理论上推知这不是一个最好的办法,而应把项数加以修正,这个修正的数就叫做自由度。559.41059.45)54.4...59.4(61xDOE30设有n个数y1,y2,…,yn,它们的平方和的自由度是多少呢?这就看{yi}之间有没有线性约束关系,如果有m个(0mn)线性约束方程a11y1+a12y2+…+a1nyn=0a21y1+a22y2+…+a2nyn=0…am1y1+am2y2+…+amnyn=0并且这m个方程相互独立,即方程系数矩阵的秩等于m,则S的自由度是n-m.niiyS12根据这个定义,如令yi=xi-x(i=1,2,…,n)则显然{yi}之间有一个线性约束关系,即即m=1,a11=a12=…=a1n=1所以变差平方和的自由度=n-m=n-1niniiiyxxS1122)(0)(111xnxxxyniiniiniiDOE31均方的概念均方的概念:平均平方和(简称均方)等于变差平方和除以相应的自由度f.平均平方和以MS表示,它的开方叫做均方差对例1、MS=0.043483/5=0.0086966,均方差为0.09326对例2、MS=0.07949/9=0.0088322,均方差为0.09398我们看到六炉和十炉的MS是很相近的,这与工艺条件相同是吻合的,说明用MS反映波动的大小是更为合理的。fSMSSn11DOE32单素方差分析单因素方差基本公式nj为组内样本大小,i=1,…,n.nj为同一水平下的抽样数。g为组数,j=1,…,g,为总平均值为同一水平下的样本平均值xxDOE33单素方差分析•计算因子影响SST=Q=•总体标准偏差=(ng-1)×S2•计算误差影响•计算总平方和DOE34单因素方差分析自由度的概念:在实际计算中,我们发现在同样的波动程度下,数据多的平方和要大于数据少的平方和,因此仅用平方和来反映波动的大小还是不够的。我们要设法消去数据个数的多少给平方和带来的影响。为此引入了自由度的概念。一个直观的想法是用平方和除以相应的项数,但应把项数加以修正,这个修正的数就叫自由度。ST的自由度为(n-1);SA的自由度为(a-1);SE的自由度为(n-a);均方:MSA=SA/(a-1);MSE=SE/(n-a)DOE35F检验法:统计量F=MSA/MSE~F(a-1,n-a),对于给出的α,查出Fα(a-1,n-a)的值,由样本计算出SA和SE,从而算出F值。从而有如下判断:若FFα(a-1,n-a),则说明试验条件的变化对试验结果有显著影响;若FFα(a-1,n-a),则说明试验条件的变化对试验结果无显著影响;为了方便计算,我们采用下面的简便计算公式:记i=1,2,……,a,则有injijixx1injijaixx11..injijaiTnxxS