DOE(DesignOfExperiment)讲师:李明时间:2016-06-25康达信管理顾问有限公司授课大纲一、实验设计简介:实验设计的定义实验设计的历史与发展实验设计的用途二、实验设计类型:全因子实验设计、部分因子实验设计三、设计一个DOE的步骤:a.计划阶段,b.实施阶段,c.分析阶段四、全因子DOE设计分析五步法(60分钟)授课大纲五、全因子DOE结果分析:因素影响与交互影响极差分析ANOVA方差分析单向方差分析双向方差分析回归分析六、如何利用专业软件进行全因子DOE分析:举例分析七、全因子DOE在应用中的问题一、实验设计简介二、实验设计类型三、设计一个DOE的步骤四、全因子DOE设计分析五步五、全因子DOE结果分析六、如何利用专业软件进行全因子DOE分析七、全因子DOE在应用中的问题为什么要做DOE?1.这里有9个球,其中有且只有一个球质量为9克,其它8个都为10克。给你一架天平,请找出重为9克的那个球。请问,你至少要称几次?实验设计的意义:应用数理统计学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。在工序开发应用实验设计方法能得出以下成果:1.提高产量;2.减少变异性,与额定值或目标值更为一致;3.减少开发时间;4.减少总成本;实验设计的意义•DOE定义:试验设计X1X2X3U1U2U3Y1Y2Y3PROCESS什么变量显著影响着我们的绩效•我们假定过程的结果当中,y1,y2,y3……是我们关心的输出变量•这些我们常常称之为响应(response)X1X2X3U1U2U3Y1Y2Y3PROCESS基本术语——响应•我们将影响响应的那些变量称为实验问题中的因子。其中x1,x2,x3是人们在实验中可以控制的因子,我们称为可控因子(controlledfactor)可控因子是输入变量,是影响过程最终结果的X1X2X3U1U2U3Y1Y2Y3PROCESS基本术语——可控因子•在影响过程和结果的因子中除了控制因子还包括一些非可控因子(uncontrolledfactor):u1,u2……,他们通常包括环境、操作员、材料批次等对于这些变量我们通常很难把它们控制在某个精确值上。X1X2X3U1U2U3Y1Y2Y3PROCESS基本术语——不可控因子做一次取得观察值得试验又叫运行水平处理•Levelandtreatment:水平和处理因子的不同取值叫水平或设置试验环境试验单元•Experimentunitandexperimentenvironment:试验单元和试验环境试验中的最小单元,如一件产品,一次诊断试验的周围条件,如:温度、湿度、电压基本术语——主效应•举一个简单的例子在农田实验中,考虑两个因子,每个因子都设置了两个水平:–A因子:浇水水少水多–B因子:施肥肥少肥多•实验结果如下(响应是产量(kg)):实验浇水(A)施肥(B)产量1水少肥少1002水少肥多1303水多肥少1204水多肥多170•Maineffectandinteractioneffect:主效应和交互效应主效应:由某因子完全作用引导的变化叫这个因子的主效应B肥A水多少多少100130120170A的主效应=(120+170)/2-(100+130)/2=30B的主效应=(130+170)/2-(100+120)/2=40交互效应:一个因子的效应依赖于另外一个因子所处的水平时,就称它们之间有交互效应BMean10-19080706050ACenter1CornerPointType-1Corner0InteractionPlot(datameans)forresult交互效应不明显交互效应明显CMean10-17570656055BCenter1CornerPointType-1Corner0InteractionPlot(datameans)forresult•DOE的试验进程:人类在认识自然的过程中,进行着许多方面的探索。试验就是学习过程中一个重要的因素。从爱迪生的“天才靠的是百分之一的灵感和百分之九十九的汗水”到今天的统计学的科学运用,大大缩短了试验的时间和节约大量的成本•DOE的用途:通过试验设计获取更多的有用的新信息,帮助我们找到哪些是显著影响输出绩效的变量,找出它们的关系,运用优化器选择我们需要的最佳设置。一、实验设计简介二、实验设计类型三、设计一个DOE的步骤四、全因子DOE设计分析五步五、全因子DOE结果分析六、如何利用专业软件进行全因子DOE分析七、全因子DOE在应用中的问题六西格码试验设计•DOE的分类:根据不用的研究内容,试验设计有多种方法的分类:根据试验因子的个数:单因子和多因子根据试验的目的:因子设计和回归设计因子设计:在相当多的因子中,找出哪些自变量X显著影响着Y应予保留,反之应予删除,这就是因子筛选设计回归设计:为了确定X与Y的关系式,找出Y对于X的回归方程,目是针对回归方程的称为回归设计当然这两类设计也有相同这处:1.筛选因子的方法其实也是先建立一个Y与X的简单线性回归方程,然后根据各项系数的显著性来筛选;2.建立了回归方程,特别是含平方的项的响应曲面方程,判断是否有效应不显著的因子,可以删除,达到筛选因子的目的但因子设计主要是建立线性关系筛选关键因子,要求比较粗糙试验次数比较少,回归是二阶的要求要细致很多,试验次数要大增。在因子设计中,又可以按因子水平个数分二水平因子设计、三水平因子设计和混合水平因子设计,在实践中证明:在因子设计,使用二水平正交试验法,加若干个中心点的设计方法最简单有效,再细分,有全因子试验设计和部分因子试验设计两大类,在这里全因子更具有通用性。全因子试验设计:所有因子的所有水平的所有组合都至少要进行一次试验,所以试验的次数较多,但可以估计出所有的主效应和所有的各阶效应:一.试验的目的:兼有因子筛选和回归设计两方面的目的,它可以分析出所有因子的主效应和各因子之间的各阶交互作用的效应。二.试验的安排和中心点的选取:试验的安排主要是考虑三个基本原则:重复试验、随机化和划分区组,如何实现重复?是将每一个试验条件重复2次或更多,好处是对试验误差估计得更准确,但试验次数太多代价太大,另一种巧妙的方法是在“中心点”处安排重复试验能够取得很好的效果,通常是3-4次。三:代码化及其计算:是用原始自变量数值回归分析好呢还是将这些数值进行代码化后再进行回归分析好呢?所谓代码化就是:高水平+、低水平-、中心水平0表示,好处:1.代码化的回归方程中,自变量及作用项的各系数可以直接比较,系数绝对值大的比系数绝对值小的效应更重要、更显著2.代码化后的回归方程中个估计量之间是不相关的3.自变量代码化后,回归方程中的常数项就有具体的物理意义了:代码化的中点“0-截距”刚好是试验结果的平均值六西格码试验设计一、实验设计简介二、实验设计类型三、设计一个DOE的步骤四、全因子DOE设计分析五步五、全因子DOE结果分析六、如何利用专业软件进行全因子DOE分析七、全因子DOE在应用中的问题DOE的设计步骤:试验设计的步骤分三个阶段:一:计划阶段:a.组建团队b.阐述目标:团队成员共同讨论,明确目标与要求,是为了筛选因子还是为了寻求关系,最终要达到什么要求c.选择响应变量:在一个试验中有若干种响应,哪些是最关键的,要选择最关键作用的d.选择因子及水平:用鱼骨图、因果图、流程图列出所有可能影响响应变量的因子清单,然后根据数据和相关知识进行细致的分析作初步筛选e.选择试验计划:根据试验目的,选择正确的试验类型,确定区组状况,试验次数,并按随机化安排好试验的顺序及试验单元的分配,排好计划矩阵一:计划阶段:二:实施阶段:a.根据计划矩阵合理安排资源分配b.根据计划矩阵安排进行试验,详细记录试验过程的状况,包括:环境(气温、室温、湿度、电压)、材料、操作员等有价值的资料信息,如有任何非正常的数据予以记录,以便以后分析使用c.建立异常反馈流程和责任制管控试验风险三:分析阶段:a.数据的分析方法要与试验的类型相适应b.分析中应包括拟合选定模型、残差诊断、评估模型的适用性并设法该进模型c.当试验结果达到目标时,给出验证试验的预测值d.验证试验结果的有效性六西格码试验设计一、实验设计简介二、实验设计类型三、设计一个DOE的步骤四、全因子DOE设计分析五步五、全因子DOE结果分析六、如何利用专业软件进行全因子DOE分析七、全因子DOE在应用中的问题全因子DOE的设计分析五步法:拟合选定模型进行残差诊断模型需要该进?对选定的模型进行分析解释是否达到目标?进行验证进行下批试验NN第一步、拟合选定模型:根据试验目的,选定一个数学模型,通常是全模型1.看ANOVA表中的总效果Ho;模型无效H1:模型有效如果对应回归项的P-value0.05,则表明本模型总体有效,相反则无效,造成的原因:1).试验误差太大:F统计,如果分母太大,则F值变小,导致效果不显著2).试验中漏掉了重要的因子:漏掉重要因子将导致误差增大3).有可能模型本身有问题:模型有失拟和数据有较强的弯曲性,模型无效2.看ANOVA表中的失拟现象Ho;无失拟H1:有失拟在ANOVA表中,如果失拟项(lackoffit)的P-value>0.05,则表明本模型没有失拟现象,相反则模型漏掉重要的项:3.看ANOVA表中的弯曲Ho:无弯曲H1:有弯曲在ANOVA表中,如果弯曲项的P-value>0.05,则表明本模型没有弯曲项,相反则数据呈现弯曲没有平方项,应该补上4.拟合的总效果多元全相关系数(multiplecorrelationcoefficient)R^2最好的状况是接近1第二步、残差诊断:主要的目的是基于残差的状况来诊断模型是否合适,有时单纯的用ANOVA表及回归系数结果来分析整个结果还远远不够,与我们要知道的真实情况相差甚远,为了填补这步的不足,就增加残差诊断,诊断的步骤:1).观察残差对于以观察值顺序为横轴的散点图,各点是否随机的在水平轴上下无规则的波动2).观察对于以响应变量拟合预测值为横轴的散点图,是否有漏斗型和喇叭型3).观察残差的正态检验图,看是否服从正态分布4).观察残差对于以各自变量为横轴的散点图,看是否有弯曲趋势第三步、模型是否要改进:主要根据数值计算和残差诊断两方面的结果,如果残差诊断的四个图都正常,说明模型是正常的,反之就要返回到第一步,重新建立模型修改模型第四步、对选定模型进行分析解释:主要是拟合选定模型后输出更多的信息和图形,并作出有意义的解释1).输出各因子的主效应和交互效应图2).输出等高线图、响应曲面图3).实现最优化第五步、是否达到目标:将预计的最佳设置与原来试验目标相比较,如果离目标尚远,则考虑新一轮的试验,通常在本次获得或预计最佳点附近,直到达到目标为止六西格码试验设计一、实验设计简介二、实验设计类型三、设计一个DOE的步骤四、全因子DOE设计分析五步五、全因子DOE结果分析六、如何利用专业软件进行全因子DOE分析七、全因子DOE在应用中的问题全因子DOE结果分析:1.选定模型:AnalysisofVarianceforresult(codedunits)SourceDFSeqSSAdjSSAdjMSFPMainEffects31585.141585.14528.38010.870.0402-WayInteractions3313.45313.45104.4852.150.2733-WayInteractions19.689.689.6800.200.686Curvature11.711.711.7070.040.863ResidualError3145.89145.8948.629PureError3145.89145.8948.629Total112055.87代表什么意思?全因子DOE结果分析:各因子效应和各交互效应分析:FactorialFit:resultversusA,B,CEstimatedEffectsandCoefficientsforresult(codedunits)TermEf