Minitab实验之试验设计实验目的:本实验主要引导学生利用Minitab统计软件进行试验设计分析,包括全因子设计、部分因子设计、响应曲面设计、混料设计、田口设计以及响应优化,并能够对结果做出解释。实验仪器:Minitab软件、计算机实验原理:“全因子试验设计”(fullfactorialdesign)的定义是:所有因子的所有水平的所有组合都至少要进行一次试验的设计。由于包含了所有的组合,全因子试验所需试验的总次数会比较多,但它的优点是可以估计出所有的主效应和所有的各阶交互效应。所以在因子个数不太多,而且确实需要考察较多的交互作用时,常常选用全因子设计。一般情况下,当因子水平超过2时,由于试验次数随着因子个数的增长而呈现指数速度增长,因而通常只作2水平的全因子试验。进行2水平全因子设计时,全因子试验的总试验次数将随着因子个数的增加而急剧增加,例如,6个因子就需要64次试验。但是仔细分析所获得的结果可以看出,建立的6因子回归方程包括下列一些项:常数项、主效应项有6项、二阶交互作用项15项、三阶交互项20项,…,6阶交互项1项,除了常数项、主效应项和二阶交互项以外,共有42项是3阶以及3阶以上的交互作用项,而这些项实际上已无具体的意义了。部分因子试验就是在这种思想下诞生的,它可以使用在因子个数较多,但只需要分析各因子和2阶交互效应是否显著,并不需要考虑高阶的交互效应,这使得试验次数大大减少。在实际工作中,常常要研究响应变量Y是如何依赖于自变量,进而能找到自变量的设置使得响应变量得到最佳值(望大、望小或望目)。如果自变量的个数较少(通常不超过3个),则响应曲面方法(responsesurfacemethodology,RSM)是最好的方法之一,本方法特别适合于响应变量望大或望小的情形。通常的做法是:先用2水平因子试验的数据,拟合一个线性回归方程(可以包含交叉乘积项),如果发现有弯曲的趋势,则希望拟合一个含二次项的回归方程。其一般模型是(以两个自变量为例):22011221112221212ybbxbxbxbxbx这些项比因子设计的模型增加了各自的变量的平方项。由于要估计这些项的回归系数,原来因子设计所安排的一些设计点就不够用了,需要再增补一些试验点。这种先后分两阶段完成全部试验的策略就是“序贯试验”的策略。适用于这种策略的方法有很多种,其中最常用的就是中心复合设计(centralcompositedesign,CCD)。稳健参数设计(robustparameterdesign)(也称健壮设计、鲁棒设计,简称参数设计)是工程实际问题中很有价值的统计方法。它通过选择可控因子的水平组合来减少一个系统对噪声变化的敏感性,从而达到减小此系统性能波动的目的。过程的输入变量有两类:可控因子和参数因子。可控因子是指一旦选定就保持不变的变量,它包括产品或生产过程设计中的设计参数,而噪声因子是在正常条件下难以控制的变量。在做参数设计时,就是把可控因子的设计当做研究的主要对象,与此同时让噪声因子按照设定的计划从而系统改变其水平的方法来表示正常条件下的变化,最终按照我们预定的望大、望小或望目地目标选出最佳设置。田口玄一博士在参数设计方法方面贡献非常突出,他在设计中引进信噪比的概念,并以此作为评价参数组合优劣的一种测度,因此很多文献和软件都把稳健参数设计方法称为田口方法(Taguchidesign)。在实际工作中,常常需要研究一些配方配比试验问题。这种问题常出现在橡胶、化工、制药、冶金等课题中。例如不锈钢由铁、镍、铜和铬4种元素组成;闪光剂由镁、硝酸钠、硝酸锶及固定剂组成;复合燃料、复合塑料、混纺纤维、混泥土、粘结剂、药品、饲料等都是由多种成分按相应比例而不是其绝对数值;而且显然所有分量之和总是为1的。对于这种分量之和总是为1的试验设计,称为混料设计(mixturedesign)。实验内容和步骤:实验之一:全因子试验设计:例:改进热处理工艺提高钢板断裂强度问题。合金钢板经热处理后将提高其断裂其抗断裂性能,但工艺参数的选择是个复杂的问题。我们希望考虑可能影响断裂强度的4个因子,确认哪些因子影响确实是显著的,进而确定出最佳工艺条件。这几个因子及其试验水平如下:A:加热温度,低水平:820,高水平:860(摄氏度)B:加热时间,低水平:2,高水平:3(分钟)C:转换时间,低水平:1.4,高水平:1.6(分钟)D:保温时间,低水平:50,高水平:60(分钟)由于要细致考虑各因子及其交互作用,决定采用全因子试验,并在中心点处进行3次试验,一共19次试验。步骤1:全因子设计的计划(创建)选择[统计]=[DOE]=[因子]=[创建因子设计],单击打开创建因子设计对话框。,选择两水平因子(默认生成元),在因子数中选择4,单击“设计”选项,弹出“设计”选项对话框。选择“全因子”试验次数为16的那行,并在“每个区组的中心点数”中选择3,其他项保持默认(本例中没有分区组,各试验点皆不需要完全复制)。单击确定。单击“因子”选项打开,分别填写四个因子的名称及相应的低水平和高水平的设置。单击确定。“选项”选项可以使用折叠设计(这是一种减少混杂的方法)、指定部分(用于设计生成)、使设计随机化以及在工作表中存储设计等;“结果”选项用于控制会话窗口中显示的输出。本例中这两项保持默认。单击确定,计算机会自动对于试验顺序进行随机化,然后形成下列表格。在表的最后一列,写上响应变量名(强度),这就完成了全部试验的计划阶段的工作。步骤2:拟合选定模型按照上图的试验计划进行试验,将结果填入上表的最后一列,则可以得到试验的结果数据(数据文件:DOE_热处理(全因)),如下:拟合选定模型的主要任务是根据整个试验的目的,选定一个数学模型。通常首先可以选定“全模型”,就是在模型中包含全部因子的主效应及全部因子的二阶交互效应。在经过细致的分析之后,如果发现某些主效应和二阶交互效应不显著,则在下次选定模型的时候,应该将不显著的主效应和二阶交互效应删除。选择[统计]=[DOE]=[因子]=[分析因子设计],打开分析因子设计对话框。点击“项”选项后,在“模型中包含项的阶数”中选择2(表示模型中只包含2阶交互作用和主效应项,三阶以上交互作用不考虑),对默认的“在模型中包括中心点”保持不选。单击确定。在“图形”选项中,“效应图”中选择“正态”和“Pareto”,“图中的标准差”中选择“正规”,“残差图”中选择“四合一”,在“残差与变量”图中将“加热温度”、“加热时间”、“转换时间”和“保温时间”选入,单击确定。在“存储”选项中,在“拟合值与残差”中选定“拟合值”和“残差”,在“模型信息”中选定“设计矩阵”。单击确定。结果如下:拟合因子:强度与加热温度,加热时间,转换时间,保温时间强度的估计效应和系数(已编码单位)系数标项效应系数准误TP常量541.6321.377393.390.000加热温度20.03810.0191.5006.680.000加热时间16.8878.4441.5005.630.000转换时间3.8131.9061.5001.270.240保温时间11.1135.5561.5003.700.006加热温度*加热时间0.7370.3691.5000.250.812加热温度*转换时间-0.487-0.2441.500-0.160.875加热温度*保温时间3.0621.5311.5001.020.337加热时间*转换时间1.2630.6311.5000.420.685加热时间*保温时间7.1133.5561.5002.370.045转换时间*保温时间0.8370.4191.5000.280.787S=6.00146PRESS=1778.45R-Sq=92.49%R-Sq(预测)=53.68%R-Sq(调整)=83.11%强度的方差分析(已编码单位)来源自由度SeqSSAdjSSAdjMSFP主效应43298.853298.85824.7122.900.0002因子交互作用6252.17252.1742.031.170.408残差误差8288.14288.1436.02弯曲19.929.929.920.250.633失拟5169.72169.7233.940.630.709纯误差2108.50108.5054.25合计183839.16强度的估计系数(使用未编码单位的数据)项系数常量932.26加热温度-0.25063加热时间-111.262转换时间43.812保温时间-16.5637加热温度*加热时间0.036875加热温度*转换时间-0.121875加热温度*保温时间0.0153125加热时间*转换时间12.6250加热时间*保温时间1.42250转换时间*保温时间0.83750结果分析:分析要点一:分析评估回归的显著性。包含三点:(1)看方差分析表中的总效果。方差分析表中,主效应对应的概率P值为0.000小于显著性水平0.05,拒绝原假设,认为回归总效果是显著的。(2)看方差分析表中的失拟现象。方差分析表中,失拟项的P值为0.709,无法拒绝原假设,认为回归方程并没有因为漏掉高阶交互作用项而产生失拟现象。(3)看方差分析表中的弯曲项。方差分析表中,弯曲项对应的概率P值0.633,表明无法拒绝原假设,说明本模型中没有弯曲现象。分析要点二:分析评估回归的总效果(1)两个确定系数R-Sq与R-Sq(调整),计算结果显示,这两个值分别为92.49%和83.11%,二者的差距比较大,说明模型还有待改进的余地。(2)对于预测结果的整体估计。计算结果显示R-Sq和R-Sq(预测)分别为92.49%和53.68%,二者差距比较大;残差误差的SSE为288.14,PRESS为1778.45,两者差距也比较大;说明在本例中,如果使用现在的模型,则有较多的点与模型差距较大,模型应该进一步改进。分析要点三:分析评估各项效应的显著性。计算结果显示,4个主效应中,加热温度、加热时间和保温时间是显著的,只有转换时间不显著;6个2因子水平交互效应中,只有加热时间*保温时间是显著的。说明本例中还有不显著的自变量和2因子交互作用,改进模型时应该将这些主效应和交互作用删除。对于各项效应的显著性,计算机还输出了一些辅助图形来帮助我们判断和理解有关结论。ACABCDBCADCBDDBA76543210项标准化效应2.306A加热温度B加热时间C转换时间D保温时间因子名称标准化效应的Pareto图(响应为强度,Alpha=0.05)Pareto图是将各效应的t检验的t值的绝对值作为纵坐标,按照绝对值的大小排列起来,根据选定的显著性水平,给出t值的临界值,绝对值超过临界值的效应将被选中,说明这些效应是显著的。从图中可以看到,加热温度、加热时间、保温时间以及加热时间*保温时间是显著的。76543210-1-2999590807060504030201051标准化效应百分比A加热温度B加热时间C转换时间D保温时间因子名称不显著显著效应类型BDDBA标准化效应的正态图(响应为强度,Alpha=0.05)正态效应图,凡是因子效应离直线不远者,就表明这些效应是不显著的;反之,则是显著的。从图中可以看到,加热温度、加热时间、保温时间以及加热时间*保温时间是显著的。步骤3:残差诊断残差诊断的主要目的是基于残差的状况来诊断模型是否与数据拟合得比较好。如果数据和模型拟合得比较好,则残差应该是正常的。残差分析包括四个步骤:(1)在“四合一”图的右下角图中,观察残差对于以观测值顺序为横轴的散点图,重点考察此散点图中,各点是否随机地在水平轴上下无规则的波动着。(2)在“四合一”图的右上角图中,观察残差对于以响应变量拟合预测值为横轴的散点图,重点考察此散点图中,残差是否保持等方差性,即是否有“漏斗型”或“喇叭型”。(3)在“四合一”图的左上角正态概率图(或右下角的直方图)中,观察残差的正态检验图,看残差是否服从正态分布。(4)观察残差对于以各自变量为横轴的散点图,重点观察此散点图中是否有弯曲趋势。1050-5-10999050101残