第一章试验设计与试验数据分析初步

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一章试验设计与试验数据分析初步在科学实验与工农业生产中,经常要做实验。如何安排实验,使实验次数尽量少,而又能达到好的实验效果呢?这是经常会碰到的问题,解决这个问题有一门专门的学问,叫做“试验设计”。20世纪30年代,由于农业试验的需要,R.A.Fisher在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。随后,F.Yates,R.C.Bose,O.Kempthome,W.G.Cochran,D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。1960年代,日本统计学家田口玄一将试验设计中应用最广泛的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛普及与应用做出了巨大的贡献。试验设计方法有很多种类。国内方面,60年代由华罗庚教授倡导与普及的“优选法”,即国外的斐波那契方法,与70年代我国的数理统计学者在工业部门中普及的“正交设计”法都是人们熟悉的试验设计法。70年代末期由方开泰教授和王元教授倡导和推广的均匀设计也是一种常用的试验设计方法。“优选法”是单变量的最优调试法,“正交设计”是基于拉丁方理论和群论的多因素试验设计方法,“均匀设计”则是基于数论方法的另一种多因素试验设计方法。材料科学与材料工业中经常会出现各种试验设计问题,例如配方试验或称混料试验(ExperimentswithMixtures),就是在材料科学中经常遇到的问题之一。在各种介绍试验设计方法的书籍中,通常都会辟出专门的章节来阐述配方试验设计的解决方案。试验设计得好,会事半功倍,反之就会事倍功半了。好的试验设计方案可以大大减少试验次数,得到充分的信息,简化数据处理过程,节省人力、物力和时间。正确合理的试验设计,可以使试验结果的可靠性显著提高。试验设计还可以为迅速寻求参数的优化数值和选择最佳工艺方案指明方向。1.1.试验设计的概念及发展历史1.1.1.试验设计的基本概念指标:在试验设计中,人们把判断试验效果好坏所采用的标准称为试验指标,或简称为指标。因素:或称为因子,有可能影响试验指标的条件,称作因素。通常情况下固定的因素在试验方案中并不称为因素,只有变化的因素才称为因素。水平:或称为处理,能影响试验指标的因素,通常人为地给予控制、分组,在统计学上,统称其为因子的水平。1.1.2.试验设计的基本要求进行不同处理的实验单元间,要有相同的系统要有明确的试验目的、恰当的指标要挑选因子,适当确定水平。使试验范围尽可能大一点,试验范围太小的缺点是不容易获得比已有条件有显著改善的结果。每一个因素的水平个数最好适当多一些,水平的间隔大小和生产控制精度是密切相关的。同时,因素和水平的含意可以是广义的处理实验数据要能配上相应的数理统计方法,以达到预期的试验目的1.1.3.因素的主效应和因素间的交互效应各因素的水平所对应的目标值称为主效应,各个因素除了对目标值有独立的影响外,还可能共同对目标值产生作用,即交互作用。交互作用通常表现为因素的乘积对指标的影响,其系数为正称为正交互作用,其系数为负称为负交互作用。1.1.4.试验设计方法的发展过程全面试验法:将每一个因素的不同水平组合做同样数目的试验。一般说m个因子n个水平的全面试验需要做nm次试验。当因素的个数不多,每个因数的水平数也不多时,用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因素较多,水平数较大时,全面试验要求的试验数目可能非常大,虽然最后能够早出最好的搭配方案,但费时费工,往往不可能实现,因此除了一些比较简单的情况外,一般不进行全面试验。简单对比法:又称孤立因素法,是将因子中只变化一个,其余的固定,然后逐步地得到好的搭配的方法。`这种方法一般也能得到一定的效果,而且比全面试验的次数少,但也有缺点,就是对待各因子和水平不是均等的。并且先固定那些因子,后变化那些因子,都会影响试验结果,因此最后的结果是不是最好的,还不能充分肯定。完全随机试验法:是一种最基本的试验设计,即各因素的水平完全随机分配随机区试验法:在划分区间后,用随机数字表或抽签法来确定顺序的试验设计方案拉丁方试验法:将一定数的文字排成正方形,每个文字在各行各列都出现一次而且只出现一次,这样的方格称为拉丁方。第一行与第一列相同的顺序排列的拉丁方称为标准型拉丁方。对于因子数多于3的实验,实验数将随着因子数的增加而快速地增加,采用拉丁方试验法,可以大大减少实验数。组成拉丁方区的必要条件是,在拉丁方区内行数等于列数等于水平数。拉丁方是供不存在交互作用的因子的实验设计用的。拉丁方设计的主要目的是研究单因素不同水平对实验结果的影响。正交拉丁方法:两个或两个阶数相同的拉丁方之间呈正交关系而言的,正交拉丁方试验一般在5*5,7*7,8*8中进行。正交拉丁方的个数不超过拉丁方字母的个数减1,对于6*6的拉丁方,则不存在正交拉丁方法,拉丁方或正交拉丁方试验,可用随机法安排试验。1.2.正交试验设计与结果分析1.2.1.正交试验设计正交试验设计方法,就是利用数理统计学与正交性原理,从大量的试验点挑选适量的具有代表性、典型性的点,应用“正交表”合理安排试验的一种科学的试验设计方法。统计学家将正交设计通过一系列表格来实现,这些表格叫做正交表,记为Lt(me),其中L表示正交表,t表示总共做9次试验,m表示每个因素都有m个水平,e表示表中有e列,最多可以安排e个因素。常用的二水平正交表有L4(23),L8(27),L16(215),L32(231);三水平正交表有L9(34),L27(313);四水平正交表有L16(45);五水平正交表有L25(56)等。还有一批混合水平的表在实际中也十分有用,如L8(424),L12(2331),L16(4423),L16(4326),L16(4229),L16(41212),L18(8128),L18(2137)等。正交设计是利用数学上的正交性确定的设计方法,本质上具有“均匀分散、整齐可比”的特点。具体表现为:1,水平均匀性:每个因子和因子的每个水平都是均匀分配的;2,搭配的均匀性每个因子的各个水平出现的次数都是相同的,任何两个因子的搭配也都以相同的次数出现。正交试验过程,就是在确定指标、因子和水平后,用正交表安排试验方案。它主要要求解决三个方面的问题:1,分析因子与指标的关系,即当因子变化时,指标是怎样变化。找出这种变化的规律,可以利用它能动地指导生产;2,分析因子影响指标的主次,即分析哪个因子是影响指标的主要因素,哪些是次要因素。找出主要影响因素常常是生产中关键问题之一;3,寻找好的生产工艺,即找到每个因子各取什么水平,会得到最好的指标。也就是选出最优方案,这是生产中最需要解决的问题。用正交表安排试验的步骤:1,根据因子数和水平数以及试验条件的限制,选择合适的正交表;2,将各因子放到表头的各列中;3,将各因子的水平安排到相应的表格中;4,形成试验方案。正交试验设计缺点在于它只适合于水平数不多的试验。通常情况每个因子有q个水平,用正交表安排试验,至少要作q2次试验,当q较多时,q2非常大,很多情况无法进行试验。正交试验设计只考虑全局平衡,只得到可能的优化方向。1.2.2.直观分析利用正交表进行试验设计并分析结果一般有两种方法,即直观分析与方差分析。直观分析就是通过计算将各个因子、水平对试验结果质量指标影响的大小,用图形表示出来,通过直观分析,综合比较,以确定最优化试验方案的方法。直观分析的目的是:因子与指标的变化规律,从k1,k2,k3与因子的关系图来考察因子影响指标的主次顺序,从极差R来考察,R越大,影响越大选顶最优方案,看各个因子中哪些水平的平均指标最高,来获得最优方案以实验验证最优方案举例如下:例:研究温度、压力、配比及时间四个因子对某产品质量指标的影响:温度取430、450、4700C,压力取10、20、30kg,配比取3%、5%、7%,时间取1、2、3小时,质量指标越大越好。1,根据因子和水平数选用可以安排四因子、三水平的正交表L9(34)2,将温度、压力、时间和配比随机安排在正交表的各个列上3,安排各因素的水平4,得到试验方案经过实验,得到各个试验方案的质量指标如下表:试验号列号A(温度)1B(压力)2C(配比)3D(时间)4试验方案质量指标11111A1B1C1D12221222A1B2C2D25231333A1B3C3D34342123A2B1C2D35852231A2B2C3D16162312A2B3C1D26173132A3B1C3D25583213A3B2C1D37093321A3B3C2D164K1117135153147总和486K2180183174168K3189168159171k139455149总平均54k260615856k363565357R2416785,对各个因子的每个水平所对应的质量指标求和得到K1,K2,K36,在每一列中计算的K1,K2,K3平均值k1,k2,k37,在每一列中计算极差,即用每一列的k1,k2,k3中最大者减去最小者所得到的值,记为R8,用每一个因子的k值对该因子的水平作图,观察各个因子与指标的变化规律9,由极差R决定因子影响指标的主次顺序:温度压力时间配比10,选顶最优方案:由各个因子中平均指标最高的水平组合而成试验方案11,实验验证优选方案上述分析可以看出,用正交表直观分析出来的最优方案并不包含在正交表的九次试验之中,者说明利用正交表还没能从全面试验中挑选出好的方案来,但是,进行这九次有代表性的试验也是完全必要的。在实际问题中,用来衡量试验效果的指标往往不止一个,而是多个,这类试验叫做多指标试验,进行多指标试验设计的分析方法有综合评分法和综合平衡法。综合评分法,是将多指标化为一个评分指标来进行直观分析的方法;综合平衡法是先分别将各个指标按单指标进行计算和分析,再将各指标的分析结果进行综合平衡,以得到“最优”试验方案。综合评分法和综合平衡法所得到的结论,一般是一致的,在实际应用中综合评分法用得较多,因为计算上比较方便。有些试验中有的因子可以取较多的水平,但是也有的因子受条件的限制,不能多选水平,这就遇到水平数不同的情况。解决不同水平数问题的方法:可以直接用不同水平混合型的正交表;也可以采用拟水平方法,即将水平一律补齐为相同水平再加以解决。对于因子间有相互作用,即存在交互作用的正交试验设计,采用专门的有交互作用的正交表。交互作用放在哪一列上,由二列间交互作用表决定。1.2.3.方差分析直观分析方法,其优点是简单、直观、计算量较小。但是,直观分析不能给出误差大小的估计,也就不能知道结果的精度。方差分析可以弥补直观分析的不足之处。在一批实验数据中,数据的算术平均值代表了数据的平均水平,反映了数据的集中性;而数据的方差,反映了数据的波动性,即数据的分散性,方差大小表明数据变化的显著程度,而数据变化的显著程度,又反映了因素对指标影响的大小。例T8钢淬火试验(四因素二水平)因素A温度B时间A*B交互作用C冷却液D操作方法水平18000C15minA1*B1,A2*B2油D128200C11minA1*B2,A2*B1水D2其中A和B有交互作用,测试淬火硬度,硬度越大越好。选用L8(27)进行表头设计误差误差ABA*BCeeD1234567正交表及试验结果如下:列号A(0C)1B(min)2A*B3C4e误差5e误差6D7硬度硬度-55试验号1111111150-521112222594312211225614122221158352121212550621221215837221122147-88221211252-3I32-12-12-4-5-7II-8-777-102m13/41/2-3-3-1-5/4-7/4m2-2-7/47/47/41/401/2T111/89/8-19/8-19/8-3/8-5/8-9/8T2-11/89/819/819/83/85/89/8I294144144162549II

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功