17正交实验设计7.1正交实验设计的基本知识7.2正交表的表头设计7.3不考虑交互作用的正交实验设计7.4考虑交互作用的正交实验设计7.5正交实验的方差分析27正交实验设计自本世纪以来,实验设计先后经历了费尔﹑芬尼和田口玄一等不断开发和发展,现已形成为一套完整的正交实验设计技术和程序化的计算方法,并在世界各国获得迅速普及和广泛应用。从50年代末到60年代初,我国数理统计学者也十分重视正交实验设计技术,在开发正交表,从事正交实验设计的理论研究和技巧方面,相继做了大量的工作,作出了积极贡献。随着科学技术的发展,正交实验设计技术在各行各业得到更为广泛的发展和应用。37.1正交实验设计的基本知识正交实验设计法是研究与处理多因子实验的方法。它借助于一种规格化的“正交表”,科学地、有计划、有目的地挑选实验条件,合理安排实验,并利用数理统计原理科学地分析实验结果。其优点是,实验次数少、分析方法简单、重复性好、可靠性高,能够通过代表性很强的少数实验,摸清各因子对实验指标的影响情况,确定诸因子的主次,找出最佳的参数组合。47.1.1正交实验原理222122212112221121211111,,,,,,,CBACBACBACBACBACBACBACBA为什么通过正交实验设计,能由较少的实验全面了解诸多因子对实验指标的影响呢?先看下列例子。例如,三因子二水平的试验,若安排全面试验共需八次:如何从中挑选出次数少且具有代表性的试验呢?很显然,随便选择是达不到这一目的的。譬如选上面一排的四个试验,它们均只含有A1而没有A2,当然就不能反映全面了。5由正交实验设计方法,可选出下列四个试验代替全面试验:122212221111,,,CBACBACBACBA为什么上述四个试验可代替全面试验呢?这是因为它们具有下述两个特点:a.水平均匀。所选四个试验对每个因子和因子的水平都是均匀分配的。为了便于直观想象,如图7.1所示,将八次全面试验形象地表示为一个立方体的八个顶点。正交实验设计方法所选的四个试验是四个黑点(●)所示的四个顶点。6图7.1全面试验示意图7由图7.1可以看出,立方体每个面上都恰有两个黑点,每条边上也恰有一个黑点。这就是说四个黑点均匀地分配在立方体的面和边上,亦即它们是均衡分散的,故它们能够反映出八次全面试验。b.搭配均匀。这四次试验还反映出水平的搭配是均匀的。四次试验中,每个因子的一水平和二水平各出现二次,而且任何两个因子的搭配也都以相同的次数出现。如因子A与B的搭配有A1B1,A1B2,A2B1,A2B2各出现一次,B和C、A和C的搭配也是一样。因此从各因子的搭配上看也是能够反映出全面试验的。8正交实验设计,正是考虑了所有因子和水平在试验中的“均衡分散性”以及由此产生的“整齐可比性”这两条原理设计的正交表来安排实验,达到减少实验次数,提高实验效率的目的。97.1.2正交表正交表是一套设计好的规格化的表格,见附表6。表7.1和表7.2就是其中两张常用的正交表。表中横行表示因子,竖行表示试验。在表7.1中表示有7个因子,每个因子2个水平,用正交实验设计方法,需做8次试验,把这个表记成L8(27);表7.2则表示有4个因子,每个因子3个水平,需进行9次试验,把它记成L9(34)。一般正交表符号的含义下:因子数Ln(tq)正交表代号水平数试验次数10表7.1L8(27)正交表11表7.2L9(34)正交表12从正交表L8(27)和L9(34)中,可以看出它们具有以下两个性质:(1)表中任何一列,其所含各种水平的个数都相同。如L8(27)表中每列“1”与“2”都有四个;L9(34)表中每列“1”,“2”与“3”都有三个。可见,每个水平出现的机会是相等的,亦即是均匀分散的。(2)表中任何两列,所有可能的数对出现的次数都相同。13正是由于正交表具有以上二个性质,因而它具有整齐可比性,即对各因子的水平可以直接比较优劣。例如:L8(27)中,1,2二个数字的可能数对为(1,1)、(1,2)、(2,1)、(2,2),任取两列,各出现两次;L9(34)中,1,2,3三个数字的可能数对为(1,1)、(1,2)、(1,3)、(2,1)、(2,2)、(2,3)、(3,1)、(3,2)、(3,3)九种,任取两列,这九种数对皆出现一次。因而,正交表中水平之间的搭配是均匀的。147.1.3指标、因子、水平的选(1)指标的选择安排正交实验时,首先要弄清实验的目的,即用什么实验指标来考核实验结果。如用一反应装置合成某一化工产品的正交实验,那么该产品的收率就可作为这个正交实验的指标。此外合成反应的速率、产品的质量都可作为实验指标。很多实验指标可以用数直接表示,这样的指标叫定量指标。但在很多情况下,如某些化工产品的颜色、外观、手感等这样的指标不能直接用数来表示,则称这样的指标为定性指标。15为了便于分析实验结果,定性指标都应定量化,即按评定结果打出分数或定出等级用数字加以表示。在实验中可以人为加以控制调节的因子叫可控因子,它是实验研究的主要对象,如反应过程中的温度、反应物的组成等。反之,不能人为控制和调节或不能轻易改变的因子叫不可控因子,如气温、实验环境等。正交实验仅适用于可控因子。在确定实验因子时,须先广泛列出与研究对象有关的诸因子,然后判别哪些是需要在实验中考察或重点考察的因子。(2)因子的选择16在判别介入实验的因子时,下述三种情况可以不作考察:①对实验指标的影响规律已经明确,或已知对实验考核指标没有影响的因子;②进行实验时在技术能力方面还不具备基本条件,或因测试技术不完善,测不出数值的因子;③能够测出因子的值,但不具备控制手段,不能把因子控制在预定水平上的因子。17对上述因子,在实验中只能将其固定在适当的状态,以便考察那些对实验指标的影响尚不清楚的因子。有的实验投资太大、周期长、不可能多做实验,也可以在正交试验中只考察主要因子。但如果在实验中漏掉了主要因子,就不可能得到最优的实验结果。因此,因子的选择应根据具体情况谨慎地加以确定。正交实验中水平应按实验的目的、性质等具体情况来确定,同时应注意以下三点:(3)水平的选择18①水平个数应取三个以上为宜。因三水平以上的因子实验结果分析所得的趋势图分布一般呈二次曲线为多,而二次曲线有利于实验结果分析。若仅取二水平做实验,其趋势图为线性分布,只能表明实验结果的趋势,很难区分最佳区域,这对分析整个实验的有效性和实验效率有不利影响。②水平间隔应是相同的。为了便于效应曲线的计算分析,水平的间隔一般取算术等间隔值,在某些特殊场合可以取对数等间隔值。水平的间隔宽度由实验的研究条件范围决定,应该包含未知领域。有时由于多种客观条件限制,各水平之间的间隔不一定能做19到完全相等,可能会有一定的差值,但也应尽可能把差值减少,一般不超过20%间隔值。③水平应当是具体的。因子的水平在正交实验的统计分析中是一个重要的指标值,因而应该是一个具体的数值或方式等,这些数值或方式等应该是可以直接控制的。至于水平的区间的确定,应将水平的区间取在最佳区域或接近最佳区域,这样可以提高实验效率。207.1.4正交表的选用原则选用正交表时,一般要根据因子和水平的多少以及实验工作量的大小来确定,即按下列三条要求来进行。(1)看水平数,选用正交表括号内底数与水平数相同的正交表;(2)看因子数,选用正交表括号内指数大于或等于因子数的正交表;(3)看实验次数,不同的正交表所要求做的实验次数不同,应根据实验要求的精度和工作量的大小,选用适宜的正交表。一般地说,当水平数、因子数满足后,实验次数越少越好。21在正交试验中,当因子水平表制订以后,如何从众多的正交表中挑选合适的正交表来安排实验,是一件灵活的工作,要针对具体问题,按照能否多做实验、实验条件和环境、有无重点考察因子等进行综合分析加以确定。表7.3是正交表选择参考表,可供选择正交表时参考。22表7.3正交表选择参考表23如何借鉴表7.3选取合适的正交表安排实验,下面举例说明。某合成工艺实验为提高产品转化率,运用正交实验考察四个因子对产品转化率的影响。若四个因子中无需重点考察的因子,因子间无交互作用,且由于实验条件的限制,不能多做实验,那么就可以把每个因子皆取3个水平,选择L9(34)正交表来安排实验;如本实验可以多做实验,那么就可以把每个因子取4个水平,选择L16(45)正交表来安排实验。24若四个因子中有一个需要重点考察的因子,因子之间无交互作用,且由于实验条件的限制,不能多做实验,那么就可以选需要重点考察的一个因子取4个水平,另三个无需重点考察的因子各取2个水平,选择L8(41×24)正交表安排实验;如本实验可以多做实验,那么可以选需重点考察的那个因子取6个水平,不需重点考察的另外三个因子各取3个水平,选择L18(61×36)来安排实验。若本实验中的四个因子之间存在交互作用,选择正交表安排实验则要先查两列间的交互作用列表进行交互作用的表头设计,再分别选择有交互作用列的正25交表L8(27)或L16(215)来安排正交实验。这种情况在后面再作详细讨论。若上述实验中只考察三个因子,同样可以利用以上所选的正交表安排实验;若因子增加到五个、六个或更多,可用类似的方法,遵循正交表的选用要求,选择合适的正交表直接安排实验或将正交表进行改造再安排相应的实验。267.2正交表的表头设计利用正交表作实验,一般包括作实物和技术设计时的计算实验。在实验中,通常涉及到因子较多,每个因子需考察的水平也参差不齐。同时考核实验的质量指标有时也不是一项,而是几项。因而,如何把这些因子及水平正确地、合理地,尽可能地安排在较小规模的正交表中进行实验,就存在一个表头设计的问题,即在正交表的表头上填因子的过程。277.2.1表头设计的内容表头设计包括两部分内容,一部分是内侧表,都以正交表(包括标准型与改造型)为内侧表;另一部分是外侧表,可以选用正交表,也可以不是正交表的形式。不取正交表为外侧表时,一般为记录表形式,供实验结果的数据记录。(1)内侧表在内侧表的正交表中一般以安排可控因子为主,还可以安排交互作用及误差项。通常在安排内侧表因子列时,应有意留出一个以上的空列作为误差项。28在表头中安排因子可用英文字母作为代号,以字母表示因子仅是为了简化写法,简单明了。但用字母e作为误差项已成常规,因此不宜再作因子代号。因子所用字母代号切勿重复,以免混淆,造成差错。在安排交互作用列时,应利用交互作用表,将两因子的交互作用列对号入座。(2)外侧表外侧表是内侧表的向右延伸部分,可以选用正交表作外侧表,计算分析时可用直接法。目前一般都把外侧表作为安排实验,考核指标数据记录的型式表格。在外侧的记录表头中,可以分别记录一个或几个29实验考核指标的数据,亦可以用英文字母分别表示指标项目,但字母不能与内侧表中的重复。若外侧表选用正交表时,在列中一般是安排标示因子(在实验中不能轻易改变或选择的因子)或误差因子。这里的误差因子是指有意改变实验环境条件并具有水平阶次的因子,而不是误差项。误差因子的阶次可以分为标准条件时,恶劣条件时和最佳条件时。307.2.2表头设计的方法在表头设计中,一般可利用标准型的正交表,但在实验研究工作中有时会常遇到一些较复杂的情况,众多的实验不可能从有限的标准型正交表中选取合适的正交表来安排实验,此时就必须将标准型的正交表作表头改造设计,具体方法如下。(1)并列法并列法就是把给定的正交表中的任意两列,按一定的规则变为一列,从而使其水平数变为不等的一种方法。凡是附有交互作用列的正交表,如L8(27)、31L16(215)、L27(313)等,都可以把任意二列以及它们的交互作用列放在一起,进行并列,得到一张新的正交表。对给定的正交表L8(27)(见表7.1),现把第一、二列合并,其规则如下:11→112→221→322→4如此得到一个新列,如表7.4所示。同时,删去因并列而产生的、原表L8(27)中不均衡搭配的一列第三列,使得到一张新正交表L8(41×24),如表7.5所示。32表7.4对照表33表7.5L8(41×24)正交表34在并列后删去的一列,