第八章回归的正交设计本章内容:§1回归正交试验设计简介§2一次回归正交设计及统计分析§3二次回归正交组合设计及其统计分析本章学习目的与要求:1.了解回归正交设计的基本概念2.掌握一次回归正交设计的基本方法3.掌握二次回归正交设计的基本方法§1回归正交试验设计简介正交设计是一种重要的科学试验设计方法,它能够利用较少的试验次数,获得较佳的试验结果。但是正交设计不能在一定的试验范围内,根据数据样本,去确定变量之间的相关关系及其相应的回归方程。传统回归分析,只能被动地去处理由试验所得到的数据,而对试验的设计安排几乎不提出任何要求。不仅盲目地增加了试验次数,而且由数据分析出的结果往往不能提供充分的信息,造成在多因素试验的分析中,由于设计的缺陷而达不到预期的试验目的。因而有必要引入把回归与正交结合在一起的试验设计与统计分析方法——回归正交设计。§1回归正交试验设计简介什么是回归设计呢?简单地说,就是在因子空间选择适当的试验点,以较少的试验处理建立一个有效的多项式回归方程,从而解决生产中的最优化问题,这种试验设计方法称为回归设计。当试验研究的依变量(如加工罐头质量)与各自变量(如杀菌方式、产品配料等)之间呈线性关系时,则可采用一次回归正交设计的方法。§2一次回归正交设计及统计分析§2一次回归正交设计及统计分析2.1一次回归正交设计的一般方法一次回归正交设计的方法原理与正交设计类似,主要是应用二水平正交表进行设计,如L4(23),L8(27),L12(211),L16(215)等,其设计的一般步骤为:(1)确定试验因素的变化范围。根据试验研究的目的和要求确定试验因素数,并在此基础上拟定出每个因素Zj的变化范围。回归正交试验设计的因素一般都大于3个,但也不能太多,否则处理过多,方案难以实施。各试验因素取值最高的那个水平称为上水平,以Z2j表示;取值最低的那个水平称为下水平,以Z1j表示;两者之算术平均数称为零水平,以Z0j表示,Z0j=(Z2j+Z1j)/2(13-1)上水平和零水平之差称为因素Zj的变化间距,以Δj表示,即Δj=Z2j-Z0jZ0j=(Z2j-Z1j)/2(13-2)§2一次回归正交设计及统计分析(2)对因素Zj的各水平进行编码。即对Zj的各水平进行线性变换,其计算式为:xij=(Zij-Z0j)/Δj(13-3)§2一次回归正交设计及统计分析例如,某试验的第一个因素,其Z11=4,Z21=12,Z01=8,则各水平的编码值为:x11=(Z11-Z01)/Δ1=(4-8)/4=-1x01=(Z01-Z01)/Δ1=(8-8)/4=0x21=(Z21-Z01)/Δ1=(12-8)/4=1经过上述编码,就确定了因素Zj与xj的一一对应关系,即:下水平4(Z11)←→-1(x11)零水平8(Z01)←→0(x01)上水平12(Z21)←→+1(x21)§2一次回归正交设计及统计分析§2一次回归正交设计及统计分析对因素Zj的各水平进行编码的目的是为了使供试因素Zj各水平在编码空间是“平等”的,即它们的取值都是在[-1,1]区间内变化,而不受原因素Zj的单位和取值大小的影响。因此,在对供试因素Zj各水平进行了以上的编码以后,就把试验结果y对供试因素各水平Zi1,Zi2,…,Zim的回归问题转化为在编码空间试验结果y对编码值xi1,xi2,…,xim的回归问题。今后,不论是一次回归设计还是二次回归设计,我们都先将各因素进行编码,再去求试验指标y对x1,x2,…,xm的回归方程,这种方法在试验设计中是经常被采用的。(3)选择适合的2水平正交表进行设计。在应用2水平正交表进行回归设计时,需以“-1”代换表中的“2”,以“+1”代换表中的“1”,并增加“0”水平。这种变换的目的是为了适应对因素水平进行编码的需要,代换后正交表中的“+1”和“-1”不仅表示因素水平的不同状态,而且表示因素水平数量变化的大小。原正交表经过上述代换,其交互作用列可以直接从表中相应几列对应元素相乘而得到。因此原正交表的交互作用列表也就不用了,这一点较原正交表使用更为方便。§2一次回归正交设计及统计分析在具体进行设计时,首先将各因素分别安排在所选正交表相应列上,然后将每个因素的各个水平填入相应的编码值中,就得到了一次回归正交设计方案。§2一次回归正交设计及统计分析例如:现有某3因素食品添香试验,3个因素,即Z1(香精用量)、Z2(着香时间)、Z3(着香温度),其因素水平及编码值如表13-1示。因素Z1/(mL/kg物料)Z2/hZ3/℃上水平(+1)1722.645.7零水平(0)121635下水平(-1)79.424.3变化间距(Δi)56.610.7表13-13因素试验水平取值及编码表本试验为3个因素。如果除考察主效外,还需考察交互作用,则可选用L8(27)进行设计,即将正交表中的“1”改为“+1”,“2”改为“-1”,且把x1,x2,x3放在1,2,4列上。这时只要将各供试因素Zj的每个水平填入相应的编码值中,并在“0”水平处(中心区)安排适当的重复试验,即可得到试验处理方案,如表13-2示§2一次回归正交设计及统计分析§2一次回归正交设计及统计分析表13-23元一次回归正交设计试验方案因素x1(Z1)x2(Z2)x3(Z3)11(17)1(22.6)1(45.7)21(17)1(22.6)-1(24.3)31(17)-1(9.4)1(45.7)41(17)-1(9.4)-1(24.3)5-1(7)1(22.6)1(45.7)6-1(7)1(22.6)-1(24.3)7-1(7)-1(9.4)1(45.7)8-1(7)-1(9.4)-1(24.3)90(12)0(16)0(35)…………N0(12)0(16)0(35)零水平安排重复试验的主要作用,一方面能够检验一次回归方程中各参试结果在被研究区域内与基准水平(即零水平)的拟合情况;另方面当一次回归正交设计属饱和安排时,可以提供剩余自由度,以提高试验误差估计的精确度和准确度。所谓基准水平(零水平)重复试验,就是指所有供试因素Zj的水平编码值均取零水平的水平组合重复进行若干次试验。例如表13-2中零水平试验由Z1=12(mL/kg物料),Z2=16(h),Z3=35(℃)所组成的水平组合。至于基准水平的重复试验应安排多少次,主要应根据对试验的要求和实际情况而定。一般来讲,当试验要进行失拟性检验时,基准水平的试验应该至少重复2~6次。§2一次回归正交设计及统计分析如果采用2水平正交表编制一次回归正交设计,一共进行了N次试验,其试验结果以y1,y2,y3,…yN表示,则一次回归的数学模型为:1majajijajajajijyxxx§2一次回归正交设计及统计分析2.2一次回归正交设计试验结果的统计分析2.2.1建立回归方程(a=1,2,…,Nij)(13-4)111211112111311121222212221232121212131111mmmmmmNNNmNNNNNmNmxxxxxxxxxxxxxxxxxxXxxxxxxxxx其结构矩阵为:记Y=(y1,y2,…,yN)′,β=[β0,β1,β2,…,βm,β12,β13,β(m-1)m]′,ε=(ε1,ε2,…,εN)′,则(13-4)的矩阵形式为:Y=Xβ+ε(13-5)§2一次回归正交设计及统计分析根据最小二乘原理建立回归方程01ˆmjjijijjijybbxbxx(13-6)由于1次回归正交设计的结构矩阵X具有正交性,即除第1列的和为N外,其余各列的和以及任意两列的内积和均为零,因而它的信息矩阵(系数矩阵)为对角阵:A=X′X=212312212222100amamaaaaamaaxxxxxxxxxN§2一次回归正交设计及统计分析1212131,00mmmNaaaaaa当N次试验中,零水平处重复m0次时,矩阵A为:§2一次回归正交设计及统计分析00000000NNmNmANmNmNmNm当m0=0时,矩阵A为:§2一次回归正交设计及统计分析00NNNANNNN相关矩阵C为:§2一次回归正交设计及统计分析12112131,101111110mmmNaaCAaaaa当m0≠0和m0=0时,矩阵C分别为:§2一次回归正交设计及统计分析000000101111101mNmNmNmNmNmNN和§2一次回归正交设计及统计分析NNNNNNN101111101常数项矩阵B为:§2一次回归正交设计及统计分析01122111212131311aaaaaamaaaaaaammamaamByBxyBxyBxyBXYBxxyBxxyBxxy于是参数β的最小二乘估计b=A-1B,即§2一次回归正交设计及统计分析0011121ajjajajjijijaiajaijijBbyNNBbxyjmaaBbxxyijaa,,,(13-7)由以上可以看出,由于按正交表来安排试验和对变量进行了线性变换,使得信息矩阵的逆矩阵运算简单了,同时消除了偏归系数间的相关性,故一次回归正交设计的计算也就十分简单了。2.2.2回归关系的显著性测验(1)回归方程的显著性检验。§2一次回归正交设计及统计分析平方和与自由度的分解;rRyrRySSSSSSSSSSSS(13-8)在一次回归正交设计下,偏回归平方和:21,2,,,12,13,,1jjjjjjbQbBjmmmc(13-9)§2一次回归正交设计及统计分析所以211211202mmNdfSSSSSSmmdfQBbSSNdfNBySSrRyrRjjjRyay(13-10)12,RRRRRrrrrMSSSdfFdfdfdfdfMSSSdf(13-11)§2一次回归正交设计及统计分析(2)偏回归系数的显著性检验。121,jjjfrrMSQFdfdfdfMSMS(13-12)如果有不显著的偏回归系数(1个或多个),可将其同时从回归方程中剔除,此时不影响其它回归系数的数值。将剔除因素的偏回归平方和、自由度并入离回归平方和与自由度,进行有关检验。2.2.3拟合度检验失拟性检验亦称拟合度检验(testofgoodnessoffit)。用基准水平的重复试验可以检验被研究的整个回归区域内特别是中心区回归方程预测与实测值的拟合程度,也就是能够检验本试验用线性模型描述是否确切,是否有必要引入二次或更高次的项。对一次回归的F测验,只能说明变量的作用相对于剩余均方而言,影响是否显著。即使检验是显著的,也仅仅反映一次回归方程在其试验点上与试验结果拟合的较好,但并不能说明在被研究的整个回归区域的拟合情况如何,即不能保证采用一次回归模型是最合适的。§2一次回归正交设计及统计分析为了分析经F检验结果为显著的一次回归方程(这里包括有交互作用的情况)在整个被研究区域内的拟合情况,可通过在零水平(Z01,Z02,…,Z0m)处所安排的重复试验估计真正的试验误差,进而检验所建回归方程的拟合度,即失拟性。§2一次回归正交设计及统计分析设在零水平处安