第8章回归正交试验设计本章问题的提出正交设计:优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案回归分析可通过所确立的回归方程,对试验结果进行预测和优化,但回归分析只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。回归正交设计可将两者结合起来。它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。回归正交设计(Orthogonalregressiondesign)回归正交设计处理的对象:可以在因素的试验范围内选择适当的试验点用较少的试验建立回归方程能解决试验优化问题不适合有非数量性因素的问题8.1一次回归正交试验设计及结果分析建立试验指标(y)与m个试验因素x1,x2,…,xm之间的一次回归方程:例:m=3时,一次回归方程:y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3其中x1,x2,x3表示3个因素;x1x2,x1x3,x2x3表示交互作用若不考虑交互作用,为三元一次线形回归方程:y=a+b1x1+b2x2+b3x38.1.1一次回归正交设计的基本方法(1)确定因素的变化范围以因素xj为例:设xj的变化范围为[xj1,xj2]xj1为xj的下水平xj2为xj的上水平xj0为xj的零水平:xj0=(xj1+xj2)/2因素xj的变化间距Δj:Δj=上水平-零水平=xj2-xj0Δj=(xj2-xj1)/28.1.1一次回归正交设计的基本方法(2)因素水平的编码编码(coding):将因素xj的各水平进行线性变换:zj:因素xj的编码,称为规范变量xj:自然变量上水平xj2的编码:zj2=1下水平xj1的编码:zj1=-1零水平xj0的编码:zj0=00jjjjxxz编码目的:使每因素的每水平在编码空间是“平等”的,规范变量zj的取值范围都是[1,-1]内变化,不会受到自然变量xj的单位和取值大小的影响。编码能将试验结果y与因素xj(j=1,2,…,m)各水平之间的回归问题,转换成试验结果y与编码值zj之间的回归问题,从而大大简化了回归计算量。(3)一次回归正交设计表将二水平的正交表中“2”用“-1”代换,例:回归正交设计表的特点:任一列编码的和为0任两列编码的乘积之和等于0说明经转换后的正交表同样具有正交性。(4)试验方案的确定表头设计:可参考正交设计的表头设计方法交互作用列的编码等于表中对应两因素列编码的乘积零水平试验(中心试验)目的是为了进行更精确的统计分析,得到精度较高的回归方程。8.1.2一次回归方程的建立总试验次数为n:n=mc+m0mc:二水平试验次数m0:零水平试验次数一次回归方程系数的计算:常数项:a一次项系数:bj交互项系数:bjk11niiayyn1,1,2,3,,(812)njiiijczybjmm1(),,1,2,3,1(813)nkjiiikjczzybjkkmm说明:求得的回归系数直接反映了该因素作用的大小回归系数的符号反映了因素对试验指标影响的正负8.1.3.回归方程及偏回归系数的方差分析(1)无零水平试验时①平方和:总平方和:一次项偏回归平方和:交互项偏回归平方和:回归平方和:残差平方和:2221111()()nnnTyyiiiiiiSSLyyyyn2jcjSSmb2kjckjSSmbRSSSSSS一次项交互项eTRSSSSSS②自由度dfT=n―1各种偏回归平方和的自由度=1回归平方和的自由度:残差自由度:Rdfdfdf一次项交互项eTRdfdfdf③均方④F检验:回归方程显著性检验偏回归系数显著性检验:判断因素或交互作用对试验的影响程度经检验不显著的因素或交互作用应归入残差,重新检验可直接从回归方程中剔除这些一次和交互项例8-1:p.126~129例8-1用石墨炉原子吸收分光光度计测定食品中的铅,为提高测定灵敏度,希望吸光度(y)大。为提高吸光度,讨论了x1(灰化温度/℃),x2(原子化温度/℃)和x3(灯电流/mA)三个因素对吸光度的影响,并考虑交互作用x1x2,x1x3。已知x1=300~700℃,x2=1800~2400℃,x3=8~10mA。试通过回归正交试验确定吸光度与三个因素之间的函数关系式。例8-1:p.126~129(1)因素水平编码编码因素xjx1(灰化温度/℃)x2(原子化温度/℃)x3(灯电流/mA)上水平(1)700240010下水平(-1)30018008零水平(0)50021009变化间距Δj2003001(2)正交表的选择和试验方案的确定(3)回归方程的建立依题意m0=0,n=mc=8试验号z1z2z1z2z3z1z3yy2z1yz2yz3y(z1z2)y(z1z2)y1111110.5520.3047040.5520.5520.5520.5520.5522111-1-10.5540.3069190.5540.554-0.554-0.554-0.55431-1-1110.4800.2304000.4800.4800.4800.4800.48041-1-1-1-10.4720.2227840.472-0.472-0.472-0.472-0.4725-11-11-1-0.5160.266256-0.516-0.5160.5160.516-0.5166-11-1-11-0.5320.283024-0.5320.532-0.532-0.5320.5327-1-111-1-0.4480.200704-0.4480.448+0.4480.448-0.4488-1-11-11-0.4840.234256-0.484-0.484-0.4840.4840.484总和4.0382.0490440.0780.270-0.0460.0380.058(3)回归方程的建立计算各回归系数:p127~128114.0380.504758niiayn1110.0780.009758niiiczybm2120.2700.033758niiiczybm3130.0460.005758niiiczybm12112()0.0380.004758niiiczzybm12113()0.0580.007258niiiczzybm(3)回归方程的建立写出y与规范变量zj的回归方程y=0.50475+0.00975z1+0.033752-0.00575z3+0.00475z1z2+0.00725z1z3根据偏回归系数绝对值大小,确定因素和交互作用的主次顺序x2>x1>x1x3>x3>x1x2根据偏回归系数的正负,得到各因素对试验指标的影响方向(4)方差分析2221114.038()2.0490440.0108648nnTiiiiSSyyn221180.009750.000761cSSmb222280.033750.009113cSSmb223380.005750.000265cSSmb22121280.004750.000181cSSmb12312130.0007610.0091130.0002650.0001810.0004210.010741RSSSSSSSSSSSS0.0108640.0107410.000123eTRSSSSSS22131380.007250.000421cSSmb(4)方差分析dfT=n-1=8-1=7df1=df2=df3=1df12=df13=1dfR=df1+df2+df3+df12+df13=1+1+1+1+1=5dfe=dfT-dfR=7-5=2MS1=SS1/df1=0.000761MS2=SS2/df2=0.009113MS3=SS3/df3=0.000265MS12=SS12/df12=0.000181MS13=SS13/df13=0.000421MSR=SSR/dfR=0.010741/5=0.002148MSe=SSe/dfe=0.000123/2=0.000062F1=MS1/MSe=0.000761/0.000062=12.27F2=MS2/MSe=0.009113/0.000062=146.98F3=MS3/MSe=0.000265/0.000062=4.27F12=MS12/MSe=0.000181/0.000062=2.92F13=MS13/MSe=0.000421/0.000062=6.79FR=MSR/MSe=0.002148/0.000062=34.65方差分析表F0.01(1,2)=98.49F0.05(1,2)=18.51F0.01(5,2)=99.30F0.05(5,2)=19.30差异源SSdfMSF显著性z10.00076110.00076112.27z20.00911310.009113146.98**z30.00026510.0002654.27z120.00018110.0001812.92Z130.00042110.0004216.79回归0.01074150.00214834.65*残差0.00012320.000062总和0.0108647新的方差分析表F0.05(1,6)=5.99F0.01(1,6)=13.74差异源SSdfMSF显著性回归(z2)0.00911310.00911331.21**残差e0.00175160.000292总和0.0108647(5)最终的回归方程y=0.50475+0.03375z2z2=(x2-2100)/300y=0.50475+0.03375×(x2-2100)/300整理后得:y=0.2685+0.0001125x2(2)有零水平试验时目的:进行回归方程的失拟性(lackoffit)检验(要求m0≥2)前面所提的对回归方程进行的显著性检验,只能说明相对残差平方和而言,各因素对试验结果的影响是否显著。即使所建立的回归方程是显著的,也只反映了回归方程在试验点与试验结果拟合得较好,不能说明在整个研究范围内回归方程都与实测值有好的拟合。失拟性检验:为了检验一次回归方程在整个研究范围内的拟合情况失拟性检验步骤:设m0次零水平试验结果为y01,y02,…,y0m0①重复试验误差:平方和:重复试验误差的自由度:②回归方程失拟部分:失拟平方和:失拟平方和自由度:0002221000011101()()mmmeiiiiiiSSyyyym101edfm11LfTReeeSSSSSSSSSSSS1Lfeedfdfdf③失拟检验:对于给定的显著性水平α(一般取0.1)当FLf<Fα(dfLf,dfe1)时,就认为回归方程失拟不显著,失拟平方和SSLf是由随机误差造成的,所建立的回归方程是拟合得很好。只有当回归方程显著、失拟检验不显著时,才能说明所建立的回归方程是拟合得很好的。11LfLfLfeeSSdfFSSdf例8-2:p.129~131例8-2从某植物中提取黄酮类物质,为了对提取工艺进行优化,选取三个相对重要的因素:乙醇浓度x1、液固比x2、和回流次数x3进行了回归正交试验,不考虑交互作用。已知x1=60%~80%,x2=8~12,x3=1~3次。试通过回归正交试验确定黄酮提取率与三个因素之间的函数关系式并确定优化方案。P129例8-2(1)因素水平编码编码Zj乙醇浓度/%(x1)液固比(x2)回流次数(x3)上水平(1)80123下水平(-1)6081零水平(0)70102变化间距Δj1021试验号z1z2z3x1x2x3Y1111801238.0211-1801217.331-1180836.941-1-180816.45-111601236.96-11-160121