单因素方差分析的基本原理与步骤单因素方差分析的目的是考查一个因素的m个水平对实验结果是否存在显著性差异。假设某单因素试验有k个水平,每个水平有n次重复,共有nk个观测值。这类试验资料的数据模式如表6-1所示。下一张主页退出上一张表6-1k个处理每个处理有n个观测值的数据模式下一张主页退出上一张表中表示第i个水平的第j个观测值(i=1,2,…,k;j=1,2,…,n);表示第i个水平n个观测值的和;表示全部观测值的总和;表示第i个水平的平均数;表示全部观测值的总平均数;可以分解为ijxnjijixx1.kiikinjijxxx111...nxnxxinjiji/./.1knxknxxkinjij/../..11ijx下一张主页退出上一张(6-1)表示第i个水平观测值总体的平均数。为了看出各水平的影响大小,将再进行分解,令(6-2)(6-3)则(6-4)其中μ表示全试验观测值总体的平均数;ijiijxkiik11iiijiijx下一张主页退出上一张iikinjiijnjiijkikiiikinjiijiijiikinjkinjiijiijxxxxxxxxnxxxxxxxxxxxxxx11211121122111122.)(].)(..).[(2..).(.)(.)..)(.(2..).(.)(..).(..)(因为kinjijTxxSS112..)(偏差平方和其中所以(6-7)(6-7)式中,为组间偏差平方和,反映了各样本平均值间的差异,记为SSt,即njiijxx1.0)(kinjkikinjiijiijxxxxnxx111112.2...2..)()()(kiixxn12..).(kiitxxnSS12..).(下一张主页退出上一张(6-7)式中,为组内偏差平方和,反映了各水平下多次实验结果间的差异,记为SSe,即于是有SST=SSt+SSe(6-8)这个关系式中三种平方和的简便计算公式如下:kinjiijxx112.)(kinjiijexxSS112.)(下一张主页退出上一张(6-9)其中,C=/kn称为矫正数。方差分析统计量在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即kn-1。总自由度记为dfT,即dfT=kn-1。CxnSSCxSSikitijnjkiT2.12111tTeSSSSSSkinjijxx110..)(下一张主页退出上一张2x在计算组间平方和时,各水平均数要受这一条件的约束,故组间自由度为水平数减1,即k-1。组间自由度记为dft,即dft=k-1。在计算组内平方和时,要受k个条件的约束,即(i=1,2,…,k)。故组内自由度为资料中观测值的总个数减k,即kn-k。组内自由度记为dfe,即dfe=kn-k=k(n-1)。.ixkiixx1...0)(njiijxx1.0)(下一张主页退出上一张因为所以(6-10)综合以上各式得:(6-11))1()1()()1(1nkkknkknketTdfdfdftTetTdfdfdfkdfkndf11下一张主页退出上一张各部分偏差平方和除以各自的自由度便得到总均方、组间均方和组内均方,分别记为MST(或)、MSt(或)和MSe(或)。即(6-12)总均方一般不等于组间均方加组内均方。2TS2tS2eSTTTTdfSSSMS/2ttttdfSSSMS/2eeeedfSSSMS/2下一张主页退出上一张构造统计量F=MSt/MSe根据显著性水平,F结论是肯定的,原假设成立;反之,不成立。),(21dfdfF【例6.4】5个不同品种猪的育肥试验,后期30天增重(kg)如表6-16所示。试比较品种间增重有无差异。表6-165个品种猪30天增重下一张主页退出上一张此例处理数k=5,各处理重复数不等。现对此试验结果进行方差分析如下:1、计算各项平方和与自由度41.848225/5.460/22..NxC下一张主页退出上一张20424415124125184.3850.4634.8550.4641.848291.852841.8482)4/5.664/8.785/5.916/0.1036/0.121(/34.8541.848275.856741.8482)0.160.175.195.21(222222.22222tTetTtTeiitijTdfdfdfkdfNdfSSSSSSCnxSSCxSS下一张主页退出上一张2、列出方差分析表,进行F检验临界F值为:F0.05(4,20)=2.87,因为品种间的F值5.99>F0.05(4,20),表明品种间差异极显著。下一张主页退出上一张极差分析法简单明了,通俗易懂,计算工作量少便于推广普及。但这种方法不能将试验中由于试验条件改变引起的数据波动同试验误差引起的数据波动区分开来,也就是说,不能区分因素各水平间对应的试验结果的差异究竟是由于因素水平不同引起的,还是由于试验误差引起的,无法估计试验误差的大小。此外,各因素对试验结果的影响大小无法给以精确的数量估计,不能提出一个标准来判断所考察因素作用是否显著。为了弥补极差分析的缺陷,可采用方差分析。下一张主页退出上一张3.2正交试验结果的方差分析3.2.1正交试验结果的方差分析方差分析基本思想是将数据的总偏差平方和分解成因素引起的偏差平方和和误差引起的偏差平方和两部分,构造F统计量,作F检验,即可判断因素作用是否显著。总偏差平方和=各列因素偏差平方和+误差偏差平方和(1)偏差平方和分解:空列(误差)因素SSSSSST(2)自由度分解:空列(误列(因素Tdfdfdf(3)方差:误差误差误差因素因素因素dfSS=MSdfSS=MS,(4)构造F统计量:误差因素因素MSMS=F(5)列方差分析表,作F检验若计算出的F值F0Fa,则拒绝原假设,认为该因素或交互作用对试验结果有显著影响;若F0≼Fa,则认为该因素或交互作用对试验结果无显著影响。(6)正交试验方差分析说明由于进行F检验时,要用误差偏差平方和SSe及其自由度dfe,因此,为进行方差分析,所选正交表应留出一定空列。当无空列时,应进行重复试验,以估计试验误差。误差自由度一般不应小于2,dfe很小,F检验灵敏度很低,有时即使因素对试验指标有影响,用F检验也判断不出来。为了增大dfe,提高F检验的灵敏度,在进行显著性检验之前,先将各因素和交互作用的方差与误差方差比较,若MS因(MS交)2MSe,可将这些因素或交互作用的偏差平方和、自由度并入误差的偏差平方和、自由度,这样使误差的偏差平方和和自由度增大,提高了F检验的灵敏度。表头设计AB……试验数据列号12…kxixi2试验号11………x1x1221………x2x22…………………nm………xnxn2K1jK11K12…K1kK2jK21K22…K2k……………KmjKm1Km2…KmkK1j2K112K122…K1k2K2j2K212K222K2k2……………Kmj2Km12Km22…Kmk2SSjSS1SS2…SSkCT=QSSr1=QCT=QSSxQnTCTxT=jji=jTTni=iT2ni=im12ij121K=表10-21Ln(mk)正交表及计算表格总偏差平方和:nx-x=SSn1=i2in1i2iT)(=列偏差平方和:),,,=()(=k...21jnx-Kr1=SSn1=i2im1i2ijj试验总次数为n,每个因素水平数为m个,每个水平作r次重复r=n/m。当m=2时,),,,=()(k...21jK-Kn1=SS22j1jj总自由度:=n-1dfT因素自由度:为因素水平个数,mj1=mdf表10-20L9(34)正交表处理号第1列(A)第2列第3列第4列试验结果yi11111y121222y231333y342123y452231y562312y673132y783213y893321y9分析第1列因素时,其它列暂不考虑,将其看做条件因素。因素A第1水平3次重复测定值因素A第2水平3次重复测定值因素A第3水平3次重复测定值因素重复1重复2重复3A1y1y2y3A2y4y5y6A3y7y8y9单因素试验数据资料格式和y1+y2+y3K1y4+y5+y6K2y7+y8+y9K39T-KKK319y9...y2y1y9y8y7y6y5y4y3y2y131SS22322212222A)(=(修正项))()()()(=3.2.2不考虑交互作用等水平正交试验方差分析例:自溶酵母提取物是一种多用途食品配料。为探讨啤酒酵母的最适自溶条件,安排三因素三水平正交试验。试验指标为自溶液中蛋白质含量(%)。试验因素水平表见表10-22,试验方案及结果分析见表10-23。试对试验结果进行方差分析。水平试验因素温度(℃)ApH值B加酶量(%)C1506.52.02557.02.43587.52.8表10-22因素水平表处理号ABC空列试验结果yi11(50)1(6.5)1(2.0)16.25212(7.0)2(2.4)24.97313(7.5)3(2.834.5442(55)1237.53522315.54623125.573(58)13211.48321310.9933218.95K1j15.7625.1822.6520.74K2j18.5721.4121.4521.87K3j31.2518.9921.4822.97K1j2248.38634.03513.02430.15K2j2344.84458.39460.10478.30K3j2976.56360.62461.39527.62表10-23试验方案及结果分析表58.65T(1)计算计算各列各水平的K值计算各列各水平对应数据之和K1j、K2j、K3j及其平方K1j2、K2j2、K3j2。计算各列偏差平方和及自由度miijjCTKrss12186.477958.6522nTCT4.4586.477)56.97684.34438.248(31)312212112(31CTKKKssA同理,SSB=6.49,SSC=0.31SSe=0.83(空列)自由度:dfA=dfB=dfC=dfe=3-1=2计算方差7.2224.45AAAdfSSV155.0231.0CCCdfSSV23.3249.6BBBdfSSV415.0283.0eeedfSSV(2)显著性检验根据以上计算,进行显著性检验,列出方差分析表,结果见表10-24变异来源平方和自由度均方F值Fa显著水平A45.40222.7079.6F0.05(2,4)=6.94**B6.4923.2411.4F0.01(2,4)=18.0*C△0.3120.16误差e0.8320.41误差e△1.1440.285总和53.03表10-24方差分析表因素A高度显著,因素B显著,因素C不显著。因素主次顺序A-B-C。(3)优化工艺条件的确定本试验指标越大越好。对因素A、B分析,确定优水平为A3、B1;因素C的水平改变对试验结果几乎无影响,从经济角度考虑,选C1。优水平组合为A3B1C1。即温度为58℃,pH值为6.5,加酶量为2.0%。3.2.3考虑交互作用正交试验方差分析例:用石墨炉原子吸收分光光度法测定食品中的铅,为了提高测定灵敏度,希望吸光度越大越好,今欲研究影响吸光度的因素,确定最佳测定条件。(1)计算计算各列各水平对应数据之和K1j、K2j及(K1j-K2j);计算各列偏差平方