第三章正交试验设计中的方差分析数据处理的意义1)直观分析法的优势:简单、直观、易做。计算量小,容易理解。2)方差分析法统计数学中常用的研究方法。是建立在差方和的加和性基础上的数据处理方法。一个化学过程就是受多种因素影响的复杂过程。每个因素都对最终结果(试验指标)的总差方和的形成提供一定的贡献。差方和的加和性:总差方和受各因素独立形成的差方和的制约,在数值上,总差方和等于各因素形成的差方和的总和。方差分析的目的和任务:方差分析是一种数据处理方法。化学过程是一个复杂的反应过程,最终的结果受多种因素影响,这些因素的影响或大或小,有时互相制约、有时互相依存。方差分析的目的就是通过对实验数据进行处理,分析出各个因素的影响,以及各因素之间交互作用的影响,找出主要的影响因素。一.几个数据处理中常用的数理统计名词:首先对几个数理统计名词进行回顾1.平均值x就是所有数据的和除以数据的个数。nniixxxnxnx21111niixn11n总体平均值:总体:数理统计学中指的是研究对象的某一特性值的全体;样本:从总体中随机抽出的一组测量值。2.极差R:就是一组数据中的最大值减去最小值得到的差值。3.差方和Q:测量值对平均值的偏差的平方和,就叫~。也叫离差平方和。niixxQ124.自由度f:差方和中独立项的数目就叫~。f=n-1.5.方差s2:niixn1221s()n6.样本方差s2:有限次测量的方差。111122nQxxnsnii测量值xi对总体平均值的误差的平方的统计平均。是测量值xi在其总体平均值周围分布状况的一种量度,表征随机变量分布的离散程度。7.标准偏差s:11112nQxxnsnii方差的平方根。二.正交试验设计的方差分析的步骤和格式假设用正交表安排N个因素的正交试验,试验总次数为n,试验结果(试验指标)分别为x1,x2,…,xn。假定每个因素取m个水平,每个水平做p次试验,则n=mp。1.计算差方和(离差平方和):包括以下几部分:那么正交试验的方差分析可以从以下几步进行:1)各因素差方和:正交试验都是多因素多水平的试验,因此有必要对各因素的差方和进行计算。各因素差方和等于它的各水平均值k1A,k2A,…,kmA之间偏差平方和。mipjijmipjijxmpxnx111111那么因素A的差方和为:211122222111mipjijmiAiAmAAAxmpKpxkxkxkpQ其他因素差方和类似于因素A的计算。所有试验次数的平均值计算如下:2)总差方和QT:QT是所有试验次数结果的偏差平方和。它反映的是试验结果的总差异,值越大,说明各次试验的结果之间的差异越大。这个差异是由因素水平的变化以及试验误差引起的,不可避免。2111122111mipjijmipjijmipjijTxmpxxxQ按照差方和的加和性,总差方和等于各因素形成的差方和的总和。eBATQQQQQN其中Qe为残差平方和,即误差的差方和。3)试验误差的差方和Qe:)QQQ(QQNBATe2.计算自由度:试验的总自由度:各因素自由度:1nfT1mf因如果有交互作用,则交互作用的自由度为两因素自由度之积:即:fA×B=fA×fB试验误差的自由度fe=fT-f因。试验误差的差方和是所有试验结果在不同水平下的指标值与该水平下的均值之间的差的平方和。它是由随机误差引起的,故叫误差的差方和。3.计算平均差方和(均方):在计算各因素的差方和时,按照前面的讲述,它是各水平的偏差方的和,其大小与水平数有关,故此还不能确切的反映各因素的情况。为了消除水平数的影响,可以计算其平均差方和:因因=因素的自由度因素差方和因素的平均差方和=fQefQe=试验误差的自由度试验误差差方和=试验误差的平均差方和4.求F比:将各因素的平均差方和与误差的平均差方和相比,得出F值。这个比值的大小反映了各因素对试验结果影响程度的大小。这就是著名的F检验法。误差平均差方和因素的平均差方和F5.对因素进行显著性检验:给出检验水平a(置信度),从F分布表中查找临界值Fa(f因,fe)。将其与上述计算出的F值比较,若FFa(f因,fe),说明该因素对试验结果(试验指标)的影响显著,两个数差别越大,说明该因素的显著性越大。一般有这样规律:F>F0.01,因素影响非常非常显著,稍微变化即引起指标的很大变化;F0.01≥F>F0.05,因素影响非常显著;F0.05≥F>F0.10,因素影响显著;F0.10≥F>F0.25,因素有一定影响;F≤F0.25,看不出该因素对指标有什么影响。