试验设计与数据处理(第三版)ExperimentDesignandDataProcessing1引言20.1试验设计与数据处理的发展概况20世纪20年代,英国生物统计学家及数学家费歇(R.A.Fisher)提出了方差分析20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化数学家华罗庚教授也在国内积极倡导和普及的“优选法”我国数学家王元和方开泰于1978年首先提出了均匀设计30.2试验设计与数据处理的意义0.2.1试验设计的目的:合理地安排试验,力求用较少的试验次数获得较好结果例:某试验研究了3个影响因素:A:A1,A2,A3B:B1,B2,B3C:C1,C2,C3全面试验:27次正交试验:9次40.2.2数据处理的目的通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。5第1章试验数据的误差分析6误差分析(erroranalysis):对原始数据的可靠性进行客观的评定误差(error):试验中获得的试验值与它的客观真实值在数值上的不一致客观真实值——真值试验结果都具有误差,误差自始至终存在于一切科学实验过程中71.1真值与平均值1.1.1真值(truevalue)真值:在某一时刻和某一状态下,某量的客观值或实际值真值一般是未知的相对的意义上来说,真值又是已知的平面三角形三内角之和恒为180°国家标准样品的标称值国际上公认的计量值高精度仪器所测之值多次试验值的平均值81.1.2平均值(mean)(1)算术平均值(arithmeticmean)121...ninixxxxxnn等精度试验值适合:试验值服从正态分布9(2)加权平均值(weightedmean)适合不同试验值的精度或可靠性不一致时11221121......Wniinninniiwxwxwxwxxwi——权重加权和10(3)对数平均值(logarithmicmean)说明:若数据的分布具有对数特性,则宜使用对数平均值对数平均值≤算术平均值如果1/2≤x1/x2≤2时,可用算术平均值代替121221121221lnlnlnlnLxxxxxxxxxxxxx设两个数:x1>0,x2>0,则11(4)几何平均值(geometricmean)当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。几何平均值≤算术平均值11212...(...)Gnnnnxxxxxxx设有n个正试验值:x1,x2,…,xn,则12(5)调和平均值(harmonicmean)常用在涉及到与一些量的倒数有关的场合调和平均值≤几何平均值≤算术平均值1121111...1ninixxxxHnn设有n个正试验值:x1,x2,…,xn,则:Excel在计算平均值中的应用131.2误差的基本概念1.2.1绝对误差(absoluteerror)(1)定义绝对误差=试验值-真值或maxtxxxxtxxx(2)说明真值未知,绝对误差也未知可以估计出绝对误差的范围:绝对误差限或绝对误差上界或maxtxxx14绝对误差估算方法:最小刻度的一半为绝对误差;最小刻度为最大绝对误差;根据仪表精度等级计算:绝对误差=量程×精度等级%151.2.2相对误差(relativeerror)(1)定义:绝对误差相对误差真值tRttxxxExx或RxEx(2)说明:真值未知,常将Δx与试验值或平均值之比作为相对误差:RxEx或16可以估计出相对误差的大小范围:maxRttxxExx相对误差限或相对误差上界相对误差常常表示为百分数(%)或千分数(‰)(1)tRxxE∴171.2.3算术平均误差(averagediscrepancy)定义式:11nniiiixxdnn可以反映一组试验数据的误差大小ixx试验值与算术平均值之间的偏差id——181.2.4标准误差(standarderror)定义式:21()(n1)niixxSEn表示当前样本对总体数据的估计;表示样本均数与总体均数的相对误差;样本个数n越大,标准误越小,表明所抽取的样本能够较好地代表总体样本19(1)定义:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小(2)产生的原因:偶然因素(3)特点:具有统计规律小误差比大误差出现机会多正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零可以通过增加试验次数减小随机误差随机误差不可完全避免的1.3.1随机误差(randomerror)1.3试验数据误差的来源及分类201.3.2系统误差(systematicerror)(1)定义:一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差(2)产生的原因:多方面(3)特点:系统误差大小及其符号在同一试验中是恒定的它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。211.3.3过失误差(mistake)(1)定义:一种显然与事实不符的误差(2)产生的原因:实验人员粗心大意造成(3)特点:可以完全避免没有一定的规律221.4.1精密度(precision)(1)含义:反映了随机误差大小的程度在一定的试验条件下,多次试验值的彼此符合程度例:甲:11.45,11.46,11.45,11.44乙:11.39,11.45,11.48,11.50(2)说明:可以通过增加试验次数而达到提高数据精密度的目的试验数据的精密度是建立在数据用途基础之上的试验过程足够精密,则只需少量几次试验就能满足要求1.4试验数据的精准度23(3)精密度判断①极差(range)222111()()/nnniiiiiixxxxnnnmaxminRxx②标准差(standarderror,SD)222111()()/11nnniiiiiixxxxnsnnR↓,精密度↑标准差↓,精密度↑24③方差(variance)标准差的平方:样本方差(s2)总体方差(σ2)方差↓,精密度↑25④相对标准偏差(relativestandarddeviation,RSD)也称变异系数(coefficientofvariation,简称CV)定义式:()100%sRSDCVx或适用于两个或多个数据资料分散程度、变异程度或精密程度的比较例1-5261.4.2正确度(correctness)(1)含义:反映系统误差的大小(2)正确度与精密度的关系:精密度不好,但当试验次数相当多时,有时也会得到好的正确度精密度高并不意味着正确度也高(a)(b)(c)271.4.3准确度(accuracy)(1)含义:反映了系统误差和随机误差的综合表示了试验结果与真值的一致程度(2)三者关系无系统误差的试验精密度:A>B>C正确度:A=B=C准确度:A>B>C28有系统误差的试验精密度:A'>B'>C'准确度:A'>B'>C',A'>B,CExcel在计算误差中的应用291.5.1随机误差的检验1.5试验数据误差的统计假设检验1.5.1.12检验(2-test)(1)目的:对试验数据的随机误差或精密度进行检验。在试验数据的总体方差2已知的情况下,(2)检验步骤:若试验数据12,,,nxxx服从正态分布,则①计算统计量230222(1)ns②查临界值2()df1dfn2服从自由度为的分布显著性水平——一般取0.01或0.05,表示有显著差异的概率双侧(尾)检验(two-sided/tailedtest):222122③检验若则判断两方差无显著差异,否则有显著差异31单侧(尾)检验(one-sided/tailedtest):左侧(尾)检验22(1)()df则判断该方差与原总体方差无显著减小,否则有显著减小右侧(尾)检验22()df则判断该方差与原总体方差无显著增大,否则有显著增大若若(3)Excel在2检验中的应用22s(当时)22s(当时)321.5.1.2F检验(F-test)(1)目的:对两组具有正态分布的试验数据之间的精密度进行比较(2)检验步骤①计算统计量1(1)(1)(1)12,,,nxxx2(2)(2)(2)12,,,nxxx22s21s设有两组试验数据:都服从正态分布,样本方差分别为和和,则2122sFs111dfn221dfn第一自由度为第二自由度为服从F分布,33②查临界值给定的显著水平α111dfn221dfn查F分布表临界值双侧(尾)检验(two-sided/tailedtest):③检验若则判断两方差无显著差异,否则有显著差异1212(1)22(,)(,)FdfdfFFdfdf34单侧(尾)检验(one-sided/tailedtest):左侧(尾)检验(F<1,即s12s22):则判断该判断方差1比方差2无显著减小,否则有显著减小右侧(尾)检验(F>1,即s12s22)则判断该方差1比方差2无显著增大,否则有显著增大若若(1)12(,)FFdfdf12(,)FFdfdf(3)Excel在F检验中的应用351.5.2系统误差的检验1.5.2.1t检验法(1)平均值与给定值比较①目的:检验服从正态分布数据的算术平均值是否与给定值有显著差异②检验步骤:计算统计量:0xtns服从自由度1dfn的t分布(t-distribution)0——给定值(可以是真值、期望值或标准值)36双侧检验:若2tt则可判断该平均值与给定值无显著差异,否则就有显著差异单侧检验左侧检验00()txtt若,且则判断该平均值与给定值无显著减小,否则有显著减小右侧检验00()txtt若,且则判断该平均值与给定值无显著增大,否则有显著增大③Excel在单样本t检验中的应用37(2)两个平均值的比较目的:判断两组服从正态分布数据的算术平均值有无显著差异①计算统计量:两组数据的方差无显著差异时121212xxnntsnn服从自由度122dfnn的t分布s——合并标准差:22112212(1)(1)2nsnssnn38两组数据的精密度或方差有显著差异时12221212xxtssnn服从t分布,其自由度为:22211222222112212()2()()(1)(1)snsndfsnsnnn②t检验39双侧检验:若2tt则可判断两平均值无显著差异,否则就有显著差异单侧检验左侧检验:120()txxtt若且则判断该平均值1较平均值2无显著减小,否则有显著减小右侧检验:120()txxtt若且则判断该平均值1较平均值2无显著增大,否则有显著增大③Excel在双样本t检验中的应用40(3)成对数据的比较目的:试验数据是成对出现,判断两种方法、两种仪器或两分析人员的测定结果之间是否存在系统误差①计算统计量:0dddtns——成对测定值之差的算术平均值:d0d——零或其他指定值(1)(2)11nniiiiixxddnnds——n对试验值之差值的样本标准差:21()1niidddsn服从自由度为1dfn的t分布41双侧检验:若2tt则可判断两平均值无显著差异,否则就有显著差异单侧检验左侧检验:120()txxtt若且则判断该平均值1较平均值2无显著减小,否则有显著减小右侧检验:120()txx