15第2章实验数据的误差分析通过实验测量所得大批数据是实验的主要成果,但在实验中,由于测量仪表和人的观察等方面的原因,实验数据总存在一些误差,所以在整理这些数据时,首先应对实验数据的可靠性进行客观的评定。误差分析的目的就是评定实验数据的精确性,通过误差分析,认清误差的来源及其影响,并设法消除或减小误差,提高实验的精确性。对实验误差进行分析和估算,在评判实验结果和设计方案方面具有重要的意义。本章就化工原理实验中遇到的一些误差基本概念与估算方法作一扼要介绍。2.1误差的基本概念2.1.1真值与平均值真值是指某物理量客观存在的确定值。通常一个物理量的真值是不知道的,是我们努力要求测到的。严格来讲,由于测量仪器,测定方法、环境、人的观察力、测量的程序等,都不可能是完善无缺的,故真值是无法测得的,是一个理想值。科学实验中真值的定义是:设在测量中观察的次数为无限多,则根据误差分布定律正负误差出现的机率相等,故将各观察值相加,加以平均,在无系统误差情况下,可能获得极近于真值的数值。故“真值”在现实中是指观察次数无限多时,所求得的平均值(或是写入文献手册中所谓的“公认值”)。然而对我们工程实验而言,观察的次数都是有限的,故用有限观察次数求出的平均值,只能是近似真值,或称为最佳值。一般我们称这一最佳值为平均值。常用的平均值有下列几种:(1)算术平均值这种平均值最常用。凡测量值的分布服从正态分布时,用最小二乘法原理可以证明:在一组等精度的测量中,算术平均值为最佳值或最可信赖值。nxnxxxxniin121(2-1)式中:nxxx21、——各次观测值;n――观察的次数。(2)均方根平均值nxnxxxxniin1222221均(2-2)(3)加权平均值设对同一物理量用不同方法去测定,或对同一物理量由不同人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。niiniiinnnwx(2-3)16式中;nxxx21、——各次观测值;n21、——各测量值的对应权重。各观测值的权数一般凭经验确定。(4)几何平均值nnxxxxx321发(2-4)(5)对数平均值21212121lnlnlnxxxxxxxxxn(2-5)以上介绍的各种平均值,目的是要从一组测定值中找出最接近真值的那个值。平均值的选择主要决定于一组观测值的分布类型,在化工原理实验研究中,数据分布较多属于正态分布,故通常采用算术平均值。2.1.2误差的定义及分类在任何一种测量中,无论所用仪器多么精密,方法多么完善,实验者多么细心,不同时间所测得的结果不一定完全相同,而有一定的误差和偏差,严格来讲,误差是指实验测量值(包括直接和间接测量值)与真值(客观存在的准确值)之差,偏差是指实验测量值与平均值之差,但习惯上通常将两者混淆而不以区别。根据误差的性质及其产生的原因,可将误差分为:1)系统误差;2)偶然误差;3)过失误差三种。1.系统误差又称恒定误差,由某些固定不变的因素引起的。在相同条件下进行多次测量,其误差数值的大小和正负保持恒定,或随条件改变按一定的规律变化。产生系统误差的原因有:1)仪器刻度不准,砝码未经校正等;2)试剂不纯,质量不符合要求;3)周围环境的改变如外界温度、压力、湿度的变化等;4)个人的习惯与偏向如读取数据常偏高或偏低,记录某一信号的时间总是滞后,判定滴定终点的颜色程度各人不同等等因素所引起的误差。可以用准确度一词来表征系统误差的大小,系统误差越小,准确度越高,反之亦然。由于系统误差是测量误差的重要组成部分,消除和估计系统误差对于提高测量准确度就十分重要。一般系统误差是有规律的。其产生的原因也往往是可知或找出原因后可以清除掉。至于不能消除的系统误差,我们应设法确定或估计出来。2.偶然误差又称随机误差,由某些不易控制的因素造成的。在相同条件下作多次测量,其误差的大小,正负方向不一定,其产生原因一般不详,因而也就无法控制,主要表现在测量结果的分散性,但完全服从统计规律,研究随机误差可以采用概率统计的方法。在误差理论中,常用精密度一词来表征偶然误差的大小。偶然误差越大,精密度越低,反之亦然。在测量中,如果已经消除引起系统误差的一切因素,而所测数据仍在未一位或未二位数字上有差别,则为偶然误差。偶然误差的存在,主要是我们只注意认识影响较大的一些因素,而往往忽略其他还有一些小的影响因素,不是我们尚未发现,就是我们无法控制,而这些影响,正是造成偶然误差的原因。17图2-1精密度、正确度、精确度含义示意图3.过失误差又称粗大误差,与实际明显不符的误差,主要是由于实验人员粗心大意所致,如读错,测错,记错等都会带来过失误差。含有粗大误差的测量值称为坏值,应在整理数据时依据常用的准则加以剔除。综上所述,我们可以认为系统误差和过失误差总是可以设法避免的,而偶然误差是不可避免的,因此最好的实验结果应该只含有偶然误差。2.1.3精密度、正确度和精确度(准确度)测量的质量和水平,可用误差的概念来描述,也可用准确度等概念来描述。国内外文献所用的名词术语颇不统一,精密度、正确度、精确度这几个术语的使用一向比较混乱。近年来趋于一致的多数意见是:精密度:可以称衡量某些物理量几次测量之间的一致性,即重复性。它可以反映偶然误差大小的影响程度。正确度:指在规定条件下,测量中所有系统误差的综合,它可以反映系统误差大小的影响程度。精确度(准确度):指测量结果与真值偏离的程度。它可以反映系统误差和随机误差综合大小的影响程度。为说明它们间的区别,往往用打靶来作比喻。如图2-1所示,A的系统误差小而偶然误差大,即正确度高而精密度低;B的系统误差大而偶然误差小,即正确度低而精密度高;C的系统误差和偶然误差都小,表示精确度(准确度)高。当然实验测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值。对于实验测量来说,精密度高,正确度不一定高。正确度高,精密度也不一定高。但精确度(准确度)高,必然是精密度与正确度都高。2.2误差的表示方法测量误差分为测量点和测量列(集合)的误差。它们有不同的表示方法。2.2.1测量点的误差表示1.绝对误差D测量集合中某次测量值与其真值之差的绝对值称为绝对误差。xXD(2-6)即DxXDxDxX式中:X——真值,常用多次测量的平均值代替;x——测量集合中某测量值2.相对误差Er绝对误差与真值之比称为相对误差XDEr(2-7)18相对误差常用百分数或千分数表示。因此不同物理量的相对误差可以互相比较,相对误差与被测之量的大小及绝对误差的数值都有关系。3.引用误差仪表量程内最大示值误差与满量程示值之比的百分值。引用误差常用来表示仪表的精度。2.2.2测量列(集合)的误差表示1.范围误差范围误差是指一组测量中的最高值与最低值之差,以此作为误差变化的范围。使用中常应用误差的系数的概念。LK(2-8)式中:K——最大误差系数;L——范围误差;——算术平均值。范围误差最大缺点是使K只以决于两极端值。而与测量次数无关。2.算术平均误差算术平均误差是表示误差的较好方法,其定义为δ=ndi,ni,2,1(2-9)式中:n——观测次数;id—-测量值与平均值的偏差,iixd。算术平均误差的缺点是无法表示出各次测量间彼此符合的情况。3.标准误差标准误差也称为根误差。ndi2(2-10)标准误差对一组测量中的较大误差或较小误差感觉比较灵敏,成为表示精确度的较好方法。上式适用无限次测量的场合。实际测量中,测量次数是有限的,改写为12ndi(2-11)标准误差不是一个具体的误差,的大小只说明在一定条件下等精度测量集合所属的任一次观察值对其算术平均值的分散程度,如果的值小,说明该测量集合中相应小的误差就占优势,任一次观测值对其算术平均值的分散度就小,测量的可靠性就大。算术平均误差和标准误差的计算式中第i次误差可分别代入绝对误差和相对误差,相对得到的值表示测量集合的绝对误差和相对误差。上述的各种误差表示方法中,不论是比较各种测量的精度或是评定测量结果的质量,均以相对误差和标准误差表示为佳,而在文献中标准误差更常被采用。192.2.3仪表的精确度与测量值的误差1.电工仪表等一些仪表的精确度与测量误差这些仪表的精确度常采用仪表的最大引用误差和精确度的等级来表示。仪表的最大引用误差的定义为最大引用误差=绝对值该仪表相应档次量程的仪表显示值的绝对误差×100%(2-12)式中仪表显示值的绝对误差指在规定的正常情况下。被测参数的测量值与被测参数的标准值之差的绝对值的最大值。对于多档仪表,不同档次显示值的绝对误差和程量范围均不相同。式(2-12)表明,若仪表显示值的绝对误差相同,则量程范围愈大,最大引用误差愈小。我国电工仪表的精确度等级有七种:0.1、0.2、0.5、1.0、1.5、2..5、5.0。如某仪表的精确度等级为2.5级,则说明此仪表的最大引用误差为2.5%。在使用仪表时,如何估算某一次测量值的绝对误差和相对误差?设仪表的精确度等级P级,其最大引用误差为10%。设仪表的测量范围为nx仪表的示值为ix,则由式(2-12)得该示值的误差为%%PxxxDEPxDinin相对误差绝对误差(2-13)式(2-13)表明:(1)若仪表的精确度等级P和测量范围nx已固定,则测量的示值ix愈大,测量的相对误差愈小。(2)选用仪表时,不能盲目地追求仪表的精确度等级。因为测量的相对误差还与inxx有关。应该兼顾仪表的精确度等级和inxx两者。2.天平类仪器的精确度和测量误差这些仪器的精度用以下公式来表示:仪器的精密度=量程的范围名义分度值(2-14)式中名义分度值指测量时读数有把握正确的最小分度单位,即每个最小分度所代表的数值。例如TG—3284型天平,其名义分度值(感量)为0.1毫克,测量范围为0~200克,则其精确度=731051002001.0)((2-15)若仪器的精确度已知,也可用式(2-14)求得其名义分度值。使用这些仪器时,测量的误差可用下式来确定:测量值名义度值相对误差名义分度值绝对误差(2-16)203.测量值的实际误差由于仪表的精确度用上述方法所确定的测量误差,一般总是比测量值的实际误差小的多。这是因为仪器没有调整到理想状态,如不垂直、不水平、零位没有调整好等,会引起误差;仪表的实际工作条件不符合规定的正常工作条件,会引起附加误差;仪器经过长期使用后,零件发生磨损,装配状况发生变化等,也会引起误差;可能存在有操作者的习惯和偏向所引起的误差;仪表所感受的信号实际上可能并不等于待测的信号;仪表电路可能会受到干扰等。总而言之,测量值实际误差大小的影响因素是很多的。为了获得较准确的测量结果,需要有较好的仪器,也需要有科学的态度和方法,以及扎实的理论知识和实践经验。2.3“过失”误差的舍弃这里加引号的“过失”误差与前面提到真正的过失误差是不同的,在稳定过程,不受任何人为因素影响,测量出少量过大或过小的数值,随意地舍弃这些“坏值”,以获得实验结果的一致,这是一种错误的做法,“坏值”的舍弃要有理论依据。如何判断是否属于异常值?最简单的方法是以三倍标准误差为依据。从概率的理论可知,大于3(均方根误差)的误差所出现的概率只有0.3%,故通常把这一数值称为极限误差,即3=极限(2-17)如果个别测量的误差超过3,那么就可以认为属于过失误差而将舍弃。重要的是如何从有限的几次观察值中舍弃可疑值的问题,因为测量次数少,概率理论已不适用,而个别失常测量值对算术平均值影响很大。有一种简单的判断法,即略去可疑观测值后,计算其余各观测值的平均值及平均误差,然后算出可疑观测值ix与平均值的偏差d如果4d则此可疑值可以舍弃,因为这种观测值存在的概率大约只有千分之一。2.4间接测量中的误差传递在许多实验和研究中,所得到的结果有时不是用仪器直接测量得到的,而是要把实验现场直接测量值代入一定的理论关系式中