误差分析与数据处理物理化学实验是研究物质的物理性质以及这些物理性质与其化学反应间关系的一门实验科学。在实验研究工作中,一方面要拟定实验的方案,选择一定精度的仪器和适当的方法进行测量;另一方面必须将所测得的数据加以整理归纳,科学地分析并寻求被研究变量间的规律。但由于仪器和感觉器官的限制,实验测得的数据只能达到一定程度的准确性。因此,在着手实验之前要了解测量所能达到的准确度以及在实验以后合理地进行数据处理,都必须具有正确的误差概念,在此基础上通过误差分析,选用最合适的仪器量程,寻找适当的实验方法,得出测量的有利条件。下面首先简要介绍有关误差等几个基本概念。一、一、基本概念1.误差。在任何一种测量中,无论所用仪器多么精密,方法多么完善,实验者多么细心,所得结果常常不能完全一致而会有一定的误差或偏差。严格地说,误差是指观测值与真值之差,偏差是指观测值与平均值之差。但习惯上常将两者混用而不加区别。根据误差的种类、性质以及产生的原因,可将误差分为系统误差、偶然误差和过失误差三种。系统误差:这种误差是由于某种特殊原因所造成的恒定偏差,或者偏大或者偏小,其数值总可设法加以确定,因而一般说来,它们对测量结果的影响可用改正量来校正。系统误差起因很多,例如:(1)仪器误差。这是由于仪器构造不够完善,示数部分的刻度划分得不够准确所引起,如天平零点的移动,气压表的真空度不高,温度计、移液管、滴定管的刻度不够准确等。(2)测量方法本身的限制。如根据理想气体方程式测量某蒸汽的相对分子质量时,由于实际气体对理想气体有偏差,不用外推法求得的相对分子质量总较实际的相对分子质量为大。(3)个人习惯性误差。这是由于观测者有自己的习惯和特点所引起,如记录某一信号的时间总是滞后、有人对颜色的感觉不灵敏、滴定等当点总是偏高等。系统误差决定测量结果的准确度。它恒偏于一方,偏正或偏负,测量次数的增加并不能使之消除。通常是用几种不同的实验技术或用不同的实验方法或改变实验条件、调换仪器等以确定有无系统误差存在,并确定其性质,设法消除或使之减少,以提高准确度。偶然误差:在实验时即使采用了完善的仪器,选择了恰当的方法,经过了精细的观测,仍会有一定的误差存在。这是由于实验者的感官的灵敏度有限或技巧不够熟练、仪器的准确度限制以及许多不能预料的其他因素对测量的影响所引起的。这类误差称为偶然误差。它在实验中总是存在的,无法完全避免,但它服从几率分布。偶然误差是可变的,有时大,有时小,有时正,有时负。但如果多次测量,便会发现数据的分布符合一般统计规律。这种规律可用图I一1中的典型曲线表示,此曲线称为误差的正态分布曲线,此曲线的函数形式为:y=y=式中:h称为精确度指数,σ为标准误差,h与σ的关系为:h=。自图I一1中的曲线可以出:(1)误差小的比误差大的出现机会多,故误差的几率与误差大小有关。个别特别大的误差出现的次数极少。(2)由于正态分布曲线与y轴对称,因此数值大小相同,符号相反的正、负误差出现的机率近于相等。如以m代表无限多次测量结果的平均值,在没有系统误差的情况下,它可以代表真值。σ为无限多次测量所得标准误差。由数理统计方法分析可以得出,误差在±1σ内出现的几率是68.3%,在±2σ内出现的几率是95.5%,在±3占内出现的几率是99.7%,可见误差超过±3σ的出现几率只有0.3%。因此如果多次重复测量中个别数据的误差之绝对值大于3σ,则这个极端值可以舍去。偶然误差虽不能完全消除。但基于误差理论对多次测量结果进行统计处理,可以获得被测定的最佳代表值及对测量精密度作出正确的评价。在基础物理化学实验中的测量次数有限,若要采用这种统计处理方法进行严格计算可查阅有关参考书。过失误差:这是由于实验过程中犯了某种不应有的错误所引起的,如标度看错、记录写错、计算弄错等。此类误差无规则可寻,只要多方警惕,细心操作,过失误差是可以完全避免的。2.准确度和精密度。准确度是表示观测值与真值接近程度;精密度是表示各观测值相互接近的程度。精密度高又称再现性好。在一组测量中,尽管精密度很高,但准确度不一定很好;相反,若准确度好,则精密度一定高。准确度与精密度的区别,可用图I一2加以说明。例如甲乙丙三人同时测定某一物理量,各分析四次,其测定结果图中以小圈表示。从图I一2上可见,甲的测定结果的精密度很高,但平均值与真值相差较大,说明其准确度低。乙的测定结果的精密度不高,准确度也低。只有丙的测得结果的精密度和准确度均高。必须指出的是在科学测量中,只有设想的真值,通常是以运用正确测量方法并用校正过的仪器多次测量所得的算术平均值或载之文献手册的公认值来代替的。3.绝对误差与相对误差。绝对误差是观测值与真值之差。相对误差是指误差在真值中所占的百分数。它们分别可用下列两式表示:绝对误差=观测值—真值相对误差=绝对误差/真值×100%绝对误差的表示单位与被测量是相同的,而相对误差是无因次的。因此不同物理量的相对误差可以相互比较。这样,无论是比较各种测量的精密度或是评定测量结果的准确度,采用相对误差更为方便。4.平均误差和标准误差。为了说明测量结果的精密度,一般以单次测量结果的平均误差表示,即=式中:d1、d2、…、dn为第1、2、…、n次测量结果的绝对误差。单次测量结果的相对平均误差为:相对平均误差=×10式中为算术平均值。用数理统计方法处理实验数据时,常用标准误差来衡量精密度。标准误差又称均方根误差,其定义为σ=,I=1,2,3,…,n。当测量次数不多时,测量的标准误差σ可按下式计算:σ==式中:d为xi-,是n个观测值的算术平均值。N-1称为自由度,是指独立测定的次数减去处理这些观测值时所用的外加关系条件的数目。因此在有限观测次数时,计算标准误差公式中采用n-1的自由度就起了除去这个外加关系条件(等式)的作用。用标准误差表示精密度要比用平均误差好,因为单次测量的误差平方之后,较大的误差更显著地反映出来,这就更能说明数据的分散程度。例如甲乙二人打靶,每人两次,甲击中处离靶中心为1和3寸,乙击中处则为2和2寸。这两人射击的平均误差都为2。但乙的射击精密度要比甲的高些,因为按照最小二乘方原理,甲的误差乘方和是12+32=10,而乙的是22+22=8。甲的标准误差为,而乙的标准误差却为、。因此化学工作者在精密地计算实验误差时,大多采用标准误差,而不用以百分数表示的算术平均误差。5.有效数字与运算法则。在实验工作中,对任一物理量的测定,其准确度都是有限的,我们只能以某一近似值表示之。因此测量数据的准确度就不能超过测量所允许的范围。如果任意将近似值保留过多的位数,反而歪曲测量结果的真实性。实际上有效数字的位数就指明了测量准确的幅度。现将有关有效数字和运算法则简述如下:(1)记录测量数据时,一般只保留一位可疑数字。有效数字是指该数字在一个数量中所代表的大小。例如,一滴定管的读数为32.47,其意义为十位数为3,个位数上为2,十分位上为4,百分位上为7。从滴定管上的刻度来看,我们都知道要读到千分位是不可能的,因为刻度只刻到十分之一,百分之一已为估计值。故在末位上,上下可能有正负一个单位出入。这末一位数可认为不准确的或可疑的,而其前边各数所代表的数值,则均为准确测量的。通常测量时,一般均可估计到最小刻度的十分位,故在记录一数量时,只应保留一位不准确数字,其余数均为准确数字。我们称此时所记的数字均为有效数字。在确定有效数字时,要注意“0”这个符号。紧接小数点后的0仅用来确定小数点的位置,并不作为有效数字。例如0.00015g中小数点后三个0都不是有效数字。而0.150g中的小数点后的0是有效数字,至于350mm中的0就很难说是不是有效数字,最好用指数来表示,以10的方次前面的数字表示。如写成3.5×102mm,则表示有效数字为两位;写成3.50×102mm,则有效数字为三位;其余类推。(2)在运算中舍去多余数字时采用四舍五人法。凡末位有效数字后面的第一位数大于5,则在其前一位上增加1,小于5则舍去。等于5时,如前一位为奇数,则增加1;如前一位为偶数则舍去。例如,对27.0235取四位有效数字时,结果为27.02;取五位有效数字时,结果为27.024。但将27.015与27.025取为四位有效数字时,则都为27.02。(3)加减运算时,计算结果有效数字的末位的位置应与各项中绝对误差最大的那项相同。或者说保留各小数点后的数字位数应与最小者相同。例如13.75,0.0084,1.642三个数据相加,若各数末位都有±1个单位的误差,则13.75的绝对误差±0.01为最大的,也就是小数点后位数最少的是13.75这个数,所以计算结果的有效数字的末位应在小数点后第二位。13.7513.750.0084舍去多余数后得0.01+)1.642+)1.6415.40(4)若第一位有效数字等于8或大于8,则有效数字位数可多计l位。例如9.12实际上虽然只有三位,但在计算有效数字时,可作四位计算。(5)乘除运算时,所得的积或商的有效数字,应以各值中有效数字最低者为标准。例如2.3×0.524=1.2又如1.751×0.0191/91其中91的有效数字最低。但由于首位是9,故把它看成三位有效数字其余各数都保留三位。因此上式计算结果为3.68×10-4,保留三位有效数字。在比较复杂计算中,要先后按加减、乘除的方法,计算中间各步可保留各数值位数较以上规则多一位,以免由于多次四舍五人引起误差的积累,对计算结果带来较大影响。但最后结果仍只保留其应有的位数。例如==3.4(6)在所有计算式中,常数π、e及乘子(如)和一些取自手册的常数,可无限制的,按需要取有效数字的位数。例如当计算式中有效数字最低者二位,则上述常数可取二位或三位。(7)在对数计算中,所取对数位数(对数首数除外)应与真数的有效数字相同。①真数有几个有效数字,则其对数的尾数也应有几个有效数字。如1g317.2=2.5013;1g7.1×1028=28.85②对数的尾数有几个有效数字,则其反对数也应有几个有效数字。如.3010=1g0.2000;0.652=1g4.49(8)在整理最后结果时,要按测量的误差进行化整,表示误差的有效数字一般只取一位至多也不超过二位,例如1.45±0.01。当误差第一位数为8或9时,只须保留一位。任何一个物理量的数据,其有效数字的最后一位,在位数上应与误差的最后一位相对应。例如,测量结果为1223.78±0.054,化整记为1223.78±0.05。又如,测量结果为14356±86,化整记为(1.436±0.009)×104。(9)计算平均值时,若为四个数或超过四个数相平均,则平均值的有效数字位数可增加一位。二、误差分析物理化学实验数据的测定工作中,绝大多数是要对几个物理量进行测量,代人某种函数关系式,然后加以运算,才能得到所需要的结果,这称为间接测量。在间接测量中每个直接测量值的准确度都会影响最后结果的准确性。例如在气体温度测量实验中,用理想气体方程式T=pV/nR测定温度T。因此T是各直接测量量p、V和n的函数。通过误差分析我们可以查明直接测量的误差对函数误差的影响情况,从而找出影响函数误差的主要来源,以便选择适当的实验方法,合理配置仪器,以寻求测量的有利条件。因此误差分析是鉴定实验质量的重要依据。误差分析限于对结果的最大可能误差而估计,因此对各直接测量的量只要预先知道其最大误差范围就够了。当系统误差已经校正,而操作控制又足够精密时,通常可用仪器读数精密度来表示测量误差范围。如50mL滴定管为±0.02mL,分析天平为0.0002g,1/10刻度的温度计为±0.02℃,贝克曼温度计为±0.002度等。究竟如何具体分析每一步骤的测量误差对结果准确度的影响呢?这就是下面所要讨论的误差传递问题。1.平均误差与相对平均误差的传递设有函数N=f(u1,u2,…,un)(1—1)N由u1,u2,…,un各直接测量值所决定。现已知测定u1,u2,…,un时的平均误差分别为Δu,Δu2,…,Δun,求N的平均误差ΔN为多少?将(1—1)式全微分得:dN=(+(+…+((I—2)设各自变