第一章误差理论及离群数据判定第一节误差产生的理论第二节粗差数据(离群数据)的判断检验第三节有效数字的修约及其运算第一节误差产生理论一、误差及误差表示方法1误差及真值误差即测定结果与被测定对象的真实值之差。可表示为:E=xi–μ(E为测定误差,xi测定值,μ为被测定对象的真实值)。真值是客观存在的,但由于任何测定过程均有误差存在,所以真值通常是未知的,很难获取真值。通常可能知道的真值有三类,即理论真值、约定真值以及相对真值。(1)绝对误差(Ea)绝对误差是指测定值与真实值之差。公式可表示为:Ea=xi–μEa反映试验值偏离真值的大小,可正可负,通常所说的误差指的是绝对误差。如某食品中的蛋白质含量测定结果为38.92%,已知真实含量为40.00%,则Ea(%)=38.92-40.00=-1.08。2误差的表示方法(2)相对误差(Er)又称误差率,是指绝对误差与真值之比(常以百分数或千分数表示),有时也表示为绝对误差与测定均值之比,这表示两组不同准确度的表示方法,所以采用相对误差更能精确表示出测定值的准确度。1100%100%100%/1aariaiaEEExExE2误差的表示方法(3)平均偏差测定结果与之间的差为偏差di,平均偏差定义为:11||||nniiiixxddnn例对某火煺肠进行亚硝酸含量的测定,共测定6次,测定结果为0.13mg/g、0.11mg/g、0.12mg/g、0.14mg/g、0.13mg/g和0.12mg/g,试求平均偏差?61111(/)(0.130.11...0.12)0.1366||/0.05/60.008mg/giiniixmggxdxxn解:2误差的表示方法(4)标准偏差与相对标准偏差标准偏差又称均方根偏差、标准差,简称为标准差。当试验次数N无穷大时,称总体标准偏差。2误差的表示方法222111()/()/NNiiNiiiixxNxNN在实际测量中,观测次数n是有限的,真值只能通过最可信赖(最佳)值来代替,即样本标准偏差。222111()()/11nnniiiiiixxxxnsnn相对标准偏差是指样本标准偏差占样本平均值的百分比(%),又称样本相对标准偏差(RSD)或变异系数(CV),为无量纲数据,2误差的表示方法()100%sRSDCVx3误差的分类可以分为系统误差,偶然误差和过失误差3类。(1)系统误差又称可测定误差或恒定误差。是指在一定的试验条件下,由某因素按某恒定变化规律造成的测定结果系统偏高或偏低的现象。系统误差的产生可以是方法、仪器、试剂、恒定的操作人员和恒定的环境等原因。(2)偶然误差又称为随机误差或不可测定误差。是由于测定过程中一些随机的、偶然的因素协同造成的。(3)过失误差是由于测定过程中犯了不应该犯的错误造成的,如读错数据、数据记录错误、操作失误以及加错试剂等等。(1)精密度精密度的高低可反映随机误差的大小。在一定的试验条件下,多次重复测定所得到的试验值彼此接近程度通常用随机不确定度来表示。精密度的概念与重复试验时单次试验值的变动性有关。如果试验数据分散程度很低,则说明该组试验数据的精密度高。4试验数据的精准度(2)正确度正确度反映的是测定结果中系统误差的大小,是测定过程系统误差的综合体现。由于随机误差和系统误差是两类不同性质的误差。精密度和正确度之间的关系是,精密度高是正确度高的前提,精密度高正确度不一定高。4试验数据的精准度(3)准确度准确度是系统误差和随机误差的综合结果,表示试验结果与真值一致程度。从误差的角度来看,准确度是测定结果的各类误差的综合体现,如果系统误差已修正,那么准确度则由不确定度来表示4试验数据的精准度一、拉依达法(Paŭta)准则此方法不需要查表,测定次数较多(n10)或精度要求不高时可以采用。值得特别注意的是,当n10时,用3s作判断准则,即使有异常数据,也无法剔除;若用2s作为判断准则,5次以内的试验次数无法舍去异常值,所以,该方法应在n≥10次的条件下使用。如可疑数据xk与平均值绝对偏差大于3s(或2s)时,应试将xk舍弃。至于选择3s还是2s,取决于显著性水平。通常情况下,3s相当于α=0.01,2s相当于α=0.05。第二节粗差数据(离群数据)的判断检验例1-7某样本重复测定10次,其测定数据为0.115,0.110,0.113,0.112,0.112,0.111,0.115,0.112,0.111,0.128,试用拉依达法准则法检验可疑值0.128是否这离群值(α=0.01)?解:(1)计算含可疑值在内的平均值与标准偏差s。1012110.114101()0.0051iiniixxsxxn(2)计算可疑值与平均值的绝对偏差。|dk|=|0.128-0.114|=0.014。3s=0.015。x(3)离群判定由于|dk|=0.0143s=0.015,所以,根据拉依达法准则,可疑值0.128应该保留。二、狄克逊(Dixon)检验法此方法适用于一组测定值的一致性检验和剔除离群值。具体检验步骤如下:(1)将试验数据从小到大按升序进行排序,即x1≤x2≤…≤xn,x1和xn分别为最小可疑值和最大可疑值。(2)Q值计算。表Dixon检验法统计量计算公式(3)根据给定的显著性水平(α)和样本容量(n),查临界值.(4)离群判定当Q≤Q0.05时,则可疑值为正常值,应保留;当Q0.05Q≤Q0.01时,可疑值为偏离值;当QQ0.01时,可疑值为离群值,应舍弃。二、狄克逊(Dixon)检验法例1-8:一组测定值按小到大排列为14.65、14.90、14.90、14.92、14.95、14.96、15.00、15.01和15.02,试用Dixon检验法检验最小值14.65是否为离群值?(α=0.01)解:当n=9,可疑值为最小值时,211114.9014.650.69415.0114.65nxxQxx查表1-7,当n=9时,给定显著性水平α=0.01时,Q0.01=0.635,Q=0.694Q0.01=0.635,故最小值14.65为离群值,应剔除。此方法适用于多组测定值的一致性和剔除多组测定值中的离群均值;也可以用于一组测定值的一致性检验和剔除一组测定值中的离群值。Grubbs检验法的具体检验步骤如下:(1)将分析测试样品分派给t个质量控制良好的实验室,每个实验室对样品进行相同次数的重复测定并计算出各自的平均值,即,其中最大的均值记为,最小的均值记为。(2)由t个均值计算总均值()和标准偏差()二、格鲁布斯(Grubbs)检验法12,,...,,...,itxxxxmaxxminxxxs21111()1ttixiiixxsxxtt(3)可疑值检验计算公式:二、格鲁布斯(Grubbs)检验法maxmin|()|xxxxTs(4)根据给定的显著性水平α和测定数据的组数t,查临界值。(5)离群值判定若TT0.01,则可疑值为离群均值,应剔除;若T0.05T≤T0.01,则可疑值为偏离均值;如T≤T0.05,则可疑值为正常均值。例1-9:将一分析样品分派给10个实验室进行分析测定,各实验室6次重复测定的平均值为1.41%、1.49%、1.50%、1.51%、1.44%、1.45%、1.41%、1.41%、1.39%和1.95%,检验最大值1.95%是否为离群均值?解:根据题意,101011111.496%()0.17%10101ixiiixxSxxmaxmax1.95%|||1.4961.95|2.70.17xxxxTS当t=10,α=0.05时,T(0.05,10)=2.176,T(0.01,10)=2.410由于T=2.7T(0.01,10)=2.410,所以1.95%为离群值,应舍弃。一、有效数字及其修约有效数字修约规则为“四舍六入五成双”,具体如下:(1)在拟舍弃的数字中,若左边第一个数字小于5(不包含等于5),则舍弃,即拟保留的末位数字不变。(2)在拟舍弃的数字中,若左边第一个数字大于5(不包含等于5),则进一,即拟保留的末位数字加一。(3)在拟舍弃的数字中,若左边第一个数字等于5,其右边数字非全部为0时,则进一,即拟保留的末位数加一。(4)在拟舍弃的数字中,若左边第一个数字等于5,其右边数字全部为0时,所拟保留的末位数若为奇数则进一,若为偶数(包括0)则不进。(5)在拟舍弃的数字中,若为两位数以上数字时,不得进行多次修约,应根据拟舍弃的数字左边第一个数字的大小,按上述规定一次修约出来。第三节有效数字的修约及其运算二有效数字的运算规则1.加减法有效数字的保留应与小数点位数最少者相同。2.乘除法乘积和商的有效数字位数应与几个数中相对误差最大的数相对应,通常根据有效数字位数最小者进行修约。3.乘方和开方结果有效数字位数与其底数相同。4.对数运算对数有效数字位数应与其真数相同5.其它(1)在计算4个或4个以上精密度接近的数据平均值时,结果有效数字位数可增加一位。(2)所有来源于手册上的数据,有效数字位数按实际需要取。如果原始数据有限制,则应服从原始数据。(3)一些常数的有效数字位数,如等有效位数可以认为是无限位的,可以根据需要取有效数字位数。(4)一般工程计算中取2~3位有效数字就足够精确了,在少数情况下需取4位有效数字。二有效数字的运算规则