1.2测量数据的估计和处理1.2.1随机误差的统计处理1.正态分布多次等精度地重复测量同一量值时,得到一系列不同的测量值,即使剔除了坏值,并采取措施消除了系统误差,然而每个测量值数据各异,可以肯定每个测量值还会含有误差。这些误差的出现没有确定的规律,具有随机性,所以称为随机误差。随机误差的分布规律,可以在大量测量数据的基础上总结出来,就误差的总体来说是服从统计规律的。由于大多数随机误差服从正态分布,因而正态分布理论就成为研究随机误差的基础。①绝对值相等的正误差与负误差出现的次数大致相等,误差所具有的这个特性称为对称性。②在一定测量条件下的有限测量值中,其随机误差的绝对值不会超过一定的界限,这一特性称为有界性。③绝对值小的误差出现的次数比绝对值大的误差出现的次数多,这一特性称为单峰性。④对同一量值进行多次测量,其误差的算术平均值随着测量次数n的增加趋向于零,这一特性称为误差的抵偿性。随机误差一般具有以下几个性质22221)(ef正态分布的分布密度曲线如图1-4所示,即为一条钟形的曲线,称为正态分布曲线,其中L、σ(σ0)是正态分布的两个参数。从图中还可以看到,曲线在L±σ(或±σ)处有两个拐点。正态分布的概率分布密度f(δ)为f(x)xL-LL+f()+-(a)(b)o0图1-4正态分布曲线(1)算术平均值x由于在测量过程中,不可避免地存在随机误差,因此我们无法求得测量的真值。但如随机误差服从正态分布,算术平均值处随机误差的概率密度最大,即算术平均值与被测量的真值最为接近,随着测量次数增加,算术平均值越趋近于真值。如果对某一量进行无限多次测量,就可以得到不受随机误差影响的值,或其影响甚微,可以忽略。由于实际上是有限次测量,因而有限次直接测量中算术平均值是诸测量值中最可信赖的,把它作为等精度多次测量的结果,即被测量的最佳估计值。2.随机误差的数字特征对被测量进行等精度的n次测量,得n个测量值x1,x2,…,xn,它们的算术平均值为niinxnxxxnx1211)(1由于被测量的真值为未知,不能按式(1-19)求得随机误差,这时可用算术平均值代替被测量的真值进行计算,则有xxvii式中,vi为xi的残余误差(简称残差)。标准偏差简称为标准差,又称均方根误差。标准差σ刻划总体的分散程度,图1-5给出了L相同,σ不同(σ=0.5,σ=1,σ=1.5)的正态分布曲线,σ值愈大,曲线愈平坦,即随机变量的分散性愈大;反之,愈小,曲线愈尖锐(集中),随机变量的分散性愈小。标准差σ由下式算得:nnLxniinniin1212limlim)((2)标准偏差σyox=0.5=1=1.5图1-5不同σ的正态分布曲线如随机变量符合正态分布,它出现的概率就是正态分布曲线下所包围的面积。因为全部随机变量出现的总的概率为1,所以曲线所包围的面积应等于1,即121)(222dxedxxfx随机变量落在任意区间(a,b)的概率为dxebxaPPxbaa22221)(式中,Pa为置信概率。3.正态分布随机误差的概率计算σ是正态分布的特征参数,区间通常表示成σ的倍数,如kσ。由于随机变量分布对称性的特点,常取对称的区间,即在±kσ区间的概率为dvekvkPPvkka22221)(式中:k——置信系数;±kσ——置信区间(误差限)。随机变量落在±kσ范围内出现的概率为Pa,则超出的概率称为置信度,又称为显著性水平,用α表示α=1-PaPa与α关系如下图22Pa0-k+k前面讲述的内容是等精度测量的问题。严格地说,绝对的等精度测量是很难保证的,但对条件差别不大的测量,一般都当作等精度测量对待,某些条件的变化,如测量时温度的波动等,只作为误差来考虑。但有时在科学研究或高精度测量中,为了获得足够的信息,有意改变测量条件,比如不同的地点、用不同精度的仪表,或是用不同的测量方法等进行测量,这样的测量属于不等精度测量。对于不等精度的测量,测量数据的分析和综合不能套用前面等精度测量的数据处理的计算公式,需推导出新的计算公式。4.不等精度直接测量的权与误差在不等精度测量时,对同一被测量进行m组独立无系统误差及无粗大误差的测量,得到m组测量列(进行多次测量的一组数据称为一测量列)的测量结果及其误差,由于各组测量条件不同,各组的测量结果及误差不能同等看待,即各组测量结果的可靠程度不一样。测量精度高(即标准差小)的测量列具有较高的可靠性。为了衡量这种可靠性和可信赖程度,引进“权”的概念。(1)“权”的概念“权”可理解为各组测量结果相对的可信赖程度。测量次数多,测量方法完善,测量仪表精度高,测量的环境条件好,测量人员的水平高,则测量结果可靠,其权也大。权是相比较而存在的。权用符号p表示,有两种计算方法:①用各组测量列的测量次数n的比值表示p1∶p2∶….∶pm=n1∶n2∶…..∶nm②用各组测量列的标准差平方的倒数的比值表示22221211::1:1:::mmppp式中每组测量结果的权与其相应的标准差平方成反比。如果已知各组算术平均值的标准差,即可确定响应权的大小。测量结果权的数值只表示各组间的相对可靠程度,它是一个无量纲的数。通常在计算各组权时,令最小的权数为“1”,以便用简单的数值来表示各组的权。在等精度测量时,测量结果的最佳估计值用算术平均值表示;而在不等精度测量时,测量结果的最佳估计值用加权算术平均值表示。加权算术平均值不同于一般的算术平均值,它是各组测量列的全体平均值,不仅要考虑各测得值,而且还要考虑各组权。若对同一被测量进行m组不等精度测量,得到m个测量列的算术平均值,相应各组的权分别为p1,p2,….,pm,则加权平均值可用下式表示:mxxx,,,21miimiiimmmpppxppppxpxpxx11212211(2)加权算术平均值xppx用加权算术平均值作为不等精度测量结果的最佳估计值时,其精度由加权算术平均值的标准差来表示。对同一个被测量进行m组不等精度测量,得到m个测量结果,则加权算术平均值xp的标准差可由下式计算:pxmxxx,,,21miimiiixpmvpp112)1((3)加权算术平均值的标准差由于系统误差的特殊性,在处理方法上与随机误差完全不同。主要是如何有效地找出系统误差的根源,并减小或消除。通常,我们可以从以下几个方面进行分析考虑。①所用传感器②测量方法是否完善③传感器仪表安装、调整或放置是否正确合理④传感器或仪表工作场所的环境条件是否符合规定条件⑤测量者操作是否正确1.2.2系统误差的通用处理方法1.从误差根源上消除系统误差发现系统误差一般比较困难,下面只介绍几种发现系统误差的一般方法。(1)实验对比法(2)残余误差观察法(3)准则检查法2.系统误差的发现与判别(1)在测量结果中进行修正(2)消除系统误差的根源(3)在测量系统中采用补偿措施(4)实时反馈修正3.系统误差的消除通常把等于3σ的误差称为极限误差,对于正态分布的随机误差,落在±3σ以外的概率只有0.27%,它在有限次测量中发生的可能性很小。3σ准则就是如果一组测量数据中某个测量值的残余误差的绝对值|vi|3σ时,则该测量值为可疑值(坏值),应剔除。3σ准则又称莱以达准则。3σ准则是最常用也是最简单的判别粗大误差的准则,它应用于测量次数充分多的情况。1.2.3粗大误差13σ准则肖维勒准则是以正态分布为前提的,假设多次重复测量所得的n个测量值中,某个测量值的残余误差|vi|Zcσ,则剔除此数据。实用中Zc3,所以在一定程度上弥补了3σ准则的不足。肖维勒准则中的Zc值见表1-3。表1-3肖维勒准则中的Zc值2.肖维勒准则格拉布斯准则也是以正态分布为前提的,理论上较严谨,使用也较方便。某个测量值的残余误差的绝对值|vi|>Gσ,则判断此值中含有粗大误差,应予剔除,此即格拉布斯准则。G值与重复测量次数n和置信概率Pa有关。3.格拉布斯准则在直接测量中,测量误差就是直接测得值的误差。而对于间接测量,是通过直接测得值与被测量之间的函数关系,经过计算得到被测量的,所以间接测量的误差则是各个直接测得值误差的函数。在间接测量中,已知各直接测得值的误差(或局部误差),求总的误差,即误差的合成(也称误差的综合);反之,确定了总的误差后,各环节(或各部分)具有多大误差才能保证总的误差值不超过规定值,这叫做误差的分配。在传感器和测量系统的设计时经常用到误差的分配。1.2.4测量数据处理中的几个问题1.间接测量中的测量数据处理如被测量为y,设各直接测得值x1,x2,…,xn之间相互独立,则与被测量y之间函数关系为y=f(x1,x2,…,xn)各测得值的绝对误差分别为Δx1,Δx2,….,Δxn,因为误差一般均很小,其误差可用微分来表示,则被测量y的误差可表示为nndxxydxxydxxydy2211(1)绝对误差和相对误差的合成iininnxxyxxyxxyxxydy12211实际计算误差时,以各环节的绝对误差Δx1,Δx2,…,Δxn来代替上式中的dx1,dx2,…,dxn,即式中,Δy为综合后总的绝对误差。如测得值与被测量的函数关系为y=x1+x2+…+xn,则综合绝对误差Δy=Δx1+Δx2+…+Δxn如被测量y的综合误差用相对误差表示,则niiiyxxyyyy11但当误差项数较多时,相对误差的合成一般情况下按方和根合成比较符合统计值,即22221xnxxy式中,xxixi设被测量y与各直接测得值x1,x2,…,xn之间的函数关系为y=f(x1,x2,…,xn),各测得值的标准差分别为σ1,σ2,…,σn,当各测得值相互独立时,被测量y的标准差为niiinnxyxyxyxyy12222222221212)((2)标准差的合成最小二乘法原理是一数学原理,要获得最可信赖的测量结果,应使各测量值的残余误差平方和为最小,这就是最小二乘法原理。可用算术平均值作为多次测量的结果,因为它们符合最小二乘法原理。最小二乘法作为一种数据处理手段,在组合测量的数据处理、实验曲线的拟合及在其它多种学科方面,均获得了广泛的应用。2.最小二乘法的应用在工程实践和科学实验中,经常遇到对于一批实验数据,需要把它们进一步整理成曲线图或经验公式。用经验公式拟合实验数据,工程上把这种方法称为回归分析。回归分析就是应用数理统计的方法,对实验数据进行分析和处理,从而得出反映变量间相互关系的经验公式,也称回归方程。当经验公式为线性函数时,例如y=b0+b1x1+b2x2+…+bnxn称这种回归分析为线性回归分析,它在工程中应用价值较高。3.用经验公式拟合实验数据——回归分析测量的目的是确定被测量的值或获取测量结果,测量结果的完整表述应包括估计值、测量单位及测量不确定度。众所周知,没有测量单位的数据不能表征被测量的大小,没有测量不确定度的测量结果不能评定测量的质量,从而失去或削弱了测量结果的可用性和可比性。不确定度这个术语虽然在测量领域已广泛使用,但表示方法各不相同。早在1978年国际计量大会(CIPM)责成国际计量局(BIPM)协同各国的国家计量标准局制定一个表述不确定度的指导文件。1993年,以国际标准化组织(ISO)等7个国际组织的名义制定了一个指导性的文件,即《测量不确定度表示指南》(GUM)。从此,国际上有了一致的普遍承认的表征测量结果质量的概念。1.2.5测量不确定度我国于1999年颁布了适合我国国情的《测量不确定度评定与表示》的技术规范(JJF1059-1999),其内容原则上采用了《测量不确定度表示指南》的基本方法,以利于国际间的交流与合作,与国际接轨。测量不确定度定义为表征合理赋予被测量之