2.误差分析基础科学实验和生产过程中对物理量或参数进行检测时,为了准确要分两步:一、选用合适的仪器与测量方法获取实验数据;二、对数据进行误差分析与数据处理。两者均重要,缺一不可。实际中常忽视后者,导致无法确定获得的数据的可靠性,会得到错误的结论或掩盖了物理现象的本质。误差不可避免地存在,因为真值永远难以得到。从实验数据中如何找到被测量真值的最佳估值,它的可靠程度如何,衡量可靠程度的指标是什么,如何进行误差分析,找出其产生的原因,采取措施减少误差使测量结果更加准确等,是进行误差理论学习的原因。根据检测的目的选择测量精度误差原因分析及误差的表示方法间接检测时误差的传递法则平均值误差的估计以及粗大误差的检验用测量数据推导试验公式我们将要学习的误差分析理论有:2.1.检测精度仪表的精度是这样规定的:用该仪表进行测量时,能够精确到的最后一位数字是哪一量级,则该仪表的精度就是哪一量级。如:用千分尺测一物的长度为19.53mm,则该千分尺的精度为0.01mm。精度是相对而言的,被测量大小不同,则精度不同。如测量地球直径精度不能达到米,而测量钢丝的直径精度不能超过厘米。测量精度越高,误差越小;精度越低,误差越大。精度高的仪器起使用条件苛刻,维护费用大,实际使用时应适当选择测量精度。2.2.误差分析的基本概念真值、测量值与误差的关系几种误差的定义—残差、方差、标准误差测量的准确度与精密度一、真值、测量值与误差的关系误差x,即测量值M偏离真值A0的程度,即X=M-A0如果对同一个被测量测量了n次,得到n个测得值Mi(i=1,2,…,n)。每个测得值的误差为Xi=Mi-A0这组测量的平均值为n1iiMn1A在有限次测量中,测量值的平均值与真值之间的偏差为:δ=A-A0当测量次数n足够多时,平均值A可以认为最接近被测量的真值,即AlimAn0二、几种误差的定义残差(残余误差):各测量值与平均值的差vi=Mi-A由平均值A的定义式可知:∑vi=0n1i220iAMn1n1i20iAMn1方差:标准误差:标准误差是方差的均方根值,它是表示测量值偏离真值的重要参数。三、测量的准确度与精密度精密度:用同样的方法与设备对同一未知量进行多次检测时,测量值之间差异的大小。差异小的测量称为精密测量,即精密度高,反之,精密度低。准确度:在同样条件下,进行无数次测量时平均值与真值的偏差大小。偏差小的测量为准确测量,即准确度高。再举一例,如1和2是两条测量数据分布曲线。A为被测量的真值,Aa为一种测量方法测得的平均值,Ab为另一种测量方法测得的平均值,其中1表示准确却不精密(误差小,标准误差大),2表示精密却不准确(误差大,标准误差小)。只有准确度和精密度都高,才能称为精确的测量。2.3.误差的来源产生误差的原因很复杂,可以是某个原因,也可能是几个因素综合引起的。可归纳为如下四种:•测量装置误差(质量问题、元器件老化等)•环境误差(温度、湿度等变化和辐射等)•方法误差(测量方法不正确,安装布置不当等)•人员误差(读表偏差、知识和经验的不同等因素而造成的误差)•测量对象变化的误差(被测对象的不稳定或者测量器件进入被测对象也能造成测量误差)2.4.误差的分类按照误差的特点和性质,误差可分为系统误差、随机误差、粗大误差。一、系统误差:1.定义:相同条件下多次测量同一量时,误差的大小和符号保持不变,或按照一定的规律变化。2.产生的原因:它是由测量工具或仪器本身或对仪器使用不当而造成的。如零点没调整好,工作电池随工作时间的增加电压逐渐下降,环境的变化等引起的误差。3.消除:查明原因可以消除;对测量值进行修正;改善测量条件;改进测量方法等。二、随机误差1.定义:相同条件下多次重复测量同一量时,误差的大小和符号是无规律变化的误差。2.产生的原因:是由测量过程中互相独立的、微小的偶然因素引起的。有些可知但却无法控制,如空气的干燥程度及气流的大小和方向都对测量有影响;有些是不知的。3.消除:不能消除,也不能修正,值是随机的。4.特点:多次重复测量时,总体服从统计规律,故可以了解它的分布特性,并能对其大小和测量结果的可靠性作出估计,是误差理论的依据。三、粗大误差1.定义:相同条件下多次重复测量同一量时,明显偏离了结果的误差。2.产生的原因:疏忽大意或不正确的观测、测量条件的突然变化、仪器故障等。3.消除:遵循一定的规则。4.特点:通常数值比较大。测量中应该避免这类误差的出现。含有粗大误差的测量值称为坏值。判断某一测量值是否为坏值,可以用统计方法或遵循一些准则。三种误差可以互相转化。如尺子的分划误差,在制造尺子时为随机误差,因为可长可短,无规律,但用它测量时,该误差使测量结果始终大些或小些,变成为系统误差。还可根据误差产生的原因将其分成设备误差、人员误差、环境误差、方法误差及测量对象变化的误差等。但名称如何总可归为上述三类。而正确的测量不会包含有粗大误差,系统误差又可以消除,因此误差分析只是随机误差的分析。2.5.随机误差的统计处理分析随机误差的性质—对称性、单峰性、有界性、抵偿性;介绍随机误差函数及其表达法—概率密度函数从测量平均和测量方差如何求得真值和方差的最佳估计值的方法一、随机误差的概率及概率密度函数的性质随机误差的统计处理:在了解误差性质之上,分析误差概率密度函数及其曲线特征,求取误差发生的概率。1.误差函数有关的定义:概率密度函数:误差发生的概率密度概率元:误差发生的概率误差在与之间的概率:x)(xfy)()(xPdxxfxabbadxxfbxaP)()(2.随机误差的统计特性:通过对大量的测量数据的观察,人们总结出了大多数随机误差具有以下4个特征,它常被称为随机误差公理。对称性:绝对值相等的正误差和负误差出现的次数相等。故f(x)为偶函数,其分布曲线对称纵轴。单峰性:绝对值小的误差比绝对值大的误差出现次数多。绝对值小的误差概率密度大,即)()0(maxxff有界性:在一定的测量条件下,随机误差的绝对值不会超过一定界限,即绝对值很大的误差基本不发生。抵偿性:随测量次数增加,随机误差的代数和为零,即正负误差相互抵消。它可以由对称性推出。※理论和实践证明:满足上述统计特征的随机误差在测量次数极大时必然服从正态分布。二、正态分布函数及其特征点1.概率密度函数为:222xe21)x(f图2-3随机误差的正态分布其中,σ为标准误差或均方根误差,是正态分布的重要参数,一旦确定f(x)为单值函数。正态分布也叫高斯分布,是随机误差的理论分布规律,也称误差法则。分布曲线如图2-3所示。2.正态分布曲线的特点:σ越小,正态分布曲线越陡,小误差出现的概率大,说明测量值集中,测量精密度高。表征了测量值偏离真值的离散程度。故等精度测量是一种σ值相同的测量。峰值点:拐点:210()(0)(max)fxfdxxdf从检测的角度看,正态分布常用N(A0,σ2)表示。A0和σ分别为测量的真值和标准误差。设测量值M作为随机变量,它服从正态分布,则有:),(21)(202220ANeMfAM0AMt)1,0(21)(22Netft实际数据分析中,常把N(A0,σ2)变成标准正态分布N(0,1)处理。只需令使分布密度函数变为:正态分布曲线的拐点;2dxxfx)(2222)(dxxfx6745.05.0)(dxxf算术平均误差:误差绝对值的平均值。概率误差:随机误差落在该范围内外的概率相等。极限误差:随机误差以给定概率(通常较大)落在极限误差的范围内。极限误差通常为标准误差的2倍或3倍。210()(0)(max)fxfdxxdfedxxdf210)(22处,值为拐点为3.与随机误差有关的特征值•正态分布曲线最大值点标准误差(标准偏差):是方差的平方根,它表示随机误差相对于中心位置的离散程度。三、置信区间与置信概率在研究随机误差的统计规律时,不仅要知道随机变量在哪个范围内取值,而且要知道在该范围内取值的概率。两者是相互关联的,缺一不可。我们常说:正常人体温在36℃~37℃之间。隐含两个含义:一指正常人体温测量值在36℃~37℃范围内取值,二指大部分(99%)正常人体温在此范围,当然还有极小部分正常人体温可能略高于37℃或略低于36℃。这样两个含义就是置信区间和置信概率的概念。•置信区间:定义为随机变量的取值范围,常用正态分布的标准误差σ的倍数来表示,即±zσ,z叫做置信系数。•置信概率:随机变量在置信区间±zσ内取值的概率。dxezxpzzx022222置信度:把置信区间和置信概率结合起来称之为置信度,即可信程度。说明测量结果的可信度。置信水平:表示随机变量在置信区间以外取值的概率。zxpzz1置信概率P置信区间22x)(xf不同的置信系数对应的置信概率可以查正态分布表得到。课本P17表2-1为其中的一部分。★置信区间、置信概率和置信水平之间的关系如图所示。置信水平越高,置信概率越小,误差范围越小,测量的精度要求越高,测量的可靠性越低。实际测量中,置信概率95%可靠性就可以了。