JJF1059.1测量不确定度评定与表示北京理工大学周桃庚bitzhtg@bit.edu.cn主要内容一.第一部分测量不确定度概念的产生和发展二.第二部分实验室认可和资质认定政策对测量不确定度评估的要求三.第三部分统计学的基本知识四.第四部分名词术语五.第五部分测量不确定度评定第三部分统计学的基本知识随机变量•作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,可把这些数看作为某变量X的取值范围,变量X称为“随机变量”,即实验结果可用随机变量X来表示。•通俗地讲,表示随机现象结果的变量称为随机变量。常用大写字母X,Y,Z等表示随机变量,它们的取值用相应的小写字母x,y,z表示。•定义:如果某一量(例如测量结果)在一定条件下,取某一值或在某一范围内取值是一个随机事件,则这样的量称作随机变量。•随机变量根据其值的性质不同,可分为离散型和连续型两种,•如果随机变量X的所有可能取值为有限个或可列个,且以各种确定的概率取这些不同的值,则称随机变量X为离散型随机变量。•如果随机变量的所有可能取值充满为某范围内的任何数值,且在其取值范围内的任一区间中取值时,其概率是确定的,则称X为连续型随机变量。概率(probability)•概率是一个0和1之间隶属于随机事件的实数–概率与在一段较长时间内的事件发生的相对频率有关–或与事件发生的可信程度(degreeofbelief)有关-----------GBT3358.1-2009统计学词汇及符号第1部分:一般统计术语与用于概率的术语概率的频率解释•若对某一个被测量重复测量,我们可以得到一系列测量数据,这些数据称测量值或观测值•测量值是随机变量,它们分散在某个区间内,概率是测量值在区间内出现的相对频率,即出现的可能性大小的度量•在此定义的基础上奠定了测量不确定度A类评定的理论基础。概率的可信程度的解释•由于测量的不完善或人们对被测量及其影响量的认识不足,概率是测量值落在某个区间内的可信度大小的度量•在这个定义中,对于那些我们不知道其大小的系统误差,可以认为是以一定的概率落在区间的某个位置,认为也属于随机变量•或者说,某项未知的系统误差落在该区间内的可信程度也可以用概率表征。•这是测量不确定度B类评定的理论基础概率•测量值x落在(a,b)区间内的概率可以表示为•概率的值在0到1之间Paxb01p概率分布(probabilitydistribution)•一个随机变量取任何给定值或属于某一给定值集的概率随取值而变化的函数–1.随机变量在整个集合中取值的概率等于1–2.一个概率分布与单一(标量)随机变量有关时称为单变量概率分布,与随机变量的向量有关时称为多变量概率分布。多变量概率分布也称联合分布–3.一个概率分布可以采用分布函数或概率密度函数的形式分布函数•对于每个x值给出了随机变量X小于或等于x的概率的一个函数称分布函数,用F(x)表示F(x)=P(X≤x)01231F(x)x10F(x)是一个不减的函数200()1,()lim()0;()lim()1.xxFxFFxFFx且概率密度函数•分布函数的导数(当导数存在时)称(连续随机变量的)概率密度函数,用p(x)表示,p(x)=dF(x)/dx•p(x)dx称“概率元素”p(x)dx=P(x<X<x+dx)离散型随机变量的概率分布•要了解离散型随机变量X的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi•如果将离散型随机变量X的一切可能取值xi及其对应的概率pi,记作P(X=xi)=pi,i=1,2,….•则称上式为离散型随机变量X的概率分布或分布Xpi21-1234141概率密度函数•若已知某个随机变量的概率密度函数p(x),则测量值x落在(a,b)区间内的概率p可用下式计算•数学上,积分代表了面积。由此可见,概率p是概率分布曲线下在区间(a,b)内包含的面积•当p=0.9,表明测量值有90%的可能性落在该区间内,该区间包含了概率分布下总面积的90%•当p=1,表明测量值以100%的可能性落在该区间内,也就是测量值必定在此区间内。baPaxbpxdx3.概率分布的特征参数•尽管概率分布反映了该随机变量的全貌,但在实际使用中更关心代表该该概率分布的若干数字特征量。–期望–方差–标准偏差期望expectation•期望又称(概率分布或随机变量的)均值(mean)或期望值(expectedvalue),有时又称数学期望。•常用符号表示,也用E(X)表示。•测量值的期望–离散随机变量–连续随机变量•通俗地说:期望值是无穷多次测量的平均值。1iiiEXpx()()EXxpxdx期望•对于单峰、对称的概率分布来说,期望值在分布曲线峰顶对应的横坐标•正因为实际上不可能进行无穷多次测量,因此,测量中期望值是可望而不可得的。123•期望是概率分布曲线与横坐标轴构成面积的重心所在的横坐标,因此它是决定随机变量分布的位置的量期望123三条测量值分布曲线的精密度相同,但正确度不同。•期望与真值之差即为系统误差,如果系统误差可以忽略,则期望就是被测量的真值•期望代表了测量的最佳估计值,或相对真值的系统误差大小方差Variance•对于一个随机变量,仅用数学期望还不足以充分描述其特性。•比如,两组测量数据:•28,29,30,31,32……数学期望30,各个数据在28和32之间波动•10,20,30,40,50……数学期望30,各个数据在10和50之间波动•两组数据具有相同的数学期望为30,但它们具有重要的差别。•第2组数据比第一组数据分散得多。方差•(随机变量或概率分布的)方差用符号表示•测量值与期望之差是随机误差,方差就是随机误差平方的期望值•方差说明了随机误差的大小和测量值的分散程度。但由于方差的量纲是单位的平方,使用不方便,因此引出了标准偏差这个术语221()limniinxn22()()VXEXEX2()()xpxdx标准偏差•概率分布或随机变量的标准偏差是方差的正平方根值,用符号表示•标准偏差是无穷多次测量的随机误差平方的算术平均值的正平方根值的极限,()VXnxniin12)(lim标准偏差标准偏差是表明测得值分散性的参数,小表明测得值比较集中,大表明测得值比较分散。通常,测量的重复性或复现性是用标准偏差来表示的。123123三条误差分布曲线的正确度相同,但精密度不同标准偏差由于标准偏差是无穷多次测量时的极限值,所以又称总体标准偏差。可见:期望和方差(或标准偏差)是表征概率分布的两个特征参数。理想情况下,应该以期望为被测量的测量结果,以标准偏差表示测得值的分散性123123三条误差分布曲线的正确度相同,但精密度不同标准偏差由于期望、方差和标准偏差都是以无穷多次测量的理想情况定义的,因此都是概念性的术语,无法由测量得到,2和。123123三条误差分布曲线的正确度相同,但精密度不同4.有限次测量时μ和σ的估计值算数平均值(arithmeticmean)-----期望的最佳估计值1211nniixxxxxnn在相同测量条件下,对某被测量X进行有限次独立重复测量,得到一系列测量值,算术平均值为12,,...,nxxx算术平均值是期望的最佳估计值•由大数定理证明,测量值的算术平均值是其期望的最佳估计值•大数定理:212,,,lim|-|1nnxxxnnPx设为个独随变则当时术敛术为数立且同期望和同方差的机量,,其算平均值依概率收于,亦即算平均值和期望的差异很小是一必然事件。式中任意小正算术平均值•若干个独立同分布的随机变量的平均值以无限接近于1的概率接近于其期望。所以是期望的最佳估计值。•即使在同一条件下对同一量进行多组测量,每组的平均值都不相同,说明算术平均值本身也是随机变量。•由于有限次测量时的算术平均值是其期望的最佳估计值,因此,通常用算术平均值作为测量结果的值。X2)实验标准偏差(experimentalstandarddeviation)------有限次测量时标准偏差的估计值•实际工作中不可能测量无穷多次,因此无法得到总体标准偏差σ。•用有限次测量的数据得到标准偏差的估计值称为实验标准偏差,用符号s表示。•现介绍几种常用的实验标准偏差的估计方法。在相同测量条件下,对某被测量X进行有限次独立重复测量,得到一系列测量值,则实验标准偏差可按以下几种方法估计12,,...,nxxx(1)贝塞尔公式式中——n次测量的算术平均值——残差——自由度——(测量值xk的)实验标准偏差,表征了观测值xk的变动性,或更确切地说,表征了它们在平均值周围的分散性211()1nkiisxxxnxiivxx1n()ksx221()limniinxnx残余误差•各个测得值与算术平均值之差,叫作残余误差(也称残差)iivxx残余误差性质:残余误差的代数和等于零。即0iv0)(nxnxxnxxxviiiii这是因为例:用游标卡尺测某一尺寸10次,数据见表(设无系统和粗大误差),求算术平均值及单次测值的实验标准差。测序li/mmvi/mmvi2/mm2175.01-0.0350.001225275.04-0.0050.000025375.07+0.0250.000625475.00-0.0450.002025575.03-0.0150.000225675.09+0.0450.002025775.06+0.0150.000225875.02-0.0250.000625975.05+0.0050.0000251075.08+0.0350.001225mmx045.751010iiv1012200825.0iimmv2175.0450.008250.03031101niixmmvsmmn可得利用贝塞尔公式求出的实验标准差是上述10个测值的测量组中单次测量的实验标准差。如何理解?例:测量列为75.01,75.04,75.07,75.00,75.03,75.09,75.06,75.02,75.05,75.08;这10个测值是等权测量,每一个测值的实验标准差都是0.0303mm。单次测值的实验标准差在数据处理中的意义:1)可比较不同测量组的测量可靠性:例:对同一被测量进行了两组测量(如由两人),其数据是:1211.21.11.20.60.70.60.90.3021.11.01.20.60.70.80.90.24xx第组:第:组测量结果一样,哪个测量者的测量水平高、测值更可靠?何时会用单次测量值作为测量结果?2)当用单次测量值作为测量结果时,可反映单次测量测量结果的可靠性。说明:(1)单次测量的实验标准偏差s并非只测量一次就能得到的。对于一定的测量方法或量仪,必须通过多次测试才能获得。(即所谓“用统计方法得出”)(2)一旦得出了s值,在今后使用该量仪或测量方法时,s便为已知值,便能对单次测量给出测量不确定度。(3)在有的仪器说明书里或手册表格中往往也给出了s值。此时,在测量过程中便可直接引用,而不必自己去求出。(2)极差法maxminxxsC从有限次对立重复测量的一列测量值中找出最大值,最小值得到极差,并根据测量次数n查表得到极差系数值代入下式得到实验标准偏差maxxminxmaxminRxxC极差系数Cn值表n23456789Cn1.131.692.062.332.532.702.852.97ν0.91.82.73.64.55.36.06.8(3)较差法从有限次独立重复测量的一列测量值中,将每次测量值与后一次测量值比较得到差值,利用下式得到实验标准偏差2221223121nnxxxxxxsn3)实验标准偏差的可靠性与自由度的关系•