1标准偏差数学表达式:S-标准偏差(%)n-试样总数或测量次数,一般n值不应少于20-30个i-物料中某成分的各次测量值,1~n;标准偏差的使用方法六个计算标准偏差的公式[1]标准偏差的理论计算公式设对真值为X的某量进行一组等精度测量,其测得值为l1、l2、……ln。令测得值l与该量真值X之差为真差占σ,则有σ1=li−Xσ2=l2−X……σn=ln−X我们定义标准偏差(也称标准差)σ为2(1)由于真值X都是不可知的,因此真差σ占也就无法求得,故式只有理论意义而无实用价值。标准偏差σ的常用估计—贝塞尔公式由于真值是不可知的,在实际应用中,我们常用n次测量的算术平均值来代表真值。理论上也证明,随着测量次数的增多,算术平均值最接近真值,当时,算术平均值就是真值。于是我们用测得值li与算术平均值之差——剩余误差(也叫残差)Vi来代替真差σ,即设一组等精度测量值为l1、l2、……ln则……通过数学推导可得真差σ与剩余误差V的关系为将上式代入式(1)有3(2)式(2)就是著名的贝塞尔公式(Bessel)。它用于有限次测量次数时标准偏差的计算。由于当时,,可见贝塞尔公式与σ的定义式(1)是完全一致的。应该指出,在n有限时,用贝塞尔公式所得到的是标准偏差σ的一个估计值。它不是总体标准偏差σ。因此,我们称式(2)为标准偏差σ的常用估计。为了强调这一点,我们将σ的估计值用“S”表示。于是,将式(2)改写为(2')在求S时,为免去求算术平均值的麻烦,经数学推导(过程从略)有于是,式(2')可写为(2)按式(2)求S时,只需求出各测得值的平方和和各测得值之和的平方艺,即可。标准偏差σ的无偏估计数理统计中定义S2为样本方差4数学上已经证明S2是总体方差σ2的无偏估计。即在大量重复试验中,S2围绕σ2散布,它们之间没有系统误差。而式(2')在n有限时,S并不是总体标准偏差σ的无偏估计,也就是说S和σ之间存在系统误差。概率统计告诉我们,对于服从正态分布的正态总体,总体标准偏差σ的无偏估计值为(3)令则即S1和S仅相差一个系数Kσ,Kσ是与样本个数测量次数有关的一个系数,Kσ值见表。计算Kσ时用到Γ(n+1)=nΓ(n)Γ(1)=15由表1知,当n30时,。因此,当n30时,式(3')和式(2')之间的差异可略而不计。在n=30~50时,最宜用贝塞尔公式求标准偏差。当n10时,由于Kσ值的影响已不可忽略,宜用式(3'),求标准偏差。这时再用贝塞尔公式显然是不妥的。标准偏差的最大似然估计将σ的定义式(1)中的真值X用算术平均值代替且当n有限时就得到(4)式(4)适用于n50时的情况,当n50时,n和(n-1)对计算结果的影响就很小了。2.5标准偏差σ的极差估计由于以上几个标准偏差的计算公式计算量较大,不宜现场采用,而极差估计的方法则有运算简便,计算量小宜于现场采用的特点。极差用R表示。所谓极差就是从正态总体中随机抽取的n个样本测得值中的最大值与最小值之差。若对某量作次等精度测量测得l1、,且它们服从正态分布,则R=lmax−lmin概率统计告诉我们用极差来估计总体标准偏差的计算公式为(5)S3称为标准偏差σ的无偏极差估计,d2为与样本个数n(测得值个数)有关的无偏极差系数,其值见表26由表2知,当n≤15时,,因此,标准偏差σ更粗略的估计值为(5')还可以看出,当200≤n≤1000时,因而又有(5)显然,不需查表利用式(5')和(5)了即可对标准偏差值作出快速估计,用以对用贝塞尔公式及其他公式的计算结果进行校核。应指出,式(5)的准确度比用其他公式的准确度要低,但当5≤n≤15时,式(5)不仅大大提高了计算速度,而且还颇为准确。当n10时,由于舍去数据信息较多,因此误差较大,为了提高准确度,7这时应将测得值分成四个或五个一组,先求出各组的极差R1、,再由各组极差求出极差平均值。极差平均值和总体标准偏差的关系为需指出,此时d2大小要用每组的数据个数n而不是用数据总数N(=nK)去查表2。再则,分组时一定要按测得值的先后顺序排列,不能打乱或颠倒。标准偏差σ的平均误差估计平均误差的定义为误差理论给出(A)可以证明与的关系为(证明从略)8于是(B)由式(A)和式(B)得从而有式(6)就是佩特斯(C.A.F.Peters.1856)公式。用该公式估计δ值,由于\right|V\right|不需平方,故计算较为简便。但该式的准确度不如贝塞尔公式。该式使用条件与贝塞尔公式相似。标准偏差的应用实例[1]对标称值Ra=0.160mathμmmath的一块粗糙度样块进行检定,顺次测得以下15个数据:1.45,1.65,1.60,1.67,1.52,1.46,1.72,1.69,1.77,1.64,4.56,1.50,1.64,1.74和1.63μm,试求该样块Rn的平均值和标准偏差并判断其合格否。解:1)先求平均值92)再求标准偏差S若用无偏极差估计公式式(5)计算,首先将测得的,15个数据按原顺序分为三组,每组五个,见表3。表3组号l_1l_5R11.481.651.601.671.520.1921.461.721.691.771.640.3131.561.501.641.741.630.24因每组为5个数据,按n=5由表2查得故若按常用估计即贝塞尔公式式(2'),则若按无偏估计公式即式(3')计算,因n=15,由表1查得Kδ=1.018,则若按最大似然估计公式即式(4')计算,则10=0.09296(mathμmmath)若按平均误差估计公式即式(6),则现在用式(5')对以上计算进行校核可见以上算得的S、S1、S2、S3和S4没有粗大误差。由以上计算结果可知0.092960.09620.09790.10170.1062即S2SS1S4S3可见,最大似然估计值最小,常用估计值S稍大,无偏估计值S1又大,平均误差估计值S4再大,极差估计值S3最大。纵观这几个值,它们相当接近,最大差值仅为0.01324μm。从理论上讲,用无偏估计值和常用估计比较合适,在本例中,它们仅相差0.0017μm。可以相信,随着的增大,S、S1、S2、S3和S4之间的差别会越来越小。就本例而言,无偏极差估计值S3和无偏估计值S1仅相差0.0083μm,这说明无偏极差估计是既可以保证一定准确度计算又简便的一种好方法。JJG102-89《表面粗糙度比较样块》规定Ra的平均值对其标称值的偏离不应超过+12%~17%,标准偏差应在标称值的4%~12%之间。已得本样块二产,产均在规定范围之内,故该样块合格。标准偏差与标准差的区别11标准差(StandardDeviation)各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。用σ表示。因此,标准差也是一种平均数。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分,说明A组学生之间的差距要比B组学生之间的差距大得多。标准偏差(StdDev,StandardDeviation)-统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。有人经常混用均方根误差(RMSE)与标准差(StandardDeviation),实际上二者并不是一回事。1.均方根误差均方根误差为了说明样本的离散程度。均方根误差(root-mean-squareerror)亦称标准误差,其定义为,i=1,2,3,…n。在有限测量次数中,均方根误差常用下式表示:,式中,n为测量次数;di为一组测量值与平均值的偏差。如果误差统计分布是正态分布,那么随机误差落在土σ以内的概率为68%。2.标准差标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。标准差也被称为标准偏差,或者实验标准差。均方根值也称作为效值,它的计算方法是先平方、再平均、然后开方。比如幅度为100V而占空比为0.5的方波信号,如果按平均值计算,它的电压只有50V,而按均方根值计算则有70.71V。这是为什么呢?举一个例子,有一组100伏的电池组,每次供电10分钟之后停10分钟,也就是说占空比为一半。如果这组电池带动的是10Ω电阻,供电的10分钟产生10A的电流和1000W的功率,停电时电流和功率为零。那么在20分钟的一个周期内其平均功率为500W,这相当于70.71V的直流电向10Ω电阻供电所产生的功率。而50V直流电压向10Ω电阻供电只能产生的250W的功率。对于电机与变压器而言,只要均方根电流不超过额定电流,即使在一定时间内过载,也不会烧坏。PMTS1.0抽油机电能图测试仪对电流、电压与功率的测试计算都是按有效值进行的,不会因为电流电压波形畸变而测不准。这一点对于测试变频器拖动的电机特别有用。均方根误差为了说明样本的离散程度。12对于N1,....Nm,设N=(N1+...+Nm)/m;则均方根误差记作:bbs.itgoal.com.F6F!Mn+t8Q5i.Y-mt=sqrt(((N^2-N1^2)+...+(N^2-Nm^2))/(m(m-1)));比如两组样本:第一组有以下三个样本:3,4,5第二组有一下三个样本:2,4,6这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值,也就是离散程度小,均方差就是表示这个的。同样,方差、标准差(方差开根,因为单位不统一)都是表示数据的离散程度的。几种典型平均值的求法(1)算术平均值这种平均值最常用。设x1、x2、…、xn为各次的测量值,n代表测量次数,则算术平均值为(2)均方根平均值(3)几何平均值(4)对数平均值(5)加权平均值13相对标准方差的计算公式准确度:测定值与真实值符合的程度绝对误差:测量值(或多次测定的平均值)与真(实)值之差称为绝对误差,用14δ表示。相对误差:绝对误差与真值的比值称为相对误差。常用百分数表示。绝对误差可正可负,可以表明测量仪器的准确度,但不能反映误差在测量值中所占比例,相对误差反映测量误差在测量结果中所占的比例,衡量相对误差更有意义。例:用刻度0.5cm的尺测量长度,可以读准到0.1cm,该尺测量的绝对误差为0.1cm;用刻度1mm的尺测量长度,可以读准到0.1mm,该尺测量的绝对误差为0.1mm。例:分析天平称量误差为0.1mg,减重法需称2次,可能的最大误差为0.2mg,为使称量相对误差小于0.1%,至少应称量多少样品?答:称量样品量应不小于0.2g。真值(μ):真值是客观存在的,但任何测量都存在误差,故真值只能逼近而不可测知,实际工作中,往往用“标准值”代替“真值”。标准值:采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定得出的结果平均值。精密度:几次平行测定结果相互接近的程度。各次测定结果越接近,精密度越高,用偏差衡量精密度。偏差:单次测量值与样本平均值之差:平均偏差:各次测量偏差绝对值的平均值。相对平均偏差:平均偏差与平均值的比值。标准偏差:各次测量偏差的平方和平均值再开方,比平均偏差更灵敏的反映较大偏差的存在,在统计学上更有意义。相对标准偏差(变异系数)例:分析铁矿石中铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25(%),计算测结果的平均值、平均偏差、相对平均偏差、标准偏差、变异系数。准确度与精密度的关系:1)精密度是保证准确度的先决条件:精密度不符合要求,表示所测结果不可靠,失去衡量准确度的前提。152)精密度高不能保证准确度高。换言之,准确的实验一定是精密的,精密的实验不一定是准确的。重复性试验按拟定的含量测定方法,对同一批样品进行多次测定(平行试验至少5次以上,即n>