第一章误差及数理统计基础§1.1误差§1.1.1误差的定义测量值x带有误差E,测量值去掉误差就等于真值0,0=x-E。所以误差的定义为:E=x-0,即测量值偏离真值的程度,也就是测量值的不确定度.§1.1.2误差的类型1.绝对误差测量值大于真值时误差为正数,表示结果偏高;反之,误差为负数时表示结果偏低.这里的误差都是绝对误差,它具有与测量值和真值相对应的量纲.00μμxx2.相对误差绝对误差在真值中所占的比率称相对误差,一般用百分率表示相对误差(%)=当真值为未知时,可用多次重复测定结果的算术平均值代替。相对误差没有量纲.3.粗差粗差也称过失误差,是由于非正常实验条件或非正常操作所造成的.如测量时对错了标志,误读了数码,实验仪器未达到预想的指标等.含有粗差的测量值常称为坏值或异常值,应予以剔除.4.系统误差由于某种原因所产生,并遵循一定的规律进行变化.例如,随样品或试剂用量的大小按比例进行变化.系统误差有一定的指向,例如称量一种吸湿性物质,其误差总是正值.从系统误差的来源看,它属于方法和技术问题,知道了产生的原因,便可消除或修正,所以此种误差也称可定误差.5.随机误差在相同条件下重复多次测定同一物理量时,误差大小或正负变化纯属偶然而毫无规律,这种误差称为随机误差,也叫偶然误差.单个地看是无规律性的,但就其总体来说,由于正负有相消的机会,随着变量个数的增加,误差的平均值将趋近于零.这种低偿正是统计规律的表现,所以随机误差是可以用概率统计来处理的.§1.1.3精密度和准确度误差表示测量的不精密度和不准确度,即不确定度.精密度和准确度是两个不同的概念.精密度表示一组测定数据相互接近的程度或分散的程度,它的大小完全决定于偶然误差.在分析化学中,常用重复性(repeatability)和再现性(reproducibility)来表示精密度.重复性是指在完全相同条件下,即同一操作者、同一仪器、同一实验室,在较短时间内分析同一样品所得结果的精密度;再现性是指在不同的条件下,即不同的操作者、非同一台仪器、不同的实验室、不同的时间,但是用相同的分析方法和分析相同样品所得结果的精密度.准确度表示测量值与真值的偏离程度,它由系统误差和偶然误差共同决定.如由4个学生用浓度准确为0.1mol/L的盐酸滴定浓度准确为0.1mol/L的氢氧化钠,氢氧化钠的体积准确为10.00ml.每个学生重复测量5次,其结果示于表1.1.学生结果(ml)注释ABCD10.0810.1110.0910.1010.129.8810.1410.029.8010.2110.199.799.6910.059.7810.049.9810.029.9710.04精密但不准确准确但不精密不准确也不精密准确而且精密由表1.1可见,学生A尽管测试结果重复性较好,即精密,但是准确性较差(A的均值为10.10),所有结果均偏高.这是由于系统误差所致.学生B的测试落到准确值(即真值)的两侧,其均值为10.01.此结果较准确,但精密度较差,主要受到了偶然误差的影响.学生C测量中既有偶然误差的影响,又有系统误差的影响,所以既不精密,也不准确.只有学生D测试结果比较精密(范围为9.97-10.04ml),又比较准确(均值为10.01).表1.1用盐酸进行氢氧化钠的滴定结果§1.1.4偶然误差的传递1.线性加和如y为测定量a,b和c等的线性组合:cKbKaKKycba式中Ka,Kb,和Kc等为常数,则加和或差值的标准偏差是各量方差加和的平方根:222)()()(ccbbaayKKK如滴定中,移液管的初值和终值分别为:3.51ml和15.67ml,其标准偏差均为0.02ml,则用去滴定液的体积及标准偏差分别为:消耗的滴定液体积=15.67-3.51=12.16(ml)标准偏差=028.0)02.0()02.0(22(ml)此例说明,组合的标准偏差大于单个读数的标准偏差,但小于各量的标准偏差之和.2.2.乘除表达式若计算y的表达式为:y=kab/cd式中a,b,c和d分别为测定量,k为常数,则相对标准偏差有如下关系:2222)()()()(dcbaydcbay如荧光的量子产率可用下式计算:ekcLIIf0/式中各量的相对标准偏差是:I0为入射光强度,0.5%;If为荧光强度,2%;E为摩尔吸收,1%;c为浓度,0.2%;的相对标准偏差为:(%)3.215.02.02.02...22222dsr由此可见,最终结果的相对标准偏差略大于上述分量中具有最大相对标准偏差的那个分量(If).这一结果给我们的启示是,若拟提高测试的精度,则首先应该设法改善具有最大相对标准偏差的那个分量的测试精度.另外,对于某一量的乘方,如y=bn则y的相对标准偏差为bnyby因为b和bn不是分别独立的量.)(xfy则x和y的标准偏差具有如下关系:dxdyxy如某溶液的吸收值A为光透过率的函数:)lg(TA若T的测定值为0.501,标准偏差为0.001,则A的值及其dA/dT分别为:300.0501.0lgATTedTdA/434.0/lg和由此可得A的标准偏差为:s=|0.001×(-0.434/0.501)|=0.000872.3.其他函数若y是x的函数§1.1.5系统误差的传递1.线性组合如测试量a,b,c等中的系统误差分别为cba和,等,则y中的系统误差y为:ckbkakycbaddccbbaayy2.乘除表达式如y=kabc/d则,相对系统误差为:同样,若nby则y的相对系统误差为:bbnyy3.其他函数和偶然误差具有相类似的表达式,即dxdyxy§1.2基础统计学概念1.总体、个体和样本所研究对象的全体称为总体,其中每个单位称为个体。从总体中随机抽取若干个体的集合称为样本。样本中所含个体的数目n称为样本容量。如,某产品设为总体,考察某产品中铅的含量,随机选取该类产品100个,那么100个产品铅的含量x1,x2,…,x100就是来自总体的容量为100的样本.在分析化学中,样本的英文(sample)一词为一分析实物。而在分析数据处理时(即在统计学中),此词指的是一组数据,即自总体中随机抽取的一组测量值。为了避免混淆,在分析化学中的“样本”可用“试样”一词。1.均值和标准偏差对某试样作无限次测定,所得数据称为总体的均值(亦称期望值)常用表示.若无系统偏差,则为真值。事实上不可能作无限次测定.若作n次测定,其均值(即算数平均值)为nxxnii/)(1x是的估计.x的表达式为:同样,若总体的标准偏差为,有限次如n次测定的标准偏差为s,则s为的估计.当n趋于无穷大时,s将趋近于。s的表达式为:niinxxs121)/()(标准偏差可以表征测定结果对于均值的离散程度,但却不能指示这些数据的分布情况。而表征数据的分布情况要用直方图(或频谱图).如对某一溶液作50次测定,其均值为0.50ug/ml.其中,0.46ug/ml出现1次,0.47ug/ml出现3次,0.48ug/ml出现5次,0.49ug/ml出现10次,等等.将每一测定值出现的频率对测定值作图即为直方图(或频谱图)。3.平均值的标准偏差将一组独立重复测定值进行平均时,一部分偶然误差相互抵消,使平均值带有的误差比原测定值要小.平均值的标准偏差又称“标准误差”,与单次测量值的之间的关系为xnx/σσ故标准误差服从x)/,(nN2σμ的正态分布.4.正态分布在数学上常用正态分布(即高斯分布)来描述某试样的总体:22221σμπσ)(xep其中,x为试样测量值,p为测量值的概率密度。正态分布具有如下重要性质(见图1.1):(1)数据关于为对称分布;(2)值越大,数据的离散程度越大;(1)样本值落入任意区间(a,b)的概率记作p(axb),等于x=a,x=b线段和曲线组成的面积,即:dxxbxapba])(exp[)(22221σμπσ经计算,样本落入的范围内约为总体的68%;落入2的范围内约为总体的95%;落入3的范围内约为总体的99.7%(见图1.2)。在分析化学中,绝大部分情况下其测量符合正态分布。图1.1均值相同,标准偏差不同的正态分布图1.2正态分布的性质§1.3区间估计在前面介绍中对于总体参数即均值(期望值)和方差的估计仅是参数的近似值,而与参数的真值可能会存在差异,因此,在一定的要求下,估计出未知参数的一个数值范围,即确定一个区间,使这一区间内包含参数真值的概率达到我们预先所要求的程度,这就是参数的区间估计问题.Z§1.3.1容许区间容许区间是对总体而言.区间内的分布曲线称为覆盖域,以P表示,它由z值所决定。在有限次测定中用样本的和s分别代替总体的和时,由于和s是随样本而异的随机变量,致使由选定的k值所组成的区间也是随机的,即对覆盖域难以进行定量.但是在选择P和k的同时再加一个出现P值的概率,便能回答所需要的问题.如欲知使覆盖率不小于P的可能性为应该取什么k值,表1.2给出了常用的P和和对应的k值。xksxx由给定P和k值组成的样本区间称为统计容许区间。例如,从同一批产品小包装中随机抽样10个测定某组分的含量,得和s=0.24%,若以90%的把握估准至少为99%的产品的含量,可以从表1.2查出=0.90,P=0.99,n=10时的k值为3.959,由此计算得到容许区间为15.32-3.959x0.24到15.32+3.959x0.24,即由14.37~16.27%。这个答案是,如果产品中某组分的含量遵从正态分布,便能以90%的把握断定99%的产品中该组分含量在区间14.37~16.27%中.spkx),(%.3215x=0.90=0.95=0.99nPnPnP0.900.950.990.900.950.990.900.950.992345678910111220306012020015.9785.8474.1663.4943.1312.9022.7432.6262.5352.4632.4042.1522.6251.8871.8041.7641.64518.8006.9194.9434.1523.7233.4523.2643.1253.0182.9332.8632.5642.4132.2482.1502.1021.96024.1678.9746.4405.4234.8704.5214.2784.0983.9593.8493.7583.3683.1702.9552.8262.7022.5762345678910111220306012020032.0198.3805.3694.2753.7123.3693.1362.9672.8392.7372.6552.3102.1401.9581.8501.7981.64537.6749.9166.3705.0794.4144.0073.7323.5323.3793.2593.1622.7522.5492.3332.2052.1431.96048.43012.8618.2996.6345.7755.2484.8914.6314.4334.2774.1503.6153.3503.0662.8982.8162.57623456789101112203060120200160.19318.9309.3986.6125.3374.6134.1473.8223.5823.3973.2502.6592.3892.2031.9421.8651.645188.49122.40111.1507.8556.3455.4884.9364.5504.2654.0453.8703.1682.8412.5062.3142.2221.960243.30029.05514.52710.2608.3017.1876.4685.9665.5945.3085.0794.1613.73