第2章误差及分析数据的统计处理ErrorsandStatisticalTreatmentofAnalyticalData2.1概述2.2测量误差2.3分析结果的数据处理2.4有效数字及其运算规则第一节概述•误差的概念,定量表示方法,分类,减免措施;•定量分析数据的归纳和取舍;•有效数字的概念,修约规则,运算规则误差(error)产生的原因1)分析化学自身的局限:methods,instruments,strategies都与人有关2)人类认识世界客观规律的局限性第二节测量误差一、误差的表示方法二、误差分类及减免三、平均值的置信区间四、提高分析结果准确度的方法一、误差的表示方法(一)准确度与误差1.准确度(accuracy):指测量结果与真值(truevalue)的接近程度2.误差(error)-准确度的定量表示(1)绝对误差(absoluteerror):测量值与真实值之差ixE(2)相对误差(relativeerror):绝对误差占真实值的百分比%100%100irxEE%100xEEr注:1)E和Er可正可负吗?2)测高含量组分,Er可小;测低含量组分,Er可大3)仪器分析法——测低含量组分,Er大化学分析法——测高含量组分,Er小注:μ未知,已知,可用代替μxx(二)精密度与偏差1.精密度(precision):在确定条件下,将测试方法实施多次(平行测量),各测量值间的一致(相互接近)程度。2.偏差(deviation)-精密度的定量表示(1)绝对偏差:单次测量值与平均值之差(2)相对偏差:绝对偏差占平均值的百分比dxxi%100xxxdir(5)标准偏差(standarddeviation):总体标准偏差样本标准偏差(6)相对标准偏差(变异系数coefficientofvariation)(3)平均偏差(averagedeviation):各测量值绝对偏差的算术平均值(4)相对平均偏差:平均偏差占平均值的百分比nxxdi%100%100xnxxxdinxnii12)(1)(12nxxSnii%100xSCVμ未知μ已知注1)平均偏差和标准偏差都为正值吗?2)标准偏差和平均偏差谁更能反映数据的离散程度?3)精密度的高低还常用重复性(repeatability)和再现性(reproducibility)表示(三)准确度与精密度的关系1.准确度高,要求精密度一定高(实验结果首先要求精密度高,精密度是必要条件)但精密度好,准确度不一定高。还要满足什么条件?2.准确度反映了测量结果的正确性精密度反映了测量结果的重现性练习例:用丁二酮肟重量法测定钢铁中Ni的百分含量,结果为10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。解:%43.10x%036.05%18.0nddi%35.0%100%43.10%036.0%100xd%046.0106.44106.81472ndsi%44.0%100%43.10%046.0%100xs二误差分类及减免误差的方法(一)系统误差(可测误差)(二)偶然误差(随机误差)根据误差产生原因及其性质的不同分为两类注:由疏忽大意造成的误差成为过失误差,此类差错,只要认真操作,是可以完全避免的。(一)系统误差(可测误差)determinateerror:由可定原因产生1.产生原因:(1)按来源分a.方法误差(methoderror):方法不恰当产生b.试剂误差(reagenterror):试剂中含被测组分或不纯组分c.仪器误差(instrumentalerror):仪器本身缺陷e.操作误差(personalerror):操作方法不当或操作偏见(2)按数值变化规律分a.恒定误差b.比值误差2.系统误差特点:重复性:同一条件下,重复测定,重复出现单向性:测定结果大小基本不变、正负固定可消除:原因可分析,大小可测定,可校正3.校正系统误差的方法1)校准仪器:消除仪器的误差2)空白试验:消除试剂误差3)对照实验:消除方法误差4)回收实验:加样回收,以检验是否存在方法误差(二)偶然误差(随机误差,不可定误差):randomerror由不确定原因引起2.特点:1)不具单向性(大小、正负不定)2)不可消除(原因不定)但可减小(测定次数↑)3)分布服从统计学规律(正态分布)1.产生原因:不确定,不可控,可能是环境温度,湿度,气压,气流,污染状况,光线,仪器性能微小波动,操作人员在操作中的细微差别3.偶然误差的统计规律1)偶然误差的正态分布2)偶然误差的区间概率3)有限次测定中偶然误差服从t分布1)正态分布曲线——偶然误差~出现概率的曲线xu令2221)(uexfydudx又duuduedxxfu)(21)(222221)(ueuy即注:u是以σ为单位来表示偶然误差x-μ随机分布性质:1)对称性2)单峰性3)有界性4)抵偿性2)、偶然误差的区间概率从-∞~+∞,所有测量值出现的总概率P为1,即偶然误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率正态分布区间概率%1,1xu%26.6864.1,64.1xu%9096.1,96.1xu%95121)(22ueduu2,2xu%5.9558.2,58.2xu%0.993,3xu%7.99正态分布概率积分表置信度Confidencelevel置信区间Confidenceinterval3)t分布与正态分布区别1.正态分布——描述无限次测量数据t分布——描述有限次测量数据2.正态分布——横坐标为u,t分布——横坐标为t3.两者所包含面积均是一定范围内测量值出现的概率P正态分布:P随u变化;u一定,P一定t分布:P随t和f变化;t一定,概率P与f有关,xusxt1nfutf注:为总体均值为总体标准差差为有限次测量值的标准s练习例:已知某试样中Co的百分含量的标准值为1.75%,σ=0.10%,又已知测量时无系统误差,求分析结果落在(1.75±0.15)%范围内的概率。解:5.1%10.0%15.0%75.1xxu%64.868664.04332.02P查表练习例:同上题,求分析结果大于2.00%的概率。解:5.2%10.0)%75.100.2(xu%38.494938.0,5.2~0,Pu时从当查表可知%62.0%38.49%00.50'%00.2P的概率为分析结果大于三平均值的置信区间(1)由单次测量结果估计μ的置信区间(2)由多次测量的样本平均值估计μ的置信区间(3)由少量测定结果均值估计μ的置信区间uxnux总体平均值有限次测量均值xnStx上式的意义:在一定置信度下(95%),真值(总体平均值)将在测定平均值附近的置信区间范围内存在的把握程度95%例1:置信区间的宽窄与置信度,测量值的精密度,测定次数有关1)精密度越高,置信区间越窄2)测定次数越多,置信区间越窄3)置信度选择越高,置信区间越宽如何理解α为显著性水平:是落在置信度范围之外的概率nstxf,P1讨论例2:对某未知试样中CL-的百分含量进行测定,4次结果为47.64%,47.69%,47.52%,47.55%,计算置信度为90%,95%和99%时的总体均值μ的置信区间解:35.2%903,10.0tP%09.0%60.474%08.035.2%60.4718.3%953,05.0tP%13.0%60.474%08.018.3%60.4784.5%993,01.0tP%23.0%60.474%08.084.5%60.47%60.474%55.47%52.47%69.47%64.47x%08.012nxxs四、提高分析结果准确度的方法1.选择合适的分析方法(化学分析,仪器分析?)例:测全Fe含量K2Cr2O7法40.20%±0.2%×40.20%比色法40.20%±2.0%×40.20%2.减小测量误差1)称量?例:天平一次的称量误差为0.0001g,两次的称量误差为0.0002g,Er%0.1%,计算最少称样量?%1.0%1000001.02%wErgw2000.0续前2)滴定?例:滴定管一次的读数误差为0.01mL,两次的读数误差为0.02mL,Er%0.1%,计算最少移液体积?3.增加平行测定次数,一般测3~4次以减小偶然误差4.消除测量过程中的系统误差1)校准仪器:消除仪器的误差2)空白试验:消除试剂误差3)对照实验:消除方法误差4)回收实验:加样回收,以检验是否存在方法误差mLV20%1.0%10001.02%VEr第三节、分析结果的数据处理一.可疑数据的取舍过失误差的判断二.方差比检验——F检验法(两个平均值精密度显著性检验)三.系统误差的检查方法四、误差的传递规律一.可疑数据的取舍过失误差的判断11211XXXXQXXXXQnnnn或1.Q检验法(测定次数10以内)步骤:(1)数据排列X1X2……Xn(2)求极差Xn-X1(3)求可疑数据与相邻数据之差Xn-Xn-1或X2-X1(4)计算:(5)根据测定次数和要求的置信度,(如90%)查表:书中表2--4不同置信度下,舍弃可疑数据的Q值表测定次数Q90Q95Q9930.940.980.9940.760.850.9380.470.540.63(6)将Q计算与QX(如Q90)相比,若Q计算QX舍弃该数据,(过失误差造成)若Q计算QX舍弃该数据,(偶然误差所致)当数据较少时舍去一个后,应补加一个数据。2.G检验(Grubbs法)sxxxxxxnn和,,,,,1321sxxG异常计算判断:保留,则异常值舍弃;否则若下,一定计算npGGP,检验过程将数据由小到大排列X1X2……Xn求出对可疑数据X1或Xn注:1.Q值法使用较方便2.Grubbs法判断可疑值较好3.对于离群数据,不能随意舍去。例如:对于测量值40.12,40.16,40.18。1.不舍去40.12,平均值的置信区间(置信度P=95%时)为2.舍去40.12,平均值的置信区间(置信度P=95%时)为之间。真值范围在23.4007.4008.015.403031.03.415.40nstx之间。真值范围在30.4004.4013.017.402014.071.1217.40nstx二.方差比检验——F检验法(两个平均值精密度显著性检验)统计量F的定义:两组数据方差的比值5221,,表一定时,查ffFP2221ssF即21ss判断:不存在显著性差异,则两组数据的精密度如表FF存在显著性差异,则两组数据的精密度如表FF三.系统误差的检查方法平均值与标准值比较——已知真值的t检验(检查方法的准确度)nstx由nsxt)1(nftPf自由度时,查临界值表在一定,判断:,则存在显著性差异如ftt,,则不存在显著性差异如ftt,小结1.比较:G检验——异常值的取舍(过失误差)F检验——检验方法的偶然误差t检验——检验方法的系统误差2.检验顺序:G检验→F检验→t检验异常值的取舍精密度显著性检验准确度或系统误差显著性检验四、四则运算中误差的传递规律(一)系统误差的传递(二)偶然误差的传递1.加减法计算2.乘除法计算CBARCBARmax)(CABR/CCBBAARRmax)/(1.加减法计算