图2PM2.5个体采样器图1采样点位置示意图图3PM2.5监测数据及官方公布数据随日期变化图应如何评价谁的实验结果更准确?这个测试结果是否准确,是否有误差,误差多少?如何评价?监测地点监测天数PM2.5算术均值(µg/m3)PM2.5中位数(µg/m3)PM2.5最大值(µg/m3)PM2.5最小值(µg/m3)A采样点17158.21155.99265.2836.97B采样点16158.23160.31259.4347.22C采样点17160.74180.56294.5729.39D采样点17153.68160.71230.0375.90广雅中学(官方)17102.78125.08143.1842.08市五中(官方)1796.2089.63160.5643.15广东商学院(官方)1792.2397.27144.8834.96表1PM2.5监测数据及官方公布数据第三章定量分析中的误差及数据处理ErrorsandDataTreatmentsofQuantitativeAnalysis§3-1误差的基本概念(相对误差是绝对误差在真值中所占的百分率)§3-1-1误差与偏差误差(Error)的定义:测定值(χi)与真值(m)之差。真值(Truevalue)的定义:真值是客观存在的,但它不可能准确知道,实际工作中往往采用“标准值(反复测定的比较准确的结果)”、纯物质的理论值或多次测定结果的平均值作为真值。误差的表示:绝对误差(Ea)和相对误差(Er)。绝对误差(absoluteerror):相对误差(relativeerror):Ea=χi-μEr=(Ea/μ)×100%误差的性质:绝对误差和相对误差都有正负。正误差—分析结果偏高。负误差—分析结果偏低。实例真值(Kg)称得量(Kg)绝对误差(kg)相对误差人62.562.40.10.16%白糖1.00.90.110%中药0.20.10.150%用相对误差比绝对误差表示结果要好!偏差(Deviation)的定义:单次测定结果(χi)与多次测定结果的平均值()之差。偏差的表示:绝对偏差(di)和相对偏差(dr)。绝对偏差(Absolutedeviation):相对偏差(Relativedeviation):xxdii%100x/ddirmxEa(绝对偏差占平均值的百分率)平均偏差(Averagedeviation):相对平均偏差(Relativeaveragedeviation):idn1d%100x/ddr(平均偏差占平均值的百分率)nsn-1:自由度(f)总体标准偏差:σ)(2nµxiS%100/xsCVxssr/变异系数(样本相对标准偏差):)20(1)(2n<nXxSiS样本标准偏差:minmaxxxR极差:§3-1-2准确度与精密度准确度(Accuracy)的定义:测量值与真值的接近程度。准确度与误差的关系:误差越小,准确度越高;准确度的大小,用绝对误差或相对误差表示。精密度(Precision)的定义:几次平行测定值相互接近的程度。精密度与偏差的关系:偏差越小,精密度越高;精密度的大小,用绝对偏差、相对偏差、平均偏差、标准偏差和相对标准偏差,也常用重复性和再现性来表示。重复性(Repeatability)的定义:同一操作者,在相同条件下,获得测定值的一致程度。再现性(Reproducibility)的定义:不同操作者,在不同条件下,用相同方法获得单个结果之间的一致程度。例:测定含铁样品中wFe比较结果的准确度。铁矿中:m1=62.38%,=62.32%Li2CO3试样中:m2=0.042%,=0.044%1x2x%002.0%042.0%044.0xE%06.0%38.62%32.62xE222a111amm%5%100042.0002.0%100EE%1.0%10038.6206.0%100EE2a2r11a1rmm相对误差能更加灵敏的反应出准确度的差异!解:例:判断两组测定值精密度的差异。一组2.92.93.03.13.1二组2.83.03.03.03.2解:08.015xxs08.0xx51d0.3xx51i2i151ii151ii114.015xxs08.0xx51d0.3xx51i2i151ii151ii1标准偏差能更加灵敏的反应出精密度的差异!36.50%37.00%37.50%38.00%甲乙丙丁真值37.40%§3-1-3准确度与精密度的关系(1)准确度高、精密度也高。(2)精密度高、准确度低。(3)准确度和精密度都低。(4)精密度差、准确度不可靠。要准确度好,精密度一定要好。精密度好,准确度不一定好。实验中要取得理想数据,实验技术一定要过关。化学定量分析(常量分析)要求精密度在0.1%~0.3%之间。§3-1-4误差的来源及减免方法误差的分类(按产生的原因及其性质的不同):系统误差(可测误差)、偶然误差(随机误差)和过失误差。产生的原因误差的性质校正方法系统误差方法不完善,试剂不纯,仪器不准。重复性,单向性,可测性。标准方法、试剂提纯、使用校正值等。偶然误差不确定因素引起试样质量、组成、仪器性能等的微小变化、操作的微小差别。服从正态分布,方向不定(正或负),数值不定(大或小)。增加测定次数。过失误差操作人员粗心大意或不负责任造成的。没有任何规律。重做实验。例:某校某届学生用重量法对BaCl2H2O试剂的纯度进行测定,共得到173个数据,得到的结果在98.9%-100.2%之间,以0.1%为组距进行分组得到下表:§3-1-5随机误差分布规律组号分组频数(ni)频率(ni/n)频率密度(ni/ns)123456789101112131498.8598.9598.9599.0599.0599.1599.1599.2599.2599.3599.3599.4599.4599.5599.5599.6599.6599.7599.7599.8599.8599.9599.95100.05100.05100.15100.15100.2512259213050261582110.0060.0120.0120.0290.0520.1210.1730.2890.1500.0870.0460.0120.0060.0060.060.120.120.290.521.211.732.891.500.870.460.120.060.06合计1731.0013.53.02.52.01.51.00.50.099.6%平均值频率密度测定量%服从正态分布!!!exxfym222)(21)(正态分布的定义:数学上的高斯分布dxduxu)/1(m2/u2x222e21xfe21xfm式中:x是随机测量值,y概率密度,m总体平均值(没有系统误差和过失误差时等于真值),σ总体标准偏差,x-m随机误差。duudue21dxe21dxxf2/u2/u22标准正态分布曲线0.40.30.20.10.021y-4-3-2-101234u-3-2-023x-mm-3m-2m-mm+m+2m+3x正态分布概率积分表us2s0.6740.25001.0000.34130.6831.6450.45001.9600.47500.9502.0000.47732.5760.49870.9903.0000.49870.9970.5001.0000.40.30.20.10.0-3-2-10123uyduesuu20221随机误差的区间概率随机误差u出现的区间(以为单位)测量值出现的区间概率p(-1,+1)(m1)68.3%(-1.96,+1.96)(m1.96)95.0%(-2,+2)(m2)95.5%(-2.58,+2.58)(m2.58)99.0%(-3,+3)(m3)99.7%随机误差分布(正态分布)的性质对称性:大小相近,符号相反的误差出现的概率大致相等,误差分布曲线对称。单峰性:小误差出现的概率大,大误差出现的概率小、误差很大的测定值出现的概率极小,误差分布曲线只有一个峰值,误差有明显的集中趋势。有界性:仅为偶然误差造成的误差数值不可能很大,若发现大误差出现,可能是过失误差造成的,应查找原因并再做。抵偿性:误差的算术平均值的极限为零。01limninndi§3-1-6随机误差的t分布规律式中:x是随机测量值,m样本平均值,平均值的标准偏差,s样本标准偏差,x-m随机误差xtnsmt分布的定义(W.S.Gosset):xtSmx总体样本数据抽样检测统计方法样本容量n:样本所含的个体数n21x,,x,xn,s,xmSxt分布的适用范围:有限的测定次数(无法计算出总体标准差和总体平均值)。t分布与正态分布的区别:正态分布曲线不随自由度的变化而变化;而t分布随自由度的变化而变化。t分布与正态分布的联系:当自由度(f)大于20时,两者很相似,当f趋于无穷大时,几乎一致。t分布曲线图动画置信度(置信水平)的定义:测定值或误差出现的概率,如68.3%、95.5%、99.7%。置信度的意义:某一定范围内的测定值(或误差值)出现的概率。置信区间的定义:m±σ,m±2σ,m±3σ等。置信区间的意义:真实值在指定概率下所分布的某一个区间。置信度与置信区间的关系:置信度选择高,置信区间就宽。t分布置信区间的依赖关系:测定值的精密度(s)、测定值的次数(n)和置信度。•测定值精密度越高,测定次数越高,置信区间就越窄,平均值就越接近真值,平均值就越可靠。•置信度选择越高,置信区间就越宽,其区间包括真值的可能性就越大。在分析化学中,一般将置信度定为95%或90%。t分布置信区间的定义:ntsxm在一定的置信度(如95%)下,真值(总体平均值)将出现在测定平均值附近的一个区间即在至之间(如把握度为95%)。xntsxntsxt分布的计算:与置信度和测定值的次数有关。测定次数置信度测定次数置信度90%95%99%90%95%99%26.31412.70663.65781.8952.3653.50032.9204.3039.92591.8602.3063.35542.3533.1825.841101.8332.2623.25052.1322.7764.604111.8122.2283.16962.0152.5714.032211.7252.0862.84671.9432.4473.707∞1.6451.9602.576例:测定SiO2质量分数,得到下列数据(%):28.62,28.59,28.51,28.48,28.52,28.63,求置信度分别为90%和95%时的总体均值的置信区间。解:0.06%s28.56%x依题:置信度为90%时:%05.056.28%606.0015.228.56nstxf,m015.2t5,10.0置信度为95%时:571.2t5,05.0%07.056.28%606.0571.228.56nstxf,mnstf,xnsxm可以得到根据,,偶然误差过失误差?=真值重做实验§3-2分析结果的数据评价系统误差显著性检验可疑数据检验§3-2-1可疑数值的取舍可疑值的定义:在被给的一组数据中,与其它数据差异较大的数据。可疑值的确定:按大小顺序排列,X1X2…Xn,最大(Xn)和最小(X1)的即是可疑值。可疑值的检验方法:Grubbs(格鲁布斯)法和Q值检验法。两种方法适用的条件:随机误差服从一定的分布规律。1.按大小排序(x1,x2,x3,,xn)。2.确定可疑值(x1或xn)。3.计算平均值及标准偏差