第3章分析化学中的误差及数据处理3.1分析化学中的误差3.2有效数字及其运算规则3.3分析化学中的数据处理3.4显著性检验3.5可疑值取舍3.6回归分析法3.7提高分析结果准确度的方法3.1分析化学中的误差一、误差与偏差绝对误差E=x-xT相对误差100%100%TrTTxxEExxE0E0真值xT:某物理量本身具有的客观存在的真实数值。理论真值计量学约定真值相对真值特点:客观存在,但绝对真值不可测偏差:测量值与平均值的差值,用d表示d=x-x∑di=01211nniixxxxxnn算术平均值中位数xM一组测量数据从小到大排列,当测量值n为奇数时,正中间的数据为中位数;若n为偶数,中间相邻两个测量值的平均值为中位数。平均偏差:各单个偏差绝对值的平均值。相对平均偏差:平均偏差与测量平均值的比值。1100%100%niirxxddxnx相对平均偏差12111()nniidddddnn112nxxsnii标准偏差s:相对标准偏差sr:%100)(xssRSDr极差R:maxminRxx准确度:测定结果与真值接近的程度,用误差衡量。精密度:平行测定结果相互靠近的程度,用偏差衡量。重现性:同一分析人员在相同条件下所得分析结果的精密度。再现性:不同分析人员或不同实验室之间在各自条件下所得结果的精密度。二、准确度和精密度1x2x3x4x准确度与精密度的关系1x2x3x4x准确度与精密度的关系1.精密度高是准确度高的前提;2.精密度高不一定准确度高。系统误差!消除系统误差的情况下,精密度可以表达准确度准确度及精密度都高——结果可靠三.系统误差与随机误差系统误差:又称可测误差,某种固定原因造成的误差。方法误差:溶解损失、终点误差-用其他方法校正仪器和试剂误差:刻度不准、砝码磨损-校准试剂不纯-空白实验操作误差:颜色观察、灼烧温度控制、试样预处理等主观误差:个人误差具单向性、重现性、可校正特点随机误差:又称偶然误差10过失:试样转移不完全、试液溅失、记录错误等由粗心大意引起,不属于误差,可以避免不可校正,无法避免,服从统计规律不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次四、公差公差:生产部门对分析结果误差允许的限量。系统误差a.加减法R=mA+nB-pCER=mEA+nEB-pECb.乘除法c.指数关系R=mAnd.对数关系R=mlgA五.误差的传递AREE=0.434mARAEE=nRAnBR=mApCCRABEEEE=+RABC随机误差:以s表示。a.加减法R=mA+nB-pCsR2=m2sA2+n2sB2+p2sC2b.乘除法R=mA×nB/pCc.指数关系R=mAnd.对数关系R=mlgA2222CRAB2222ssss=RRRRRAss=nRAARss=0.434mA极值误差最大可能误差R=A+B-CER=|EA|+|EB|+|EC|CRABmaxEEEE=+RABCABR=C3.2有效数字及运算规则1有效数字:分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内。a数字前0不计,数字后计入:0.03400b数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103,1.00×103,1.000×103)c自然数和常数可看成具有无限多位数(如倍数、分数关系)d数据的第一位数大于等于8的,可多计一位有效数字,如9.45×104,95.2%,8.65e对数与指数的有效数字位数按尾数计,如pH=10.28,则[H+]=5.2×10-11f误差只需保留1~2位m◇分析天平(称至0.1mg):12.8228g(6),0.2348g(4),0.0600g(3)◇千分之一天平(称至0.001g):0.235g(3)◇1%天平(称至0.01g):4.03g(3),0.23g(2)◇台秤(称至0.1g):4.0g(2),0.2g(1)V☆滴定管(量至0.01mL):26.32mL(4),3.97mL(3)☆容量瓶:100.0mL(4),250.0mL(4)☆移液管:25.00mL(4);☆量筒(量至1mL或0.1mL):25mL(2),4.0mL(2)2有效数字运算中的修约规则尾数≤4时舍;尾数≥6时入尾数=5时,若后面数为0,舍5成双;若5后面还有不是0的任何数皆入四舍六入五成双例下列值修约为四位有效数字0.324740.324750.324760.324850.3248510.32470.32480.32480.32480.3249禁止分次修约!!运算时可多保留一位有效数字进行.0.57490.570.5750.58×加减法:结果的绝对误差应不小于各项中绝对误差最大的数。(与小数点后位数最少的数一致)0.112+12.1+0.3214=12.5乘除法:结果的相对误差应与各因数中相对误差最大的数相适应(与有效数字位数最少的一致)0.0121×25.66×1.0578=0.3284323运算规则33CaCO3CaCO10.100025.000.100024.10210swMm=例NaOH30.100025.000.100024.10100.120.2351100.0191599?3CaCO2HClCaClHCOHCl()322过量0.01920.019H2O+CO2系统误差:可校正消除随机误差:不可测量,无法避免,可用统计方法研究0123456789100.000.020.040.060.080.100.12yx一.随机误差的正态分布1.测量值的频数分布频数,相对频数,骑墙现象分组细化测量值的正态分布3.3分析化学的数据处理1.总体标准偏差σ无限次测量;单次偏差均方根2.样本标准偏差s样本均值n→∞时,→μ,s→σ112nxxSniixnxnii12离散特性x总体平均值μ:消除系统误差的前提下,μ就是真值xT总体平均偏差δ:总体标准偏差与平均偏差的关系(n20)=0.7970.80集中趋势11limninixn1niixn:总体标准偏差2.随机误差的正态分布22/2)(21)(xexfy离散特性:各数据是分散的,波动的集中趋势:有向某个值集中的趋势:总体平均值nxnii12ixnnin11lim24正态分布N(μ,σ2)的两个重要参数:1)μ为无限次测量的总体均值,表示无限个数据的集中趋势,决定曲线位置2)σ是总体标准差,表示数据的离散程度,决定曲线形状,σ↑,y↓,数据分散,曲线平坦;σ↓,y↑,数据集中,曲线尖锐正态分布曲线特点单峰性:x=μ时最大,即误差为0时测量值出现概率最大,大多数值集中在附近;有界性:当x趋于+∞或-∞时,曲线以x轴为渐近线,说明小误差出现概率大;对称性:曲线以x=μ的垂直线为对称轴,说明绝对值相等的正负误差出现概率相等。x25测量值都落在-∞~+∞区间,总概率为122()21()12xPxedx221()2uyfxexu令进行变量转换,dxdudxdu221()()2ufxdxeduudu221()2uyue26标准正态分布N(0,1)曲线以u和概率密度表示的正态分布曲线为标准正态分布曲线N(0,1)。曲线形状与σ大小无关。1)利用正态分布求区间概率随机误差的区间概率P:用一定区间的积分面积表示该范围内测量值出现的概率。duebxaPbau2221)(2)分析结果(个别测量值)落在此范围的概率27若u=1,x=uP=2×0.3413=68.3%若u=2,x=uP=2×0.4773=95.5%若u=3,x=uP=2×0.4987=99.7%3)从以上的概率的计算结果看,①分析结果落在3范围内的概率达99.7%,即误差超过3的分析结果是很少的,只占全部分析结果的0.3%。②在多次重复测定中,出现特别大误差的概率是很小的,平均1000次中只有3次机会。③一般分析化学测定次数只有几次,出现大于3的误差是不大可能的。如果出现了,有理由认为不是由偶然误差造成的,可以舍弃。P57例题7、8、928标准正态分布的特点:曲线形状与大小无关。横坐标是以为单位的x-值。曲线最高点对应于u=0.标准正态分布曲线就是以总体平均值为原点,以为横坐标单位的曲线。拐点在u=1的垂线上。无论多大,都被看成1,对不同的和,标准正态分布曲线都适用。3989.021y29xsxssn二、总体平均值的估计1.平均值的标准偏差:m个样本,每个样本作n次测量的平均值的标准偏差与单次测量结果的标准偏差s的关系为对于无限次的测量值,则xn即平均值的标准偏差与测定次数的平方根成反比,平均值的精密度随测定次数↗而↗。分析工作中,一般平行测定3~4次即可。P59图3-5N→∞:随机误差符合正态分布(高斯分布)(,)n有限:t(置信因子)分布和s代替,xnstx2.少量实验数据的统计处理1)t分布曲线曲线下一定区间的积分面积,即为该区间内随机误差出现的概率自由度f=n-1;f→∞时,t分布→正态分布snxsxtx)(xu某一区间包含真值(总体平均值)的概率(可能性)置信区间:一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围)置信度越高,置信区间越大nstx平均值的置信区间定量分析数据的评价---解决两类问题:(1)分析方法的准确性系统误差及偶然误差的判断显著性检验:利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异。方法:t检验法和F检验法确定某种方法是否可用,判断实验室测定结果准确性(2)可疑数据的取舍过失误差的判断方法:4d法;Q检验法;格鲁布斯(Grubbs)检验法确定某个别数据是否可用。3.4显著性检验分析方法准确性的检验b.由要求的置信度和测定次数,查表,得:t表c.比较若t计t表,表示有显著性差异,存在系统误差,被检验方法需要改进若t计t表,表示无显著性差异,被检验方法可以采用。nSxt计算t检验法---系统误差的检测平均值与标准值()的比较a.计算t值c查表(自由度f=f1+f2=n1+n2-2),比较:t计t表,表示有显著性差异两组数据的平均值比较(同一试样)b计算t值:新方法--经典方法(标准方法)两个分析人员测定的两组数据两个实验室测定的两组数据a求合并的标准偏差:2)1()1(21222211nnSnSnS合212121||nnnnSxxt合合F检验法-两组数据间偶然误差的检测b按照置信度和自由度查表(F表),比较F计算和F表a计算F值:22小大计算SSF统计检验的正确顺序:可疑数据取舍F检验t检验可疑数据的取舍过失误差的判断4d法偏差大于4d的测定值可以舍弃步骤:求异常值以外数据的平均值和平均偏差如果(可疑值-x)4d,舍去11211XXXXQXXXXQnnnn或Q检验法步骤:(1)数据排列X1X2……Xn(2)求极差Xn-X1(3)求可疑数据与相邻数据之差Xn-Xn-1或X2-X1(4)计算:(5)根据测定次数和要求的置信度,(如90%)查表:不同置信度下,舍弃可疑数据的Q值表测定次数Q90Q95Q9930.940.980.9940.760.850.9380.470.540.63(6)将Q与QX(如Q90)相比,若QQX舍弃该数据,(过失误差造成)若QQX保留该数据,(偶然误差所致)当数据较少时舍去一个后,应补加一个数据。格鲁布斯(Grubbs)检验法(4)由测定次数和要求的置信度,查表得G表(5)比较若G计算G表,弃去可疑值,反之保留。由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q检验法高。SXXGSXXGn1