第1页章序名称第二章误差和分析数据的处理教学目的要求1.掌握误差和偏差的意和表示方法;2.理解准确度和精密度的意义与关系;3.掌握随机误差的正态分布;4.掌握有限测定数据的统计处理;5.理解有效数字的意义并掌握其用算规则。教学重点1.系统误差和随机误差的概念.产生的原因.特征及消除总体平均值的估计;2.对随机变量正态分布的理解;3.提高分析结果准确度的方法;4.各种检验法的正确使用,双侧和单侧检验如何查表;5.t检验法.6.数字修约规则.教学难点1、对随机变量正态分布的理解;2、各种检验法的正确使用,双侧和单侧检验如何查表。3、误差基本公式的记忆和应用.教学场所环境教室授课方式课堂讲授(√);实验();课时分配11学时教学方法讲授与讨论教学手段网络教学();多媒体(√)教学用具投影仪教学内容提要备注第2页§2-1误差及其产生的原因一、系统误差二、偶然误差三、过失误差§2-2误差和偏差的表示方法一、准确度和误差二、精密度与偏差三、准确度和精密度的关系四、公差五、提高分析结果准确度的方法§2-3偶然无误差的正态分布一、频数分布二、正态分布§2-4分析数据的处理一、置信度与平均值的置信区间二、可疑测定值的取舍三、分析方法准确度的检验四、分析结果的表示方法§2-5有效数字及其运算规则一、有效数字的意义及位数二、有效数字的运算规则在分析化学中的应用第3页日程及课时分配节序内容学时第二章误差和分析数据的处理11学时第一节误差及其产生的原因2第二节误差和偏差的表示方法2第三节偶然无误差的正态分布2第四节分析数据的处理2第五节有效数字及其运算规则1第六节第七节第节习题课2第节第节第节第节第节复习思考题1.系统误差和随机误差产生的原因和特点,应该采用什么方法减免?2.如果分析天平的称量误差为±0.2mg,拟分别称取试样0.1g和1g左右,称量的相对误差各为多少?这些结果说明了什么问题?3.准确度和精密度的联系和区别.4.两位分析者同时测定某一试样中硫的质量分数,称取试样均为3.5g,分别报告结果如下:甲:0.042%,0.041%;乙:0.04099%,0.04201%。问哪一份报告是合理的,为什么?5.正态函数区间概率的意义?第4页讨论练习1.什么是准确度和精密度?写出数学表达式.2.各种检验法的正确使用.3.双侧和单侧检验如何查表?4.系统误差产生的原因有哪些?拓展学习观察下面几个公式:(自己整理写出公式理解意义)1.分布概率密度函数表达式;2.正态函数区间概率表达式;3.t检验及Q检验;4.样本标准偏差和总体标准偏差.课程作业P662,4,7P2698,12,13学生学习质量监控与评价从完成作业情况看,本章内容部分学生掌握较好,有些学生概论理解不深,计算结果有误.教学后记本章内容学生首次接触,比较抽象,公式多概念多,学生感到很难,应强调如何理解和记忆不同的公式和解题方法。第二章误差和分析数据数据的处理1.总体与样本总体:在统计学中,对于所考察的对象的全体,称为总体(或母体)。个体:组成总体的每个单元。样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。样本容量:样品中所包含个体的数目,用n表示。例题:分析延河水总硬度,依照取样规则,从延河取来供分析用2000ml样品水,这2000ml样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是第5页延河样品水的一个随机样本,样本容量为20。2.随机变量来自同一总体的无限多个测量值都是随机出现的,叫随机变量。1ixxn,1liminxn(总体平均值),xn(单次测量的平均偏差)2.1标准偏差2.1.1总体标准偏差(无限次测量)21niixnn-测量次数2.1.2样本标准偏差(有限次测量)21()1niixxSn(n-1)-自由度2.1.3相对标准偏差相对标准偏差(变异系数)100%sCVx100%dx相对平均偏差2.1.4标准偏差与平均偏差当测定次数非常多(n大于20)时,0.7970.8,但是00.8dS2.1.5平均值的标准偏差统计学可证明平均值的标准偏差与单次测量结果的标准偏差存在下列关系:xn,xn(无限次测量)xssn,xddn(有限次测量)2.2随机误差的正态分布2.2.1频数分布频数:每组中数据的个数。相对频数:频数在总测定次数中所占的分数。频数分布直方图:以各组分区间为底,相对频数为高做成的一排矩形。特点:1.离散特性:测定值在平均值周围波动。波动的程度用总体标准偏差表示。2.集中趋势:向平均值集中。用总体平均值表示。在确认消除了系统误差的前提下,总体平均值就是真值。2.2.2正态分布(无限次测量)增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明显,因此在实际工作中,一般平行测定3-4次即可;当要求较高时,可适当增加平行测量次数第6页1.正态分布曲线:如果以x-(随机误差)为横坐标,曲线最高点横坐标为0,这时表示的是随机误差的正态分布曲线。2221()2xyfxe,记为:N(,2),-决定曲线在X轴的位置-决定曲线的形状,小曲线高、陡峭,精密度好;曲线低、平坦,精密度差。随机误差符合正态分布:(1)大误差出现的几率小,小误差出现的几率大;(2)绝对值相等的正负误差出现的几率相等;(3)误差为零的测量值出现的几率最大。(4)x=时的概率密度为12xy2.标准正态分布N(0,1)令xu,222211()22uuyfxeyue2.2.3随机误差的区间概率所有测量值出现的概率总和应为1,即2221(,)12uPedx求变量在某区间出现的概率,2221(,)2ubaPabedx概率积分表,p248。注意:表中列出的是单侧概率,求u间的概率,需乘以2。随机误差出现的区间测量值出现的区间概率u=1x=10.3413×2=68.26%u=2x=20.4773×2=95.46%u=3x=30.4987×2=99.74%结论:1.随机误差超过3的测量值出现的概率仅占0.3%。2.当实际工作中,如果重复测量中,个别数据误差的绝对值大于3,则这些测量值可舍去。例例:已知某试样中Fe的标准值为3.78%,=0.10,又已知测量时没有系统误差,求1)分析结果落在(3.78±0.20)%范围内的概率;2)分析结果大于4.0%的概率。解:1)0.202.00.10xuu查表,求得概率为2*0.4773=0.9546=95.46%2)分析结果大于4.0%的概率,4.003.782.20.10xuu,查表求得分析结果落在3.78-4.00%以内的概率为0.4861,那么分析结果大于4.00%的概率为0.5000-0.4861=1.39%2.3少量数据的统计处理第7页2.3.1t分布曲线(有限次测量中随机误差服从t分布)有限次测量,用S代替,用t代替uxxxtnss置信度(P):表示的是测定值落在xtS范围内的概率,当f,t即为u显著性水平()=1-P:表示测定值落在xtS范围之外的概率。t值与置信度及自由度有关,一般表示为,ft,见p250,表7-3(双侧表)2.3.2平均值的置信区间Sxtn意义:表示在一定的置信度下,以平均值为中心,包括总体平均值的范围。从公式可知只要选定置信度P,根据P(或)与f即可从表中查出t,f值,从测定的x,s,n值就可以求出相应的置信区间。例分析某固体废物中铁含量得如下结果:x=15.78%,s=0.03%,n=4,求1)置信度为95%时平均值的置信区间;2)置信度为99%时平均值的置信区间解:置信度为95%,查表得t0.05,3=3.18,那么0.0315.783.1815.780.05%4Sxtn置信度为99%,查表得t0.05,3=5.84,那么0.0315.785.8415.780.09%4Sxtn对上例结果的理解:1.正确的理解:在15.78±0.05%的区间内,包括总体平均值的的概率为95%。2.错误的理解:a.未来测定的实验平均值有95%落入15.78±0.05%区间内b.真值落在15.78±0.05%区间内的概率为95%从该例可以看出,置信度越高,置信区间越大。例1下列有关置信区间的定义中,正确的是:a.以真值为中心的某一区间包括测定结果的平均值的几率;b.在一定置信度时,以测量值的平均值为中心的包括总体平均值的范围c.真值落在某一可靠区间的几率;d.在一定置信度时,以真值为中心的可靠范围。例2某试样含Cl-的质量分数的平均值的置信区间为36.45%±0.10%(置信区间90%),对此结果应理解为:a.有90%的测量结果落在36.45%±0.10%范围内;b.总体平均值落在此区间的概率为90%;c.若再作一次测定,落在此区间的概率为90%;d.在此区间内,包括总体平均值的把握为90%2.3.3显著性检验判断是否存在系统误差。1。t检验:不知道,检验12xxx与,与(1)比较平均值与标准值,统计量xtnS(s=s小)tt表,有显著差异,否则无。第8页(2)比较12xx与2221221212(1)(1)2SSnnnnn12121xxnnn统计量t=SS2.F检验:比较精密度,即方差S1和S2,F表为单侧表统计量22sFs大小FF表,有显著差异,否则无。例一碱灰试样,用两种方法测得其中Na2CO3结果如下方法1:11142.340.105xsn,,方法2:22242.440.124xsn,,解:先用F检验s1与s2有无显著差异:22220.121.440.10sFs大计算小查表7-4,得F表=6.59,因F计算F表,因此s1与s2无显著差异用t检验法检验12xx与12121242.3442.44541.490.1054xxnntsssnn小计算()查表7-3,f=5+4-2=7,P=95%,得:t表=2.36,则t计算t表,因此,无显著差异。2.3.4异常值的取舍1.4d法(简单,但误差大)依据:随机误差超过3的测量值出现的概率是很小的,仅占0.3%。=0.80,34。偏差超过4的个别测定值可以舍去。方法:a.求出x与平均偏差d。4xxd,则测定值x可以舍去。2.格鲁布斯(Grubbs)法步骤:(1)数据由小到大排列,求出x与s。x1,x2……xn(2)统计量T1xxTs(x1为可疑值)nxxTs(xn为可疑值)(3)将T与表值Ta,n比较,TTa,n,舍去。3.Q检验法步骤:(1)数据由小到大排列。(2)计算统计量12111(xnnnnnxxxxQxQxxxx1为可疑值)(为可疑值)(maxminxxQxx可疑邻近计算)(3)比较Q计算和Q表(QP,n),若Q计算Q表,舍去,反之保留。例10、11分别用三种检验法来判断1.40这个数据是否应该保留。2.5提高分析结果准确度的方法1选择合适的分析方法(1)根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或重量分析法;低含量用仪器第9页分析法。(2)充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。(3)对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定。2减小测量误差→称量:分析天平的称量误差为±0.0002g,为了使测量时的相对误差在0.1%以下,试样质量必须在0.2g以上。→滴定管读数常有±0.0lmL的误差,在一次滴定中,读数两次,可能造成±0.02mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20mL以上,最好使体积在25mL左右,一般在2