•第四章误差与实验数据的处理第四章误差与实验数据的处理4.1误差的基本概念4.2随机误差的正态分布4.3有限数据的统计处理4.4有效数字及其运算规则教学要求1、了解误差的基本概念、产生的原因、规律性以及减免误差的有效措施2、学会处理实验数据的基本方法3、对分析结果的可靠性和准确性作出合理判断和正确的表达4、在实践中不断提高分析结果的准确度学习意义:定量分析:准确测定试样中物质的含量分析方法仪器和试剂工作环境分析者等误差:分析结果与真值之差。分析工作者的任务对试样准确测量对产生误差的原因进行分析提出改进措施对分析结果的可靠性和准确性作出评价误差是客观存在不可避免4.1误差的基本概念一.准确度与误差绝对误差:测量值与真值间的差值,用Ea表示Ea=xi–T式中xi为单次测定值。如果进行了数次平行测定,xi为全部测定结果的算术平均值X(测定平均值)Er=(Ea/T)×100%(更为实用)准确度:测定结果与真值(T)接近的程度,用误差衡量。误差相对误差:绝对误差占真值的百分比,用Er表示真值:客观存在,但绝对真值不可测理论真值:如纯物质的理论组成或含量约定真值:国际计量大会确定的质量、长度等,标准参考物质证书上给出的数值等相对真值:标准样品、基准物质、标准方法,校正过的仪器等误差有正负之分E>0误差为正,测定值较真值偏高E<0误差为负,测定值较真值偏低如:对于1000kg和10kg,绝对误差相同(±1kg),但产生的相对误差却不同。0.1%100%10001RE%10%100%101RE%结论:相对误差可用来比较不同情况下测定结果的准确度,更具有实用意义。二.精密度与偏差1.几个定义精密度一组平行测定值相互接近的程度。偏差是衡量数据精密度高低的尺度。偏差越小,数据的分散性越小,测定值的精密度越高。第一组1.101.121.111.111.10第二组1.101.181.151.131.16在实际分析中,真实值难以得到,常以多次平行测定结果的算术平均值代替真实值。2.偏差的表示方法(一)绝对偏差、平均偏差与相对平均偏差绝对偏差(d)=个别测定值xi-测定平均值有正负号,偏差的大小反映了精密度的好坏,即多次测定结果相互吻合的程度在一般的分析工作中,常用平均偏差和相对平均偏差来衡量一组测得值的精密度,平均偏差是各个偏差的绝对值的平均值,如果不取绝对值,各个偏差之和可能等于零。平均偏差相对平均偏差:平均偏差没有正负号,平均偏差小,表明这一组分析结果的精密度好,平均偏差是平均值,它可以代表一组测得值中任何一个数据的偏差。ndnddddddniin14321||||||||||||%100Xddr例:测定某试样中氯的百分含量,三次分析结果分别为25.12、25.21和25.09,计算平均偏差和相对平均偏差。如果真实百分含量为25.10,计算绝对误差和相对误差。解:平均值平均偏差相对平均偏差=(0.05/25.14)×100%=0.2%绝对误差Ea=25.14-25.10=+0.04(%)相对误差Er=(+0.04/25.10)×100%=+0.2%X25122521250932514....(%)d0020070053005....(%)测定数据/%第一组10.3,9.8,9.4,10.2,10.1,10.4,10.0,9.7,10.2,9.7第二组10.0,10.1,9.3*,10.2,9.9,9.8,10.5*,9.8,10.3,9.9平均偏差和相对平均偏差不能准确的反映大偏差的存在。10.010.00.24%0.24%2.4%2.4%Xdrd例:测定合金中铜含量(%)的两组结果如下总体在一定的条件下,对某试样进行无限多次测定,所得数据的全体。------总体标准偏差б样本随机从总体中抽出的一组数据。------样本标准偏差:s样本容量样本中所包含测定值的数目。(二)标准偏差(均方根偏差)在数理统计中常用标准偏差来衡量数据的精密度有限测定次数:样本标准偏差:s21()1niixxSnf=n-1-自由度,指独立变量的个数,可供选择的机会样本相对标准偏差(变异系数):Sr,RSD或CV(变异系数)表示实际工作中:常用样本相对标准偏差表示分析结果的精密度100%rsSx请看下面两组测定值:甲组:2.92.93.03.13.1乙组:2.83.03.03.03.2甲组乙组平均值3.03.0平均偏差0.080.08标准偏差0.080.14∴标准偏差能很好地反映测定的精密度(三)平均值的标准偏差m个n次平行测定的平均值:由统计学可得:平均值的标准偏差与测定次数的平方根成反比一般:3-4次有nssxmXXXX,,,321n<5n>5n>10随n增加迅速减小减小变慢减小不明显增加测量次数可以提高精密度。增加(过多)测量次数的代价不一定能从减小误差得到补偿一般:3-4次小结:准确度常用误差来表示,误差越小,准确度越高,而且用相对误差更为确切。精密度的大小常用偏差表示。在偏差的表示中,用标准偏差更合理,因为将单次测定值的偏差平方后,能将较大的偏差显著地表现出来。在科研论文中,常用标准偏差表示精密度;在学生实验中,常用平均偏差表示精密度。三.准确度与精密度的关系准确度精密度系统误差随机误差甲乙丙丁Tx精密度高、准确度低精密度高、准确度高精密度低,不科学精密度低、准确度低①准确度表示测量的正确性→由系统误差和偶然误差共同决定。②精密度表示测量的重复性→由偶然误差决定。③准确度高一定要求精密度高,但精密度好,准确度不一定高(1)精密度与准确度都很高。(2)精度很高,但准确度不高。(3)精度不高,准确度也不高。22四、系统误差(SystematicError)和随机误差(RandomError)(一)系统误差1.产生原因由确定的、经常性的因素引起,对测定值的影响比较恒定。方法误差来源于分析方法本身不够完善或有缺陷。例:滴定分析中指示剂的变色点(滴定终点)与化学计量点不一致。NaOH+HCl====NaCl+H2O化学计量点pH=7甲基橙指示剂滴定终点pH≈4方法误差仪器与试剂误差仪器不够精确或未经校准;试剂不纯或蒸馏水中有微量杂质。操作误差因分析者的操作与正确的操作规程有所出入而引起;而“个人误差”则由分析者的主观因素造成,但都是有确定原因的。2.特点重现性重复测定时会出复出现(条件相同);单向性使测定结果系统偏高(正误差)或系统偏低(负误差),数值大小也有规律;可测性找出原因后可以减免(可校正),因此又称可测误差。3.影响影响分析结果的准确度(使其与真值不相符合),是定量分析中误差的主要来源。(二)偶然误差(随机误差,不可定误差)由某些微小的偶然因素(如环境,湿度,温度,气压的波动,仪器的微小变化等)引起的误差如,同一坩埚称重(同一天平,砝码),得到以下克数:29.3465,29.3463,29.3464,29.3466对于天平称量,原因可能有以下几种:1)天平本身有一点变动性2)天平箱内温度有微小变化3)坩埚和砝码上吸附着微量水分的变化4)空气中尘埃降落速度的不恒定特点:随机性(大小、正负不定)不可消除(原因不定)但可减小(测定次数↑,一般平行测定3-4次)分布服从统计学规律(正态分布)(三)过失误差由于操作者的过失而引起的误差(损失试样、加错试样、记录或计算错误等)--错误。(四)如何提高分析结果准确度?减少误差的方法1.选择合适的分析方法根据待测组分的含量、性质、试样的组成及对准确度的要求。2.减少测量误差控制取样量:天平称量取样0.2g(为什么?)以上,滴定剂体积大于20mL(为什么?)。3.增加平行测定次数,减小偶然误差化学分析中通常要求平行测定3~4次。4.消除系统误差可见,试样的质量必须在0.2g以上才能保证称量误差在0.1%以下。减少或消除系统误差方法校准仪器:消除仪器的误差主要校准砝码、容量瓶、移液管,以及容量瓶与移液管的配套校准。空白试验:消除试剂误差不加试样但完全照测定方法进行操作的试验,消除由干扰杂质或溶剂对器皿腐蚀等所产生的系统误差。空白值需扣除。空白值过大,则需提纯试剂或换容器。对照实验:消除方法误差采用标准样比对法或加入回收法、选择标准方法、相互校验(内检、外检等)等方法对照。标准样比对法或方法校正:用其他方法校正1.称取一定量无水碳酸钠溶解后定容于250mL容量瓶中,量取25mL用以标定盐酸,容量瓶和移液管采取的校准方法是:()A.容量瓶绝对校准B.容量瓶和移液管相对校准C.移液管绝对校准D.不用校准2.重量分析中沉淀的溶解损失所属误差是()A.过失误差B.操作误差C.系统误差D.随机误差练习题BC303.偶然误差不可避免,减少偶然误差可采用(D)A.对照试验B.空白试验C.进行量器的校准D.增加平行测定次数4.2随机误差的正态分布一.正态分布曲线N(μ,σ2)和标准正态分布曲线*定量描述偶然误差(随机事件)的基本规律的数学图形*反映了误差值的大小与其出现的概率之间的定量关系。*正态分布是以无限多次测量为基础测量值的正态分布曲线N(,2)yµx0µ-xσ=1σ=2正态分布曲线规律:*单峰性:小误差出现概率大,大误差出现概率小,很大误差出现概率极小。误差分布曲线只有一个峰值。体现了测量值的集中趋势。*对称性:正误差和负误差出现的概率相等,误差分布曲线是对称的。*抵偿性:随机误差的算术平均值的极限为零。*有界性:大误差出现概率很小,误差很大的测量值,往往由过失误差造成的。对这种数据应作适当处理。标准正态分布曲线N(0,1)为了将不同精密度的正态分布曲线统一起来,令u=x-u/σ为横坐标表示的正态分布曲线xu横坐标:u纵坐标:误差出现的概率大小。二.随机误差的区间概率正态分布曲线下面某区间的面积,表示了随机误差在此区间出现的概率。4.3有限测定数据的统计处理一、t分布曲线二、平均值的置信区间三、可疑值的取舍四、显著性检验一.t分布曲线有限次测量数据(n≤20)横坐标为统计量tt的涵义:平均值的误差(x-u)以平均值的标准偏差为单位表示xsxt注意:1.t分布是以有限次数测量为基础2.t分布曲线的陡度为自由度df(df=n-1)有关,当df=∞,即n=∞,t分布与正态分布曲线一致。二.置信度与置信区间-分析结果的表示置信区间:真值u按一定概率落在的范围置信度(置信水平)P:真值包含在所给定范围内的概率置信度高,置信区间范围越宽真值u与平均值之间的关系(平均值的置信区间)nstxstxxx讨论:(1)置信区间的宽窄与置信度、测定次数和测定值的精密度有关,当S小,n↑,置信区间↓,平均值越接近真值,平均值越可靠。(2)置信度↑,置信区间↑,其区间包括真值的可能性↑,一般将置信度定为95%或90%。三、可疑测定值的取舍1.可疑测定值的定义可疑测定值又称为异常值(离群值),在一组平行测定值中,与其它数据相差较大。2.对可疑值进行取舍的实质区分可疑值与其它值之间的差异到底是由随机误差(留)还是由过失(舍)所引起,从而以一定的概率决定对其进行取舍。11211XXXXQXXXXQnnnn或3.对可疑值进行取舍的方法(一)Q检验法步骤:(1)数据排列X1X2……Xn可疑值应在两端(双侧);(2)求极差Xn-X1(3)求可疑数据与相邻数据之差Xn-Xn-1或X2-X1(4)计算:(5)根据测定次数n和舍取的置信度P(一般定为0.09)查表,找出相应值;(6)将Q与Qp,n(如Q90)相比,若QQp.n舍弃该数据,(过失误差造成)若QQp,n保留该数据,(偶然误差所致)·注意事项:△不要在3个数据中舍去一个;△取舍两难时,可在相同条件下补测1、2次,再进行检验;△如果没有条件再补测,宜取中位值报告测定结果,因为中位值也反映了测定值的集中趋势。P97,例4-11(二).格鲁布斯(Grubbs)检验法(4)由测定次数和要求的置信度,查表得G表(5)比较若G计算G