分析化学中的数据处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章分析化学中的数据处理53第三章分析化学中的数据处理§3.1误差及其表示方法定量分析(QuantitiveAnalysis)的目的是通过一系列的分析步骤,来获得被测组分的准确含量。但是,即使最可靠的分析方法,使用最精密的仪器,由技术最熟练的分析人员操作,也难获得绝对准确的结果。由同一个人,在同样条件下对同一试样进行多次测定,所得结果也不一定是一致的。即分析过程中误差是客观存在的。所以我们应根据实际需要对分析结果的可靠性和精确程度作出合理的评价和正确的表示。同时还应查明产生误差的原因及其规律性,采取减免误差的有效措施,从而不断提高分析测定的准确程度。一、误差的分类根据误差的来源和性质,可将误差分为两类:1.系统误差系统误差又称可测误差,是由某种固定的原因引起的误差。它们的突出特点是:A.单向性:它对分析结果的影响比较固定,可使测定结果系统偏低或偏高。B.重现性:当重复测定时,它会重复出现。增加测定次数不能使系统误差减小。C.可测性:一般来说产生系统误差的具体原因都是可以找到的。因此也就能够测定它的大小,正负,至少在理论上说是可以测定的,所以又称为可测误差。根据系统误差产生的具体原因,又可把系统误差分为:(1)方法误差:是由分析方法本身不够完善或有缺陷而造成的,如滴定分析中所选用的指示剂指示的终点与计量点不相符;分析中干扰离子的影响未清除;重量分析中沉淀的溶解损失等。(2)仪器误差:由仪器本身不准确造成。如天平两臂不等,滴定管刻度不准,砝码未经校正。(3)试剂误差:所使用的试剂或蒸馏水不纯而造成的误差。(4)主观误差(操作误差):由操作人员一些生理上或习惯上的主观原因造成的。如终点颜色的判断;重复滴定时,有人总想第二份滴定结果与第一份相吻合。在判断终点读数时,就有“先入为主”的影响。2.偶然误差(或称随机误差、未定误差)它是由无法避免和无法控制的偶然因素造成的。如测定时环境温度、湿度、仪器性能的微笑变化,或个人一时的辨别的差异而使读数不一致等。如天平和滴定管最后一位读数的不确定性。它的特点:大小和方向都不固定,也无法测量和校正,但多次测定也有规律性。A.对称性:经过多次重复测定,随机误差大小相等的正负误差出现的几率相等。B.单峰性:小误差出现的机会多,大误差出现的机会少。C.有界性:超出3的误差出现的机会很少,应属于过失。第三章分析化学中的数据处理543.过失误差由于分析人员工作上粗枝大叶不遵守操作规程等造成过失误差。如器皿不洁净、丢损试液,加错试剂,看错砝码,记录或计算错误等。二、准确度和精密度1、准确度和误差准确度指测定值x和真实值T之间接近的程度,两者越接近准确度越高。用误差来衡量准确度的高低。绝对误差:aEXTaEXT相对误差:100%arEET绝对误差只反映误差的大小,而不能反映误差在真值中所占的百分率,所以相对误差更便于比较各种情况下测定结果的准确度。准确度的高低体现了在分析过程中,系统误差和随机误差对测定结果综合影响的大小,它决定了测定值的正确性。在实际工作中,真实值常常是不知道的,因此无法求出分析结果的准确度,因此不得不用另外一种方式来判断分析结果的好坏。2、精密度和偏差精密度指各次分析结果相互接近的程度,它反映了测定值的再现性。精密度的高低用偏差来衡量。偏差越小,精密度越高。常用的几种偏差表示方法为:(1)绝对偏差iidxx(i=1,2,3,…..n)有“+”、“-”之分11niixxn相对偏差100%100%iirxxddxx平均偏差12........1niddddxxnn无“+,-”之分相对平均偏差100%rddx平均值虽然不是真值,但比单次测定结果更接近真值。而且平均值反映了测定数据的集中趋势,因此,测定值与平均值之差就体现了精密度的高低。通常以测定结果的相对平均偏差来衡量。(2)标准偏差与相对标准偏差使用平均偏差表示精密度比较简单,但这个表示方法有不足之处,因为在一系列的测定中,小偏差的测定总是占多数,大偏差占少数,按总的测定次数去求平均偏差,则大偏差得不到反映。因此,数理统计中,常采用标准偏差(标准差)来反映精密度。第三章分析化学中的数据处理55在数理统计中,将一定条件下无限多次测定值称为总体,从总体中随机抽出的一组测定值称为样本,样本所含测定值的数目称为样本的大小或容量。若样本容量为n,平行测定数据为12......nxxx,,则此样本平均值为1ixxn当测定次数无限增多时,所得的平均值为总体平均值为:limnx当消除了系统误差后,得到的总体平均值(n30)即为待测组分的真值T。当测定次数无限时,总体标准偏差表示了各测定值ix对总体平均值的偏离程度。总体标准偏差2()ixn2:方差ix被平方,即强调了大偏差的作用。一般测定次数n20,总体平均值不知道,则采用样本标准偏差来衡量该组数据的精密度:22()11iixxdsnnf=n-1:自由度(在n次测量中只有n-1个可变的偏差)样本的相对标准偏差(变异系数cv)为:100xssr%以上反映了单位测定值的精密度。(3)平均值的标准偏差如果从同一总体中抽出容量相同的数个样本,由此可以得到一系列样本的平均值12,,.....nxxx。这些平均值也不会完全一致,但与任一样本中的各单位测定值相比,这些平均值的波动性更小,即精密度更高。()xnnx:平均值的标准偏差;单次测定值的标准偏差有限次数的测定则有:xssn第三章分析化学中的数据处理56xs:样本平均值的标准偏差。*当n时,x,d(无限多次测定时的平均偏差)用统计学方法可以证明,n,标准偏差与平均偏差有下列关系:0.79790.80但如果测定次数少,d与s与此相差较大。(4)极差maxminRxx相对极差=100%Rx偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。3、准确度与精密度的关系准确度用误差来表示,反映了测定结果的正确性,它与系统误差和随机误差都有关系,体现了系统误差和随机误差对测定结果综合影响的大小。精密度用偏差来表示,反映了测定值的再现性,偏差的大小仅与随机误差有关,体现了随机误差对测定结果的影响。显然,精密度好,是保证准确度高的先决条件。但精密度好却不一定准确度高。只有在消除了系统误差的前提下,精密度好其准确度必然高。三、误差的减免1、系统误差的消除可以采用一些校正的办法和制定标准规程的办法加以校正,使之接近消除。(1)采用标准方法,找出校正数据消除方法误差(2)实验前校正器皿和仪器消除仪器误差(3)做空白实验检验和消除试剂误差(4)做对照实验可以与标准试样的标准结果进行对照,与成熟的分析方法进行对照;由不同分析人员,不同实验室来进行对照实验。如对试样组分不完全清楚,可采用加标回收法。2、减小偶然误差由于多次测定后,偶然误差呈现一定规律性,故在消除系统误差的情况下,增加测定次数,取其平均值来消除或减小偶然误差。§3.2随机误差的统计规律一、频数分布以下是在不涉及系统误差的情况下讨论的。第三章分析化学中的数据处理57频数:每组内的数据个数根据测量数据的组值与响应的频数(或相对频数)绘制成频率分布直方图。相对频数=频数样本容量由于随机误差的存在,分析数据具有分散性,又有向某个中心值集中的趋势,这种既分散又集中的特性就是随机误差分布的规律。二、正态分布当测量次数无限时,测量数据一般符合正态分布规律,其概论密度函数为:22()2xe1y=f(x)=2y就是测定值ix出现的概论大小。:曲线的最高点对应的横坐标就是,即总体平均值,平均值出现的概论最大,消除了系统误差。T:总体标准偏差,是拐点之一到直线x的距离,表征测定值的分散程度。小,峰瘦高;大,峰胖矮(对于同一总体)。一旦、确定,正态分布曲线的位置和形状也就确定了。所以、是正态分布的两个基本参数。这种正态分布用2N(、)表示。如果用x代替x,就得到了随机误差的正态分布曲线。随机误差的特征:(1)对称性(2)单峰性(3)有界性:绝对值很大的误差出现的概率很小。第三章分析化学中的数据处理58三、标准正态分布以标准偏差为单位表示随机误差,引入变量u。xu正态分布曲线就变换为以标准偏差为单位的u值做横坐标的标准正态分布曲线,相应以u值为变量的函数()u称为标准正态分布概率密度函数。221()2uyue标准正态分布记为N(0,1),标准正态分布曲线见图3-3。四、随机误差概率的计算标准正态分布曲线与横坐标到之间的所夹的面积,代表所有数据出现的总概率,其值为100%即1。因此落在0到u范围内的测量值出现的概率,就应为其所包围的面积与总面积之比。即概率=面积=0()uudu不同u值时所占面积已用积分方法求得,并绘成各种形式的概率积分表,供查用。第三章分析化学中的数据处理59例1计算测量值落在区间1.64内的概率。解:概率=面积=0()uuduxuxu查积分表1.64时,面积为0.4495,求得测量值落在区间1.64内的概率P=20.4495=89.9%。同理,可求出测量值落在其它区间的概率为:面积区间概率%1.00.341368.31.960.47501.9695.02.00.4773295.52.580.49512.5899.03.00.4987399.7例2某班学生的117个数据基本遵从正态分布N(66.62,0.212)求数据落在66.20~67.08中的概率及大于67.08的数据可能有几个?解:=66.62=0.21当x=66.20时,66.2066.622.00.21x查2.19时,概率为0.4773第三章分析化学中的数据处理60当x=67.08时67.0866.622.190.21x查2.19时,概率为0.4857缺图数据落在66.20~67.08内的概率为0.4774+0.4857=96.3%数据大于67.08的概率为:P=0.5-0.4857=0.0143可能的个数为:1170.01432个§3.3少量数据的统计处理正态分布是无限测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限的测量。如何以统计的方法处理有限次测量数据,使其能合理地推断总体的特性?这是本节讨论的问题。一、t分布曲线当测量数据不多时,总体标准偏差是不知道的,只好用样本标准偏差s来估计测定的分散情况。用s代替,必然引起正态分布的偏差,这时可用t分布来处理,t分布如图3-4所示,纵标仍为概率密度,但横坐标为统计量t。t定义为:x-t=st分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。f时,t分布就趋近正态分布。与正态分布曲线一样,t分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。不同的是t分布曲线形状不仅随t值而改变。t值已计算出来。第三章分析化学中的数据处理61表中置信度用P表示,它表示在某一t值时,测定值落在()ts范围内的概率,落在此范围之外的概率为(1-P)称为显著性水准,用α表示。由于t值与置信度及自由度有关,一般表示为fpt,。例0.05,10t,表示置信度为95%,自由度为10时的t值。理论上,只有当f,各置信度对应的t值才与相应的u值一致,实际上,f=20时,t值与u值已十分接近了。二、平均值的置信区间由随机误差的区间概率可知,当用单次测量结果(x)来估计总体平均值的范围,则包括在(1)x范围内的P=68.3%,在(1.64)x范围内的概率P=90%;在(1.96)x范围内的概率为95%。它的数字表达式:xu不同置信度的u值可查表得到。若以样本平均值来估计总体平均值可能存在的区间,可按式uxn对于少量数据,必须根据t分布进行统计处理。则有xtsxtsxn第三章分析化学中的数据处

1 / 19
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功