第四章误差和分析数据的处理§4.1误差的基本概念§4.2随机误差的正态分布§4.3有限测定数据的统计处理§4.4提高分析结果准确度的方法§4.5有效数字及其运算规则§4.6Excel在实验数据处理中的应用(自学)§4.1误差的基本概念一、准确度与误差准确度是指测定结果与真实值接近的程度。准确度的高低是用误差来衡量的。误差越小,说明分析结果的准确度越高。误差可分为绝对误差和相对误差。绝对误差(Ea)=测定值(x)-真实值(T)100%TEEr)真实值()绝对误差(相对误差绝对误差和相对误差都有正值和负值之分,正值表示分析结果偏高,负值表示分析结果偏低;(p77:例4-1)两次分析结果的绝对误差相等,它们的相对误差却不一定相等。例1:用万分之一的分析天平直接称量两金属铜块,其重量分别为5.0000g和0.5000g,由于使用同一台分析天平,两铜块重量的绝对误差均为±0.0001g,但其相对误差分别为多少?%002.0%1000000.50001.0%02.0%1005000.00001.0※用相对误差表示分析结果的准确性更为确切。相对误差更具实际意义。称量物质量越大,相对误差越小,测定的准确度就越高。二、精密度与偏差精密度:在相同条件下,用同样的方法,对同一试样进行多次平行测定时所得数值之间相互接近的程度。精密度的高低用偏差来衡量下面先介绍一些基本术语niixnx111、总体(母体)与样本(子样)总体:对于所考察对象的全体样本:自总体中随机抽出的一组测量值2、样本大小(容量):样本中所含测量值的数目。幻灯片73、中位数xM:数据由小到大排列后中间的那个数(n为奇数)或中间相邻两个数据的平均值(n为偶数)。4、样本平均值与总体平均值:niinxn11lim在无系统误差存在的前提下,μ=xT例如:分析濠河水总硬度,依照取样规则,从濠河中取来供分析用2000mL样品水,这2000mL样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是濠河样品水的一个随机样本,样本容量为20。5、绝对偏差、相对偏差、样本平均偏差与相对平均偏差平均偏差是否在任何情况下都能反映精密度的好坏呢?)20(1nnxxdnii%100xddr100%xddr)平均值()绝对偏差(相对偏差)()()(xxdi算术平均值个别测定值绝对偏差例2:甲乙两学生进行铜合金中铜含量的测定实验,得到如下两组数据(铜的质量分数%)10.3,9.8,9.6,10.2,10.1,10.4,10.0,9.7,10.2,9.710.0,10.1,9.3*,10.2,9.9,9.8,10.5*,9.8,10.3,9.9分别求这两组数据的平均值、平均偏差和相对平均偏差。经过计算发现两组数据的平均偏差都为0.24%,但显然第二组数据比较分散,并且有过大和过小的值,因此用平均偏差已不能反映出这两组数据的精密度的差异。6、总体标准偏差与样本标准偏差总体标准偏差nxi2)(样本标准偏差1)(2nxxsi无限次测量对总体平均值的离散有限次测量对平均值的离散1nf7、相对标准偏差(变异系数)例3:求例2中两组数据的标准偏差与相对标准偏差。s比平均偏差好,因为将单次测定的偏差平方之后,较大的偏差能更好地反映出来,能更清楚地说明数据的分散程度。8、平均值的总体标准偏差与平均值的标准偏差%100%xsRSDnxnssx对有限次测量:nssx结论:1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。ssx测量次数0.00.20.40.60.81.005101520259、极差(R):测定数据中最大值与最小值之间的差值,其值越大表示测定结果越分散。三、准确度与精密度的关系:例如,甲、乙、丙三人同时测定某一铁矿石中Fe2O3的含量(真实含量为50.36%),各分析四次,测定结果如下:甲:50.30%乙:50.40%丙:50.36%50.3050.3050.3550.2850.2550.3450.2750.2350.33平均值:50.2950.3050.35将所得数据绘于下图:准确度与精密度的关系精密度是保证准确度的先决条件。精密度高不一定准确度高,但准确度高一定要求精密度高。若精密度很差,说明测定结果不可靠,也就失去了衡量准确度的前提。在真实值未知的情况下,精密度更为重要。误差表示分析结果偏离真值的程度,而偏差表示数据分散的程度。四、系统误差与随机误差1、系统误差又称为可测误差,它是由于分析过程中某些固定的原因造成的,使分析结果偏低或偏高。A特点重复性;单向性;可测性B产生原因:(1)方法误差(重量分析中,沉淀的溶解损失、共沉淀现象、灼烧过程中沉淀的分解或挥发;滴定分析中,反应进行不完全、滴定终点与化学计量点不符合、指示剂选择不恰当、杂质的干扰等)(2)仪器误差(天平砝码不够准确,滴定管、容量瓶和移液管的刻度有一定误差等);(3)试剂误差(试剂不纯和蒸馏水不纯,含被测组分或有干扰的杂质离子等);(4)操作误差(滴定速度太快、读数偏高或偏低、终点颜色辨别偏深或偏浅,平行测定时,主观希望前后测定结果吻合等):对于同一操作者具有单向性。注:过失误差(溶液的溅失,加错试剂,读错读数,记录和计算错误等)2、随机误差又称为偶然误差或不可测误差,它是由一些随机的或偶然因素引起的。A特点:不确定性B产生的原因:偶然因素(室温、温度、气压的微小变化)C减免措施:增加平行测定的次数,取其平均值系统误差与随机误差有时也会同时存在而不易区分。一、随机误差的正态分布随机误差的出现符合下列规律:(1)正误差和负误差出现的概率相等(2)小误差出现的次数占绝大多数,大误差出现的次数少,个别特别大的误差出现的次数极少二、正态分布与标准正态分布1、正态分布§4.2随机误差的正态分布22221xexfy从标准正态分布曲线可知:σ:无限次测量的标准偏差μ真值:无限次测量的平均值或总体平均值对于无限次测定,结果落在μ±σ范围内的概率是68.3%;落在μ±2σ范围内的概率是95.5%;落在μ±3σ范围内的概率是99.7%。这种测定值在一定范围内出现的几率称为置信度p。测定值落在一定范围以外的几率(1-p)称为显著性水平α。22221xexfy2、标准正态分布曲线——u分布曲线将正态分布曲线的横坐标用u来表示。令则xu2221uuey§4.3有限测定数据的统计处理一、置信度和置信区间几个重要概念置信度(P):真值出现在置信区间内的概率。显著性水平α:落在此范围之外的概率α=1-P自由度f:f=n-1真值的置信区间:通过无限多次测定所估计出的真值可能存在的范围。平均值的置信区间:通过有限次测定所估计出的真值可能存在的范围。二、标准正态分布与t分布1.标准正态分布——描述无限次测量数据t分布——描述有限次测量数据标准正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t分布曲线处理。纵坐标仍为概率密度,但横坐标为统计量t。t定义为:sxtfP,fPt,是随置信度P和自由度f变化的统计量2.平均值的置信区间由少量测定结果均值估计μ的置信区间nstxstxfPxfP,,总体平均值有限次测量均值xt值可从书p90:表4-3查到%95%10.0%50.47在内的概率为包括总体均值的区间内理解为在解:%95%10.0%50.47P置信度?如何理解例4:对某试样中SiO2含量进行测定,4次测定结果为47.64%,47.69%,47.52%和47.55%,计算置信度为90%,95%时的平均值μ的置信区间。解:18.3%953,05.0tP%13.0%60.474%08.018.3%60.47%60.474%55.47%52.47%69.47%64.47x%08.012nxxs35.2%903,10.0tP%09.0%60.474%08.035.2%60.47置信度高,置信区间大。区间的大小反映估计的精度,置信度的高低说明估计的把握程度。例5:书p114:17三、可疑测定值(cutlier)的取舍在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。处理方法有Q检验法和格鲁布斯(Grubbs)法。1.Q检验法设一组数据,从小到大排列为:x1,x2,……,xn-1,xn设x1、xn为异常值,则统计量Q为:式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。Q值越大,说明xn离群越远。Q称为“舍弃商”。当Q计算Q表时,异常值应舍去,否则应予保留。例6:书p97:例4-1111xxxxQnnn112xxxxQn2.格鲁布斯(Grubbs)法有一组数据,从小到大排列为:x1,x2,……,xn-1,xn其中x1或xn可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量G进行判断。若GGP,n,则异常值应舍去,否则应保留。sxxG1sxxGn练习例7:测定某药物中钴的含量,得结果如下:1.25,1.27,1.31,1.40μg/g,试问1.40这个数据是否应该保留?(用G检验法,P=0.95)36.1066.031.140.1066.0,31.1sxxGsx异常46.14,95.04,05.0GnP这个数应该保留40.14,05.0GG解:四、显著性检验用统计学的方法检验测定结果之间是否存在显著性差异,以此来推断是否存在方法误差1、样本平均值与真值的比较——t检验法2、两组数据平均值精密度的比较——F检验法(略)3、两组平均值的比较——F检验和t检验(略)1、样本平均值与标准值的比较——t检验法已知真值的t检验(准确度显著性检验)nstx由nsxt)1(nftPfP自由度时,查临界值表在一定,判断:,则存在显著性差异如fPtt,,则不存在显著性差异如fPtt,例8:采用某种新方法测定基准明矾中铝的百分含量,其真值为10.77%,得到以下九个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。试问采用新方法后,是否引起系统误差?(P=95%)8199fn%04.0%,79.10sx50.19%04.0%77.10%79.10t31.28,95.08,05.0tfP时,当之间无显著性差异与因xtt8,05.0解:由此可见,对有限次测定分析结果的处理应包括下列步骤:①进行可疑值的取舍②进行t检验,排除可能的方法误差③求出平均值的置信区间④用合适的有效数字表示测定结果§4.4提高分析结果准确度的方法一、选择合适的分析方法常量组分分析:相对误差0.2%微量组分分析:相对误差1%~5%滴定分析法、重量分析法:相对误差千分之几仪器分析法:相对误差5%根据试样的具体情况、对准确度的要求以及客观实际条件等综合考虑后选择合适的分析方法二、减小测量的相对误差试样质量绝对误差相对误差相对误差绝对误差试样质量分析天平每次称量误差为±0.0001克。一份样品需称量两次,最大绝对误差为±0.0002克,若要求相对误差0.1%。计算试样的最小质量。溶液体积绝对误差相对误差相对误差绝对误差溶液体积滴定管每次读数误差为±0.01mL。一次滴定中,需读数两次,最大绝对误差为±0.02mL,若要求相对误差0.1%。计算消耗溶液的最小体积。三、增加平行测定次数,减小随机误差四、消除测定过程的系统误差对照试验——检验是否存在方法系统误差空白实验