第二章误差及分析数据的处理本章教学要求:1、误差、偏差的概念及表达。2、误差产生的原因及特点,避免方法。3、有限次测定数据的处理方法4、有效数字的位数及运算方法重点:误差、偏差的概念及表达;有效数字的位数及运算方法;有限次测定数据的处理方法。难点:有限次测定数据的处理方法第一节概述•误差客观存在•定量分析数据的归纳和取舍(有效数字)•计算误差,评估和表达结果的可靠性和精密度•了解原因和规律,减小误差,测量结果→真值第二节测量误差一、误差分类及产生原因二、误差的表示方法三、提高分析结果准确度的方法一、误差分类及产生原因(一)系统误差及其产生原因(二)偶然误差及其产生原因(一)系统误差(可定误差):由可定原因产生1.特点:2.分类:按来源分a.方法误差:方法不恰当产生b.仪器与试剂误差:仪器不精确和试剂中含被测组分或不纯组分产生c.操作误差:操作方法不当引起单向性、可消除、重现(二)偶然误差(随机误差,不可定误差):由不确定原因引起特点:1)不具单向性(大小、正负不定)2)不可消除(原因不定)但可减小(测定次数↑)3)分布服从统计学规律(正态分布)二、误差的表示方法(一)准确度与误差(二)精密度与偏差(三)准确度与精密度的关系(一)准确度与误差1.准确度:指测量结果与真值的接近程度2.误差(1)绝对误差:测量值与真实值之差(2)相对误差:绝对误差占真实值的百分比aExT100%arEET注:1)测高含量组分,Er可小;测低含量组分,Er可大2)仪器分析法——测低含量组分,Er大化学分析法——测高含量组分,Er小注:T未知,Ea已知,可用均值代替T例:滴定的体积误差VEaEr20.00mL0.02mL0.1%2.00mL0.02mL1.0%说明?(二)精密度与偏差1.精密度:平行测量的各测量值间的相互接近程度2.偏差:(1)绝对偏差:单次测量值与平均值之差(2)相对偏差:绝对偏差占平均值的百分比dxxi100%100%irxxddxx续前(3)平均偏差:各测量值绝对偏差的算术平均值(4)相对平均偏差:平均偏差占平均值的百分比nxxdi100%100%irxxddxnx(5)标准偏差:(6)相对标准偏差(变异系数)nxniix12)(1)(12nxxSniixRSDSxx100%μ未知μ已知什么是?(7)平均值的标准偏差()XS对于有限次的测定值而言,平均值的标准偏差与测定次数的平方根成反比。xXSSn测定次数越多,可减小随机误差的影响你,数据的标准偏差越小,精密度越大。1.平均值的标准偏差设有一样品,m个分析工作者对其进行分析,每人测n次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。试样总体样本1样本2……样本mmmnmmmnnxxxxxxxxxxxxxxx,......,,......,......,,,......,,3212223222111131211xxxxxm.......,,321平均值的标准偏差一定比单个样品n次测定的s要小xs对有限次测量:nssx1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。一般3~4次就可以了。结论:xS测量次数0.00.20.40.60.81.00510152025平均值的总体标准偏差:nx平均值的标准偏差单次测定结果的s之间的关系xs(三)准确度与精密度的关系1.准确度高,要求精密度一定高但精密度好,准确度不一定高2.准确度反映了测量结果的正确性精密度反映了测量结果的重现性练习例:用丁二酮肟重量法测定钢铁中Ni的百分含量,结果为10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。解:%43.10x%036.05%18.0nddi%35.0%100%43.10%036.0%100xd%046.0106.44106.81472ndsi%44.0%10043.10%046.0%100xs三、提高分析结果准确度的方法1.选择合适的分析方法例:测全Fe含量K2Cr2O7法40.20%±0.2%×40.20%比色法40.20%±2.0%×40.20%2.减小测量误差1)称量例:天平一次的称量误差为0.0001g,两次的称量误差为0.0002g,RE%0.1%,计算最少称样量?REw%..200001100%01%gw2000.0续前2)滴定例:滴定管一次的读数误差为0.01mL,两次的读数误差为0.02mL,RE%0.1%,计算最少移液体积?3.增加平行测定次数,一般测3~4次以减小偶然误差4.消除测量过程中的系统误差1)校准仪器:消除仪器的误差2)空白试验:消除试剂误差3)对照实验:消除方法误差4)回收实验:加样回收,以检验是否存在方法误差mLV20REV%..2001100%01%第三节有效数字及其运算规则一、有效数字二、有效数字的修约规则三、有效数字的运算法则一、有效数字:实际可以测得的数字1.有效数字位数包括所有准确数字和一位欠准数字例:滴定读数20.30mL,最多可以读准三位第四位欠准(估计读数)±1%2.在0~9中,只有0既是有效数字,又是无效数字例:0.06050四位有效数字定位有效位数例:3600→3.6×103两位→3.60×103三位3.单位变换不影响有效数字位数例:10.00[mL]→0.001000[L]均为四位续前4.pH,pM,pK,lgC,lgK等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,整数部分只代表该数的方次例:pH=11.20→[H+]=6.3×10-12[mol/L]两位5.结果首位为8和9时,有效数字可以多计一位例:90.0%,可示为四位有效数字例:99.87%→99.9%进位二、有效数字的修约规则1.四舍六入五留双2.只能对数字进行一次性修约3.当对标准偏差修约时,修约后会使标准偏差结果变差,从而提高可信度例:s=0.134→修约至0.14,可信度↑例:0.37456,0.3745均修约至三位有效数字例:6.549,2.451一次修约至两位有效数字0.3740.3756.52.5三、有效数字的运算法则1.加减法:以小数点后位数最少的数为准(即以绝对误差最大的数为准)2.乘除法:以有效数字位数最少的数为准(即以相对误差最大的数为准)例:50.1+1.45+0.5812=?δ±0.1±0.01±0.000152.1例:0.0121×25.64×1.05782=?δ±0.0001±0.01±0.00001RE±0.8%±0.4%±0.009%0.328保留三位有效数字保留三位有效数字第四节偶然误差的正态分布一、偶然误差的正态分布和标准正态分布二、偶然误差的区间概率一、偶然误差的正态分布和标准正态分布正态分布的概率密度函数式1.x表示测量值,y为测量值出现的概率密度2.正态分布的两个重要参数(1)μ为无限次测量的总体均值,表示无限个数据的集中趋势(无系统误差时即为真值)(2)σ是总体标准差,表示数据的离散程度3.x-μ为偶然误差yfxex()()12222以x-μ~y作图正态分布曲线——x~N(μ,σ2)曲线yfxex()()12222x21)(xfy特点σ↑,y↓,数据分散,曲线平坦σ↓,y↑,数据集中,曲线尖锐测量值都落在-∞~+∞,总概率为1x=μ时,y最大→大部分测量值集中在算术平均值附近曲线以x=μ的直线为对称→正负误差出现的概率相等当x→﹣∞或﹢∞时,曲线渐进x轴,小误差出现的几率大,大误差出现的几率小,极大误差出现的几率极小标准正态分布曲线——x~N(0,1)曲线xu令2221)(uexfydudx又2221)(ueuy即以u~y作图注意:u是以σ为单位来表示随机误差x-μduuduedxxfu)(21)(22二、偶然误差的区间概率从-∞~+∞,所有测量值出现的总概率P为1,即偶然误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率121)(22ueduu标准正态分布区间概率%1,1xu%26.6864.1,64.1xu%9096.1,96.1xu%952,2xu%5.9558.2,58.2xu%0.993,3xu%7.99uu~正态分布概率积分表00.10.20.30.4-4-3-2-10123468.3%95.5%99.7%u-3-2-023x--3-2-++2+3x正态分布概率积分表练习例:已知某试样中Co的百分含量的标准值为1.75%,σ=0.10%,又已知测量时无系统误差,求分析结果落在(1.75±0.15)%范围内的概率。解:5.1%10.0%15.0%75.1xxu%64.868664.04332.02P查表练习例:同上题,求分析结果大于2.0%的概率。解:5.2%10.0)%75.100.2(xu%38.494938.0,5.2~0,Pu时从当查表可知%62.0%38.49%00.50'%0.2P的概率为分析结果大于第五节有限数据的统计处理和t分布一、正态分布与t分布区别二、平均值的精密度和平均值的置信区间三、显著性检验四、异常值的取舍一、正态分布与t分布区别1.正态分布——描述无限次测量数据t分布——描述有限次测量数据2.正态分布——横坐标为u,t分布——横坐标为t3.两者所包含面积均是一定范围内测量值出现的概率P正态分布:P随u变化;u一定,P一定t分布:P随t和f变化;t一定,概率P与f有关,xusxt1nfutf注:为总体均值为总体标准差差为有限次测量值的标准s两个重要概念置信度(置信水平)P:某一t值时,测量值出现在μ±t•s范围内的概率显著性水平α:落在此范围之外的概率fttP,下,一定值的,自由度为表示置信度为值的,自由度为表示置信度为tttt4%9910%954,01.010,05.0P1二、平均值的精密度和平均值的置信区间1.平均值的精密度(平均值的标准偏差)注:通常3~4次或5~9次测定足够nx例:nssxxn4xxss21n25xxss51总体均值标准差与单次测量值标准差的关系有限次测量均值标准差与单次测量值标准差的关系x,xnsn抽出样本总体续前2.平均值的置信区间(1)由单次测量结果估计μ的置信区间(2)由多次测量的样本平均值估计μ的置信区间(3)由少量测定结果均值估计μ的置信区间uxnuxuxxnstxstxxxnstxstxxfxf,,总体平均值有限次测量均值x续前•置信区间:一定置信度下,以测量结果为中心,包括总体均值的可信范围•平均值的置信区间:一定置信度下,以测量结果的均值为中心,包括总体均值的可信范围•置信限:结论:置信度越高,置信区间越大,估计区间包含真值的可能性↑置信区间——反映估计的精密度置信度——说明估计的把握程度uuxxst注意:(1)置信区间的概念:μ为定值,无随机性(2)单侧检验和双侧检验单侧——大于或者小于总体均值的范围双侧——同时大于和小于总体均值的范围练习例1:%95%10.0%50.47在内的概率为包括总体均值的区间内理解为在解:%95%10.0%50.47P置信度如何理解练习例2:对某未知试样中CL-的百分含量进行测定,4次结果为47.64%,47.69%,47.52%,47.55%,计算置信度为90%,95%和99%时的总体均值μ的置