第一节误差的基本概念第二节随机误差的正态分布第三节有限测定数据的统计处理第四节提高分析结果准确度的方法第五节有效数字及其运算规则第六节Excel在实验数据处理中的应用第四章误差与实验数据的处理第一节误差的基本概念一、准确度与误差二、精密度与偏差三、系统误差与随机误差一、准确度与误差1.准确度:指测量结果与真值的接近程度2.误差(1)绝对误差:测量值与真实值之差(2)相对误差:绝对误差占真实值的百分比注:1)测高含量组分,Er可小;测低含量组分,Er可大2)仪器分析法——测低含量组分,Er大化学分析法——测高含量组分,Er小Ea=-TxEr=a100%ET二、精密度与偏差1.精密度:平行数次测定值相互接近的程度2.偏差:(1)绝对偏差:单次测量值与平均值之差,有正负(2)相对偏差:绝对偏差占平均值的百分比,有正负idxx=100%100%irxxddxx(3)平均偏差:各测量值绝对偏差的算术平均值,无正负(4)相对平均偏差:平均偏差占平均值的百分比无正负nxxdi100%100%irxxddxnx(5)标准偏差:总体标准偏差样本标准偏差(6)相对标准偏差(变异系数)21()1niixxSn100%rSRSDSxnxniix12)(总体样本数据统计方法样本容量n:样本所含的个体数.抽样观测无限多次平行测定数据的全体从“总体”中随机抽出的一组测定值注:通常3~4次5~9次测定足够练习例:用丁二酮肟重量法测定钢铁中Ni的百分含量,结果为10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。解:%43.10x%036.05%18.0nddi%046.0106.44106.81472ndsi0.036%100%100%0.35%10.43%rddx0.046%100%100%0.44%10.43sRSDx(8)准确度与精密度的关系准确度:表示测定结果与真实值的符合程度精密度:表示测定结果的重现性真实值甲乙丙丁精密度准确度好好好差差差差?结论精密度是保证准确度的先决条件精密度差结果不可靠高的精密度不能保证高的准确度只有在消除系统误差后,精密度高,准确度才高。区别联系1.系统误差(systematicerror)又称可测误差,具有单向性、重现性,可测性方法误差---用其他方法校正仪器和试剂误差---校准操作误差---多实践三、系统误差和随机误差2.随机误差(randomerror)又称偶然误差、不确定误差,不具有单向性(大小、正负不定)不可消除(原因不定)但可减小(增加测定次数)服从统计规律。3.过失(mistake)粗心大意、违反操作规程,实质是错误。可以避免重做!第二节随机误差的正态分布一、频率分布二、正态分布三、随机误差的区间概率一、频率分布集中性、分散性测量值越多,分组越细,相对频数直方图→平滑曲线二、正态分布(一)正态分布曲线表达式1.x表示测量值,y为测量值出现的概率密度2.正态分布的两个重要参数(1)μ-无限次测量的总体平均值(无系统误差时即为真值),表示无限个数据的集中趋势,决定正态分布曲线在横坐标的位置。(2)σ-总体标准差,表示数据的离散程度,决定正态分布曲线的形状3.x-μ为随机误差yfxex()()12222(二)正态分布曲线的讨论12xy时,x=μ时,y最大→大部分测量值集中在算术平均值附近;曲线以x=μ的直线为对称轴;1、测定值的正态分布σ↑,y↓,数据分散,曲线平坦σ↓,y↑,数据集中,曲线尖锐正态分布N(μ,σ2)测量值都落在-∞~+∞,总概率为12、随机误差的正态分布1)正负误差出现的概率相等;2)小误差出现的概率大,大误差出现的概率小,特大误差出现的概率极小。σ越小,数据越集中,曲线呈“瘦高型”σ越大,数据越分散,曲线呈“矮胖型”标准正态分布曲线—N(0,1)表示注:u是以σ为单位来表示随机误差x-μdxdudxdu又则duuduedxxfu)(21)(222221)(ueuy即xu令2221)(uexfy3、标准正态分布(u分布)误差大于3σ舍去三、随机误差的区间概率1.随机误差的区间概率P—用一定区间的积分面积表示2.从-∞~+∞,所有测量值出现的总概率P为1221()12uPudue即正态分布概率积分表2u20=12uPedu概率相对面积即4.若区间为[-u,+u],概率×25.从概率计分表的概率确定误差界限例:P=95%,随机误差界限±1.96σ练习例:已知某试样中Co的百分含量的标准值为1.75%,σ=0.10%,又已知测量时无系统误差,求分析结果落在(1.75±0.15)%范围内的概率。解:5.1%10.0%15.0%75.1xxu%64.868664.04332.02P查表第三节有限数据的统计处理一、t分布曲线二、平均值的置信区间三、可疑值的取舍四、显著性检验一、t分布曲线1.正态分布——描述无限次测量数据及其随机误差t分布——描述有限次测量数据及其随机误差3.两者所包含面积均是一定范围内测量值出现的概率P正态分布:P随u变化;u一定,P一定t分布:P随t和f变化;t一定,概率P与f有关,xu1nf为总体均值为总体标准差差为有限次测量值的标准s2.正态分布——横坐标为u,t分布——横坐标为txts,ftus注:两个重要概念置信度(置信水平)P:某一t值时,测量值出现在(μ±t•s)范围内的概率显著性水平α:落在此范围之外的概率,fPtt一定下,0.05,100.95,1095%95%1010tttt表示置信度表示置为,自由度信度为,自由度为为的的值值P1,Pft教材:置信区间:一定置信度下,以测量结果为中心,包括总体平均值的可信范围范围愈小,测量值与u愈接近,测定准确度越高作用:根据有限的测定值来估计真值可能存在的范围1.置信区间的意义%95%10.0%50.47P置信度如何理解%95%10.0%50.47在内的概率为包括总体均值的区间内理解为在解:二、平均值的置信区间2.平均值的置信区间的计算(1)由单次测量结果估计μ的置信区间uxxxuxun总体平均值有限次测量均值xxsxtsxtn(3)由少量测定结果均值估计μ的置信区间(2)由多次测量的样本平均值估计μ的置信区间例2:对某未知试样中Cl-的百分含量进行测定,4次结果为47.64%,47.69%,47.52%,47.55%,计算置信度为90%,95%和99%时的总体均值μ的置信区间解:35.2%903,10.0tP%09.0%60.474%08.035.2%60.4718.3%953,05.0tP%13.0%60.474%08.018.3%60.4784.5%993,01.0tP%23.0%60.474%08.084.5%60.47%60.474%55.47%52.47%69.47%64.47x%08.012nxxssxtn置信度越高,置信区间越大三、可疑值的取舍——过失误差的判断可疑值(异常值):在平行测定数据中,与其它测定结果相差较大的个别值。4法Q检验法Grubbs法d(一)四倍法-4,xxd可疑舍弃1.计算(除可疑值外)的平均值和平均偏差2.计算可疑值与平均值的绝对差值3.绝对差值≥4,舍弃;否则保留d(二)Q检验法1.数据从小到大排列2.计算Q值11nnnxxQxx若x1为可疑值211nxxQxx3121,,,,,nnxxxxx若xn为可疑值3.查Q值表4.判断若QQ表,舍弃;否则保留Q值表测量次数n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49置信度:把握性,可信程度,统计概率(三)格鲁布斯法1.数据从小到大排列3.计算G值xxGs可疑3121,,,,,nnxxxxx2.计算该组数据的平均值和标准偏差4.查表比较若GGP,n,舍弃;否则保留练习例:测定某药物中钴的含量,得结果如下:1.25,1.27,1.31,1.40μg/g,试问1.40这个数据是否应该保留?36.1066.031.140.1066.0,31.1sxxGsx异常46.14,95.04,05.0GnP这个数应该保留40.14,05.0GG解:四、显著性检验——系统误差及偶然误差的判断(一)总体均值的检验——t检验法(准确度检验)(二)方差检验——F检验法(精密度检验)(一)总体均值的检验——t检验法1.平均值与标准值比较——已知真值的t检验(准确度显著性检验)nstx由nsxt(p90,4-3)(1)PfPtfn,在一定时,查临界值表表自由度判断:如ttP,f,则存在显著性差异如ttP,f,则不存在显著性差异例:采用某种新方法测定基准明矾中铝的百分含量,得到以下九个分析结果,10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。试问采用新方法后,是否引起系统误差?(P=95%)8199fn%042.0%,79.10Sx43.19%042.0%77.10%79.10t31.28,95.08,05.0tfP时,当之间无显著性差异与因xtt8,05.0解:xtns(二)方差(s2)检验——F检验法(精密度显著性检验)统计量F的定义:两组数据方差的比值21,,ffFP一定时,查判断:不存在显著性差异,则两组数据的精密度如表FF存在显著性差异,则两组数据的精密度如表FF22sFs大小即表中F为单边值注意:单侧检验,P=95%,α=0.05双侧检验,α=0.10,P=90%例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准偏差s1=0.055;用性能稍好的新仪器测定4次,得到标准偏差s2=0.022。试问新仪器的精密度是否显著地优于旧仪器?00048.0,022.0,40030.0,055.0,6222211小大ssnssn25.600048.00030.0F01.935%,95表小大,由FffP显著性差异两仪器的精密度不存在表FF解:单边检验,置信度为95%2.两组样本平均值的比较——未知真值的t检验(系统误差显著性检验)设两组分析数据为:1n1s1x2n2s2x12,ss当合并标准偏差221212111211nniiiiRxxxxsnn偏差平方和总自由度111121222121nnnsnssR(一)总体均值的检验——t检验法212121nnnnsxxtR12(2)PfPtfnn,在一定时,查临界值表总自由度判断:如ttP,f,则两组平均值存在显著性差异如ttP,f,则两组平均值不存在显著性差异例:用两种不同方法测定合金中铌的百分含量第一法1.26%1.25%1.22%第二法1.35%1.31%1.33%1.34%试问两种方法是否存在显著性差异(置信度90%)?%021.0%,24.1,3111sxn%017.0%,33.1,4222sxn53.1)017.0()021.0(222221ssF55.932表小大,,Fff著性差异两组数据的精密度无显表FF解:22121212()()0.0192iiRxxxxsnn