第二章误差及分析数据的统计处理Chapter2ErrorsandStatisticalTreatmentofAnalyticalData§2-1定量分析中的误差Q:定量分析的任务是什么?一准确度和精密度1准确度:测量值xi与真实值μ的接近程度。误差(E):测量值xi与真值μ之间的差值误差--准确度的衡量标准。绝对误差E=xi-μ±相对误差相对误差表示误差占真值的百分率(或千分率)100%ixEr误差有正负+偏高-偏低例1:分析天平称量两物体的质量各为1.6380g和0.1637g,假定两者的真实质量分别为1.6381g和0.1638g,则两者称量的绝对误差E分别为:(1.6380-1.6381)g=-0.0001g(0.1637-0.1638)g=-0.0001g两者称量的相对误差Er分别为:绝对误差相等,相对误差并不一定相同。减小误差称大样。0.0001100%0.006%1.63810.0001100%0.06%0.1638用相对误差表示测定结果的准确度更为确切2精密度(Precision):各次分析结果相互接近的程度。偏差d(Deviation)----精密度的衡量标准。个别测定结果xi与几次测定结果的平均值的差。绝对偏差相对偏差±相对偏差是绝对偏差在平均值中所占的百分率(或千分率)。xxxdii100%rxxdx偏差有正负+偏高-偏低一平均偏差(AverageDeviation)又称算术平均偏差,是各偏差值的绝对值的平均值,表示为:1111nniiiiddxxnn单次测定的相对平均偏差表示为:%100xddr两个重要的偏差概念及运算公式必须掌握,在分析化学实验中会经常计算它们的数据结果平均偏差是本科生实验数据处理所要求掌握的,例如一般平行试验做3次x1,x2,x3。那么先求算出然后分别计算出:再计算:最后算出:xixx1233xxxxxxd100%rddx绝对偏差分析化学实验数据处理的通常步骤及结果二标准偏差(StandardDeviation)又称均方根偏差,当n→∞时,无限多次测定的标准偏差,用σ表示如下:21()niixnμ——无限多次测定的平均值即总体平均值,代表真值。n为测定次数。(实际上能进行的是有限次测定)112-)(nxxsnii(n-1)表示n个测定值中具有独立偏差的数目,又称为自由度。有限次测定时,标准偏差称为样本标准差,以s表示:用下式计算标准偏差更为方便:s与平均值之比称为相对标准偏差,以sr或CV表示:Sr如以百分率表示又称为变异系数CV(CoefficientofVariation)。22111niniiixxnsn100%rssCVx平均偏差和标准偏差都可用于表示测定结果的精密度。但是通常分析工作者更倾向于用标准偏差表示测定结果。Why?例2:x1x2x3x4x5x6x7x8x9x10甲+0.10+0.400.00-0.30+0.20-0.30+0.20-0.20-0.40+0.30乙-0.10-0.20+0.900.00+0.10+0.100.00+0.10-0.70-0.20解:0x0.240.24dd甲乙S甲=0.28S乙=0.40n甲=10n乙=10标准偏差甲乙,甲测量结果的精密度比乙好结论1平均偏差不能表示各次测定之间彼此接近或分散的情况。因为即使在一组测量中偏差彼此较为接近,另一组测量中,偏差彼此相差较大,但它们所得平均值可能相同。2用标准偏差处理分析数据,是迄今衡量测定值分散度最好,最有用的方法。因为用标准偏差表示精密度时,将单次测量的偏差平方后,较大的偏差可显著地反映出来,这样就能较好地说明数据的符合程度。例3:分析铁矿中铁含量,得如下数据:37.45%,37.20%,37.50%,37.30%,37.25%。计算此结果的平均值、平均偏差、标准偏差、变异系数。计算:%.%.%.%.%.%.3437525373037503720374537x%.%.....11050900401601401101nddnii%.%).().().().().(1301001509004016014011012222212ndsnii%.%..3501003437130xsCV最后提醒大家注意:分析结果在允许的误差范围内即可,不必是越小越好,“小”是相对的。3准确度与精密度的关系精密度是保证准确度的先决条件;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。精密度准确度好好好稍差差差很差偶然性二误差产生的原因及减免的方法(一)误差的产生1系统误差:固定原因。误差具有重复性,单向性,恒定可测性。2随机误差:偶然的、随机的原因。误差可大可小,属不可测误差。系统误差的固定原因•方法误差:反应不完全、干扰成分、指示剂选择•仪器误差:容量器皿未校正、电子仪器“噪声”大•试剂误差:纯度不够带入测定的组分中造成干扰•主观误差:操作人员观察颜色偏深或偏浅等。•系统误差特点:系统偏大或偏小.误差大小可以测定出来,对测定结果进行校正.随机误差的统计规律(1)大小相近的正误差、负误差出现的机会相等,即绝对值相近,正负号相反的误差是以同等的机会出现的。(2)小误差出现频率高,大误差出现频率较低。随机误差特点:误差时大时小,无法消除是不可测定的。随机误差的分布服从正态分布横坐标:随机误差的值,纵坐标:误差出现的概率大小。服从正态分布的前提测定次数无限多;系统误差已经排除。(二)误差的减免方法系统误差的减免方法:选择标准方法、提纯试剂和使用校正值等办法加以消除。具体操作:常采用对照试验和空白试验的方法。对照试验和空白试验:(1)对照试验:选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验,找出校正值加以校正。(2)空白试验:指除了不加试样外,其他试验步骤与试样试验步骤完全一样的实验,所得结果称为空白值。空白实验的目的:对试剂或实验用水是否带入被测成份,或所含杂质是否有干扰可通过空白试验扣除空白值加以修正。回收试验:在测定试样某组分含量x1的基础上,加入已知量的该组分x2,再次测定其组分含量x3。由回收试验所得数据计算出回收率。%100213xxx回收率由回收率的高低来判断有无系统误差存在。常量组分:一般为99%以上,微量组分:95~110%。随机误差的减免方法:无法消除。通过增加平行测定次数降低;或通过可疑数据的取舍来判定过失误差(粗差):认真操作,可以完全避免。三置信度与平均值的置信区间置信度(ConfidenceLevel):指分析结果在某一范围内出现的几率.如置信度95%,指测定结果在一定范围内的几率为95%.置信区间(ConfidenceInterval):真实值在指定概率下,分布的某个区间。μ±σ,μ±2σ,μ±3σ等称为置信区间。置信度选得高,置信区间就宽。上图中68.3%,95.5%,99.7%即为置信度。随机误差的区间概率从-∞~+∞,所有测量值出现的总概率P为1,即随机误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率标准正态分布区间概率%1,1xu%26.6864.1,64.1xu%9096.1,96.1xu%95121)(22ueduu2,2xu%5.9558.2,58.2xu%0.993,3xu%7.99uu~正态分布概率积分表根据统计学可以推导出有限测定次数的平均值与总体平均值μ(真值)的关系tsxnμ:总体平均值(若无系统误差,即为真实值):有限次测量的平均值s:标准偏差n:测量次数t:置信因子,与置信水平和测定次数有关的统计量(可查表):平均值的置信区间.xtsxnx上述公式的意义:当测定值精密度愈高(s值愈小),测定次数愈多(n值愈大)时,置信区间愈窄,即平均值愈接近真值,平均值愈可靠。练习%95%10.0%50.47在内的概率为包括总体均值的区间内理解为在解:%95%10.0%50.47P置信度如何理解Q:置信区间的宽窄与哪些因素有关?tsxn与t,s,n都有关例4:测定SiO2的质量分数,得到下列数据,求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。28.62,28.59,28.51,28.48,28.52,28.63解:查表2-2置信度为90%,n=6时,t=2.015。56286632852284828512859286228........x06016070040080050030060222222.).().().().().().(s置信度为95%时:0705628606057125628.....置信度↑,置信区间↑。0505628606057125628.....2.015例5测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次测定和五次测定平均值的置信区间(95%置信度)。查表2-2,得t95%=12.7。%.%.%.x14121511210210120150015022.).().(s%.%...%.W19014120210712141Cr解:n=2时n=5时:查表2-2,得t95%=2.78。%.%.%.%.%.%.x1315121161111151121022012.)(nxxs%.%...%.W03013150220782131Cr在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,即可使测定的平均值与总体平均值μ接近。(1)由小到大排序:x1,x2,x3,x4……xn(2)求(3)求标准偏差s(4)计算G值:可疑数据的取舍1.Grubbs法(5)由测定次数和要求的置信度,查表得G表(6)比较:若G计算G表,弃去可疑值,反之保留。由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q检验法高。sXXGsXXGn1计算计算或x§2-2分析结果的数据处理2.Q值检验法(1)由小到大排序x1,x2,……xn(2)求极差xn-x1(3)求可疑数据与相邻差:xn-xn-1或x2-x1(4)计算:11211xxxxQxxxxQnnnn或(5)根据测定次数和要求的置信度,(如90%)查表2-4:(6)将Q与Qx(如Q90%)相比,若QQx舍弃该数据,(过失误差造成)若Q<Qx保留该数据,(偶然误差所致)测定某药物中Co的含量(10-4)得到结果如下:1.25,1.27,1.31,1.40,用Grubbs法和Q值检验法判断1.40是否保留。查表2-3,置信度选95%,n=4,G表=1.46G计算G表故1.40应保留。3610660311401....计算G解:①用Grubbs法:x=1.31;s=0.066例1:②用Q值检验法:可疑值xn60025140131140111.....xxxxQnnn计算查表2-4,n=4,Q0.90=0.76Q计算Q0.90故1.40应保留。例5:三次分析得到下列结果:30.13%,30.20%和31.23%是否31.23%应该弃去?要求置信度90%。解:①排序30.13%,30.20%,31.23%②极差31.23-30.13=1.10%③邻差31.23-30.20=1.03%④⑤查表n=3时,Q0.90=0.94⑥Q计算≈Q0.90,,此类情况只能多做几次或舍弃31.23%111.030.9360.941.10nnnxxQxx计算讨论:(1)Q值法不必计算x及s,使用比较方便;(2)Q值法在统计上有可能保留离群较远的值。(3)Gr