§2-2分析结果的数据处理一、置信度与置信区间二、可疑数据的取舍三、平均值与标准值的比较四、两组平均值的比较如何用测量值来估计真实值?一、置信度与置信区间若用单次测量值x来估计真实值μ真值μ被包括在x±1σ内的可能性p=68.3%,同理真值μ被包括在x±2σ内的可能性p=95.5%,真值μ被包括在x±3σ内的可能性p=99.7%。真值被包括的区间可表示为:μ=x±ξσ叫单次测量结果的置信区间,p叫置信度。若用平均值估计真值xxxx2xx3叫平均值的置信区间。nxp=68.3%p=95.5%p=99.7%其中由可见,平均值的置信区间比单次测量结果的置信区间要小,亦即用平均值估计真值的准确度比单次测量值更高,即平均值更接近于真值。xxnx有限次测量结果平均值的置信区间为:其中,t—置信因子,是试验次数n、置信度p的函数。由p14表2-2可以查到。nstxp15.例3:测定SiO2的百分含量,得到下列数据:28.62、28.59、28.51、28.42、28.52、28.63。求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。解:06.01607.004.008.005.003.000656.28663.2852.2848.2851.2859.2862.28222222sx07056286060571256285712695%05056286060015256280152690%2-2.....μ.tn.....μ.tn。,时,同理,置信度为。,,,置信度为查表p15例4测定钢中含铬量时,先测定两次,得到1.12%和1.15%;以后又补测了三次为1.11%、1.16%和1.12%。试分别按两次和按五次测定的数据计算平均值的置信区间(p=95%)。解:两次测定时021.012015.0015.014.1215.112.122sx03.013.150.0222.781.13Cr%)5(78.22-2022.01)(13.1512.116.111.115.112.119.014.120.02112.71.14Cr%)2(7.122-2%952%95ntnxxsxnti,得查表五次测定时。得查表通过给出的这两条例题,可得到如下结论:①测定次数一定时,置信度越高,则t越大,置信区间越宽。②置信度和精密度一定时,测定次数越多,越小,置信区间越窄,结果较可靠。nst测定铁矿中Fe的百分含量,求得置信度为95%时平均值的置信区间为35.21±0.10。对此表达式的正确理解是真值不是随机变量。所以,不能用出现概率来描述。(A)在已测定的数据中有95%的数据在此区间内(B)若再作测定,则数据有95%将落入此区间内(C)真值μ在此区间出现的概率为95%(D)用此区间估计真值μ的把握有95%√二、可疑数据的取舍22.38,22.39,22.36,22.40,22.44这组测量数据中22.44精密度较差,而又没有什么明确理由舍弃它时,怎么办?例1,以90%的置信度,用Q检验法检验下列数据中22.44是否参加平均值的计算。22.38,22.39,22.36,22.40,22.441.Q检验法①将数据从小到大排序:22.36,22.38,22.39,22.40,22.44②求极差;xn-x1=22.44-22.36=0.08③求可疑值的邻差(或);xn-xn-1=22.44-22.40=0.04④求Q值:或;⑤将Q值与p18表2-4给出的Q表进行比较。n=5,Q0.90=0.64>0.5,则22.44给予保留参加平均。1nnxx12xx如果QQ表则舍弃可疑值Q≈Q表则补1~2个实验数据后再检验2.Grubbs法例2测定某药物中Co的质量分数(×10-6)得到结果如下:1.25,1.27,1.31,1.40。用Grubbs法判断1.40×10-6这个数据是否保留。36.1066.031.140.1计算G查p17值表2-3G(p,n),置信度选95%,n=4,G表=1.46,G计算G表,故1·40×10-6应保留。解:用Grubbs法,=1.31×10-6,s=O.066×10-6x用Q值检验法:可疑值为xn。60.01.25-1.4031.140.1Q1n1nnxxxx计算查表2-4,置信度选90%,n=4,Q表=0.76,Q计算Q表,故1·40×10-6应保留。Grubbs法和Q值检验法的结果一致。注意:1.如果一系列数据中需要检验若干个可疑值,则每次首先检验邻差较大的那个数据。例如:8.32,8.38,8.44,8.45,8.52,8.69。因为8.69与8.52的差0.17是所有数据邻差中最大的,所以首先应当检验8.69,然后有必要时,再检验剩下的数据。2.从三次测量结果中舍弃一个“离群值”是不可取的。因为这样做表面上精密度提高了,但实际上会增大了置信区间的宽度。为什么?参看p19二~四段n值变小,t值增大通过t检验能够判断分析方法是否有系统误差。三、平均值与标准值的比较(系统误差的检验)1.用某种方法测量标准值为μ的基准物质或标准试样n次,求平均值。2.计算t值nsxt计算3.将t计算值与表2-2中的t值比较若t计算>t表,则该测量方法有系统误差;若t计算≤t表,则该方法的测量差异主要是随机误差所致。xp19例2一种新方法用来测定试样含铜量,用含量为11.7mg/kg的标准试样,进行五次测定,所得数据为10.9,11.8,10.9,10.3,10.0。判断该方法是否可行?(是否存在系统误差)解:计算平均值,标准偏差s=0.78.10x87.257.07.118.10nsxt计算查表2-2t(0.95,n=5)=2.78,因此t计算>t表说明该方法存在系统误差,结果偏低。四、两个平均值的比较在分析化学实验中往往要通过比较①两种分析方法;②两个实验室;③两个不同操作者;的试验结果之间是否有显著性差异,来确定他们之间的差异是系统原因造成,还是随机原因造成的。在两组数据的精密度没有显著差别的情况下,可以用t检验法比较这两组数据的平均值,给出上述问题作出回答。下面通过p20例3来介绍这种检验方法某人用两种方法对同一试样进行测定,结果如下:方法1:1.261.251.22方法2:1.351.311.331.34问这两种方法间有无显著性差异?解:n甲=3=1.24s甲=0.021n乙=4=1.33s乙=0.01753.1017.0021.02222小大计算ssF先用F检验比较两种方法的精密度:甲x乙x续例3905434320033124102002430.017)1(40.021)1(32)1()1(2121212221222211....nnnnsxxt.--nnsnsns合合则因为f=n-1,查表2-5得F表=9.55,大于F计算=1.53,表明两组数据的s没有显著差异。所以能合并它们查表2-2,因为f=7-2=5,置信度95%时,t表=2.57,小于上述计算值5.90。表明两种方法有显著差异。续例30404343020572212121...nnnnstxx合表这两种方法所能允许的最大随机差别为:而实际上两者的平均值相差达到0.09,所以,至少有0.05是由于系统的差别引起的。§2-3误差的传递分析结果的误差是由各步测量值的误差,在运算时通过某种传递方式而形成的。系统误差和偶然误差的传递规律是不一样的下面分别加以讨论。一、系统误差的传递规律①对于加、减运算:测量值A、B、C的误差对分析结果R的影响为:,如果误差为有限量,则:,极端情况下,有:若ΔAΔB和ΔC,则ΔR≈ΔA,即计算结果的绝对误差取决于绝对误差最大的ΔA。dCdBdAdRCBARCBARmax)(CBAR②对于乘、除运算:测量值A、B、C的误差对分析结果R的影响为:如果误差为有限量,则:极端情况下,有:若,则,即计算结果的相对误差由相对误差最大的决定。CBARCdCBdBAdARdRCCBBAARRCCBBAA和AdARdRAdA二、随机误差的传递规律2222CBARssssCBAR①在加、减运算中由此可见,在加减运算中分析结果的方差,取决于测量值中方差最大者。②在乘、除运算中由此可见,在乘除运算中分析结果的相对标准偏差的平方取决于参加运算的测量值中相对标准偏差的平方最大者。§2-4有效数字及其运算规则一、有效数字的概念有效数字通过实验仪器所能测量到的数字。例如:①滴定管的体积读数20.52mL;②分析天平称出的质量读数0.5180g;③分光光度计的吸光度读数0.235等等。有效数字与其他数字的区别不仅表示数值的大小,还表示所用仪器的精度。例如,用分析天平称某物体的质量,应读准到小数点后第四位:正确不正确记录数据0.5180g0.518g绝对误差±0.0001g±0.001g相对误差±0.02%±0.2%实验数据的表示应当注意:①在实验数据的所有有效数字中,只允许最后一位是可疑值。②数据中的“0”是否为有效数字,取决于它所起的作用。起定位作用的“0”不是有效数字,与测定精度有关的“0”均是有效数字。只起定位作用0.5180g=518.0mg=518000μg=5.180×105μg③在用有效数字表示大于1的整数时,应采用科学记数法。25.00mL25mL0.02500L2.500×10-2L例:下列数据各包含几位有效数字0.03761.20670.21800.00401.8×10-50.0052.0×103100010.98%3位5位4位4位2位2位1位2位含糊因测量误差的存在,所以实验数据的最后一位是可疑数字,而用它进行运算的结果也只能保留一位可疑数字。二、有效数字的运算规则1.加减运算运算结果的绝对误差,应当与参加运算数据中绝对误差最大者一致。≈26.71ΔR=0.0001+0.01+0.00001≈0.010.0121+25.64+1.05782=26.709920.0325~RE%=0.3,5.103~RE%=0.02,60.06~RE%=0.02,139.8~RE%=0.07。250363071.08.13960.60310.55032.03.007.002.002.03.0RdR2.乘除运算运算结果的有效数字位数,应当与参加运算数据中相对误差最大者一致。0.071250363×0.3%=0.0002≈0.0713①化学计量系数、得失电子数、质子转移数、倍数等的有效数字位数应视为足够多。②第一位数字大于等于8的数据,其有效数字的位数可比该数据的实际位数多算一位,例如,8.33可以当作4位有效数字处理。③计算的中间结果可多保留一位有效数字,最终结果则应按四舍五入规则舍弃其他多余的可疑值,只保留一位可疑值。④在全分析中应采用“四舍六入五成双”的规则对数据进行修约。3.取舍有效数字应注意⑤涉及到平衡常数的计算,其结果的有效数字一般保留两位。⑥对数和pH值的有效数字是小数点后的部分,小数点前的部分起定位作用,不是有效数字。⑦误差和偏差最多用两位有效数字表示。⑧常量组分分析中,含量≥10%的结果用四位有效数字表示;含量在1~10%的用三位有效数字表示;微量组分分析通常用两到三位有效数字表示分析结果。74.426.058.1lg5pH108.1108.1100.0100.0]H[108.1]HAc[]Ac][H[555-从上述计算可知:例如:HAc-NaAc浓度均为0.100mol/L时溶液的pH值。①涉及平衡常数的计算,结果一般取两位有效数字。②对数的有效数字是小数点后的数字。例题p2610(1)计算2.187×0.854+9.