1第四节监测数据的统计处理和结果表述一、基本概念•二、数据的处理•三、监测结果的表述•四、环境参数的统计推断2四、环境参数的统计推断(一)均数置信区间估计考察样本均数与总体均数(μ)之间的关系,即以样本均数代表总体均数的可靠程度。x和S只能是μ和σ的估计值。样品有限次测量得到样本的和S;能否代表样品的真值,即总体均值μ;只当测定次数n趋于无穷大时S才趋于σ,实际不可能。xxx3从正态分布曲线可知,68.26%的数据在μ±σ区间之中,95.44%的数据在μ±2σ区间之间…。当从同一总体中随机抽取足够量的、大小相同的样本,并对它们测定得到一批样本均数。如果总体是正态分布,则样本均数的分布将随样本容量(n)的增大而趋向正态。4•样本均数的均数是各组测定结果的平均值的总平均值•其均数的标准偏差•有限的测定组数,有限的测定次数。•均数的标准偏差()的大小与总体的标准偏差(σ)成正比,与总体容量(N)(测定次数)的平方根成反比11LiixxL211()1LxiiSxxLxSxSxSN5•当N→∞时,μ总体均数,σ总体标准偏差,显然N、μ、σ都是未知数(实际的监测过程是在有限次测量中完成的,所以一般用样本标准偏差(S)及样本容量(n)代替(S是反映一组测定值中个体变量的离散程度)xSSnxSxxtSxSxtSxtn§这样所得的均数标准偏差仅是一个估计值,均数的大小反映抽样误差的大小。其值愈小则用样本均数代表总体均数的可靠性愈大,反之亦然,样本均数与总体均数之差对均数标准偏差的比值称为t值6•根据正态分布的对称性特点,应写成•、S、n可从测定值求得,而t与样本容量(n)和置信度有关。而置信度是可以直接要求指定,当n置信度确定,t值便可以从P424表9-9中查得,•当n一定时,置信度愈大,t值愈大,置信区间(数值范围)大。当置信度一定时,n值大,t值小,数值范围小。Sxtnix通常采用90~95%置信度(α=0.10~0.05)。一般认为:•α>10%不显著•5%<α≤10%可能显著•1%<α≤5%显著•0.1%<α≤1%很显著•α≤0.1%极显著7【例】测定某废水氰化物浓度,得到数据如下:n=4,=15.30mg/L,s=0.10。求置信度分别为90%,95%时的置信区间。解:自由度n-1=3置信度为90%,t=2.35置信度为95%时,t=3.188xSxtn=15.30±0.12mg/Lμ=15.30±0.16mg/L9表9-9 t值表10(二)测量结果的统计检验(选讲)需要回答问题:从有限点位和一定频率下获得的监测数据是否与总体真值相符;同一样品采用两种不同的测定方法(或不同的人员、实验室)所测均数在准确度与精密度方面有无变化……。需要进行统计检验。本课主要介绍:样本均数与总体均数差别的显著性检验(t检验)。11相同的试样由不同的分析人员或不同分析方法所测得均数之间差异?不同实验室,对标准样的实际测定均值与其保证值之间的差异,到底是由抽样误差引起的,还是确实存在本质的差别?解决方法:对这些差异进行“显著性检验”,简称“t检验”,判断两均数之差是属于抽样误差的概率有多大。原理:当抽样误差的概率较大时,两均数的差异很可能是抽样误差所致,亦即两均数的差别无显著性意义;如其概率很小,即此差别属于抽样误差的可能性很小,因而差别有显著意义。13t检验判断通则:当t<t0.05(n),即P=1-α>0.05,差别无显著意义;当t0.05(n)≤t<t0.01(n),即0.01<P≤0.05,差别有显著意义;当t≥t0.01(n),即P≤0.01,差别有非常显著意义。14解:μ=1.06%=1.054%n=10n′=10-1=9s=0.009%x[例]某含铁标准物质,已知铁的保证值为1.06%,对其10次测定的平均值为1.054%,标准偏差为0.009,检验测定结果与保证值之间有无显著性差异。查t0.05(9)=2.262|t|=2.11<2.262=t0.05(9)P>0.05即差别无显著意义,测定正常。15[例]一种标准参考物质的Cu浓度为100mg/L,一个实验室测定该物质重复12次,结果为:100.2,99.3,99.4,99.3,99.8,100.0,99.2,100.1,100.3,99.5,99.6,99.7。问该方法有无系统误差(α=0.05)?解:经计算=99.7mg/L,S=0.38mg/Lx10099.7100||12122.730.38xts在α=0.05时,t0.025,(12-1)=2.201>t0.025,(12-1)说明有系统误差存在。16四、直线相关和回归(一)相关和直线回归方程变量之间关系有两种主要类型:1.确定性关系2.相关关系22xxnyxxyna222xxnxyxyxb变量之间既有关系,又无确定关系。它们之间的关系式叫回归方程。最简单的回归方程为:Y=ax+b17§举例:BOD,TOC关系§对同一水样若有机污染物全部被微生物降解。或在高温催化剂存在下,所有有机物全部被氧化转化为CO2,则对同一个水样应该有确定的关系232::12BODTOCWOWCBODTOC§事实上:实测BOD、TOC受各种因素的影响,不能用完全确定的的关系来表示。§又如:用分光光度计测某污染物的含量,因受仪器、药品、操作人员技术水平……等因素的影响,使A=kc这种完全正比的理论关系,只能作相关关系来表达。181、利用最小二乘法计算对于数组:变量x:x1,x2,x3……xn变量y:y1,y2,y3……yn最简单的直线回归方程为:对应于每一个xi,有和yi令:“使Q最小”的方法求a、b,称最小二乘法。baxyiy21niiQyy21niiibxayQ(xi,)iy(xi,)iy192、利用word计算回归方程插入图表,选择散点图。选择图表中的数据系列,右击,添加趋势线,点击“选项”选项卡,勾选“显示公式”、显示R平方值。需要用SQRT()函数,计算出R值。203.用Excel计算(点击链接)相关系数和进行回归分析输入数据;选定数据区域;点击插入,图表,散点图。添加趋势线,选择显示公式、R2、倒推……等。2122()()()()xxyyrxxyy(二)相关系数及其显著性检验相关系数是表示方程中两个变量之间关系的密切程度的指标,符号用“r”表示。其值-1~+1在之间x与y之间可能存在的几种关系如下:)()(),(),(ysxsyxsyxr22x与y的相关关系x增大,y也相应增大x增大,y相应减小y与x的变化无关x与y呈正相关x与y呈负相关x与y不相关0<r<1,若v=1,称完全正相关-1<r<0,当v=-1时,称完全负相关r=0x与y的相关关系23图9.5 正相关的两种图形图9.6 负相关的两种图形2''(1)21()0.01()0.1rnrnPnP'0.010.1求出值(2)按t=求出t值n变量配对数n-2=n自由度(3)查t值表若tt有非常显著意义而相关即方程中x与y关系密切若tt关系不显著,不相关24在抽样时由于偶然性误差,可能计算所得r≠0,所以应检验r值有无显著性意义。不能仅根据r值的大小判断相关的密切程度。环境监测一般要求∣r∣≥0.99925第五节实验室质量保证一、常用名词◇准确度◇精密度◇灵敏度◇空白试验◇校准曲线◇检测限◇测定限26分析结果与真值之间符合程度的度量系统误差和随机误差两者的综合指标决定分析结果的可靠性。定义作用表示标准物质分析加标回收法评价方法绝对误差和相对误差100%加标试样测定量试样测定量回收率加标量准确度27加标回收实验的几个问题1.关于加标浓度通常标准物质的加入量应和待测物浓度水平相等或接近为宜如果待测物质浓度较高,则加标后的总浓度不宜超过方法线性范围上限的90%;若浓度小于检测限,可按照检测下限加标;加标量不得大于样品中待测物含量的三倍。2.关于干扰物克服样品中的某些干扰物质对待测物产生的正干扰或副干扰,有时不能为回收率实验所发现。28◇精密度用一特定的分析程序在受控条件下重复分析均一样品所得测定值的一致程度。反映分析方法或测量系统所存在随机误差的大小。表示:极差、平均偏差、相对平均偏差、标准偏差和相对标准偏差,较常用的是标准偏差。同一实验室中,分析人员、分析设备和分析时间相同,用同一分析方法对同一样品进行双份或多份平行样测定结果之间的符合程度同一实验室,分析人员、分析设备和分析时间至少一项不同,用同一分析方法对同一样品进行的两次或两次以上独立测定结果之间的符合程度不同实验室(分析人员、分析设备、甚至分析时间不相同),用同一分析方法对同一样品进行多次测定结果之间的符合程度平行性重复性再现性讨论精密度时的常用术语29关于精密度的几个补充问题-供参考1.精密度与待测物浓度水平有关。可用两个或两个以上的不同浓度水平的样品测试,对精密度进行检查。2.精密度可因与测定有关的实验条件改变而改变,如加热仪器、试剂、器皿的更换。3.同一样品的一批测定结果的精密度往往好于分散在较长时间内的结果的精密度。4.标准偏差受测量次数的影响。用S估计某种方法精密度,需足够多的测量次数。5.分析标准溶液与分析实际样品的精密度可能存在一定差异。30◇灵敏度单位浓度或单位量的待测物质的变化所引起的响应量变化的程度。灵敏度=仪器的响应量或其他指示量/对应的待测物质的浓度或量常用标准曲线的斜率来度量灵敏度。灵敏度因实验条件改变而变。标准曲线的直线部分:A=kc+a式中:A——仪器的响应量c——待测物质的浓度;a——校准曲线的截距;k——方法的灵敏度,k值大,方法灵敏度高 31◇空白试验又叫空白测定,是指用“水”代替试样,并与试样测定同步进行的测定。(全程序空白测定)空白试验所得的响应值称为空白试验值。空白值来源:测定过程中待测组分以外的其他因素,如试剂中杂质、环境及操作进程的沾污等综合因素对分析响应值的影响。影响空白值的因素经常变化,在每次测定时,均进行空白试验。32•1.空白水中待测物的浓度应低于所用方法的检测限,否则,将使空白试验值和标准偏差拉大。并影响测定结果的精密度和准确度。•2.必要时对“空白水”进行检验:(1)用其它方法制备更纯的“水”,作为“空白水”的空白。(2)用检测限更低的方法,和更纯的水作参比,“对空白水”做分析。关于空白测定的几个补充问题-供参考333.空白试验值并不完全是由水所带来的。当空白值较高时,应检查:实验用水、试剂空白、量器及容器的玷污、仪器的性能及实验状态。34◇校准曲线描述待测物质的浓度或量与相应的测量仪器的响应量或其他指示量之间定量关系的曲线。工作曲线:绘制校准曲线的标准溶液的分析步骤与样品分析步骤完全相同。标准曲线:绘制校准曲线的标准溶液的分析步骤与样品分析步骤相比有所省略,如省略样品的前处理。线性范围:校准曲线直线部分所对应的物质的浓度(或量)范围。35•注意问题:1.配制的标准系列应在方法线性范围之内。2.只有确认某些操作对校准曲线无显著影响时,方可免除这些操作,如摇匀、静置时间、操作次数等。3.应同时做空白试验,并在各点扣除空白试验值;4.校准曲线的使用时间取决于多种因素,如实验条件改变,试剂的重新配置,仪器的稳定性等。应在每次测定时检验校准曲线,可选择两个适当浓度的标准物同时进行测定,必要时重新绘制校准曲线。365.校准曲线通常没有考虑样品的基体效应,可采用标准物质样品绘制校准曲线。6.使用标准方法绘制校准曲线,如达不到标准方法的要求,则应检查试剂、量器及操作步骤是否有误,并作出必要的纠正。•HJ/T345─2007铁的测定邻菲啰啉分光光度法,规定:(1)精密度同一实验室六次测定铁离子的浓度为0.5、2.5、4.5mg/L的水样,相对标准偏差分别为1.1%、0.44%和0.33%。(2)准确度对于0.5、2.5mg/L浓度的铁溶液按1∶1的比例加标进行回收