数据的统计处理和解释:重复性限和再现性限

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据的统计处理和解释:重复性限和再现性限@智慧的弟弟2012年08月(微博:weibo.com/201292986博客:blog.sina.com.cn/wisdomtang)摘要:本文简要说明重复性限和再现性限的定义以及它们在方法验证中的应用。关键词:重复性限,再现性限,精密度,标准差,临界极差Abstract:Abstract:Abstract:Abstract:Thedefinitionsandtheirapplicationinthemethodvalidationofrepeatabilitylimitandreproducibilitylimitwerebrieflydescribedinthispaper.KeyKeyKeyKeyword:word:word:word:Repeatabilitylimit,Reproducibilitylimit,Precision,Standarddeviation,Criticaldifference在日常分析与测试中,我们会经常接触到精密度试验,即在重复性和再现性(复现性)条件下对同一被测物质重复测试,并对测试(或测量)结果进行估算,最后以标准差(或变异系数)来度量测试(或测量)结果的分散性。然而在通常的实验室工作中往往要求对两个(或多个)测试(或测量)结果观测值的差进行检查,为此需要确定一些类似临界差之类的度量,而不仅仅是标准差(或变异系数)。一、术语和定义1.1.1.1.接受参照值用作比较的经协商同意的标准值。2.2.2.2.准确度测试结果或测量结果与真值间的一致程度。注:准确度是正确度和精密度的组合,在过去一段时间只用来表示现在称为正确度的部分,在很多标准及文献中此情况如今依旧普遍存在。在实际情中,真值用接受参照值代替。3.3.3.3.正确度测试结果或测量结果的期望与真值间的一致程度。4.4.4.4.精密度在规定条件下,所获得独立测试/测量结果间的一致程度。5.5.5.5.重复性条件为获得独立测试/测量结果,由同一操作员按相同的方法、使用相同的测试或测量设施、在短时间间隔内对同一测试/测量对象进行测试/测量的观测条件。6.6.6.6.再现性条件由不同的操作员按相同的方法,使用不同的测试或测量设施,对同一测试/测量对象进行观测以获得独立测试/测量结果的观察条件。7.7.7.7.重复性临界差一个数值,在重复性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。注:最终值的例子包括结果序列的平均值或中位数,而序列本身可能含有一个或多个结果。8.再现性临界差(复现性临界差)一个数值,在再现性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。9.9.9.9.重复性限指定概率为95%的重复性临界差。10.10.10.10.再现性限(复现性限)指定概率为95%的再现性临界差。以上术语和定义引自GB/T3358.2-2009《统计学词汇及符号第2部分:应用统计》,更多术语和定义见GB/T3358.2-2009,以上术语的定义与GB/T6379.1-2004中存在部分差异。二、临界差的来源如果一个估计量是n个独立估计量的和或差,每个估计量的标准差均为σ,则和或差的标准差为nσ。重复性限r和再现性限R均为两个测试结果之间的差,因而相应的标准差为2σ。在常规的统计工作中,为了检查两个测试(或测量)结果之间的差异,往往用这个标准差的Z倍作为临界差。临界差系数Z的值依赖于与临界差相应的概率水平及测量结果所服从的分布。对于重复性限和再现性限,概率水平规定为95%。在准确度(正确度与精密度)的分析中,我们一般假定基本分布是近似正态的。对于标准正态分布,95%的概率水平下,Z=1.96,因此77.22=Z。对于一般的统计使用,将2Z修约为2.8。注:标准正态分布N(0,1),查标准正态分布表)(xΦ可知,对概率975.0)96.1()96.1(=Φ=≤ZP那么95.01)96.1(2)96.1()96.1()96.196.1(=−Φ=−Φ−Φ=≤≤−ZP,即表示落在区间μ±1.96σ范围内的概率为95%。Z被称为是标准正态分布N(0,1)的0.975分位数。在对重复性条件或再现性条件下得到的两个单一测试(或测量)结果进行检验时,应与重复性限rrσ8.2=或再现性限RRσ8.2=进行比较。也就是说,在进行精密度试验得到的两个测试(或测量)结果(这两个结果可能是的多个结果平均值或中位数)的差值与重复性限rrσ8.2=或再现性限RRσ8.2=进行比较,小于等于重复性限rrσ8.2=或再现性限RRσ8.2=则表示这两个测试(或测量)结果是可接受的。注:在实际中,当标准差的真值σ未知时(我们不能进行完全精密度实验,只能基于有限次的测试(或测量)),用标准差的估计值s替代真值σ。由GB/T6379.1-2004和GB/T6379.2-2004可知重复性限和再现性限是通过实验室间比对试验的测试(或测量)结果来确定。对于标准中的重复性限和再现性限也就是标准起草单位组织多个实验室进行比对试验来确定的。所以,一般情况我们不需要深入的了解标准中重复性限和再现性限是怎么得来的,只需要利用它来验证标准方法及其他证明实验室有能力控制精密度的证据。如有兴趣深入了解重复性限和再现性限,可参见GB/T6379.1-2004和GB/T6379.2-2004等相关标准。三、重复性限(再现性限)在方法验证中的应用1.以《水质氨氮的测定纳氏试剂分光光度法》(HJ535-2009)为例,这份标准里面出现了两个新术语——重复性限和再现性限(至少对于我来说,这两个是新术语),标准中表述如下:对于我们这类非研究级别的实验室来说,可以不去追究重复性限和再现性限来源,但是我们需要对方法进行验证,就必须弄清以下问题:1)重复性限和再现性限的定义2)如果按标准所述,怎么进行精密度试验?跟以往用标准差(或变异系数)来评价的精密度试验又有何区别?从字面上理解,标准中确定的重复性限和再现性限的数据应该类似于一个限值,也就是如果需要验证此方法,我们得到相关数据就应该小于或等于重复性限和再现性限。2.HJ535-2009中精密度试验的验证方法如下:1)首先,分别配制氨氮浓度为1.21mg/L和1.47mg/L的标准溶液(如果能购买,最好是购买有证标准溶液/样品)。2)每种浓度进行两组测定(在重复性条件和再现性条件下),每组可以仅测定一次,即每组仅测定得出一个数据(此为极端情况)。3)对每组测定结果进行统计处理,剔除错误值和离群值(如利用格拉布斯(Grubbs)检验法检验离群值),求得每组数据的平均值或中位数,所得的平均值或中位数即为我们最终所需要的数据。4)将两组所得的平均值或中位数相减(大减小)的差与重复性限或再现性限进行比较,如差值小于等于重复性限或再现性限即为合格。表1111HJHJHJHJ535-2009535-2009535-2009535-2009中精密度试验结果表测试条件重复性再现性氨氮标准溶液1.211.471.211.47序号平行1平行2平行1平行2平行1平行2平行1平行211.2001.2231.4501.4591.1401.2341.4501.49521.1951.2311.4671.4711.2381.1901.4051.42331.1881.2011.4691.4851.2311.1391.4991.52041.2341.2381.4741.4871.2761.2801.4111.45651.2151.2271.4731.4771.2011.1591.4721.487注:假设测试结果中无异常和离群数据5)统计检验1.212.80.028rrσ==1.472.80.024rrσ==1.211.2381.1880.050.028R′=−=1.471.4871.4500.0370.024R′=−=可以看出在重复性条件下的试验,结果的极差(两组平均值相减)均大于标准中的重复性限,由此可证明该重复性试验是不可接受的,需要重新或追加试验。同理求证复现性试验(这里不一一列出)。6)重复性条件下结果可接受性检验表2222重复性条件下测试结果可接受性检验规则结果数(n)情形种类是否接受最终报告补救办法1不可取2极差≤r是两者均值极差>r否不报告再取2个结果2+2极差≤r是四者平均值极差>r否四者中位数2+1极差≤r是三者平均值极差>r否三者中位数(无第4个结果)不报告再取1个结果(如可以)2+1+1极差≤r是四者平均值极差>r否四者中位数n>2极差≤r是n者平均值极差>r否A:不报告再取n个结果B:n者中位数C:不报告再取m个结果注:1)“2+2”为测试过程费用较低的情况,“2+1”、“2+1+1”为测试过程费用较高的情况;2)A为测试过程费用较低的情况,B、C为测试过程费用较高的情况;3)对于方法验证中进行重复性限或再现性限试验时,极差>r的情况是不被接受的,必须追加或重新试验;4)m为满足n/3≤m≤n/2的整数;5)在最终检验之前,应先剔除异常和离群的结果;6)再现性条件下结果可接受性检验见GB/T6379.6-2009中的“5.3”。四、临界极差的计算第“三”部分是对标准方法中重复性限和再现性限的验证,因为标准已提供参考的限,所以我们只需要计算测试结果的极差(用极差与标准中的限比较即可),而不需要计算测试结果本身之间的临界极差。在部分试验中,我们需要计算一组数据的标准差(或称标准偏差)、变异系数或临界极差。1.重复性临界极差重复性临界极差计算公式如下:0.95()()rCRnfnσ=其中:n——测试结果数;f(n)——临界极差系数;rσ——标准差的真值,实际可用标准差的估计值s代替;0.95()CRn——在n次测试在95%概率下的重复性临界极差。f(n)可通过下表查询得到:表3333临界极差系数(f(n)f(n)f(n)f(n))表2.再现性临界极差参考GB/T6379.2-2009中的“4.2”和“5.3”条款,这里不再阐述。五、小结1)在进行精密度试验时,建议尽量采用多次平行测定,这样可以检验内部环境和时间变化所引起的误差;2)在进行精密度试验时,计算结果之前,应先剔除异常和离群的数据,可使用奈尔(Nair)、格拉布斯(Grubbs)、狄克逊(Dixon)等检验法检查离群值,具体详见GB/T4483-2008;3)关于再现性(复现性)的定义,GB/T6379.1-2004与GB/T3358.2-2009存在差异,前者强调是不同实验室,根据个人实践及经验的理解与GB/T3358.2-2009相同。从GB/T6379.6-2009中对再现性临界极差的检验似乎只针对不同的实验室。个人认为将其二者综合起来理解,不管是否不同实验室,再现性都是存在的,再现性临界极差可参考GB/T6379.6-2009中“5.3”条款;4)在方法验证过程中,如测试结果的极差大于标准中的重复性限或再现性限,建议重新试验,相应的数据也应丢弃不用;其他需要计算测试结果临界极差的情况,特别是测试过程费用较高的情况,才建议参考GB/T6379.6-2009对重复性临界极差和再现性临界极差的检验情况处理,并报告最终结果。六、致谢感谢四川大学华西公共卫生学院郑波老师给与的帮助和指导!七、参考文献:[1][1][1][1]GB/T6379.1-2004,测量方法与结果的准确度(正确度与精密度)第1部分:总则与定义[S][S][S][S].[2][2][2][2]GB/T6379.2-2004,测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复性与再现性的基本方法[S][S][S][S].[3][3][3][3]GB/T6379.6-2009,测量方法与结果的准确度(正确度与精密度)第6部分:准确度值的实际应用[S][S][S][S].[4]GB/T3358.2-2009,统计学词汇及符号第2部分:应用统计[S].[5]GB/T3358.1-2009,统计学术语第1部分:一般统计术语与用于概率的术语[S].[6

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功