CNAS-GL02-2006-能力验证结果的统计处理和能力评价指南

fj疯鸡
1 ℃
2020-03-07

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

CNAS—GL02能力验证结果的统计处理和能力评价指南GuidanceonStatisticTreatmentofProficiencyTestingResultsandPerformanceEvaluation中国合格评定国家认可委员会二〇〇六年六月CNAS-GL02：2006第1页共18页2006年06月01日发布2006年07月01日实施能力验证结果的统计处理和能力评价指南1．目的与范围1.1本指南对CNAS能力验证结果的统计处理和根据统计处理结果对实验室进行能力评价的方法提供了指南。1.2本指南适用于CNAS的能力验证活动，以及将结果应用于CNAS认可的由其他方组织的能力验证活动。2．引用文件下列文件中的条款通过引用而成为本文件的条款。以下引用的文件，注明日期的，仅引用的版本适用；未注明日期的，引用文件的最新版本（包括任何修订）适用。ISO/IEC指南43-1：1997《利用实验室间比对的能力验证——能力验证计划的建立和运作》（GB/T15483.1，IDT）APLACPT001《检测实验室间的比对》APLACPT002《校准实验室间的比对》《NATA能力验证指南》ISO5725：19941-6《测量方法和结果的准确度（正确度和精密度）》3．统计处理3.1统计设计3.1.1能力验证的结果可以多种形式出现，并构成各种统计分布。分析数据的统计方法应与数据类型及其统计分布特性相适应。无论使用哪一种方法对参加者的结果进行评价，一般应包括以下几方面内容：a）确定指定值；b）计算能力统计量；c）评价能力；d）在某些情况下需预先确定被测样品的均匀性和稳定性。3.1.2在统计设计中应考虑下列事项及其相互影响：CNAS-GL02：2006第2页共18页2006年06月01日发布2006年07月01日实施a)所涉及测试的精密性和正确性；b)在要求的置信水平下检出参加者之间的最小差异；c)参加者的数量；d)待检样品的数目和对每一被测样品进行重复检测/测量的次数。在校准能力验证计划中，应考虑比对的周期；e)估算指定值所使用的程序，及识别离群值所使用的程序；f)校准能力验证计划中，参考实验室必须能够给出优于参加者的测量不确定度（应尽量选择拥有国家基标准的实验室）。3.1.3在缺乏4.1.2a)的可靠信息时，可能有必要组织一次先导性实验室间比对(协同试验)，以获得该信息。3.2指定值及其不确定度的确定3.2.1确定指定值的方法有多种，下面是最常用的几种。按不确定度增加的顺序（多数情况下如此）排列如下：a）已知值——其结果由特定样品配制（如制备、稀释）时确定。b）有证参考值——由定义法确定（用于定量检测）。c）参考值——与一个可追溯到国家或国际标准的参考标准物质/标准样品或标准进行分析、测量或比对检测物品所确定的值。d）由各专家实验室获得的公议值。专家实验室在对被测量的测定方面应具有可证实的能力，其使用的方法已经过确认，并且有较高的精密度和准确度，与通常使用的方法具有可比性。在某些情况下，这些实验室可以是参考实验室。e)从参加实验室获得的公议值——利用4.2.3中的统计量，并考虑到极端结果的影响。3.2.2为公正地评价参加实验室，以及促进实验室之间和方法之间的协调一致，应有确定的指定值。这一点通过参加共同的比对，并使用共同的指定值就可以实现。3.2.3下述统计量适合于使用公议方法来确定指定值：定性值——预先确定的多数百分率的公议值；定量值——适当比对组的平均值，如:a)可以是加权或变换（如修剪平均或几何均值）的平均值；b)中位值、众数或其它稳健度量。3.2.4应根据所开展项目的特定技术要求，运用“测量不确定度表示指南”（由BIPM、IEC、IFCC、ISO、IUPAC和OIML等联合制定）中规定的程序确定指定值的不确定度。CNAS-GL02：2006第3页共18页2006年06月01日发布2006年07月01日实施3.2.5极端结果a）在使用参加实验室的数据确定指定值时，所用的统计方法应当使极端结果的影响降至最小，这可以通过使用稳健统计方法或在计算之前剔除离群值来实现（详见ISO5725-2）。b）如果参加者的结果作为离群值被剔除，那么该剔除应仅为了计算总计统计量，而在能力验证报告中仍需对这些结果进行评估，并且给出适当的能力评价。3.2.6其它需考虑的事项a）按理想情况，如果用参考值或参加者的公议值来确定指定值，协调人应有一个程序来确定指定值的正确度以及检查数据的分布；b）协调人必须有根据其不确定度判断指定值是否可接受的准则。3.3能力统计量的计算3.3.1单个检测项目的能力3.3.1.1能力验证结果常需转换成一个能力统计量以便于说明和衡量与指定值的偏差。3.3.1.2检测能力的评价对于能力验证的参加者应有意义。因此，对检测项目的能力评价应该和检测的要求相关，并能被理解或符合特定领域里的惯例。3.3.1.3变动性度量常用于计算能力统计量和能力验证计划的总结报告中。对一组比对的数据常用例子是：-标准偏差（SD）；-变异系数（CV）或相对标准偏差（RSD）；-百分数与中位值的绝对偏差或其它稳健度量。3.3.1.4定性结果通常不需要经过计算。定量结果常用的统计量如下：a）偏差XxD−=，这里x是参加者的结果值，X为指定值b）偏差百分比率%100×XDc）百分数或秩d）Z比分数sXxZ−=这里S是指变动性的适当的估计量/度量值。这种模式既适用于X和S由参加者结果推导出的情形，亦适用于X和S不是由全部参加者结果推导出的情形（例如，对指定值和变动性可作出明确规定时。CNAS-GL02：2006第4页共18页2006年06月01日发布2006年07月01日实施利用四分位数稳健统计方法处理结果时，()IQRXxZ7413.0−=。式中IQR为四分位间距。e）nE值（该统计量通常用于测量比对计划和测量审核活动）。22REFLABREFLABnUUExx+−=式中xLAB是实验室的测量结果，xREF是被测物品的参考值。LABU为参加者结果的不确定度；REFU是指定值的不确定度。3.3.1.5注意事项a）参加者结果和指定值之间的简单差值可能足以确定能力，且易被参加者所理解。数值()Xx−在ISO5725-4中称为“实验室偏移的估计值”。b）百分率差适用于浓度的变化，参加者较易理解。c）百分数或秩用于高度离散或偏态分布的结果和次序响应，或不同的响应值有限时的情形。不要轻易使用该方法。d）根据检测数据的性质须对结果实行变换。有时这种变换是必要的，比如，稀释的结果以几何尺度变化，因而可以进行对数变换。e）如果使用统计量作为评价标准（如Z比分数），变动性的估计必须可靠，即基于足够的观察以减少极端值的影响和降低不确定度。3.4综合能力评估3.4.1在单独一次能力验证轮回中，可以根据一个以上的结果对实验室能力进行评估。这种情况出现在一个特定测试物或一组相关的测试物有一个以上测试项目时，将能提供更为全面的测试能力的评估方法。某些图表，例如尤登（Youden）图或曼德尔（Mandel）h-值图，都是表示测试能力的有效手段。综合评估的例子如下：a）相同被测量的综合值-满意结果的数目-z比分数的平均值-绝对偏差的平均值（以单位或百分比表示）-绝对偏差（或平方偏差）之和b）不同被测量的综合值CNAS-GL02：2006第5页共18页2006年06月01日发布2006年07月01日实施-满意结果的数目或百分比-绝对Z比分数的平均值-与评价极限相关的绝对偏差的平均值。3.4.2注意事项a）数值可以根据需要进行变换，使它们都服从相同的假设分布（如Z比分数服从正态分布，偏差的平方服从x2分布）。b）对严重影响综合能力评价的极端值应进行检查。3.5能力评价3.5.1在建立能力的评价标准前，应考虑能力的度量值是否具有下列特点：a）专家公议：在这种情况下，顾问组或其它资深专家直接确定报告的数据是否符合要求，专家公议是评价定性检测结果的主要途径。b）与目标的符合性：例如，应考虑方法的使用范围和参加者被认可的操作水平等。c）数值的统计判定：这里的评价准则适用于各种结果值。一般将Z比分数分为：∣Z≤2∣满意结果2∣Z3∣有问题∣Z≥3∣不满意或离群的结果将nE值分为∣nE≤1∣满意结果∣nE∣1不满意结果d）参加者的公议：由一定百分比的参加者或由某个参考标准组提供的比分数值或结果的范围。如：-中心百分比（80%，90%或95%）满意，或-单侧百分比（最低90%）满意。3.5.2分割样品方案的设计，目的是识别不合适的校准或结果中严重的随机误差。对此，应依据足够数量的数据和较宽的浓度范围进行评估。为识别和描述这些问题，可采用作图法，特别是采用平均值所作的图表明实验室间差异。结果用适当的参数或非参数技术与回归分析和残差分析进行比较。3.5.3只要可能，应使用图示法表示能力（如直方图、误差柱状图和Z比分数次序图）这些图示法可用来表示：CNAS-GL02：2006第6页共18页2006年06月01日发布2006年07月01日实施-参加者结果的分布；-多个检测项目数据间的关系；-不同方法的分布比较。有时，某些实验室出具的数据，在能力验证计划中为离群结果，但可能仍在其相关标准规定的允差范围之内，鉴于此，利用参加能力验证计划的结果来对实验室的能力进行判定时，通常不作出“合格”与否的结论，而是使用“满意/不满意”或“离群”的概念。3.5.4当利用测量审核对实验室的能力进行判定时，可利用En值或参照相关技术标准（包括统计技术方面的标准）进行判定，附件C给出了相应的统计方法信息。CNAS-GL02：2006第7页共18页2006年06月01日发布2006年07月01日实施附件A:检测实验室间能力验证计划的结果处理方法A.1引言本文件概括了CNAS用于处理能力验证计划结果的程序。但仅适用于检测能力验证计划，而不适用于校准能力验证（测量比对）计划，校准能力验证计划的统计将在附录B中阐述。在检测验证计划中，结果的评价是建立在与给定值的比较之上，给定值通常是从所有参加者的结果中获得，即公议值。本文件中所描述的统计程序能够适用于大部分的检测能力验证计划。只要可行，能力验证计划的结果分析应尽量采用这些程序，但在某些情况下，也可能需要采用其它更适合的统计技术。对于所有的能力验证计划，统计分析只是评价其结果的一个方面。如果一个结果被认为是离群值，这意味着，从统计上看它明显地不同于本组的其他结果。然而，从所涉及的具体学科（如化学）看，结果可能没有“错”。这就是为什么规定结果的评价应由统计分析和技术专家共同参加的原因。本文件的A.4、A.5和A.6列出了实际使用的统计分析（包括某些实例）──即能力验证计划最终报告中出现的统计、表格和图表。在A.2中将说明一些在能力验证计划筹划过程中需考虑的理论背景；在A.3中将描述开始统计分析前需进行的结果的收集、输入和检查。A.2统计设计提供给实验室的检测物品之间的所有差别已降至最小，因此结果的变异性主要有两个来源:实验室间的变异（包括测量方法间的变动）和实验室内部的变异。我们将通过在这两种类型的变异上来评价实验室的结果和提供反馈。为了评定实验室间和实验室内这两种变异性，实验室必须进行多于一次（如两次）的相同检测。因此，只要可能，验证计划应设计成能够获得成对的相关结果。这可以用样品对来实现，如不可能,也可以通过对一个样品检测两次的结果来获得。如果使用成对的样品，它们可以是等同的（即“均一对”）或者存在轻微的差别（分割水平对）。由样品对获得的结果分成两类：均一对，其结果预期是相同的（即两个样品完CNAS-GL02：2006第8页共18页2006年06月01日发布2006年07月01日实施全相同或同一样品检测两次）；分割水平对，其结果稍有差异。均一对和分割水平对这两种类型结果的统计分析是相同的，但在解释上稍有不同（见A.5）。有些验证计划不可能获得结果对，即只能获得单一样品的单个结果，在这种情况下，统计分析较为简单，但不能区分出两种不同类型的变异。在能力验证计划设计过程中另一个重要的统计考虑是，假