用于临床疾病诊断的试验方法很多,而且随着科学技术的发展,特别是医学、分子生物学、电子计算机技术的发展,越来越多的新诊断试验方法被应用于临床。评价一种新的诊断试验方法的基本程序是与诊断某病的金标准作盲法和同步比较第一节评价的基本程序(步骤)确立金标准选择研究对象样本大小估计同步评价根据试验检查结果评价诊断价值一、确立金标准要评价一种新的诊断试验方法,首先要确定一个参照标准即金标准(goldstandard)。金标准是指一种疾病标准诊断方法,即当前医学界公认的、可靠的、诊断某病的诊断方法,应用该标准能较正确区分患某种疾病的人和不具有该病的人。一项诊断试验的准确程度只有在金标准诊断的病人组和非病人组中进行考核,才能得到正确的评价。二、选择研究对象在诊断试验方法评价中,研究对象包括两组:一是被金标准确诊的病例组,另一组是金标准证实无该病的人群,即对照组。所有的研究对象都要有代表性,病例组和对照组都应代表各自的总体。三、样本大小估计评价诊断试验的样本含量用下列公式计算:n=zα2p(1﹣p)/δ2注:p为试验的预期特异度或灵敏度;δ为允许误差;α为第一类误差的概率(α=0.05或0.01),zα值由z界值表查得。四、同步评价用被评价的诊断试验方法对研究对象进行同步检查,采用盲法观察。目的:①消除研究对象心理情绪上的波动或异常而影响试验结果②避免研究者的主观意愿而影响试验结果。五、根据试验检查结果评价诊断价值如试验结果是定性资料,可以整理成如下表格形式:诊断性试验方法评价资料整理表试验结果金标准合计有病无病阳性a(真阳性)b(假阳性)a+b阴性c(假阴性)d(真阴性)c+d合计a+cb+dn(a+b+c+d)第二节评价指标对一个诊断试验方法评价包括多方面,在技术上主要包括两方面:可靠性(reliability)真实性(validity)一、可靠性评价可靠性也称重复性(repeatability)或精确性(precision),指一项试验在相同条件重复使用获得相同结果的稳定程度(stsbility)评价诊断试验方法的可靠性通过测量变异的大小来判断。㈠结果是定量数据的可靠性判定变异系数(coefficientofvariation,CV)判定定量数据的可靠性:变异系数(CV)=标准差/算数均数㈡结果是定性数据的可靠性判定⒈符合率:即粗一致率(crudeagreement,CA)是指试验结果与金标准结果一致性CA=(真阳性+真阴性)/受试者总人数=(a+d)/(a+b+c+d)×100%符合率受人为因素影响较多,一般用调整符合率(adjustedagreement,AA):AA=1/4[a/(a+c)+d/(b+d)+a/(a+b)+d/(c+d)]×100%⒉Kappa值:表示两种试验的一致性程度观察一致率(P0):P0=(a+d)/(a+b+c+d)机遇一致率(Pc):Pc={[(a+b)(a+c)/(a+b+c+d)]+[(c+d)(b+d)/(a+b+c+d)]}/(a+b+c+d)Kappa=(P0-Pc)/(1-Pc)Kappa值越高,表示一致性程度越好。Kappa值(在0~1之间):0.75~1之间为一致性高0.40~0.74为一般0.39以下为一致性差二、真实性评价任何检查或测量结果与金标准相比,有下列四种情况:正确结果:①真正有病的人试验结果阳性(真阳性a)②真正无病的人试验结果阴性(真阴性d)错误结果:①真正有病的人试验结果阴性(假阴性c)②真正无病的人试验结果阳性(假阳性b)真实性是指测量值与实际值的符合程度一项试验方法得出的正确结果越多,则该试验的真实性越高。评价试验方法的真实性包括两个方面,即对有病和无病的识别能力。主要评价指标如下:⒈灵敏度(sensitivity)⒉特异度(specificity)⒊似然比(likelihoodratio,LR)⒋Youden指数(Youden’sIndex,YI)⒈灵敏度(sensitivity)灵敏度(真阳性率)是真正有病的人中试验结果阳性的百分率,其表示试验方法对疾病的检出能力。灵敏度越高,说明试验方法对疾病的检出能力越强,病人漏诊机会越少。与灵敏度相对的是漏诊率(假阴性率)。⒉特异度(specificity)特异度(真阴性率)是无病的人中试验结果阴性的百分率,其表示试验方法对无病的检出能力。特异度越高,说明试验方法对无病的判断能力越强,无病的人被误诊机会越少。与特异度相对的是误诊率(假阳性率)。⒊似然比(likelihoodratio,LR)①阳性似然比(+LR)=真阳性率/假阳性率=灵敏度/误诊率阳性似然比指正确判断阳性的可能性是错判阳性可能性的倍数,表明诊断试验结果呈阳性时患病与不患病的比例,其比值越大,试验的诊断价值越高。②阴性似然比(-LR)=假阴性率/真阴性率=漏诊率/特异度阴性似然比指错判阴性的可能性是正确判断阴性可能性的倍数,表明诊断试验结果呈阴性时患病与不患病的比例,其比值越小,试验的诊断价值越高。⒋Youden指数(Youden’sIndex,YI)灵敏度和特异度是反映一项诊断试验的两个基本指标,两者之和减去一,即为Youden指数。Youden指数(YI)越大,试验的真实性越高。Youden指数也称正确指数举例:见教材P243302例高度疑为肝癌的病人肝穿刺活检(金标准),病理报告明确诊断为肝癌234例,非肝癌68例。对上述病人行血中甲胎蛋白检测,结果为,阳性236例(其中肝癌者205例),阴性66例(其中肝癌者29例),试评价甲胎蛋白检测作为诊断肝癌的价值。请计算相关指标,并对数据结果作出恰当解释。甲胎蛋白诊断肝癌的评价资料整理表甲胎蛋白肝癌(肝穿刺)合计试验结果有病无病阳性205(真阳性)31(假阳性)236阴性29(假阴性)37(真阴性)66合计23468302解答:1、资料可整理为如下表格:2、计算有关指标及评价⑴可靠性评价定性数据的可靠性判定用符合率和一致性评价:①符合率(CA)=(真阳性+真阴性)/受试者总人数=(205+37)/302=80.13%②调整符合率(AA)=1/4[真阳性/(真阳性+假阴性)+真阴性/(假阳性+真阴性)+真阳性/(真阳性+假阳性)+真阴性/(假阴性+真阴性)]×100%=1/4[205/(205+29)+37/(31+37)+205/(205+31)+37/(29+37)]×100%=1/4[205/234+37/68+205/236+37/68]×100%=71.24%③Kappa值=(P0-Pc)/(1-Pc)P0=(a+d)/(a+b+c+d)=(205+37)/302=0.8013Pc={[(a+b)(a+c)/(a+b+c+d)]+[(c+d)(b+d)/(a+b+c+d)]}/(a+b+c+d)=[(236×234)/302+(66×68)/302]/302=(55224+4488)/91204=0.6547Kappa=(0.8013-0.6547)/(1-0.6547)=0.1466/0.3453=0.4246由于0.40<Kappa<0.74,表示两种试验的一致性程度为一般,因此,甲胎蛋白检测作为诊断肝癌的指标可靠性一般。⑵真实性评价真实性判定用灵敏度、特异度、Youden指数等评价①灵敏度(Se)=真阳性/(真阳性+假阴性)×100%=205/234×100%=87.61%漏诊率(假阴性率)=1﹣灵敏度=假阴性/(真阳性+假阴性)×100%=12.39%②特异度(Sp)=真阴性/(真阴性+假阳性)×100=37/68×100%=54.41%误诊率(假阳性率)=1﹣特异度=假阳性/(真阴性+假阳性)×100%=45.59%③阳性似然比=真阳性率/假阳性率=灵敏度/误诊率=0.8761/0.4559=1.92④Youden指数(YI)=灵敏度+特异度-1=0.8761+0.5441-1=0.4202表明甲胎蛋白检测作为诊断肝癌的指标敏感性较高,而判断为无病及正确指数为一般。举例:论文:强迫震荡法呼吸系统有效阻力频率依赖性的测定及临床应用目的:提出一种检出小气道早期病变的新方法(R2HZ-4HZ-R5HZ-7HZ)金标准:现有的诊断小气道早期病变较好指标(FEF25-75%;FEF75-85%;V50;V25)之正常组的均值±1.65标准差(95%可信限)为异常判断标准结果见下表:表1二组R2HZ-4HZ-R5HZ-7HZ测定值组别例数R2HZ-4HZ-R5HZ-7HZ正常组450.42±0.115吸烟组440.75±0.256表2二组五项指标检出的异常例数和异常率(%)组别例数FEF25-75%FEF75-85%V50V25R2HZ-4H-R5HZ-7HZ正常组453(6.7)1(2.2)2(4.4)2(4.4)3(6.7)吸烟组4410(22.7)1(2.3)9(20.5)6(13.6)16(36.4)注:两组对象均为男性,体检正常,半年内胸片正常,年龄有可比性;唯吸烟组吸烟年限10-30年,吸烟量10-20支/日试分析新方法(R2HZ-4HZ-R5HZ-7HZ)是否是检出小气道早期病变的好指标解答:1.可靠性评价:定量数据的可靠性判定用变异系数评价:变异系数(CV)=标准差/算数均数,根据表1的数据计算,两组R2HZ-4H-R5HZ-7HZ的测定值CV均很小,表明该指标是可靠的。2.真实性评价:真实性判定用灵敏度、特异度等评价⑴灵敏度:灵敏度(Se)=真阳性/(真阳性+假阴性)×100%▲Se(FEF25-75%)=22.7%▲Se(FEF75-85%)=2.3%▲Se(V50)=20.5%▲Se(V25)=13.6%▲Se(R2HZ-4H-R5HZ-7HZ)=36.4%显示R2HZ-4H-R5HZ-7HZ检出小气道早期病变的灵敏度明显高于其他四项指标⑵特异度:特异度(Sp)=真阴性/(真阴性+假阳性)×100%△Sp(FEF25-75%)=93.3%△Sp(FEF75-85%)=97.8%△Sp(V50)=95.6%△Sp(V25)=95.6%△Sp(R2HZ-4H-R5HZ-7HZ)=93.3%显示R2HZ-4H-R5HZ-7HZ对无小气道早期病变的判断能力与其他四项指标相近因此,可以得出结论,新方法(R2HZ-4HZ-R5HZ-7HZ)是检出小气道早期病变较敏感的好指标。第三节预测值在试验结果(阳性或阴性)已知的条件下,有无疾病的概率称为试验的预测值(predicativevalue,PV)。当一个试验对一个人群进行检查时,仅了解其灵敏度和特异度是不够的,还必须了解:△试验结果阳性的人中患有这种疾病的概率,即阳性预测值(positivepredicativevalue,PPV)△试验结果阴性的人中不患该疾病的概率,即阴性预测值(negativepredicativevalue,NPV)阳性预测值(PPV)=真阳性/试验结果阳性人数=a/(a+b)×100%它表示试验结果阳性者可能患有该病的概率,阳性预测值越高,诊断价值越高。影响阳性预测值的因素有试验方法本身(灵敏度和特异度)以及患病率。三者的升高都能提高阳性预测值。患病率不变的条件下,特异度的升高比灵敏度升高使阳性预测值升高的影响更大;阳性预测值与被检人群的预期患病率呈正相关。第四节提高试验效率的方法一、选择合适的方法和指标尽量选择客观指标,对指标的测量应采用标准化的方法。若有多个指标可供选择,应根据灵敏度、特异度大小来决定。二、选择患病率较高的人群进行检查对患病率较高的人群进行检查,可以获得较高的阳性预测值。三、采用联合试验一种方法的灵敏度或特异度不能满足要求时,可以采用联合试验,有两种方式:㈠平行(并联)试验平行试验(paralleltest)指同时做几项试验,只要有一个试验阳性,结果即判为阳性。平行试验可以提高灵敏度,但降低特异度。在临床工作中,当某病需要一种灵敏度很高的诊断试验,而目前尚无一种试验能满足要求时,可采用几种不太灵敏的试验进行平行试验,以提高灵敏度。㈡系列(串联)试验系列试验