预防医学第六章诊断试验与筛检试验案例1心力衰竭是多种心脏疾病晚期共同表现出的一种综合征,是心源性死亡的重要原因。B型利钠肽(BNP)、心房利钠肽(ANP)、N-末端ANP(NT-ANP)是人体内重要的心脏激素,研究显示,充血性心力衰竭时,血浆BNP、ANP和NT-ANP浓度升高。通过放射免疫法检测三项指标的血浆浓度变化对心力衰竭有诊断价值。图1是测定三种不同利钠肽的血浆浓度水平和后前位X线胸片测心胸比例(CTR)对诊断心力衰竭效能的ROC曲线比较。BNP、ANP、NT-ANP和CTR的ROC曲线下面积分别为0.96、0.93、0.89和0.79。图1三种利钠肽浓度和后前位X线胸片测心胸比例对诊断心力衰竭效能的ROC曲线(CowieMR,etal.Lancet,1997;350:1349-53)作为一名医生,你认为何项指标是最佳诊断的指标?神经母细胞瘤(NB)是最常见的儿童恶性肿瘤之一,它可产生于自主神经系统的各个神经网络(肾上腺髓质最为常见),但其发病率较低(英国每年患此病的人不足100例)。目前,超过50%的NB在诊断时已从原发部位扩散,过去20年中,该病的生存状况并未改善。本病预后取决于患儿年龄和疾病诊断的阶段,疾病发现越早,预后越好。检测尿中儿茶酚胺(VMA)及其代谢产物的含量可对该病进行筛查。案例2目前在英国尚未确立神经母细胞瘤的筛查方案,但该病的筛查方案已在日本实施。神经母细胞瘤有自发消退的可能,筛查可能会导致过度诊断。如何建立一个研究以探讨在英国实行神经母细胞瘤筛检的价值?学习目的定义诊断和筛检,比较诊断试验与筛检试验有何不同;学会计算试验评价的各种指标;应用真实性、可靠性和收益等指标评价诊断试验和筛检试验;列举和讨论试验结果阳性截断值的选定方法及注意的问题;讨论患病率、灵敏度、特异度及预测值等各类指标的相互关系;了解提高试验效率的方法。第一节概述第二节诊断试验与筛检试验的评价第三节提高试验效率的方法内容一、概念筛检(screening)是运用快速、简便的检验、检查或其它措施,在健康的人群中,发现那些表面健康,但可疑有病或有缺陷的人。筛检也称筛查,筛检所用的各种手段和方法称为筛检试验(screeningtest),它可以是体检、实验室检查和问卷调查等。第一节概述筛检试验只是将人群中可疑有病或有缺陷者(试验阳性者)与那些可能无病者(试验阴性者)区分开来,仅是一个初步的检查,对筛检结果阳性或可疑阳性者需进一步做确诊检查,对确诊者还需进行治疗。图2筛检试验流程图(引自:连志浩《流行病学》北京医科大学,北京,1989)筛检的目的1.疾病的二级预防,早发现、早诊断、早治疗。如乳腺癌等筛检。2.疾病的一级预防,高危人群,采取相应的干预措施。例如筛检高血压预防脑卒中。3.识别疾病的早期阶段,帮助了解疾病的自然史,揭示疾病的“冰山现象”。4.合理分配卫生资源。是指在临床上医务人员通过详尽的检查及调查等方法收集各种信息,经过整理加工后对病人病情的基本认识和判断。据此制定下一步的治疗或干预方案,完成救治任务。诊断(diagnosis)用于诊断的各种检查及调查的方法称诊断试验(diagnostictest)。诊断试验的含义是广泛的,它既包括各种实验室检查,也包括放射线、B超等物理检查手段,还包括病史、体检等临床资料。诊断的主要目的是对病人病情做出及时、正确的判断,以便采取相应有效的治疗措施。此外,还可应用诊断试验进行病例随访,确定疾病的转归、判断疗效和估计预后以及监测治疗的副作用等。二、应用原则筛检的应用原则1.被筛检的疾病或缺陷是当地重大的卫生问题。2.对被筛检的疾病或缺陷有进一步确诊的方法与条件。3.对发现并确诊的病人及高危人群有条件进行有效的治疗和干预,且应有统一的标准。4.了解被筛检疾病的自然史,有可供识别的早期症状和体征或测量的标志。5.筛检试验要快速、简便、经济、可靠、安全、有效及易为群众接受。诊断的应用原则诊断是临床采取有效治疗措施的前提,因此诊断试验必须能正确判断病人和非病人,还要为受检者所接受,所以诊断试验要求:1.灵敏度、特异度要高。2.快速、简单、价廉、容易进行。3.安全、可靠、尽量减少病人的损伤和痛苦。三、诊断试验与筛检试验的区别筛检试验诊断试验目的用以区别可疑病人与可能无病者用来区别病人与可疑有病但实际无病的人对象健康或表面健康的人病人或可疑病人要求快速、简便,有高灵敏度,尽可能发现所有可能的病人较高的准确性、特异度和灵敏度,尽可能诊断出所有病人和排除所有非病人费用简单、廉价的方法一般价格较高处理阳性者须进一步作诊断试验以确诊阳性者需要进一步观察和及时治疗图3宫颈癌自然史与筛检和诊断的示意图(Ahrens2005)不管是“诊断试验”还是“筛检试验”都需要针对该方法对疾病“诊断”的真实性和价值做出评价。一、试验评价的基本步骤试验的评价就是将待评价的试验结果与“金标准”(goldstandard)结果——进行同步盲法比较,判定该方法对疾病“诊断”的真实性和价值。第二节筛检试验的评价金标准特定人群病人非病人待评价方法评价指标图4试验评价的基本步骤+-+-(一)确定“金标准”“金标准”指当前临床医学界公认最可靠、最权威的、可以反映有病或无病实际情况的诊断方法称为金标准(goldstandard),是诊断疾病的最可靠的方法,也称为标准诊断。活/尸检手术发现微生物培养特殊检查影像诊断长期随访的结果应注意:金标准会随着医学的发展不断更新,如金标准选择不当,则可造成错误分类偏倚,影响对试验的正确评价。一些较难诊断的疾病可能没有真正意义上的金标准,或金标准复杂且昂贵、甚至使受检者遭受痛苦或冒一定风险,此时可选一种相对公认的诊断方法作金标准,但要考虑此类金标准的假阳性率和假阴性率。(二)选择研究对象用于评价诊断试验和筛检试验的研究对象,应能代表筛检试验和诊断试验可能应用到的目标人群。因此,筛检的研究对象应从社区人群中选择,诊断试验的研究对象应从可疑人群或高危人群中选择。用金标准确诊‘有病’的病例,应包含典型的、不典型病例,早、中、晚期病例,轻、中、重病例、有和无并发症的患者。代表性使评价结果具有普遍意义。来自男性、年轻人群的试验评价结果一般不能适用于女性、老年人群。(三)样本大小的计算待评试验的灵敏度待评试验的特异度显著性检验水平α,一般为0.05容许误差δ,一般为0.05~0.10当灵敏度和特异度均接近50%时,可用近似公式21αznppδ待评价方法的灵敏度或特异度正态分布中累积概率等于α/2时的Ζ值(双侧)此公式适用于p接近50%时,当预期的灵敏度或特异度小于20%或大于80%时,需对灵敏度或特异度的估计值做平方根反正弦转换。(四)同步盲法测试对用金标准所确定的病例组与非病例组的研究对象,用待评价试验进行同步盲法测试。(五)整理分析资料待评价试验金标准确诊合计病例非病例阳性a(真阳性)b(假阳性)a+b阴性c(假阴性)d(真阴性)c+d合计a+cb+dn表1评价试验的整理表在收集和分析试验资料时,盲法的使用具有非常重要的意义,可以减少人为的主观偏差。假设未实施盲法,研究者可能对同样可疑的结果,倾向于将金标准确诊的病人判断为试验阳性,金标准诊断为非病人的判断为试验阴性,这样就会过高估计待评价试验的价值。(六)质量控制除采用同步盲法测试以保证结果的真实性外,对试验所用的仪器型号、试验条件、试验方法、所用试剂的质量、标号等要统一、标准化,尽量采用客观指标,对调查员要进行严格培训,将误差减小到最低。二、试验评价的指标(一)真实性(validity,效度)指测量值与实际值(金标准)相符合的程度,故又称准确性(accuracy)灵敏度(sensitivity)与假阴性率(falsenegativerate)特异度(specificity)与假阳性率(falsepositiverate)约登指数(Youden’sindex)粗一致性(crudeagreement)灵敏度又称敏感度或真阳性率,指金标准确诊的病例中待评价试验也判断为阳性者所占的百分比。它可反映待评价试验能将实际患病的病例正确地判断为患某病的能力。理想值应为100%。式中n为实际患病人数,即计算灵敏度的分母。nSenSenSEsen)1()(%100caa灵敏度=特异度又称真阴性率,指金标准确诊的非病例中待评价试验也判断为阴性者所占的百分比。它可反映待评价试验能将实际未患某病的研究对象正确地判断为未患某病的能力。理想值也应为100%。式中n为实际无病人数,即计算特异度的分母。%100dbd特异度nSpeSpeSESpe)1()(假阴性率又称漏诊率,是指金标准确诊的病例中待评价试验错判为阴性者所占的百分比,理想值也应为0%,漏诊率=1-灵敏度。灵敏度越高,漏诊率越低。%100cac假阴性率=假阳性率又称误诊率,是指金标准确诊的非病例中待评价试验错判为阳性者所占的百分比,理想值应为0%,误诊率=1-特异度。特异度越高,误诊率越低。%100dbb假阳性率=灵敏度与特异度是评价试验真实性的两个基本指标。临床上,病人和医生都希望获得高灵敏度和高特异度的诊断试验或筛检试验,即尽可能没有漏诊和误诊,但大多数情况下是难以达到的。因为许多试验是用定量或半定量方法判定阳性与阴性,而患者与非患者的测量值多不能截然分开,有重叠现象,故灵敏度与特异度之间往往顾此失彼。往往提高了试验的灵敏度却降低了试验的特异度,而提高了试验的特异度却又降低了试验的灵敏度,下图说明了两者的关系,当判断标准移向B时,提高了特异度降低了灵敏度,当判断标准移向A时,提高了灵敏度降低了特异度。图5人群中血清钙水平的分布图约登指数也称正确指数是灵敏度与特异度之和减去1表示试验方法发现真正病人与非病人的总能力范围在0~1之间,指数越大,其真实性越高粗一致性是指试验所检出的真阳性和真阴性例数之和占受试人数的百分比。它反映试验结果与金标准诊断结果的符合程度。%100dcbada粗一致性=甲状旁腺功能确诊结果血清钙水平亢进正常合计阳性(>11mg/dL)12315阴性(≤11mg/dL)85765合计206080表2人群某病患病状况与试验结果的关系(虚拟数据)%00.60%1002012%100caa灵敏度=%00.95%1006057%100dbd特异度=表示在无甲状旁腺功能亢进的人中血清钙试验阴性或正常者占95.00%。表示在甲状旁腺功能亢进确诊的病人中血清钙试验阳性或异常者占60.00%。%00.40%100208%100cac假阴性率(漏诊率)=%00.5%100603%100dbb假阳性率(误诊率)=表示在甲状旁腺功能亢进确诊的病人中血清钙试验阴性或正常者占40.00%。表示在无甲状旁腺功能亢进的人中血清钙试验阳性或异常者占5.00%。约登指数=(0.60+0.95)-1=0.55%25.86%100805712%100dcbada粗一致性(符合率)=表示血清钙试验阳性和阴性结果均正确的概率是86.25%。(二)评价试验的可靠性(reliability)也称信度、精确度(precision)或可重复性(repeatability),指在相同条件下用某测量工具(如待评试验)重复测量同一受试者时获得相同结果的稳定程度。影响试验可靠性的因素受试对象自身生物学差异观察者差异试验方法的差异评价试验可靠性的指标标准差变异系数(CV)符合率(agreement/consistencyrate)Kappa值%100测定值均数测定值均数的标准差变异系数=符合率又称一致率是筛检试验判定的结果与标准诊断的结果相同的数占总受检人数的比例%100nda符合率=第一次试验第二次试验阳性阴性合计阳性aba+b(r1)阴性cdc+d(r2)合计a+c(c1)b+d(c2)n表3可靠性评价的资料归纳表然而仅仅通过符合率来评价筛检或诊断试验的一致性是不全面的。第一,符合率未表明结果不一致性的具体原因:两个观察者所得的阳性