诊断试验的研究与评价四川大学华西口腔医院陈娥一、诊断性试验研究的意义•诊断性试验研究的意义在于使临床医务人员认识诊断试验的规律,正确解释与评价其结果,提高临床诊断的效率,确定其在临床实践中的具体应用价值。•把现代科技发展的成果引入诊断学领域,不断地研究和应用更准确、安全、经济和更方便的诊断试验,提高临床诊断水平,是临床医务人员的重要任务之一。诊断性试验的范畴•各种实验室检查•病史和体检获得的临床资料•X线、B超、核素等影像学检查•各种临床公认的诊断标准诊断试验评价的目的•怎样进行诊断试验研究•怎样阅读和评价有关诊断试验的文章•临床和科研工作中怎样选择诊断试验–诊断疾病:灵敏度和特异度高–筛检无症状患者:简便、经济、安全易接受–疾病随访:重复性好,影响因素少–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应二、诊断学试验设计的原则•1、有标准诊断——金标准(Goldstandard)•2、选择研究对象•3、盲法判断试验结果•4、确定合适的样本量•5、确定正常阈值金标准与新的诊断试验•金标准:是指当前临床公认的诊断疾病最可靠的方法,也称标准诊断。•-活体病理组织检查•-手术发现•-细菌培养•-尸检•-特殊检查•-持续较长时间的随访结果•-公认的综合临床诊断标准•-权威机构颁布的标准••用金标准进行诊断时,试验对象可被分为患病组,未患病组。•应对参加试验的对象同步进行金标准诊断和新的诊断试验检测。•新的诊断试验用阳性代表患病,阴性代表未患病时,金标准与新诊断试验的结果可以列入四格表内四格表•金标准(标准诊断)•有病无病合计•诊断性+真阳性ab假阳性a+b•试验-假阴性cd真阴性c+d••合计a+cb+dn选择研究对象•诊断试验评价中,研究对象应能代表检查对象的总体•病例组:应该包括所研究疾病的各种临床类型如轻、中、重型;早、中、晚期;典型与非典型;有和无并发症者;病程长与病程短,经治疗和未经治疗的患者;对照组:应选择确实无该病的其他病例,且应包括相当比例的临床上容易与所研究的疾病相混淆而需要鉴别的其他疾病患者,只包括健康自愿者是不恰当的。盲法判定试验结果•判断诊断试验结果的观察者如确知纳入对象的实际患病情况,即已知金标准分类结果,或提示金标准分类的其他临床资料,可能自觉或不自觉地按照已知结果或信息进行判断,从而过高估计诊断试验与金标准的符合程度。•观察者偏倚observerbias三、诊断试验常用指标•敏感度Sensitivity(SN)a/(a+c)•特异度Specificity(SP)d/(b+d)•准确度accuracy(AC)(a+d)/(a+b+c+d)或(a+d)/N•阳性预测值Positivepredictivevalue+PV=a/(a+b)•阴性预测值Negativepredictivevalue-PV=d/(c+d)•阳性似然比Positivelikelihoodratio•a/(a+c)•+LR────=SN/(1-SP)•b/(b+d)•阴性似然比Negativelikelihoodratio•c/(a+c)•-LR────=(1-SN)/SP•d/(b+d)•患病率Prevalence(a+c)/N•(一)敏感度•敏感度SN是金标准诊断为“有病”的病例中,诊断性试验为阳性例数的比例,即真阳性病例所占部分的百分率。•SN=a/(a+c)•假阴性所占部分的百分率称为漏检率。•诊断试验敏感度越高,漏检率越低;•漏检率=100%-SN金标准+-•诊断试验+aba+b-cdc+d•a+cb+d(二)特异度•特异度SP是金标准诊断为“无病”的例数中,诊断性试验为阴性的比例,即真阴性部分所占百分率。•SP=d/(b+d)•假阳性所占部分的百分率称为误诊率,•诊断试验的特异度越高,则误诊率越小。•误诊率=100%-SP金标准+-•诊断试验+aba+b•-cdc+d•a+cb+d选择更敏感的试验•当因漏诊会造成不良后果时,例如有传染危险且可治疗的疾病如结核、梅毒、SARS等,应选择更敏感的试验。•疾病的早期阶段可能怀疑多种疾病,为了排除某种诊断可能性,也要选择敏感的诊断试验,当试验结果为阴性时,高敏感度试验临床价值最大。选择特异度高的试验•对于某些预后险恶的疾病,诊断试验的假阳性结果会给病员带来巨大风险、或更多医疗花费时,如对恶性肿瘤采取放疗、化疗或手术之前时,必须选择特异度高的试验,以肯定诊断。•要肯定某病的诊断,高特异度试验阳性结果的临床价值最大。(三)准确度•又称符合率,粗一致率•准确度AC是指诊断试验获得正确试验结果,即真阳性和真阴性在总检例数中的比例••Ac=(a+d)/(a+b+c+d)•反映了诊断性试验结果与金标准试验结果符合或一致的程度。(四)预测值(验后概率)•预测值是根据诊断试验的结果来估计患病可能性大小的指标•阳性预测值:是诊断试验阳性结果中真正患病的比例。也称为验后概率。•+PV=a/(a+b)•阴性预测值是试验诊断阴性结果时真正未患病的概率。•-PV=d/(c+d)金标准+-•诊断试验+ab•-cd(五)验前概率•验前概率又称为患病率•为金标准证实患某病的病例数,占接受金标准及诊断试验检查对象总数的百分率。•P=(a+c)/N•在级别不同的医院中,某种疾病的患者集中程度不同,故患病率差别很大,因而会影响阳性及阴性预测值的结果。•在临床实践中,随着就诊对象来源不同,患病率在不同医疗环境中的变化是很大的,如在初级医疗单位,各种疾病的患病率都很低,而在二级或三级医院中随着转诊率增加,就诊患者中的疾病患病率增高,特别是专科医院、专科门诊范围内的疾病患病率更高。•通过诊断试验估计验后概率的第一步是尽可能准确地估计具体条件下的患病率。预测值可用敏感度、特异度、患病率计算•根据Bayes'条件概率理论,预测值可用敏感度、特异度、患病率计算,公式如下:•+PV=SN×P/[SN×P+(1-SP)×(1-P)]•-PV=SP×(1-P)/[(1-SN)×P+SP×(1-P)]•(SN=敏感度,SP=特异度P=患病率)预测值与敏感度、特异度有关•预测值与敏感度、特异度有关,但患病率对预测值的影响更为重要。•越是特异的试验,阳性预测值愈大,即在阳性结果时对确诊证实疾病越有把握。•越是敏感的试验阴性预测值愈大,即在阴性结果时对排除待查疾病越有把握。•在保持敏感度和特异度不变的情况下,阳性预测值随患病率上升而上升,阴性预测值随患病率上升而下降。预测值与患病率有关•在保持敏感度、特异度不变的情况下,则患病率增大时,阳性预测值随之升高,患病率减小时,阳性预测值下降,患病率极低时,阳性预测值趋向于零患病率对预测值的影响要比敏感度和特异度更为重要。阳性预测值随患病率上升而上升阴性预测值随患病率的上升而下降阳性预测值的上升速度快于阴性预测值的下降速度患病率对阳性预测值的影响较明显预测值与患病率的关系实线为阳性预测曲线虚线为阴性预测值曲线EXAMPLE1例:在前列腺患病率水平不同的人群中,应用前列腺特异性抗原(PSA)筛查前列腺癌对象患病率/(1/10万)阳性预测值%一般男性人群3.50.02高龄无症状男性5003.4有可疑症状者(如前列腺结节)500087.50患病率很低时,即使试验特异度很高,仍会出现大量假阳性病例患病率很高时,即使试验敏感度很高,仍会出现大量假阴性病例。EXAMPLE2•监护病房CPK诊断心梗(CPK80=AMI-)心梗无心梗CPK+215(93%)16231+PV=93%CPK-15114(88%)129-PV=88%Total230130360Pre=64%•普通医院CPK诊断心梗(CPK80=AMI-)心梗无心梗CPK+215(93%)248463+PV=46%CPK-151822(88%)1837-PV=99%Total23020702300Pre=10%(六)似然比•是反映敏感度和特异度的复合指标,即诊断试验的结果在患者中出现的概率与非患者中出现概率之比。•阳性似然比为患病组真阳性率和无病组假阳性率的比值••+LR=[a/(a+c)]÷[b/(b+d)]=SN/(1-SP)••阴性似然比为患病组假阴性率与无病组真阴性率的比值•-LR=[c/(a+c)]÷[d/(b+d)]=(1-SN)/SP•似然比的临床应用•阳性似然比越大,提示能够确诊患有该病的可能性越大。•阴性似然比越小,提示能够否定患有该病的可能性越大。•似然比可用于计算患病的概率,便于更准确的对患者作出诊断。EXAMPLE•某医院心血管内科病房收治了急性心前区疼痛疑诊急性心肌梗死的患者共360例,为了研究肌酸磷酸激酶对急性心肌梗死的诊断价值,在经冠脉造影确诊的“金标准”诊断基础上,同步检测了患者血清肌酸磷酸激酶,在设定诊断异常界值≧80u/L条件下,获得下列结果:•血清肌酸磷酸激酶测定急性心肌梗死•血清肌酸急性心肌梗死•磷酸激酶+-合计≧80u/L21516231<80u/L15114129合计230130360SN=93.5%SP=87.7%AC=91.4%+PV=93.1%-PV=88.4%+LR=7.6-LR=0.07结果解释•SN=93.5%,SP=87.7%:测定血清肌酸磷酸激酶确诊急性心肌梗死时,有93.5%的心肌梗死病例被正确诊断,有87.7%的非心肌梗死被正确排除。•+PV=93.1%,-PV=88.4%:该诊断性试验为阳性时,93.1%疑诊病例被正确诊断为心肌梗死,而该诊断试验为阴性时,88.4%的疑诊病例被正确排除。+LR=7.6:急性心肌梗死患者出现血清肌酸磷酸激酶试验结果阳性的机会是非急性心肌梗死患者出现阳性机会的7.6倍。-LR=0.07:急性心肌梗死患者出现血清肌酸磷酸激酶试验结果阴性的机会是非急性心肌梗死患者出现阴性机会的0.07倍或1:13.4。诊断性试验指标的稳定性•随着检测范围的大小、患病率的高低,评价指标的改变有三种情况。•稳定的指标:敏感度、特异度、阳性似然比、阴性似然比•相对稳定的指标:准确度•不稳定的指标:阳性预测值、阴性预测值EXAMPLE•某地对一批运动员进行体检,有胸前区疼痛史者195例,分别作运动心电图及冠脉造影,结果:•冠状动脉狭窄≥75%•+-合计•运动心电图+55762•-4984133•合计10491195•SN=53%SP=92%+PV=89%-PV=63%•Acc=71%P=53%+LR=6.6-LR=0.51•如果扩大检查范围,将该地区全体运动员都作上述检查,结果:•冠状动脉狭窄≥75%•+-合计•运动心电图+554297•-49478527•合计104520624•SN=53%SP=92%+PV=57%-PV=91%•Acc=85%P=17%+LR=6.6-LR=0.51(七)ROC曲线(receiveoperatorcharacteristiccurve受试者工作特征曲线)•ROC曲线将各个敏感度/特异度对子,以敏感度为纵坐标,以1-特异度为横坐标,依照连续分组测定的数据,分别计算SN和SP,将给出各点连成曲线,即为ROC曲线。•做ROC曲线只靠一、二次试验结果是不可能找到正确的临界点的,一般要求最少五组连续分组测定数据。ROC曲线作用•在诊断性试验中,用于正常值临界点的正确选择。距左上角最近的一点,即为正常值的最佳临界值。•ROC曲线还可以用来比较两种以上诊断性试验的诊断价值,曲线下的面积反映了试验的准确性,面积越大,准确性越高。CPK和EKG诊断心梗ROC曲线比较0%20%40%60%80%100%0%20%40%60%80%100%CPKEKG假阳性率真阳性率(灵敏度)完美诊断试验0.00.20.40.60.81.00.00.20.40.60.81.0FPRTPR无用诊断试验0.00.20.40.60.81.00.00.20.40.60.81.0FPRTPR完美与无用的ROC曲线真阳性率即灵敏度假阳性率机率线(chanceline)(diagonalreferenceline)诊断准确度较低(0.