第十一章相对数分析第一节相对数分类变量的变量值是定性的(计数资料),对其观察结果的分析与比较常用率、构成比、相对比等统计指标。这些指标都是由两个有联系的指标之比组成,称为相对数relativenumber。常用相对数:率、比、构成比一、率rate:又称频率指标。说明某现象发生的频率或强度。常用百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。k为比例基数:100%、1000‰、10万/10万等,主要根据习惯用法和使算得的率一般至少保留一、二位整数,以便阅读。kAAAk单位数可能发生某现象的观察数发生某现象的观察单位率=常用率有:患病率prevalencerate:时点和期间患病率感染率infectionrate发病率morbidityrate,incidencerate死亡率deathrate,mortalityrate病死率fatalityrate治愈率curerate分析:总率或平均率,某一事物发展的趋势或水平及特征二、构成比proportion:又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常用百分数表示,故称做百分比percentage常用来表示:疾病或死亡的顺位、位次或所占比重特点:之和为100%;任一部分变化,其余部分相应发生变化;%100观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比=三、比ratio:又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几,通常用倍数或分数表示。比=A/B两个比较指标可以性质相同,亦可不同。如RR、CV;A、B可以是绝对数、相对数或平均数等婴儿死亡率是相对比有些教科书中的分类:三类频率型指标:近似地反映某一事件出现的机会大小。=(某事件发生的个体数/可能发生某事件的个体数)*K,是频率或概率的近似强度型指标:指一段时间内的平均概率.强度是单位时段内某现象发生的频率.=(某事件发生的个体数/(可能发生某事件的个体数时间))*K相对比型指标:指任何两个相关联的变量A和B之比。它表示相对于B的一个单位A有多少个单位。=A/B常用指标:1、对比指标:两个同类事物某种指标之比。如性别比、某指标随时间的变化2、关系指标:指两个有关的、但非同类事物的数量比。如医务从员与床位比、3、计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。四、应用相对数时注意的问题1、计算相对数的分母不宜过小:如少于30例时以绝对数表示为好,必须用时应给出可信区间。但动物实验中,经周密设计、精选对象、严格控制实验因素,每组10只动物也可求率2、分析时不能以构成比代替率,防止概念混淆,称为率不一定都相同构成比只能说明事物各组成部分的比重或分布,并不说明某现象发生的频率或强度。实际应用中常出现的错误:指标的选择错误:通常是应计算频率指标而选择了构成比用构成指标来下频率指标的结论易导致错误结论(把构成比当成率来分析)3、应当注意不能用构成比的动态分析代替率的动态分析4、对观察单位不等的几个率不能直接求总率,而应分子相加除以分母相加5、在比较相对数时应注意可比性观察对象、研究方法、观察时间、地区和民族等因素应相同或相近其它影响因素在各组的内部构成是否相同6、对样本率(或构成比)的比较应随机抽样,原则上需要进行参数估计,并做假设检验。但对相对比的统计推断非常困难,对强度型指标的统计推断也不容易,而对频率分布作统计推断的理论和技术却比较成熟。第二节率的差别的统计学检验一、率的标准误standarderrorofrate:表示率的抽样误差的大小:样本含量总体率率:总体中某现象的发生:率的标准误nnpp)()1(Nxi2)(nx0,1,1,0,0,……:n个1,n-n个0n个(1-)2,n-n个(0-)2(x-μ)2=n(1-)2+n(1-)(0-)2=n(1-)(1-+)=n(1-)由于实际工作中,总体率一般不知道,故常用样本率p来代替,计算率的标准误的估计值Spq=1-p为样本的阴性率P140,例11-1npqSp二、总体率的可信区间当总体率不是太靠近0%或100%,且每次抽取的样本含量n不是太小时,样本率的分布近似正态分布,可用正态理论求可信区间:总体率的95%可信区间:p1.96Sp总体率99%可信区间:p2.58Sp不符合以上要求时,改用二项分布或poisson理论估计可信区间三、样本率与总体率差别的统计意义检验:用正态分布理论进行,P141例11-2四、两个样本率差别的显著性检验P142例11-3ppu)11(21)()(212121nnpqSSppupppp第三节率的标准化法一、标准化法standardizationmethod的意义和基本思想1、何时需标化:当两组或多组率之间比较时,其内部各小组的率明显不同,且各小组观察例数的构成比(如年龄、性别、工龄、病情轻重、病程长短等)也明显不同时,则不能直接比较两组或多组的总率,得出结论。原因见P143表11-82、标准化法:若比较的两组或多组率,当内部构成不同时,需要按统一的“标准”进行调整,使之具备可比性,称指标标准化。3、选取的标准:统一的标准(人口年龄、病型、病情轻重、病程长短)构成:计算出直接标化率。以消除人口构成不同对总率的影响,以具可比性标准(年龄)组(死亡)率:计算出间接标化率率的标化思想亦可用于均数的标准化:如两组平均治疗天数的影响应考虑病程、病型、病期等的标准化。二、标准化率的计算方法(一)直接法directstandardization标准化率standardizationrate亦称调整率adjustedrate直接标化法是利用同一人口年龄构成(标准人口构成)与实际年龄别死亡率求得的一个调整率。为各年龄组死亡率;为标准组人口年龄构成为标准总人口数为各组标准人口数;或iiiiiiipNNNNpNNNpNp)('计算步骤:以P144表11-9,10为例1、将标准构成的各年龄组人口数乘上原来相应年龄组的死亡率,得出各年龄组按标准人口计算的预期死亡数Nipi2、各年龄组预期死亡数相加,得预期总死亡人数Nipi,将预期总死亡数除以标准总人口数,得出直接标化率采用标准人口构成比时,计算见P144表11选用直接标化的条件:有被比较的两组资料的年龄别死亡率资料有标准人口构成或构成比(二)间接法indirectstandardization:利用标准年龄别死亡率与相互比较的两组年龄别人口数计算求得的死亡率选用间接法的条件:有被比较的两组资料的各年龄别人口数及总死亡率(或数)已知作为标准的某一人口各年龄别死亡率及其总死亡率常用于:实际各年龄组死亡率未知时计算步骤:以P145表1-12为例1、将各年龄组标准死亡率分别乘以各县相应年龄组的人口数,得出各年龄组预期死亡数nipi2、分别将两县各年龄组预期死亡人数相加,得各县预期总死亡数nipi3、将各县实际死亡数除以预期总死亡数,称为SMR标准化死亡比,standardizedmortalityratio,1表示被标化人群死亡率高于标准组,反之亦然。实际应用中需要进行SMR是否为1的假设检验4、以各县的SMR乘以原来(标准)的总死亡率,得间接标化死亡率为标化死亡比=为预期死亡数为被标化实际死亡数为各组标准组的率为标准总率iiiiiiiPnrSMRPnrPPSMRPPnrPp'三、标准的选择:方法有三1、选用一个通用的、有代表性、较稳定的、来自数量较大的人群的年龄别人口数(或年龄构成)或年龄别死亡率作为需要比较的各组资料的标准。2、把比较的两组或几组资料中,各年龄组人口数加在一起组成一个新的人口构成作为标准3、由相互比较的两组或几资料中,任选其中一组人口年龄构成比或年龄别死亡率作为共同的标准四、标化使用注意事项1、标化法是采用统一标准人口年龄构成,以清除由于构成明显差异造成对率的影响,使算得的标准总率具有可比性;一般情况下直接法简便易理解,更为常用。如果原资料中有些年龄组人口过少,致使年龄别死亡率波动较大,则宜用间接法。2、标化后的率并不代表某地实际水平,只能表明相互比较资料间的相对水平,且仅限于采用共同标准构成的组间比较。3、选用不同标准算得的标化率不同,但标化率的对比趋势通常是一致的,但也有不一致的情形出现,所以,取全国或两组合计的人口来计算标化率比较妥。4、如不计算标化率,而分别比较各分组的率,也可得出正确结论,但不能比较总率的大小5、两样本标化率是样本值,存在抽样误差,若欲得出标化组和被标化组的总率是否相等的结论,还应作假设检验五、标化率差别的统计意义检验当选用直接法计算时,可应用“内部构成不同的两率差别的统计意义检验”法中的加权卡方检验法(Cochran检验),计算过程见P147-149第四节重复检验结果总阳性的计算一、总阳性率的计算寄生虫感染检验常采用第一次阴性者再进行第二检查,若阴性再进行第三次检查,得三次阳性率。错误方法:直接算三个阳性的均值;三次阳性者的合计除第一检查人数(全部阴性者均参与下一次检查时正确)。合理方法:先算出各次检查的阳性率和阴性率,根据乘法定理,经过n次检查的总阴性率为各次阴性率的乘积。1-总阴性率即为总阳性率。见P150表11-18实例二、标准误的计算nnnnqNpNpNpqS...2211三、两个总阳性率的比较以两村各次的复检人数及阳性人数合并计算其期望阳性率,以各村各次受检人数乘以该次期望阳性率即得各村各次检验的期望阳性人数,然后将各村阳性人数相加为TA及TB与两村实际人数OA及OB作卡方检验BBBAAATTOTTO222)()(自由度为组数-1注意:如果各村是全面调查,则不需要计算标准误及作统计意义检验