第五章定性资料的统计描述5-1第五章定性资料的统计描述【思考与练习】一、思考题1.应用相对数时需要注意哪些问题?2.为什么不能以构成比代替率?3.标准化率计算的直接法和间接法的应用有何区别?4.常用动态数列分析指标有哪几种?各有何用途?5.率的标准化需要注意哪些问题?二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测,发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例,于是该医生得出结论:女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。该结论是否正确?为什么?三、最佳选择题1.某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为BA.率B.构成比C.发病率D.相对比E.时点患病率2.标准化死亡比SMR是指AA.实际死亡数/预期死亡数B.预期死亡数/实际死亡数C.实际发病数/预期发病数D.预期发病数/实际发病数E.预期发病数/预期死亡数3.某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死第五章定性资料的统计描述5-2亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数:11395283.18%16774p,2139521936983.08%1677423334p,313952101.86/1013697600p万,416774122.46/1013697600p万,523334176.85/1013194142p万,645ppp71395219369123.91/101369760013194142p万81677423334149.15/101369760013194142p万该地男性居民五种心血管疾病的死亡率为DA.1pB.2pC.3pD.4pE.5p4.根据第3题资料,该地居民五种心血管病的总死亡率为EA.1pB.2pC.5pD.6pE.8p5.根据第3题资料,该地男、女性居民肺心病的合计死亡率为DA.2pB.5p第五章定性资料的统计描述5-3C.6pD.7pE.8p6.某地区2000~2005年结核病的发病人数为015,,,aaa,则该地区结核病在此期间的平均增长速度是DA.0156aaaB.6015aaaC.550aaD.5501aaE.560aa7.经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,发生此现象最有可能的原因是CA.甲地的诊断技术水平更高B.乙地的恶性肿瘤防治工作做得比甲地更好C.甲地的老年人口在总人口中所占比例比乙地多D.乙地的老年人口在总人口中所占比例比甲地多E.甲地的男性人口在总人口中所占比例比乙地多8.下列不属于相对比的指标是CA.相对危险度RRB.比值比ORC.病死率D.变异系数CVE.性别比第五章定性资料的统计描述5-49.计算标准化率时,宜采用间接法的情况是BA.已知被标准化组的年龄别死亡率与年龄别人口数B.已知被标准化组的死亡总数与年龄别人口数C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大四、综合分析题1.为研究经常吸烟与慢性阻塞性肺病(COPD)的关系,1998~2000年间,某医生收集了356例COPD患者的吸烟史,经常吸烟(日平均1支以上,30年)的COPD患者有231例;而同时期同年龄段的479名非COPD患者中,经常吸烟的有183例。试计算两组患者的经常吸烟率,并分析经常吸烟对COPD的影响。2.某地居民1998~2004年某病的死亡率资料如表5-1所示,试作动态分析。表5-1某地居民1998~2004年某病死亡率(1/10万)年份1998~1999~2000~2001~2002~2003~2004~死亡率160.5144.2130.0120.285.669.538.53.对某地不同年龄、性别人群的HBsAg阳性率进行检测,结果如表5-2所示,试比较该地男、女HBsAg阳性率。第五章定性资料的统计描述5-5表5-2某地不同年龄、性别人群的HBsAg阳性率(%)年龄组(岁)男性女性检查数阳性数阳性率检查数阳性数阳性率0~521122.30560132.3220~516142.71957262.7240~710436.06836546.4660~838637.52570498.60合计25851325.1129231424.86【习题解析】一、思考题1.①计算相对数应有足够的观察单位数;②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验。2.率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。3.对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。4.常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长第五章定性资料的统计描述5-6程度。5.①标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不相同。因此标准化率是用于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。二、案例辨析题该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。三、最佳选择题1.B2.A3.D4.E5.D6.D7.C8.C9.B四、综合分析题1.解:表5-3经常吸烟与慢性阻塞性肺病(COPD)的关系分组调查人数经常吸烟经常吸烟率(%)是否COPD患者35623112564.89非COPD患者47918329638.20COPD患者的经常吸烟率:231/356×100%=64.89%非COPD患者经常吸烟率:183/479×100%=38.20%第五章定性资料的统计描述5-7COPD患者的经常吸烟率比非COPD患者高26.69%231296=2.989125183OR比值比()还需进一步对OR作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量,case表示分组(0为非COPD患者,1为COPD患者),smok表示吸烟情况(0为非经常吸烟,1为经常吸烟),freq表示频数;再点击DataView标签,录入数据(见图5-1,图5-2)。图5-1VariableView窗口内定义要输入的变量case、smok和freq图5-2DataView窗口内录入数据分析:Data→WeightCases…第五章定性资料的统计描述5-8WeightCasesby:Frequency框:freqOKAnalyze→DescriptiveStatistics→CrosstabsRows框:caseColumns框:smokStatistics:RiskContinueOK输出结果分组*吸烟情况CrosstabulationCount296183479125231356421414835非COPD患者COPD患者分组Total不吸烟吸烟吸烟情况TotalRiskEstimate2.9892.2473.9761.7601.5032.061.589.513.675835OddsRatiofor分组(非COPD患者/COPD患者)Forcohort吸烟情况=非经常吸烟Forcohort吸烟情况=经常吸烟NofValidCasesValueLowerUpper95%ConfidenceInterval2.解:表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化年份符号死亡率绝对增长量发展速度增长速度累计逐年定基比环比定基比环比1998~a0160.5——————1999~a1144.2-16.3-16.30.900.90-0.10-0.102000~a2130.0-30.5-14.20.810.90-0.19-0.102001~a3120.2-40.3-9.80.750.92-0.25-0.082002~a485.6-74.9-34.60.530.71-0.47-0.29第五章定性资料的统计描述5-92003~a569.5-91-16.10.430.81-0.57-0.192004~a638.5-122-310.240.55-0.76-0.45该病死亡率的平均发展速度60=/38.5/160.50.79nnaa该病死亡率的平均增长速度=1=0.791=0.21平均发展速度3.解:因为该地男、女性的年龄构成有所不同,为了消除年龄构成的不同对HBsAg阳性率的影响,应先进行标准化再进行比较。根据本题资料,以男、女合计为标准人口,已知被标化组的年龄别阳性率,采用直接法计算标准化阳性率。表5-5直接法计算某地不同年龄、性别人群的HBsAg标准化阳性率(%)年龄组标准人口数iN男性女性原阳性率ip预期阳性数iiNp原阳性率ip预期阳性数iiNp0~10812.3024.902.3225.0920~14732.7139.972.7240.0240~15466.0693.636.4699.8660~14087.52105.858.60121.04合计5508(N)5.11264(iiNp)4.86286(iiNp)男性HBsAg标准化阳性率:264100%4.79%5508p女性HBsAg标准化阳性率:286100%5.19%5508p可见,经标准化后女性HBsAg阳性率高于男性。SPSS操作数据录入:打开SPSSDataEditor窗口,点击VariableView标签,定义要输入的变量p1、c1、p2和c2;再点击DataView标签,录入数据(见图5-3,图5-4)。第五章定性资料的统计描述5-10图5-3VariableView窗口内定义要输入的变量p1、c1、p2和c2图5-4DataView窗口内录入数据分析:Transform→Compute…TargetVariable:键入sp要生成的变量为spNumericExpression:键入p1+p2生