26·第三章分类资料的统计描述名人名言吾志所向,一往无前;愈挫愈奋,再接再励。孙中山第一节常用相对数例3-1某医生调查甲乙两中学初中三年级学生的近视眼患病情况,结果甲校近视眼患者为100人,乙校近视眼患者60人,甲校比乙校多40人,由此得出甲校近视眼患病情况比乙校严重。你认为该结论是否正确?为什么?【问题3-1】1.这是什么资料?2.该医生分析结论是否正确?为什么?3.如何正确分析比较?【分析】(1)近视眼患病人数是按患病与未患病分类,属于二分类资料,即计数资料。(2)该医生分析结论不正确。因为患病人数是根据患病与未患病分组直接清点各组所得数据即绝对数,可以说明某现象在一定条件下的规模和实际水平,但不能互相比较,因基数(或调查人数)未知。(3)若要比较两校近视眼患病严重程度,还需要考虑两校被调查的学生数,计算两校学生近视眼患病率后才能比较。近视眼患病率是近视眼患病人数除以调查人数所得的比值,是一种相对数。相对数(relativenumber)是分类资料的描述性统计指标,是两个有联系指标之比。常用相对数有率、构成比、相对比和动态数列,对比的两个指标可以是绝对数、相对数、平均数等,性质可以相同,也可以不同。假如调查了甲校400人,乙校200人,则甲校近视眼患病率为100/400×100%=25%,乙校近视眼患病率为60/200×100%=30%,可见乙校近视眼患病率高于甲校。【知识点3-1】1.绝对数是分类资料整理中,根据资料的类别直接清点各组所得的数据。2.相对数是分类资料的描述性统计指标,是两个有联系指标之比。常用相对数有率、构成比、相对比和动态数列。3.对比的两个指标可以是绝对数、相对数、平均数等,性质可以相同,也可以不同。例3-2某年某地不同年龄组某病的患病情况见表3-1,某医师由此认为“20~”年龄组的患病情况最为严重。该结论是否正确?为什么?表3-1某年某地不同年龄组某病的患病情况比较27年龄组(岁)(1)调查人数(2)患病人数(3)患病构成比(%)(4)与0~之比(5)0~60030182021.241.0020~38013301935.241.6640~20260220825.771.2160~7120152117.750.84合计1254238568100.00—【分析】该结论不正确。原因是以患病构成比代替患病率来说明问题。上表第4栏是每一组患病人数除以总患病人数得到的;第5栏是定基比,以“0~”岁组的患病构成比作基数,每组患病构成比与之相比。从第4栏和第5栏可以看出,患病构成比是随着年龄的增加而增大,“20~”岁组达到最高峰(达35.24%),以后随着年龄的增加而逐渐减少,“60~”岁组最低,但这并不能说明“20~”岁组的患病情况最为严重,见图3-1(A),只能说明“20~”岁组患病构成比重最大。要说明患病的严重程度,需要用患病率来比较。在表3-1的基础上,用患病人数除以调查人数计算出患病率,见表3-2第6栏和图3-1(B)。从患病率可以看出,患病率是随着年龄的增加而增大,“60~”岁组患病最严重,原因是疾病免疫力或抵抗力是随着年龄的增加而减少。因此,该医师用患病构成比来代替患病率分析是错误的。表3-2某年某地不同年龄组某病的患病情况比较年龄组(岁)(1)调查人数(2)患病人数(3)患病构成比(%)(4)与0~之比(5)患病率(%)(6)=(3)/(2)0~60030182021.241.003.0320~38013301935.241.667.9440~20260220825.771.2110.9060~7120152117.750.8421.36合计1254238568100.00—6.8321%35%26%18%0~岁20~岁40~岁60~岁05101520250~20~40~60~年龄组(岁)患病率(%)AB图3-1某年某地不同年龄组某病的患病情况比较一、率(rate)281.意义率(rate)是说明某现象发生的频率或强度,又称为频率指标。2.计算公式某现象实际发生的观察单位数率比例基数可能发生该现象的观察单位总数(3-1)表3-2第7栏“0~”的患病率为1820/60030=3.03%,由第2、3栏的数据算得,依次类推,可算得“20~”、“40~”和“60~”岁组的患病率分别为7.94%、10.90%和21.36%。比例基数可以取100%或1000‰100000/10万等。比例基数的选择主要根据习惯用法或使计算的率有适当位数的整数,而且整数不太大;小数位数保留1~2位即可。3.特点例3-3南华大学某医师在研究乳腺癌与C-erbB-2表达的关系时,数据显示:55例特征表现为肿块的其C-erbB-2阳性表达率为69.1%,19例乳腺癌X线特征表现为局限浸润致密影的其C-erbB-2阳性表达率为73.7%,17例乳腺癌X线特征表现为单纯钙化的其C-erbB-2阳性表达率为82.4%,三者之间差异无统计学意义(2=1.162,P=0.559)。表3-3乳腺癌X线直接征象与C-erbB-2表达的关系影像表现例数C-erbB-2阳性阳性率(%)肿块553869.1局限浸润致密影191473.7单纯钙化171482.4合计916672.5单纯钙化局部浸润致密影肿块影像表现100.0080.0060.0040.0020.000.00阳性率(%)82.473.769.1图3-2乳腺癌X线直接征象与C-erbB-2表达的关系从表3-2、表3-3和图3-2看出,率有以下两个特点:(1)一般合计率或总率不等于100%。(2)某一部分的分率改变不影响其它分率的变化。294.应用在医疗卫生工作和科学研究的分析中应用非常广泛,如患病率、发病率、死亡率、病死率、阳性率、治愈率、有效率等。二、构成比(proportion)1.意义构成比(proportion)是表示某事物内部各组成部分所占的比重或分布,常以百分数表示。2.计算公式100事物内部某一组成部分的观察单位数构成比%该事物各构成部分的观察单位总数(3-2)表3-1第4栏的患病构成比是由第3栏算得的,其中“0~”占全部患病人数的比重为1820/8568×100%=21.24%,依次类推,可算得“20~”、“40~””和“60~”所占的比重分别为35.24%、25.77%和17.75%。例3-4某县医院2000年各科病床数均为100张病床,2005年各科病床数如2005年外科病床增加了100张病床,见表3-4和图3-3。表3-4某县医院2000年和2005年各科病床数比较科室2000年2005年病床数构成比(%)病床数构成比(%)内科10025.010020.0外科10025.020040.0妇产科10025.010020.0其它科10025.010020.0合计400100.0500100.025%25%25%25%内科外科妇产科其它科20%40%20%20%内科外科妇产科其它科2000年2005年图3-3某县医院2000年和2005年病床数比较例表3-4中各个科室的病床构成比等于各个科室数除以合计病床数乘100%,如2000年内科病床构成比=100÷400×100%=25.0%,其余依次类推,各科室病床数构成比总和等于100%。在2005年,由于外科病床数增加100张,外科病床数构成比从25.0%增加为40.0%,其余科室的病床数没有改变,但构成比从25.0%下降为20.0%,因要保持总病床构成比为100.0%。303.特点从表3-2、表3-4和图3-3看出构成比有两个特点:(1)某事物内部各构成比的总和必定等于100%,即各分子的总和等于分母。(2)某一部分构成比的改变受到两方面因素的影响:一是其本身数量的变化,二是同一内部其他部分数量的变化。4.应用在医疗卫生工作和科学研究的分析中应用非常广泛,如年龄构成、血型构成、病种构成、死亡原因等。三、相对比(relativeratio)1.意义相对比(relativeratio)是表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。2.计算公式%)100(或乙指标甲指标相对比(3-3)式中甲、乙指标可以是相对数、绝对数、平均数。如果甲指标大于乙指标,用倍数表示;如果甲指标小于乙指标,用百分数表示。例表3-3中,试验组和对照组有效率相对比为95.2%÷82.2%=1.2倍。3.特点(1)甲乙两个指标的性质可相同也可不同。(2)甲乙两个指标可以是绝对数、相对数或平均数。4.应用在医疗卫生工作和科学研究的分析中应用也非常广泛,如性别比、人口密度、医生(护士)床位比等。【知识点3-2】1.率是说明某现象发生的频率或强度。某一分率改变不影响其它分率变化。2.构成比是表示某事物内部各组成部分所占的比重或分布。某一部分构成比的改变将影响其它构成比的变化。3.相对比表示两个有关事物指标之比,用以说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数、相对数或平均数。第二节动态数列例3-5某县医院1995~2005年门诊就诊人数的统计数据见表3-5,试作动态分析。表3-5某县医院1995-2005年门诊就诊人数动态变化年份(1)符号(2)门诊就诊人数(3)绝对增长量发展速度(%)增长速度(%)累计(4)逐年(5)定基比(6)环比(7)定基比(8)环比(9)1995a04700——100.0100.0——311996a15000300300106.4106.46.46.41997a25300600300112.8106.012.86.01998a35400700100114.9101.914.91.91999a45650950250120.2104.620.24.62000a558201120170123.8103.023.83.02001a660101310190127.8103.327.93.32002a762801580270133.6104.533.64.52003a864501750170137.2102.737.22.72004a96500180050138.3100.838.30.82005a1067002000200142.6103.142.63.1【分析】动态数列(dynamicseries)是按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。动态数列分析建立在相对比基础上,采用定基比和环比两种方式。常用的动态数列分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。1.绝对增长量说明事物在一定时期所增长的绝对值。绝对增长量可计算:(1)累计增长量,若以1995年该县医院门诊就诊人数为基数,各年门诊就诊人数与其相减即得,如1998年门诊就诊累计增长量为5400–4700=700(人);(2)逐年增长量,即以下一年门诊就诊人数与上一年相减,如表3-5第5栏。2.发展速度和增长速度可计算:(1)定基比,即统一以某个时间的指标为基数,用各时间的指标与之相比;(2)环比,即以前一个时间的指标为基数,用相邻的后一时间的指标与之相比。发展速度和增长速度是说明事物在一定时期的速度变化。增长速度=发展速度–1(或100%)。如:2000年定基发展速度=5820/4700×100%=123.8%2000年定基增长速度=123.8%–100%=23.8%2000年环比发展速度=5820/5650×100%=103.0%2000年环比增长速度=103.0%–100%=3.0%按上述方法分别计算出各时期的发展速度与增长速度。见表3-5的第6~9栏。3.平均发展速度和平均增长速度平均发展速度是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐年平均发展变化的程度。平均增长速度是各环比增长速度的平均数,说明某事物在一个较长时期中逐年平均增长的程度。其计算公式为平均发展速度=nnaa0(3-4)式中:a0为基期指标;an为第n年指标。平均增长速度=平均发展速度–1(