计数资料的统计描述华中科技大学同济医学院公共卫生学院熊光练2013年9月基数数据(cardinaldata)区间尺度数据(intervalscaledata)比例尺度数据(ratioscaledata)有序数据(ordinaldata)名义尺度数据(nominalscaledata)可以使用某种尺度测出任何两个数据的距离。基数数据的均值和标准差都是有意义的。对于基数数据,如果零点是任意的(零点意义不明确)称为区间尺度数据。零点固定(零点意义明确)称为比例尺度数据。任何两个数据的比值是有意义的。可以排列次序,比较大小,但是没有指定的数值。通常的算数运算没有意义。不同的数值代表的是类型,而类型是没有次序的。13:59:542本质是事物的根本性质,是事物自身组成要素之间相对稳定的内在联系,是由事物本身所具有的特殊矛盾构成的。组成事物的要素以及要素之间的关系结构是事物本质存在的客观基础,一个事物和其他事物的本质区别是由事物的各个特殊的组成要素及其关系结构决定的。要素关系结构本质=+计数资料类别数量,强度结构优势计数资料本质的描述维度计数资料--》性质--》类别--》数量总量分析频数分析集中度分析位次分析均衡性分析绝对总量相对总量绝对集中度相对集中度强度是某个量的多少或强弱程度。结构是一系统诸要素之间的组织形态,包括诸要素及组织的序量、张量等。优势是指某些方面超过同类的形势。计数资料描述静态指标动态指标强度绝对量、相对量结构构成优势比、优势比趋势动态数列发展内容•相对数–强度–分布–相对比•应用相对数时的注意事项•率的标准化法–标准化法的意义和基本思想–标准化率的计算•应用标准化法的注意事项•动态数列及其指标–绝对增长量–发展速度与增长速度–平均发展速度和平均增长速度•医学上常用指标相对数相对数(Relativenumber):是两个有关联的数据之比,用以说明事物的相对关系,便于对比分析。常用的相对数指标很多,按联系的性质和说明的问题不同,主要分为:率、构成、相对比三类。表1.不同工种调查对象白细胞减少症患者统计调查对象患者患病频率(%)工种例数百分比(%)病例数百分比(%)笨作业39835.42945.37.3塑料作业31127.71320.34.2化学药物26023.21320.35.0放射作业15413.7914.15.8合计1123100.064100.05.7不同工种调查对象白细胞减少症登记表观察序号年龄性别工种…白细胞减少症156男笨作业…是247女塑料作业…否325男化学药物…否………………112359男放射作业…是收集数据--》整理--》统计数据粒度强度相对数--频率(frequency)是最常见的一种相对数,频率在实践中又称为比率(proportion)。它表示事物内部某个组成部分所占的相对多少。具有可比性。计算公式:某现象出现的数量比率=--------------------------------------------X100%(K)观察的全部可能现象数量结构相对数—构成比(constituentratio)概念:说明某事物内部各组成部分所占的比重或分布,又称构成比。计算公式:某部分的数量某部分的比重(%)=------------------------------------X100%事物内部各部分数量的和基数:100%。构成比可相加,和等于100%。优势相对数----比(ratio)比是指两个有关联的指标A和B之比,简称比。A和B可以是性质相同,也可以是性质不相同。通常以倍数或百分数(%)表示。计算公式:A比=-------X100%B式中A、B指标可以是绝对数、相对数或平均数等。两种相对比对比指标:指两个同类事物某种指标的比,说明一个数为另一个数的几倍或百分之几,两指标可是绝对数、相对数或平均数。如:2000年我国人口普查,男子65355万人,女子61228万人,男女性别比为:1.0674关系指标:指两个相关的、但非同类事物的数量比。如:某医院1995年医护人员为875人,同年平均开放病床1436张,医护人员与病床数之比为:(875÷1436)×100=61(人),表示该医院每100张病床平均配备61名医护人员。病床与医护人员之比为:1436÷875=1.64,表示每名医护人员平均负责1.64张病床。应用相对数时的注意事项1、正确理解相对数的含义,常见问题是解释错误。2、频率型指标的解释要紧扣总体与属性3、计算相对数时分母应有足够数量4、正确计算合计率5、注意资料的可比性在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近。下列因素可能影响对比组之间的可比性:(1)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。(2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同。(3)对比不同时期资料应注意客观条件是否相同。6、样本相对数的统计推断在随机抽样的情况下,从样本估计值推断总体的相对数应当考虑抽样误差,不能仅凭数字表面差别的大小下结论,而应根据需要进行参数估计和假设检验。第二节粗率的标准化法一、标准化法的意义和基本思想比较两个(或两个以上)总体率时,如果两个总体的内部构成有所差别(年龄、性别、病情等影响因素构成不同),就不能直接拿两个总体率来做比较和下结论。只有通过采用统一的标准消除其内部构成上的差别之后,才能进行比较,这种消除内部构成差别,使总体率能够直接进行比较的方法就叫做率的标准化法。采用统一标准调整后的率为标准化率,简称为标化率(standardizedrate)。标准化的基本思想:采用统一的“标准人口构成”,以消除人口构成不同对各组总率的影响,使算得的标准化率具有可比性。表3-4甲、乙两种疗法治疗某病的治愈率比较病型甲疗法乙疗法病人数治愈数治愈率(%)病人数治愈数治愈率(%)普通型30018060.01006565.0重型1003535.030012541.7合计40021553.840019047.5对比下表两种疗法的治愈率二、标准化率的计算•(一)标准化方法•1、直接法如对死亡率的年龄构成标准化,若已知各属性的率(如:年龄别死亡率,可采用);•2、间接法若只有总死亡数和年龄别人口数而缺乏各属性的率(如缺年龄别死亡率),或各年龄组人口数较小,年龄别死亡率不稳定,宜用间接法。•选择标准构成的方法通常有三种:•1.两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。•2.两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。•3.另外选用一个通用的或便于比较的标准作为两者的“共同标准”,如采用全国、全省或全地区的数据作为标准。这种方法适用于直接法和间接法。(二)计算标准化率直接法标准化率:选择年龄别人口数作标准,iiNppN(3-5)选择年龄别人口构成比作标准,iiNppN(3-6)Ni为标准年龄别人口数,ip为实际年龄别死亡率,N为标准人口总数。Ni/N为标准年龄别人口构成比。1.直接标准化法表3-5按式(3-5)用直接法计算标准化治愈率(%)病型(1)标准治疗人数(Ni)(2)甲疗法乙疗法原治愈率预期治愈数(pi)(Nipi)(3)(4)=(2)(3)原治愈率预期治愈数(pi)(Nipi)(5)(6)=(2)(5)普通型40060.024065.0260重型40035.014041.7167合计800(N)—380∑Nipi—427∑Nipi380100%47.5%800p甲疗法标准化治愈率 427100%53.4%800p乙疗法标准化治愈率 2.间接标准化法选择年龄别死亡率作标准,iirpPPSMRnP(3-7)式(3-7)中P为标准总死亡率,r为实际总死亡数,in为实际年龄别人口数,iP为标准年龄别死亡率,in与iP的乘积和iinP为预期死亡数,riinP为标准化死亡比(standardmortalityratio,SMR),用SMR表示。表3-61998年某省城乡女性原发性骨质疏松症患病率比较年龄组(岁)(1)城市农村调查人数(2)患病人数(3)患病率(%)(4)调查人数(5)患病人数(6)患病率(%)(7)50~354……241……60~251……315……70~130……175……80及以上41……58……合计77632241.578933542.5表3-7按式(5-12)用间接法计算标准化患病率(%)年龄组(岁)(1)标准患病率iP(2)城市农村人口数in(3)预期患病人数iinP(4)=(2)(3)人口数in(5)预期患病人数iinP(6)=(2)(5)50~21.3354752415160~46.125111631514570~65.51308517511580及以上71.741295842合计42.17763057893531)选另一个地区某年的50岁以上老年妇女原发性骨质疏松症的年龄组患病率iP作为标准,见表3-7第(2)栏。2)按式(3-7)分别计算城乡两地的SMR及标准化患病率3221.05305SMR城市原发性骨质疏松症标准化患病比42.1%1.0544.2%p城市原发性骨质疏松症标准化患病率3350.95353SMR农村原发性骨质疏松症标准化患病比42.1%0.9540.0%p农村原发性骨质疏松症标准化患病率经标准化后,城市原发性骨质疏松症标准化患病率高于农村。若SMR1,表示被标化人群的死亡率高于标准组;反之,若SMR1,表示被标化人群的死亡率低于标准组。样本的SMR有抽样误差,在单独使用SMR这个指标时,还需作总体SMR是否为1的假设检验。标准总死亡率P与SMR的乘积为间接法的标准化死亡率。三、应用标准化的注意事项•1.标准化法应用广泛,可用于不同年龄、性别、工种、病情的内部构成不同的标准化。•2.标准化率因选择的标准人口而不同。因此,当比较几个标准化率时,应采用同一标准人口。•3.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。•4.两样本标准化率是样本值,存在抽样误差。当样本含量较小时,比较两样本的标准化率,需要作假设检验。第三节动态数列及其指标•动态数列(dynamicseries)•是按时间顺序排列的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。•分析动态数列常用的指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。一、绝对增长量•绝对增长量是说明事物在一定时期增长的绝对值。•①累计增长量:即报告期指标与基线期指标之差。•②逐年增长量:即报告期指标与前一期指标之差。例3-5某医院1998~2005年日门诊量的统计数据见表3-8第(1)、(3)栏,试作动态分析。表3-8某医院1998-2005年日门诊量动态变化年份(1)指标符号(2)日门诊人次(3)绝对增长量发展速度%增长速度%累计逐年(4)(5)定基比环比(6)(7)定基比环比(8)(9)19980a2680——100.0100.0——19991a3450770770128.7128.728.728.720002a38751155425144.6112.344.612.320013a44881808613167.5115.867.515.820024a555028701062207.1123.6107.123.620035a54632783-87203.898.4103.8-1.620046a660039201137246.3120.8146.320.820057a760249221002283.7115.2183.715.2二、发展速度与增长速度•1.发展速度•表示报告期指标的水平相当于基线期(或前一期)指标的百分之多少或若干倍。定基比发展速度为%8.2032680546305aa环比发展速度为%4.9855505463