第十章统计表与统计图statisticaltableandstatisticalgraph作用与特点统计研究结果的表现形式是多种多样的。除单纯的文字叙述外,统计表与统计图也是一种常用形式。统计图表简单明了,可代替冗长的文字叙述,便于阅读和把握主要的研究结果。在数字语言中,统计表应是基本的,统计图常起补充作用。把文字叙述与统计图表结合起来才是最完美、最生动的数字语言。统计图表都是一种具有综合性和总结性的叙述数字资料的方法。统计图在表示事物的变化趋势、事物间关系和分布方面有其特别的优势,缺点是对资料的描述不够细致。统计表则容量大,能将数字精确到所需小数位,并有利于进一步的统计处理,故其应用更为广泛。表12000年三种杂志统计表使用情况杂志使用率(%)中华内科杂志85.0中华儿科杂志87.3中华预防医学杂志87.82000年对7种中华系列杂志(中华内科杂志、中华儿科杂志、中华风湿病学杂志、中华预防医学杂志、中华病理学杂志、中华眼科杂志、中华放射学杂志)717篇论著的调查,有统计图的80篇(11.2%),共有统计图132个。第一节统计表statisticaltable调查表整理表统计分析表一、统计表的编制要求简单明了,重点突出,对比鲜明。主语谓语划分清楚。主语是统计表所要说明的事物,谓语是用来说明事物的指标,多为数字指标。一般说来,统计表的主语排在左端,谓语排在表的右端。二、统计表的结构表号标题横标目名称纵标目横标目数字合计1、标题:标题应概括表的主要内容,一般包括研究的时间、地点和研究内容,写在表的上端中央。2、标目:标目是表格内的项目。标目有横目和纵标目两种。横标目列于表的左侧,是表的主语位置,说明横行数字的涵义,一般是所分析研究事物的分组。纵标目列于表的右上方,是表的谓语位置,说明各纵列数字的涵义,一般表示被研究事物的各项指标。3、线条:一张表至少要有三条线(三线表)。有合计栏的表格可再用横线将“合计”分隔开,对一些有两组标目的组合表,需用横线将两组标目分隔开。其它竖线和斜线一概省去。4、数字:一般用阿拉伯数字表示,同一指标的小数位应一致,且按小数点位数对齐。不留空格,无数字用“—”表示,缺失数字用“…”表示。5、备注:不要列入表内,如表内有需要说明的内容,应在表内做出*号标记,并在表底线下加以说明。三、统计表的种类1、简单表表2某地某年**药治疗急性咽喉炎疗效比较级别例数有效数有效率(%)试验组1079386.9对照组1089477.82、组合表表3某地某年不同年龄、性别的儿童青少年意外损伤情况年龄(岁)男女调查数损伤数损伤率(%)调查数损伤数损伤率(%)3.5--4476614.77424296.846.5--1215927.571239534.289.5--118012210.341070807.4812.5--121715012.331136665.8115.8--18.56226510.45582203.44合计468149510.5744512485.57四、应用举例表4治疗组与对照组的疗效比较治疗组对照组疗效常规剂量大剂量常规剂量大剂量例数百分率(%)例数百分率(%)例数百分率(%)例数百分率(%)显效21/6830.914/6023.30/240.03/319.7有效43/6863.244/6073.321/2487.526/3183.9无效4/685.92/603.43/2412.52/316.4总有效率64/6894.158/6096.722/2487.529/3193.5表5不同治疗剂量的治疗组和对照组疗效比较*:总有效=显效+有效级别总例数疗效总有效*显效有效无效例数率(%)治疗组1283587612295.3常规剂量68214346494.1大剂量60144425896.7对照组5534755090.9常规剂量2402132187.5大剂量3132622993.5问题:某地不同年龄儿童身高体检资料年龄例数均数±标准差587114.1±5.086605117.4±5.88--------------例10-1表10-1列出某地进行喷昔洛韦软膏(试验组)治疗颜面单纯疱疹与阿昔洛韦软膏(对照组)比较的随机对照临床试验结果。该表只有试验分组一个层次,属简单表。表10-1某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较组别例数治愈数治愈率(%)治愈天数试验组1079386.95.7±1.3对照组1088477.86.4±1.2例10-2某年某地分别在城乡进行乙型肝炎病毒抗原携带者的检测,该研究的对象按城乡和年龄两个特征分层,结果列在表10-2。该表属组合表。表10-2某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析年龄组城市乡村检查数阳性数阳性率(‰)检查数阳性数阳性率(‰)20423842746.469854494.9720~22807620188.85138741248.9425~235879269711.43841413415.9330~146142209314.3256909015.8235~74629129917.4139508120.51≥402119327312.8814993120.68合计748303865411.564328150911.76例10-3某地进行冠心病危险因素研究时,调查了居民的心理得分值与其他冠心病有关因素,结果列成表10-3(表略)。该表存在许多问题,首先将太多的内容放在一个表里,特别是将两种不同类型资料的统计量放在同一表中。其次,该表将主语放在表的右侧作为纵标目,宾语放在表的左侧作为横标目,也不符合制表原则。最后由于表的内容较多,层次复杂,表格中数据罗列无条理,较难读懂。将该表资料分别制成两个统计表,见表10-4和表10-5。表10-5某年某地居民不同心理得分值的冠心病危险因素水平比较心理分值例数吸烟率(%)饮酒率(%)慢性疾患数构成(%)01≥2125270.852.381.615.13.3225369.455.579.316.24.5325270.753.177.516.56.0425371.152.873.915.011.1表10-4某年某地居民不同心理得分值的冠心病危险因素水平比较心理例年龄收缩压舒张压体力体重吸烟量饮酒量受教育社会分值数(岁)(mmHg)(mmHg)活动指数(支/天)(g/d)程度支持125235.2±120.7±78.8±2.1±23.1±8.0±60.1±4.5±8.7±6.513.410.20.23.21.07.50.81.2225337.0±121.2±77.9±2.1±24.0±10.0±78.2±4.2±7.5±6.313.210.50.13.52.08.50.91.1325236.5±121.1±78.2±2.1±24.8±15.0±79.3±3.5±7.0±6.813.211.00.23.12.06.80.81.2425337.8±120.4±78.4±2.3±25.8±15.0±106.8±3.4±7.0±6.512.810.60.33.12.010.20.81.2P值0.050.50.390.080.010.0010.0010.050.05第二节统计图statisticalgraph统计图是利用几何学上的点、线、面、体等图形,有时也利用自然地图来表示资料的多少和分布,以及变化趋势或相互关系。一、制图的一般原则1、按资料的性质和分析目的选用合适的图形。2、要有标题:概括表的主要内容,包括时间、地点和研究内容,一般写在图的下端中央。3、统计图一般有横轴和纵轴:横轴是主语位置所在,纵轴则为谓语位置。一般将两轴的相交点即为原点处定为0,横轴尺度自左至右,纵轴尺度自下而上,纵横比例大致为5:7。4、当要用不同线条和颜色表达不同事物或对象时,需要附图例加以说明。二、常用统计图的种类、选择与作用图形种类资料性质特征和作用条图间断性品质资料以条的高度表示数值,比较大小百分构成图间断性品质资料以全长为100%,看结构圆图间断性品质资料扇面表示数值,每1%为3.6度,结构直方图连续性数量资料以矩形面积表示数值,看群体分布线图动态资料看变化趋势散点图连续性、间断性看两变量间的关系统计地图连续性、间断性表示事物数量地理分布2000年对7种中华系列杂志(中华内科杂志、中华儿科杂志、中华风湿病学杂志、中华预防医学杂志、中华病理学杂志、中华眼科杂志、中华放射学杂志)717篇论著的调查,有统计图的80篇(11.2%),共有统计图132个。其中线图居首位87个(65.9%),条图次之共22个(16.7%)。三、常见统计图1、条图(barchart):用等宽的直条长短来代表按性质分类的资料各类别的数值大小,表示它们之间的对比关系。以横轴为基线,表示条个类别;纵轴表示其数值。纵轴尺度从“0”开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须一律相等。各直条的宽度应相等,间隙的宽度与直条的宽度相等或为直条宽度的1/2。复式直条图一个组包括两个以上直条,直条所表示的类别应用图例说明。三城市某种传染病发病率(‰)比较051015202530354045甲乙丙某地89年与90年男女婴儿死亡率(‰)比较051015202530女性男性89年90年2、百分条图(percentbarchart):表示事物内部各组成部分的构成情况,又称构成条图。先绘制一个标尺,尺度分成10格,每格代表10%,总长度为100%。绘制一直条,全长等于标尺的100%,直条宽度可任意选择,以直条内相对面积的大小代表数量的百分比。直条各部分用线分开,并注明简要文字及百分比。资料可由大到小,或按习惯次序,自左至右顺序排列。如有两种或以上性质类似的资料相比较,则绘制的各直条应全长相同,且各直条中各部分的排列次序要一致,以利比较分析。某矿1961~1965年各期存活矽肺构成比较3、圆图(piechart):用途与百分条图相同,表示事物内部各部分的构成情况。先绘一圆形,由于圆周360度,因此每1%相当于3.6度的圆周角,将百分比乘以3.6度即为构成部分应占的圆周角度数。圆形图上各部分按自然顺序或大小排列,一般相当于时种9点或12点为起点,顺时钟方向排列,扇形面积即代表某一构成部分。某民族血型构成29%32%28%11%A型B型0型AB型4、线图(linegraph):用线段的上升或下降来表示事物在时间上的变化趋势,或某一现象随另一现象的变化情况,适用于连续性资料。横轴表示时间或组段,纵轴表示相应的指标数值,纵轴尺度一般应自0开始。图线应按实际数字绘制成折线,不能任意改为光滑曲线。同一图内不应有太多的折线,不同折线需用图例说明。某市1980—1987年产妇产褥感染死亡率(1/10万)02040608010012080818283848586875、半对数线图:一般用于比较两种或两种以上事物的变化速度。当相互比较的事物数量间相关较大时,普通线图往往难于表达。半对数线图又称算术对数图。其绘制方法类似于普通线图,只是其纵轴取对数尺度。某地1950—1966年伤寒与结核病死亡率0.11101001000505254565860626466年份死亡率(1/10万)结核伤寒6、直方图(histogram):用矩形面积表示连续变量的频数分布。以横轴表示被观察现象,纵轴表示频数或频率。纵轴尺度一般从“0”开始,直方图的各直条间不留间隙,各直条间可用直线分隔,也可不用直线分隔。对不等组距资料,应先将不等距的各组折算为等距频数,然后再作图。某地13岁女孩118从身高频数分布身高(cm)160.0158.0156.0154.0152.0150.0148.0146.0144.0142.0140.0138.0136.0134.0132.0130.0频数201007、散点图(scatterdiagram):用点的位置表示两变量间的数量关系和变化趋势。某地10名四岁儿童体重与体表面积散点图55.566.51012141618体重(kg)体表面积(1000cm