1第三章统计表与统计图余小金东南大学公共卫生学院流行病学与卫生统计学系2WHYTABLE&GRAPH?统计学中最美丽的风景Themostcharmingpointinstatistics!更清楚,更直观地表达数据(topresentyourpointsmoreclearly,moredirectly)使你的表达简洁美3KISSKeepItSimple,butScientificByEmanuelParzen基本原则:尽可能简单(makeitmoresimpler),避免用令人费解的图表。(Donotusetablesorgraphsthatwouldcostthereaderminutestotrytounderstand!)43.1统计表table3.1.1统计表的结构(structure)及列表的基本要求(basicrules)3.1.2统计表的种类(classification)3.1.3word中统计表的制作(makingtableinWORD)5统计表的结构表*-*某省某厂1994/1998年四项指标异常检出率1994年1998年指标受检人数异常人数检出率受检人数异常人数检出率血压5195510.6582386.52心率519448.48582296370TTT519366.94582233.95GPT519203.85582162.751.标题,表号(title)2.标目横标目和纵标目(heading)3.线条(line)4.数字(number)5.备注(remarks)6制表要求(1)标题和编号简明扼要,说明来源、时间及对象指标;编号位于标题之前,表22.1,表22-1标目(横标目、纵标目和总标目)清楚表达内容(注明单位)“Usethetableheadingtoconveycriticalinformation.Donotstint.Themoreinformativetheheading,thebetterthetable.”7制表要求(2)线条(line)数字(number)相同位数暂缺或未记录可用“”缺失值“-”备注(note)写于表外,应用“”表明8西南某地1998年吸毒者中HIV感染情况吸毒方式调查人数HIV阳性数阳性率(%)静注吸毒27911440.9非静注吸毒4624.3合计32511635.7可读成1998年西南某地调查静注吸毒者(druggerusingveininjection)279人,HIV阳性人数114人,阳性率40.9%等。示例表9论文中最常见的表格Groupn疗前疗后Treatment103.450.57Placebo103.320.64t=0.481P=0.63710统计表的种类简单表复合表表4-8某省某厂1994/1998年四项指标异常检出率1994年1998年指标受检人数异常人数检出率受检人数异常人数检出率血压5195510.6582386.52心率519448.48582296370TTT519366.94582233.95GPT519203.85582162.7511统计表的制作选择最简单的表型避免斜线竖线以及过多内容12附图某医院住院死亡病人的死因构成恶性肿瘤27%呼吸系病17%脑血管病16%泌尿系病9%损伤和中毒8%其它11%心脏病12%统计图—统计图的结构标题和标号图域横轴纵轴比例7:5和标目尺度图例13绘制统计图的要求根据资料性质和分析目的选择图形choosinggraph标题要说明图的内容title两轴应有标目并注明单位heading&unit尺度应等距或有一定规律性,表明数值equalinterval一般纵轴尺度应从0点开始verticalaxisfrom0;横纵轴比例为7:5简单,正确表达趋势和差距,不产生错误的印象14常用统计图条图圆图百分条图线图半对数线图直方图散点图15条图(barchart)适用资料:相互独立的统计指标注意事项0起点等宽16直条图孵化比例%17为何坐标从0开始?0123456甲乙18Excel中作条图19同一种颜色表示的是一个系列,分类轴决定指标的分类20212223图22.1江苏省90年代城市农村集中恶性肿瘤死亡率比较0102030405060食管癌胃癌肝癌肺癌死亡率(1/10万)城市农村24圆图piechart适用资料:表示事物内部的构成从9点或12点处开始然后顺时针安排。25Excel中作饼图2627某市1990年主要传染病的构成比痢疾32%肝炎18%腮腺炎14%麻疹12%流脑9%其它15%28百分条图percentilebar某市1990年主要传染病的构成比痢疾,32.32肝炎,18.18腮腺炎,13.9214.76其它,14.76麻疹,12.20102030405060708090100其它流脑麻疹腮腺炎肝炎痢疾29303132线图(linegraph)连续发展的指标,如死亡率在不同年份的连续变化。纵轴可不从0开始33Excel中作线图3435363738图1990-1992某地55岁以上人群肺癌年龄别死亡率05010015020025030035055~60~65~70~75~80~年龄(岁)死亡率(1/10万)男女39数值变量的描述图骨碎补对家兔高血脂症的作用050100150200250300350400450500550600650700750800850051015时间(周)血清胆固醇均数造型组治疗组预防组对照组研究中药骨碎补对高脂血症的治疗和预防作用。取家兔44只,随机分成四组,每组11只。每间隔5周测定血清胆固醇一次,共测四次。40右击折线41半对数线图semi-logarithmiclinegraphY轴为对数尺度的线图与普通线图相同,适合于连续性指标的描述42对数尺度(logarithmscale)43半对数线图图1990-1992某地55岁以上人群肺癌年龄别死亡率110100100055~60~65~70~75~80~年龄(岁)死亡率(1/10万)男女图1990-1992某地55岁以上人群肺癌年龄别死亡率05010015020025030035055~60~65~70~75~80~年龄(岁)死亡率(1/10万)男女普通线图44绝对差与对数差的比较AB绝对差A-B相对比A/B对数差lgA-lgB10001001000-100=9001000/100=10Lg1000-1g100=110010100-10=90100/10=10Lg100-lg10=110110-1=910/1=10Log10-log1=145两种尺度对比图10010146散点图scatterplot用点的密集程度和趋势来表示两种现象间的相互关系。(pairedvalues)横纵轴各代表一种事物,分别表示自变量与因变量。横纵轴比例一般为1:147选择散点图48体重X体表面积Y1112131415165.05.56.06.549调整坐标轴刻度50图2岁身高与成年身高的散点图62636465666768697071723032343638402岁时的身高成年时的身高51直方图(Histogram)频数1081101121141161181221241261281301320510152025120用于表示连续性资料的频数分布52100名成年男性的血红细胞计数频数表1012/L53AgePyramid(人口金字塔)54统计地图(statisticalmap)图22.11中国低出生体重发生率(‰)分布地图表示某现象的数量在地域上的分布。55x4248.67箱式图(box-whisperplot)用于描述资料的中位数,四分位数及最大值和最小值。56Stem-leafplot(茎叶图)57Pictograph58DotChart59后记随着计算机软件的发展,统计图的绘制和修饰变得十分方便和富有乐趣,应用者在操作过程中可以不失科学性和直观性,设计其他统计图为分析目的服务。60复习思考题复习思考题学号pra1.docxiaojinyu@seu.edu.cnHomework61Thankyouforyourattention!