第八章统计分析与统计图表本章要点:了解:中位数、众数;单变量的统计推断;我国的统计报表制度;统计图。理解:变异指标定含义;相对指标与总量指标的结合运用;平均指标的作用。掌握:算术平均数的计算;标准差及其计算;相关分析;回归分析;统计分析报告的写法;统计报表的构成。第一节统计分析方法第二节我国的统计报表制度第三节统计图表☆本章习题本章目录开篇案例:我国城市农民工生活质量状况为了解我国城市农民工生活质量状况,为党和政府制定有关政策提供参考依据,2006年8月,国家统计局在全国范围内开展了一次城市农民工生活质量状况的专项调查。调查范围:全国各级城市(含直辖市、副省级市、地级市和县级市)中固定岗位就业的农民工和灵活就业的农民工。调查对象:年龄在16-65周岁的跨地区外出进城务工经商人员,包括被企业(单位)招用的在固定岗位就业的农民工和在社区街道上自主创业、自谋职业的灵活就业的农民工。调查方式:抽样调查,样本容量为各类农民工29425人。对在固定岗位上就业的农民工直接深入企业进行调查,对灵活就业的农民工采取街道社区拦截调查和入户调查方式。调查内容:城市农民工生活质量状况,包括劳动就业、获取报酬、就业保障、住房、子女教育、劳动技能培训等情况。调查结论:当前城市农民工工作和生活条件普遍较差。他们劳动强度大,生活开销大;文化程度低,社会保障低;工作环境差,生活条件差;文化娱乐少,技能培训少。那么,这一结论又是怎样得来的呢?第一节统计分析方法公共管理中经常进行统计调查,但调查所获得的数据资料往往是杂乱无章的原始材料,无法在公共管理中发挥重要作用,这就需要对统计调查所得的原始资料进行统计整理和统计分析,以便得出科学而准确的结论。对于统计资料的统计分析方法,按照其所涉及变量的多少,可以分为单变量、双变量和多变量(多元)统计分析。本章主要介绍单变量和双变量统计分析方法及其在公共管理中的具体应用。一、单变量统计分析单变量统计分析是对事物某一数量特征所作的描述,其分析内容包括描述统计和推断统计两个方面。描述性分析是对变量水平和其他特征的一种刻画;推断性统计是在描述统计的基础上,根据抽样调查资料,进一步推断总体的数量特征。我们前面所讲的案例就属于推断统计分析。(一)单变量的统计描述单变量统计描述要用到总量(绝对)指标、相对指标和平均指标三大类统计综合指标。第一节统计分析方法第一节统计分析方法1.总量指标(1)总量指标的概念和作用总量指标反映某种社会经济现象在一定时间、空间和条件下的总规模、总水平或工作总量以及总量间的绝对差额,用绝对数表示,所以又称为绝对指标。2011年我国国内生产总值471564亿元,其中第一产业增加值47712亿元,第二产业增加值220592亿元,第三产业增加值203260亿元。年末全国大陆总人口为134735万人,比上年末增加644万人。全年出生人口1604万人,出生率为11.93‰;死亡人口960万人,死亡率为7.14‰;自然增长率为4.79‰。出生人口性别比为117.78。全国人户分离的人口为2.71亿人,其中流动人口为2.30亿人。总量指标在社会经济统计中具有重要的作用:总量指标是认识社会经济现象的起点,是实行社会经济管理的依据之一,同时也是计算相对指标和平均指标的基础。(2)总量指标的分类①单位总量和标志总量②时期指标和时点指标时期指标可以累加,说明较长时期内现象发生的总量。时期指标数值的大小与时期长短有直接关系。时期指标的数值一般通过连续登记取得;时点指标的数值则通过间断登记取得。③实物指标、价值指标和劳动指标第一节统计分析方法第一节统计分析方法2.相对指标(1)相对指标的意义相对指标,是两个互相联系指标的比率,说明现象之间数量固有的对比关系,反映某些相关事物之间数量联系的程度。2011年山东省实现生产总值(GDP)45429.2亿元,按可比价格计算,比上年增长10.9%。其中,第一产业增加值3973.8亿元,增长4%;第二产业增加值24037.4亿元,增长11.7%;第三产业增加值17418.0亿元,增长11.3%。产业结构调整稳步推进,三次产业比例由上年的9.2:54.2:36.6调整为8.8:52.9:38.3。人均生产总值47260元,增长9.9%,按年均汇率折算为7317美元。第一节统计分析方法(2)相对指标的种类①计划完成程度相对数②结构相对指标③比例相对指标④比较相对指标⑤强度相对指标⑥动态相对数第一节统计分析方法3.平均指标(1)平均指标的意义和作用平均指标反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。它将总体各单位标志值之间的差异抽象化,反映的是分布的集中趋势。第一节统计分析方法如果社会经济现象总体的标志总量是各单位标志值的算术和,计算平均数,就适合采用算术平均方法,其基本公式是:随着给定资料的不同又有不同的方法和公式:简单算术平均数nxnxxxxn21总体单位总量总体标志总量算术平均数第一节统计分析方法加权算术平均数:月工资(元)人数(人)比重(%)工资总额(元)640700760820890970241523514830461021280280011400188604450970合计5010039760例如:调查50名职工周工资为:fxfffffxfxfxxnnn212211795.25039760fxfx则50名职工平均周工资为:第一节统计分析方法又如调查育龄妇女年龄分组为:年龄人数(人)组中值标志总量15-1920-2425-2930-3435-3940-4445-4920352923169217.522.527.532.537.542.547.5350.0787.5797.5747.5600.0382.595.0合计134—3760.038.061343760212211fxfffffxfxfxxnnn第一节统计分析方法4.中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。(1)未分组资料(2)已分组资料12ifmemSMLif(下限公式)第一节统计分析方法5.众数在一组数据中,出现次数最多的数据叫这组数据的众数。(1)未分组资料(2)已分组资料112oMLi(下限公式)第一节统计分析方法6.变异指标平均指标对总体中各单位代表性如何决定于各单位的变异程度。平均指标代表性越好,变异程度越小,反之则越大,所以变异指标是说明平均指标代表性如何的一类指标,可以分析事物的均衡性及发展的节奏性。(1)全距(2)异众比率(3)四分位差第一节统计分析方法(2)平均差平均差是各单位标志值对算术平均数的离差绝对值的算术平均数。nxxDA-..资料未分组:ffxxDA-..资料已分组:第一节统计分析方法(4)标准差先求出各单位标志值对算术平均数的离差,计算离差平方的算术平均数,再开方就是标准差。有各单位具体资料时:在次数分配条件下:21()niixxn211()niiiniixxff第一节统计分析方法(5)变异系数标志变动程度的大小,不仅受标志值变异大小的影响,还受平均水平的影响。要清除平均水平的影响,尚需计算变异系数。变异系数是标志变动度与其算术平均数之比。sSVVXX或第一节统计分析方法(二)单变量统计推断1.参数估计(1)总体平均数的区间估计(2)总体比例的区间估计2.假设检验(1)总体平均数的假设检验(2)总体比例的假设检验第一节统计分析方法二、双变量的统计分析(一)相关分析1.相关关系与函数关系函数关系是指客观现象之间存在着的一种固定的、严格的数量依存关系。相关关系是指客观现象之间确实存在着的,但关系数值不固定、不严格的数量依存关系。第一节统计分析方法2.相关关系的种类按相关关系涉及的变量多少划分:单相关、复相关按相关关系的方向划分:正相关、负相关按相关关系的形式不同划分:线性相关、非线性相关曲线相关散点图正负相关散点图第一节统计分析方法按相关关系的程度划分:不相关、完全相关、不完全相关。现象之间联系的三种类型第一节统计分析方法3.简单相关系数222xyxyxxyynrxxyynn变量x的标准差:2xxxn变量y的标准差:2yyyn变量x与y的协方差:2xyxxyyn第一节统计分析方法4.相关系数的显著性检验相对于现象总体而言,计算相关系数的两个随机变量(x,y),可以被看成是现象总体中的一组对应的样本数据。所以,相关系数r实质上只是这个样本的相关系数,而不是现象总体的相关系数R。当用样本相关系数作为总体相关系数的估计量时,样本单位数n的多少,在很大程度上直接影响r对R所做的推断:可能会出现总体中两个变量实际上不存在线性相关关系(R=0),而根据本计算的相关系数的绝对值较大,显示两个变量有较为密切的相关关系。这就需要根据样本资料对总体相关系数R进行假设检验。一般情况下,这类检验要用t检验法。第一节统计分析方法如果样本来自正态总体,在变量x与y之间无线性相关(即R=0)的前提下,可以证明统计量逼近自由度为n-2的t分布,即在R=0假设下,有:式中,根据以上结论,可以对相关系数进行检验。需要强调的是,有时r虽然较高,但在进行检验时,却可能接受R=0的假设。也就是说,尽管从样本相关系数r看,两变量存在着显著相关甚至高度相关关系,但总体却并无明显的线性相关关系。在这些情况下,通常要增大样本容量以进一步进行研究。()rrt()~(2)rrttn2()12rrn第一节统计分析方法(二)回归分析一元线性回归又称简单直线回归,它是根据成对的两种变量的数据,配合直线方程式,根据自变量的变动,来推算因变量发展趋势和水平的方法。一元回归模型:标准方程:待定参数:ˆyabx2ynabxxyaxbx22nxyxybnxxyxabybxnn第一节统计分析方法三、统计分析报告(一)统计分析报告类型与特点1.类型资料性统计分析报告分析性统计分析报告2.特点以实际体积分析资料为基础所揭示的问题具有普遍性和一般性第一节统计分析方法(二)统计分析报告的撰写1.拟定写作大纲2.报告基本结构标题导言主体结尾第二节统计报表制度一、统计报表的特点与作用二、统计报表的种类三、统计报表的资料来源第三节统计表和统计图一、统计表及其结构二、统计图及其分类几何图象形图统计地图第三节统计表和统计图第一季度第二季度第三季度第四季度第一季度第二季度第三季度第四季度0102030405060708090100第一季度第二季度第三季度第四季度东部西部北部0102030405060708090第一季度第二季度第三季度第四季度东部西部北部本章习题一、名词解释1.总量指标2.相对指标3.平均指标4.算术平均数5.标准差6.相关系数二、问答题1.时期指标和时点指标的区别是什么?2.总量指标和相对指标为什么要结合运用?3.什么是众数和中位数?4.简述统计表的构成。5.为什么要计算变异系数?三、计算题1.已知下表资料:日产量(件)工人数(人)工人比重(%)65707580852050803614102540187合计200100试根据频数和频率资料,分别计算工人平均日产量。单位产品成本(元/件)单位数产量比重(%)10~1212~1414~18233224038合计81002.某企业集团将其所属的生产同种产品的8个下属单位按其生产该产品平均单位成本的分组资料如下表:试计算这8个企业的平均单位成本。日产量分组(件)工人数60以下60~7070~8080~9090~100100以上401001802209050合计6803.某企业某月某日产量资料如下:试