1统计数据的收集、整理与显示第一节统计数据的收集第二节统计数据的整理第三节统计数据的显示2第一节统计数据的收集(参见袁卫等《统计学》P8-9,交代得很简单)•统计数据收集:是指根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地收集反映客观现实的统计资料的过程。•统计数据的收集是统计工作的基础环节。3一、统计数据的收集方法•按所收集数据是否经过加工来划分,统计数据有两种表现形式:(见袁卫等《统计学》P8)–原始资料:是直接向调查对象收集的反映调查单位的统计数据;–二手资料:是已经加工、整理过的、说明总体现象的数据。4一、统计数据的收集方法•按被调查单位是否处于人为控制之下来划分,原始资料又有两种类型:–试验数据:是在既定的控制条件下进行试验,反映试验过程和结果的数据(适用于自然科学);–调查数据:是按照既定的调查方案,通过统计调查所取得的数据(适用于社会经济现象)。5一、统计数据的收集方法•收集被调查单位的原始资料(即调查数据),常用的方法有:直接观察法、报告法(通讯法)、采访法、登记法等。•此外,计算机辅助电话调查、网络调查、卫星遥感技术等,正被广泛地用于统计数据的收集。6二、统计调查方式•统计调查方式:是指从调查对象中选取调查单位的方式。–全面调查:对调查对象中的所有单位一一进行调查。–非全面调查:仅对调查对象中的一部分单位进行调查。•常用的统计调查方式:–普查–抽样调查–重点调查–统计报表制度71.普查(见袁卫等《统计学》P8)•普查:是专门组织的一种全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。对国情国力的调查一般采用普查。•普查的特点:(1)普查是一种非经常性的全面调查;(2)普查比任何一种调查形式更能掌握大量、详细、全面的统计资料。8第二次全国经济普查•普查时点为2008年12月31日24时,普查时期为2008年1月1日-12月31日。•普查对象:在境内从事第二、第三产业的法人单位、产业活动单位和个体经营户。•普查范围:采矿业,制造业,电力,建筑业,交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业等。•普查内容:单位基本属性、财务状况、生产经营情况、生产能力、能源消耗等。92.抽样调查(见袁卫等《统计学》P8)•抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。–概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。–非概率抽样是随便地或有意识地抽取单位进行调查,一般不用样本数据推断总体的数量特征。(袁卫等《统计学》P8没有提及)–通常讨论的是概率抽样。10概率抽样•概率抽样的特点:–样本单位按随机原则抽取,排除了主观因素对选样的影响。–根据部分调查的实际资料对调查对象总体的数量特征作出估计。–抽样误差可以事先计算并加以控制。•抽样调查的适用场合:–不可能或不必要进行全面调查的社会经济现象,采用抽样调查;–对普查资料进行必要的修正。113.重点调查(袁卫等《统计学》没讲)•重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。–重点单位:它们的数量虽少,但在所研究现象的标志总量中占有绝大比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。•重点调查的特点:–可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。•重点调查的适用场合:–当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。124.统计报表制度(袁卫等《统计学》没讲)•统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。•统计报表制度的主要特点:–报表资料的来源建立在各个基层单位的原始记录的基础上;–由于统计报表是逐级上报和汇总的,各级领导部门都能获得管辖范围内的报表资料;–是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。13三、统计调查体系(袁卫等《统计学》没讲)•统计调查体系:一个国家开展统计调查的方法和制度的总称。•我国现行的统计调查体系:–以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。14四、统计调查方案的设计(袁卫等《统计学》没讲)•统计调查方案的设计,是指在背景分析的前提下,制定出一个周密的方案,用以指导调查工作的全过程。15四、统计调查方案的设计•统计调查方案一般包括以下内容:〈一〉明确调查目的。–就是明确统计调查要解决什么问题。〈二〉确定调查对象和调查单位。–调查对象:是指需要调查的现象总体。–调查单位:是指所要调查的具体单位,它是所要调查登记的标志的承担者。16四、统计调查方案的设计•报告单位:亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。•报告单位一般是在行政上、经济上具有一定独立性的单位;而调查单位可以是人、企事业单位,也可以是物。二者有时一致,有时不一致。–例:全国人口普查,属于报告单位和调查单位不一致的情形。17〈三〉设计调查项目。–调查项目:是调查中所要登记的调查单位的特征,也就是调查单位的标志。〈四〉设计调查表格和问卷。–将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。–调查表的种类:一览表和单一表–调查问卷:一种特殊形式的调查表格四、统计调查方案的设计18〈五〉确定调查时间和调查期限。–调查时间:是指调查资料所属的时间。在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期;如果所要调查的是时点现象,调查时间就是规定的统一标准时点。–调查期限:是进行调查工作的时限。包括收集资料和报送资料的工作所需的时间。〈六〉拟定实施调查的进度计划。–包括培训调查人员、落实调查经费、调查数据的报送方式等。〈七〉调查报告的撰写。四、统计调查方案的设计19五、二手资料的主要来源渠道(参见袁卫等《统计学》P9)1.统计年鉴–中国统计年鉴、国际统计年鉴、地方统计年鉴、中国统计摘要、中国劳动统计年鉴、中国财政年鉴、中国西部统计年鉴、中国地区统计公报、中国人口年鉴等2.有关期刊–中国经济景气月报(国家统计局主办)–中国经济数据分析(中国信息中心主办)20小结:统计数据的收集卫星遥感等电话调查、网络调查、采访法、登记法直接观察法、报告法、收集数据的方法统计报表制度重点调查抽样调查普查统计调查方式调查数据的取得)2()1(二手资料济现象)调查数据(关于社会经象)试验数据(关于自然现原始资料统计数据有关网站有关期刊统计年鉴道二手资料的主要来源渠统计调查方案21第二节统计数据的整理(参见袁卫等《统计学》P15-23“2.1统计数据的整理”)一、数据整理概述(袁卫等《统计学》没有)1.统计数据整理的含义–统计数据整理是指对统计调查所收集到的各种数据进行分类和汇总,又称为汇总性整理。2.统计数据整理方案的设计–确定如何对所研究的总体进行统计分组;–确定描述总体数量特征的统计指标体系。223.统计数据整理的程序(袁卫等《统计学》没有概括)(1)统计资料的审核(2)统计资料的分组与汇总(3)编制统计表或绘制统计图(4)统计资料的积累、保管和公布23二、统计分组(重点)(一)统计分组的概念和种类1.统计分组的概念–根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。(袁卫等《统计学》P16的定义不严谨)–统计分组标志:可以是品质标志或数量标志。(袁卫等《统计学》没有定义“品质标志”和“数量标志”这两个概念,但P16用到了)242.统计分组的性质(袁卫等《统计学》没有)•统计分组兼有“分”和“合”双重含义。–对于现象总体,是“分”;对于总体单位,是“合”。•统计分组在突出一种差异时,必然掩盖其他差异。–所以,必须根据统计研究的任务和分组对象的特点,正确选择分组标志。253.统计分组的种类(袁卫等《统计学》没有)•按分组标志的多少,分为简单分组和复合分组–简单分组是对研究现象按一个标志进行分组。许多简单分组从不同角度说明同一总体,就构成一个平行分组体系。–复合分组是把两个或两个以上的分组标志层叠起来对研究现象所作的分组。即:先按一个标志分组,在此基础上再按第二个标志分组,依此类推。复合分组构成一个复合分组体系。翻页26某班学生按年龄分组年龄(周岁)人数1718192021合计返回27高校教师按专业技术职务和年龄分组按专业技术职务分组按年龄分组人数教授30岁及以下31-4546-6061及以上小计副教授30岁及以下31-4546-6061及以上小计﹕﹕﹕﹕合计返回283.统计分组的种类•按分组标志的性质不同,分为品质分组和数量分组–品质分组(或属性分组):就是按品质标志分组–数量分组(或变量分组):就是按数量标志分组29(二)统计分组的原则和方法1.统计分组必须遵循两个原则:(袁卫等《统计学》P18将其概括为:“不重不漏”)–穷尽原则:总体中的每一个单位都应有组可归,或者说各个分组一起足以包容总体所有的单位。–互斥原则:在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时可以归属于几个组。302.统计分组的方法(袁卫等《统计学》没有展开说明)(1)按品质标志分组:–有的简单,如按性别分组。–有的很复杂,如按职业分组、城乡划分等。此时也叫分类,需由国家统计部门制定统一的分类标准。312.统计分组的方法(袁卫等《统计学》没有展开说明)(2)按数量标志分组–单项式分组:用数量标志的每个取值作为组的名称。–组距式分组:把数量标志的取值范围依次划分为若干个满足互斥原则和穷尽原则的区间,用这些数值区间作为组的名称。32例1:某班学生按年龄分组年龄(周岁)人数1718192021合计返回33组距式分组的几个概念•组限:在组距式分组中,每一组变量值中的最大值称为上限,最小值称为下限。•按照组限的写法不同,组距式分组有两种:–间断型组距式分组:指相邻两组的组限不相连的组距式分组;–连续型组距式分组:指相邻两组的组限相连(重叠),即以同一数值作为相邻组的共同界限的组距式分组。•对于连续型组距式分组,为满足互斥原则,需遵循“上组限不在内”原则。–“上组限不在内”原则:是指总体某个单位的变量值是相邻两组的界限值时,这个单位应归入作为下组限的那一组内。(袁卫等《统计学》P18)•组距:每组数值区间的距离。–等距分组与不等距分组(袁卫等《统计学》P18)34例2:人口按年龄分组年龄(周岁)人数0—56—1213—1516—1819—22﹕合计返回35例3:全班同学按统计学成绩分组成绩人数90以上80—9070—8060—7060以下合计返回36组距式分组相关指标的计算(1)组距的计算–连续型组距式分组的组距=本组上限–本组下限–间断型组距式分组的组距=本组上限–本组下限+相邻组的组限间隔(2)组中值(上下限之间的中点数值,代表各组标志值的平均水平)的计算(3)开口组的组距与组中值–开口组:指“××以上”、“××以下”这种未规定上限或未规定下限的组。–开口组的组距:以相邻组的组距作为开口组的组距。该公式对连续变量离散化(舍尾)得到的组距式分组不适用!补充37全班同学按统计学成绩分组成绩组距组中值人数90以上109580—90108570—80107560—70106560以下1055合计——返回38企业按职工人数分组职工人数(人)组界组距组中值企业数1—90.5—9.59510—199.5—19.51014.520—4919.5—49.53034.550—99100—19949.5—99.599.5—199.55010074.5149.5200及以上199.5以上100249.5合计—