第二章统计数据的搜集与整理学习目的本章主要掌握:统计调查的意义和种类。制定统计调查方案的几个问题,各种统计调查方式。能够联系实际,制定合理的调查方案,并能够实际操作。重点掌握统计分组的基本理论和方法,次数分布的编制,以及统计表、统计图的基本绘制方法。结合微机操作,掌握统计整理方法。重点:调查方案的设计次数分布的编制第二章统计数据的搜集与整理第一节统计数据的搜集第二节统计数据的整理新华网北京9月4日电(记者吴晶晶、白瀛)国家汶川地震专家委员会副主任史培军4日在国务院新闻办公室举行的发布会上说,汶川地震造成直接经济损失8451亿元,其中四川的损失占到总损失的91.3%,甘肃占5.8%,陕西占2.9%。截至7月底,我国外汇资产余额为137690.05亿元,较上月增加了3440.61亿元人民币,折合成美元约503.7亿。第一节统计数据的搜集一、统计数据来源(一)统计数据的直接来源统计数据的直接来源是指通过专门组织的调查和科学实验搜集数据。科学实验是取得自然科学数据的主要手段,如医学、生物学等的数据都是通过实验和观察取得的。(二)统计数据的间接来源统计数据的间接来源是指对次级资料的搜集,即第二手资料的搜集。一般是搜集公开出版或公开报道的数据。数据来源数据来源第一手资料实验法调查观察出版物第二手资料1.统计调查的意义和要求统计调查,是指根据统计研究的目的和要求,利用各种统计调查的方式方法,搜集统计资料的工作过程。统计调查作为统计工作的第二个阶段,在统计工作的整个过程中,担负着提供基础资料的任务,对统计资料的搜集,要求做到准确、及时和完整。二、统计调查的种类社会经济现象错综复杂,根据不同的调查目的,需要采取不同的统计调查方式方法。统计调查的常见分类有:是否包括全部调查单位调查资料登记时间是否具有连续性全面调查:对调查对象中的全部单位一一加以调查。例如:统计报表、普查非全面调查:对调查对象中的部分单位进行调查。例如:抽样调查、典型调查和重点调查经常性调查:随着调查对象的变化而进行的经常地、连续不断地登记调查。一次性调查:是间隔一段时间对调查对象进行的登记调查。例如:人口普查资料搜集的方法不同调查的组织方式不同统计报表:按一定的表式和要求,自上而下统一布置,自下而上上报统计资料的一种统计调查方式方法专门调查:是为了研究某些专门问题,由进行调查的单位专门组织的调查。直接观察法采访法报告法问卷法(一)统计调查方案的主要内容1、调查目的。统计调查中,首先要明确调查目的,既通过调查要解决什么问题。2、调查对象、调查单位和报告单位调查对象又称调查总体,是我们所要研究事物的整体。调查单位就是调查对象范围内的各个个体单位。报告单位又称填报单位,它是负责填报调查资料的单位。二、统计调查方案的设计3、调查项目和调查表调查项目就是进行调查时向调查单位需要调查的问题。一般来说有多少个问题,便有多少个调查项目。调查表类型单一表:在一张表格上只登记一个调查单位的资料,可以容纳较多的调查项目。一览表:在一张表上登记若干个调查单位的资料,调查的项目不能过多。调查表制定以后,为了保证调查资料的科学性和统一性,需要编写填表说明和指标解释。4.调查时间和调查地点调查时间包括调查资料所属的时间和调查期限。(1)调查资料所属的时间。时期资料指事物在某一时期内发展过程的总量。例如,总产值、总产量时点资料是指事物在某一时点上的水平。例如,工人数、商品库存量、耕地面积等(2)调查期限。调查期限是指调查工作的起止时间。包括搜集资料和报送资料的整个工作所需的时间。调查地点是指登记调查资料的地点。在一般情况下,调查地点和调查单位所在地点是一致的。5.调查方式根据调查目的的不同,采取不同的调查方式。具体采用哪种调查方式,主要考虑人员、时间和经费等条件。一般来说,能够通过非全面调查解决的问题,不要进行全面调查。6.制定调查的组织实施计划(1)建立调查队伍;(2)调查人员的组织和培训;(3)经费的预算和开支办法;(4)试点调查。三、统计报表(一)统计报表统计报表是我国取得统计资料的一种基本的组织形式。它是基层企业、事业单位以及各级领导机关,按照国家有关部门统一规定的报表格式、报告内容、报送时间和程序等,自下而上报送报表的一种调查方式。统计报表的特点和优点:可以在调查进行前把报表布置到基层填报单位,以便它们根据报表的要求,及时建立健全各种原始记录,使统计报表建立在可靠的基础上,做到资料准确、报送及时。各级领导部门可以通过统计报表,经常了解经济和社会发展变化的情况便于完整地积累资料,用来进行历史对比,较有系统地分析研究经济和社会发展变化的规律性。统计报表分类调查范围不同报送周期长短不同报送方式不同填报单位和程序的不同全面的统计报表非全面的统计报表。日报旬报月报半年报年报邮寄报表电讯报表基层报表综合报表。电话电报传真(二)普查普查是为了某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。特点:普查通常是一次性的或周期性的普查一般需要规定统一的标准调查时间普查的数据一般比较准确普查的使用范围比较窄,只能调查一些最基本及特定的现象。(三)、抽样调查抽样调查是实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中随机抽取一部分单位做为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查。抽样调查的特点:经济性:这是抽样调查的一个显著的优点。由于调查样本是总体中很少的一部分,调查的工作量小,可以节省大量的人力、物力、财力和时间。时效性:抽样调查可以迅速及时地获得所需要的信息。由于工作量小,调查的准备时间、调查时间、数据处理时间等都可以大大缩减,从而提高数据的实效性。适用性:抽样调查可以获得更广泛的信息,适用于各个领域、各种问题的调查。准确性:抽样调查的数据质量有时比全面调查更高,因为抽样调查工作量小,可使各环节的工作做的更细,误差往往很小。但是用样本资料去推断总体时不可避免的会有推断误差,但这种误差的大小可以计算并加以控制(四)重点调查重点调查在调查总体中,选择一部分重点单位进行调查,以了解总体基本情况的一种非全面调查。重点单位,是指调查单位的标志总量在总体标志总量中占绝大比重的单位。应用重点调查的先决条件:第一,调查的任务只要求掌握调查总体的基本情况。第二,在调查总体中,确实存在着重点单位。(五)典型调查典型调查是根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识的选取少数具有代表性的典型单位进行深入细致的调查研究,借以认识同类事物的发展变化规律及本质的一种非全面调查。特点:1.典型单位是根据调查目的和要求,通过对调查对象的全面分析后,有意识地选定的。2.只对少数典型单位调查,其调查范围小,调查单位少。3.调查的内容具有很大的灵活性。重点调查、抽样调查和典型调查的区别和联系联系:都属于非全面调查,都具有省时省力的特点区别:(1)目的不同重点调查只能了解总体的基本情况不能推断总体抽样调查目的是用部分推断总体典型调查只有在一定的条件下才能推断总体(2)选取调查单位的方法不同重点调查是挑选总体中的重点单位进行调查抽样调查是按着随机原则抽取调查单位典型调查有意识的选取典型单位进行调查第二节统计数据的整理一、数据的审核在对统计数据进行整理时,首先要进行审核,以保证数据质量,为进一步统计分析打下基础。对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。审核数据准确性的方法主要有逻辑检查和计算检查。二、统计分组(一)统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。统计分组同时具有两个方面的含义:对总体而言是“分”,即将总体区分为性质相异的若干部分;对总体单位而言,是“合”,即将性质相同的总体单位组合起来。(二)统计分组的作用1.区分不同事物的性质区分事物不同的性质是统计分组的根本作用。例如,研究人口时,可以从性别、年龄、民族、文化程度等方面来区分人口的不同性质。分组前分组后25%33%42%2.反映事物的内部构成及其变化规律性通过分组区分了事物的不同性质,可以研究现象的各部分构成,进而识别事物的主要部分与共性特征,以说明事物发展变化的规律。表2-12004年某地区产业结构100.01894.02合计15.950.933.2301.15964.06628.81第一产业第二产业第三产业比重%增加值(亿元)产业3.揭示现象之间的数量依存关系通过分组将性质上有关联的分组资料联系起来分析,便可研究不同现象总体之间数量上的依存关系。例如表2-2中的数据便可展现出小麦亩产量与施肥量二者之间的相互依存关系。表2-2小麦施肥量与亩产量之间的关系500651490420350280210140小麦亩产量(斤)706050403020100施肥量(斤)(三)统计分组的原则与分组标志1、统计分组的原则一是要有周延性,即不遗漏,每一单位都有所归属。二是要有互斥性,即不重复,每一单位只能归属于某一组而不能归属于另一组。2、统计分组的标志分组标志就是将总体分为各个性质不同的标准或根据。根据分组标志的特征不同,总体可按品质标志分组,也可按数量标志分组。(1)按品质标志分组按品质标志分组就是以品质标志作为分组标志,并在品质标志的变异范围内划分各组界限,将总体分为若干组。(2)按数量标志分组按数量标志分组就是以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体分为若干组。(四)简单分组和复合分组1.简单分组对总体只按一个标志分组称为简单分组。2.复合分组对总体按两个或两个以上标志层叠起来进行分组称为复合分组。即先按一个标志分组,然后再按另一个标志将已经分好的各个组进一步划分为若干组。3.交叉分组对总体按两个标志交叉进行分组称为交叉分组,它也是一种复合分组。如表2-3所示。表2-32004年三个地区按城乡分组的文盲率——合计6.395.846.203.383.294.07甲地区乙地区丙地区乡村文盲率(%)城镇文盲率(%)地区三、次数分布(一)次数分布的概念在统计分组的基础上,将组中的所有单位按组归类整理,形成总体中各个单位在各组间的分布,就叫做次数分布。分布在各组的个体单位数叫次数,又称频数。各组次数与总次数之比称比率,又称频率。将各组组别与次数依次编排而成的数列就叫做次数分布数列,简称分布数列。次数分布分为质量次数分布和变量次数分布。质量次数分布就是按品质标志分组所形成的次数分布。它有两个构成要素:一是组的名称,二是各组的次数。如表4-4。表4-4某地人口按性别分组的情况100.01265合计51.6248.38653612男女占总人口比重(%)人数(万人)性别变量次数分布就是按数量标志分组所形成的次数分布。它也有两个构成要素:一是变量,二是各组的单位数。如表所示。表2-5某班组工人看管机器台数的情况100.0016合计20.0053.3026.70385123比率(%)工人数(人)看管机器数(台)变量次数分布又分为单项次数分布和组距次数分布。变量次数分布中的每个组只用一个变量值来表示就是单项次数分布。如表2-5。变量次数分布中的每个组用一定范围的变量值来表示就是组距次数分布。如果变量值的变动范围大,项数较多,就要采用组距次数分布反映总体的分布状态。如表2-6。表2-6某地区2004年城镇居民可支配收入情况100.00合计2.5514.8224.4522.0017.369.644.912.361.91200以下200—300300—400400—500500—600600—700700—800800—900900以上百分比(%)每人每月可支配收入(元)(二)变量次数分布的编制方法步骤:1、编制序列和计数2、确定组数和组距3、确定组限和组中值例如,对某工厂某月50名工人装配零件(件)情况进行调查,得到下列初级资料:1068210697968110884105110981141289211211112210411110391109911071081071