上一页下一页返回本章首页第二章统计数据的收集与整理第二章统计数据的收集与整理第一节统计调查方案设计第二节统计数据收集第三节统计数据整理第四节统计数据表现形式第五节统计数据特征描述本章小节主要内容上一页下一页返回本章首页第二章统计数据的收集与整理第二章统计数据的收集与整理加工整理,归并汇总,重新排列调查得到的原始统计资料发现数据的规律性,作进一步的统计分析上一页下一页返回本章首页第二章统计数据的收集与整理第一节统计调查方案设计一、明确调查目的和任务明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。二、确定调查对象和调查单位确定调查对象调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。确定调查单位调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。上一页下一页返回本章首页第二章统计数据的收集与整理第一节统计调查方案设计三、确定调查项目、设计调查表或问卷确定调查项目调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。设计调查表或问卷调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。上一页下一页返回本章首页第二章统计数据的收集与整理第一节统计调查方案设计四、确定调查时间、调查地点和调查方式方法调查时间调查时间是指调查资料所属的时点或时期。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。调查地点调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。调查方式方法调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查的对象。统计调查的方式多种多样。按其组织形式不同,可分为统计报表制度和专门组织的统计调查;专门组织的调查有普查、重点调查、典型调查和抽样调查等方式。统计调查的方法有直接观测法、实验法、报告法、采访法和网上调查法等。上一页下一页返回本章首页第二章统计数据的收集与整理五、制定调查的组织实施计划调查的组织计划,是指为确保实施调查的具体工作计划。调查的组织实施计划应包括以下内容:建立调查工作的组织领导机构,做好人员的配备与分工;做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等;制定调查工作的检查、监督方法;调查成果的公布及工作后的总结等。第一节统计调查方案设计上一页下一页返回本章首页第二章统计数据的收集与整理第二节统计数据收集一、收集资科的方式取得统计数据有多种途径,但概括起来不外乎是直接方式和间接方式。(一)统计资料的直接收集直接获取第一手统计资料的主要方法包括:统计调查和试验设计。统计调查的方式主要有普查抽样调查重点调查统计报表制度。上一页下一页返回本章首页第二章统计数据的收集与整理调查方式方法统计调查的方式统计报表制度专门组织的统计调查普查重点调查抽样调查…上一页下一页返回本章首页第二章统计数据的收集与整理普查普查是专门组织的一次性的全面调查,用来调查属于—定时点上或时期内的社会经济现象的总量。抽样调查抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。重点调查重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。统计报表制度统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。(一)统计资料的直接收集上一页下一页返回本章首页第二章统计数据的收集与整理试验设计科学试验是进行科学研究的重要手段,在许多学科中几乎都起着积极的作用。统计中的试验设计是科学试验研究的组成部分之一。试验设计,包括五个相互关联的环节,分别是:方案设计方案实施数据采集数据分析优化生产(一)统计资料的直接收集上一页下一页返回本章首页第二章统计数据的收集与整理凡不是通过直接的统计调查和试验,而是从其他各种渠道搜集的第二手资料,我们把它总称为统计资料的间接收集。间接资料的来源大体包括:统计年鉴、统计摘要、统计资料汇编、统计台账、统计公告、报纸、杂志、网上资料等。(一)统计资料的间接收集上一页下一页返回本章首页第二章统计数据的收集与整理二、收集资料的方法数据资料的收集方法可以分为初级资料收集方法和次级资料收集方法或称文案资料。初级资料收集方法访问法访问法是按所拟调查事项,有计划地通过访谈询问方式向被调查者提出问题,通过他们的回答来获得有关信息资料的方法。按访问内容的传递方式不同,可分为:面谈调查、电话调查、邮寄调查、留置调查、日记调查和网上调查等方法。上一页下一页返回本章首页第二章统计数据的收集与整理二、收集资料的方法观测法观测法是指调查者通过直接观测、跟踪和记录被调查者的情况来收集资料的—种调查方法。报告法报告法是由报告单位根据原始记录和核算资料,按照统计机关颁发的统—的表格和要求,按—定的报送程序提供资料的方法。次级资料收集方法次级资料又称二手资料,是指他人为了他自己的研究目的而调查、整理的资科。上一页下一页返回本章首页第二章统计数据的收集与整理统计的整个工作过程就是对数据的加工过程,从原始数据的收集开始,经过整理、显示、样本信息的获取到总体数量规律性的科学推断,都有一个减少误差、提高数据质量的问题。也就是说,统计数据的质量控制问题是贯穿于统计全过程的重要问题,因此,加强统计数据质量的管理要体现在统计研究的全过程。三、统计数据的质量问题上一页下一页返回本章首页第二章统计数据的收集与整理主要任务资料审核、分组、汇总、制表、制图等。分组频数分布统计表统计图第三节统计数据整理上一页下一页返回本章首页第二章统计数据的收集与整理一、统计分组统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。(一)统计分组原则根据统计研究的目的选择分组标志选择能够反映现象总体本质特征的标志考虑现象所处的具体时间、地点、条件来分组满足完备性、互斥性及一致性第三节统计数据整理上一页下一页返回本章首页第二章统计数据的收集与整理(二)统计分组的方法按标志的特征分组总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。按分组标志数量分组统计分组按分组标志多少不同,可分为简单分组和复合分组。第三节统计数据整理上一页下一页返回本章首页第二章统计数据的收集与整理第三节统计数据整理简单分组简单分组是对研究对象按照一个标志进行的分组。例如某高校职工按照性别或者职称进行的分组,如表2.3.1、2.3.2所示。表2.3.1按性别分组2.3.2按职称分组按性别分组职工人数(人)男800女600合计1400按职务分组职工人数(人)副教授或副教授以上400副教授以下800合计1200上一页下一页返回本章首页第二章统计数据的收集与整理第三节统计数据整理复合分组复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。例如企业职工按性别分组后,在每组内再按年龄分组,如表2.3.3所示。表2.3.3某高校按性别和年龄分组按性别和年龄分组职工人数(人)50岁以下450男50(含50)岁以上15050岁以下260女50(含50)岁以上60合计920上一页下一页返回本章首页第二章统计数据的收集与整理第三节统计数据整理文盲小学初中高中中专或技工大专毕业大学本科毕业硕士研究生毕业博士研究生毕业按文化程度分组图2.3.1按年龄、性别、文化程度分组的平行分组体系(三)统计分组体系统计分组体系有两种:平行分组体系和复合分组体系,如图2.3.1、2.3.2所示。上一页下一页返回本章首页第二章统计数据的收集与整理(三)统计分组体系女生组男生组专科组女生组男生组本科组女生组男生组研究生组文科组女生组男生组专科组女生组男生组本科组女生组男生组研究生组理科组高等学校在校学生总体图2.3.2我国高等学校在校学生的一个复合分组体系上一页下一页返回本章首页第二章统计数据的收集与整理二、分配数列将统计总体按某一标志分组后,用来反映总体单位在各组中分配情况的数列叫分配数列。分配在各组的总体单位数叫次数或频数。各组次数与总次数的比值称为频率。(一)分布数列的分类根据分组标志的不同,分配数列可以分为品质分配数列和变量分配数列两种。上一页下一页返回本章首页第二章统计数据的收集与整理(一)分布数列的分类品质数列按品质标志分组所形成的分布数列称品质分布数列或属性分布数列,简称品质数列。它是由总体各组名称及各组总体单位数(次数)组成,如表2.3.4所示。表2.3.4某高校学生的性别分布按性别分组人数比例(%)女生545841.2男生780458.8合计13262100.0分组名称频数频率上一页下一页返回本章首页第二章统计数据的收集与整理(一)分布数列的分类变量数列按数量标志分组形成的分布数列,称为变量分配数列,简称变量数列。它由各组变量值及各组总体单位数(次数)组成。变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列,如表2.3.5所示。表2.3.5某企业职工人数统计表按年龄分组按性别分组30以下30~5050以上合计男5004002001100女100300100500合计6007003001600上一页下一页返回本章首页第二章统计数据的收集与整理确定组数k找出xmin与xmax计算组距h确定每组上下限将相应数据归并到各组maxminxxhkXmin最小值,xmax最大值(二)分布数列的编制上一页下一页返回本章首页第二章统计数据的收集与整理某校200个学生大学英语考试成绩的频数分布表分数人数(f)分数人数(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539总数200(二)分布数列的编制上一页下一页返回本章首页第二章统计数据的收集与整理组距数列的分类组距数列可分为等距分组和异距分组。等距分组即各组组距相等的分组。异距分组即各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。组数的确定组距数列中组距的大小与组数的多少成反比。组限和组中值当组距、组数确定后,只需划分各组数量界限便可编制组距数列。(二)分布数列的编制上一页下一页返回本章首页第二章统计数据的收集与整理(二)分布数列的编制组限和组中值由于变量有离散型与连续型两种,因此,其组限的划分也有所不同。离散变量其变量值可以依次列举,而相邻组两个变量值之间没有中间数值,因此,分组时相邻组的组限必须间断。连续变量由于其变量值不能依次列举,而且相邻两个变量值之间可以存在无限多的中间数值,因此,相邻组的上限和下限无法用两个确定的数值分别表示,这时相邻的上、下限采用重叠的方法分组界定。在统计工作中,为保证变量的分组不发生混乱,习惯上规定各组一般均只包括本组下限变量值的单位,而不包括上限变量值的单位,这就是“上限不在内”原则。上一页下一页返回本章首页第二章统计数据的收集与整理(二)分布数列的编制若按照间断式组限分组时,则需要转换成连续式组限后再计算组中值,闭口组时采用上(2.3.