第二章统计资料的搜集和整理STAT本章重点1、统计数据采集的方式方法;2、统计数据的整理;3、统计数据的显示。本章难点1、统计调查方案的拟定;2、统计分组与次数分布。STAT第一节统计调查一、概念1、定义:具体搜集统计资料的工作过程。[例]统计调查的目的:欲获得A班50名同学的平均年龄。(1)向班主任(学工处)查寻获得平均年龄为18.2岁/人。(2)自己动手获得平均年龄=总年龄/总人数2、资料的种类(1)原始资料:未经加工整理的资料“个体”。(2)次级资料:已经加工整理的资料“总体”。18:20:17:500201AAA第二章统计资料的搜集和整理STAT3、统计调查的要求准确性、及时性、全面性准、快、全三者关系:准中求快、准中求全。二、统计调查的种类(一)按调查对象所包括的范围分类1、全面调查普查、全面统计报表。2、非全面调查、抽样调查、重点调查和典型调查。(二)按调查登记是否连续进行分类1、经常性调查:间隔1年[例]年产值=12个月产值=365天产值;2、一次性调查:间隔1年第二章统计资料的搜集和整理STAT(三)按调查的组织形式分类1、统计报表制度:自上而下布置调查任务,自下而上上报调查资料的统计制度(调查方法)。布置:国家省、市、自治区设区市县乡;上报:国家省、市、自治区设区市县乡。2、专门调查:专门组织的调查。普查、抽样调查、重点调查和典型调查。普查:专门组织的一次性的全面调查。三、我国统计调查方法改革的目标模式在1994年全国统计工作会议上,明确提出了统计调查方法改革的目标模式,即:建立以必要的周期性普查为基础、经常性的抽样调查为主体,同时辅之以重点调查、科学推算和少量的全面报表综合运用的统计调查方法体系。第二章统计资料的搜集和整理STAT第二节统计调查方案※一、明确调查目的(Why)[例]人口普查:准确查清人口的数量、地区分布、构成和素质状况及其变化情况。二、确定调查对象与调查单位(Who)1、调查对象:调查研究的总体。[例]人口普查:具有中国国籍并在中国境内常住的自然人;农村生育率调查:农村15~49岁的女性人口。商店们销售情况教师们质量情况调查粉笔的品种、规格等价格、销售量商店们销售情况折断率等重量、书写的流利程度教师们质量情况调查粉笔的第二章统计资料的搜集和整理STAT2、调查单位:调查研究的总体单位(个体),调查内容的承担者。[例]A企业职工住房面积调查;B企业设备完好状况调查。(1)调查谁每一名职工,调查什么住房面积;(2)调查谁每一台设备,调查什么完好状况。3、填报单位:填写、上报统计资料的单位。[例]下列各项调查中,调查单位和填报单位可能一致的有()A、工业企业普查B、工业企业设备普查C、商业职工工资调查D、工业产品产值调查E、职工出勤调查答:A、C、E[例]确定调查单位是指确定由哪些单位来进行调查。()第二章统计资料的搜集和整理STAT三、确定调查项目和调查表(What)1、调查项目:调查内容。2、调查表单一表:一个调查单位用一张表;一览表:多个调查单位共一张表。某市商业局主要经济指标统计表单位销售额库存额利润百货公司纺织品公司五交化公司副食品公司问:调查项目是标志还是指标?第二章统计资料的搜集和整理STAT全国城市老年人口基本情况调查表通讯地址省(自治区、市)市街道号01姓名02性别:1、男2、女03年龄出生年月日,周岁04文化程度:1、大学2、中专3、高中4、初中5、小学6、识字很少7、不识字05婚姻状况:1、从未结过婚2、有配偶(不包括分居)3、分居4、离婚5、丧偶第二章统计资料的搜集和整理STAT四、确定调查时间(When)1、调查时间:资料所属时间。[例]某局欲派员调查B企业2008年的产值及年末职工人数情况,要求调查工作于次年1月1日开始,资料1月底之前上报。调查时间:2008年、2008年年末。2、调查期限:调查工作的起止时间。调查期限:2009年1月。3、调查地点:在什么地点进行调查登记。五、组织实施计划(How)具体包括:调查人员的选择、组织与培训;调查文件、表格、调查员手册的印刷,调查宣传工作,必要调查工具的准备;调查经费的来源和开支预算等。第二章统计资料的搜集和整理STAT第三节专门调查一、普查(一)定义:专门组织的一次性的全面调查。特点:1、政府组织的;2、周期性;如我国基本是:逢“0”人口普查,逢“3”第三产业普查,逢“5”工业普查,逢“7”农业普查1次/10年。3、全国性的调查。(二)注意的问题1、标准时点(间):普查登记时所依据的统一时点。[例]我国第四次人口普查的标准时间为1990年7月1日零时,第五次人口普查为2000年11月1日零时。第二章统计资料的搜集和整理STAT2、普查项目一经确定,不得任意改变或增减。1953年人口普查:5项;1964年人口普查:9项;1982年人口普查:19项;1990年人口普查:21项;2000年人口普查:59项。二、重点调查1、定义:对重点单位进行的调查。2、重点单位:总体中一小部分单位的标志量占总体该方面标志总量的比重足够大。3、注意的问题(1)客观性;(2)可对总体情况作一大致估计;(3)某些情况下,不可进行重点调查。第二章统计资料的搜集和整理STAT3、方法(1)“解剖麻雀”式;(2)划类选典。4、注意的问题(1)主观性;(2)只有划类选典可以推断总体。突出典型一般典型三、典型调查1、定义:对典型单位进行的调查。2、种类后进典型先进典型第二章统计资料的搜集和整理STAT一、意义1、定义:使资料由个体特征过渡到总体特征的工作过程。2、整理对象:调查资料(原始资料、次级资料)。[例]通过调查得某班平均成绩为3.5分/人(五分制)统计整理5:100=3.5:x,∴x=70分。万元万元万元75012501000100002001AAA1000+1250++750=50亿元50亿/100=5000万元/家第四节统计整理的意义和步骤[例]统计目的:了解A地区工业企业的生产情况(产值)第二章统计资料的搜集和整理STAT二、步骤(一)审核1、准确性审核(1)逻辑审核(2)计算审核2、全面性审核3、及时性审核(二)统计分组※(三)统计汇总(四)统计制表08会计班年龄分布表年龄x人数f频率171819202161418930.120.280.360.180.06合计501.00第二章统计资料的搜集和整理STAT第五节统计分组※一、概念与作用(一)概念1、定义:将统计总体按一定的分组标志区分为若干个性质不同的组或类。[例]对会计08班的50名同学进行分组A、按专业分组B、按年级分组C、按性别分组D、按籍贯分组答:C、D。分组标志:分组的标准或依据。2、过程:分“总体”;合“单位”。男女3、分组要求:组内同质、组间差异。4、分组原则:不重复、不遗漏。2624第二章统计资料的搜集和整理STAT二、统计分组方法1、按分组标志的性质不同(1)按品质标志不同分组A、按简单的品质标志分组[例]对人口按性别进行分组男性组、女性组;[例]对中国人口按民族进行分组汉、满、维吾尔等56组。B、按复杂的品质标志分组(分类)[例]产品按用途可分为工业用和民用“煤”?[例]人口按职业可分为工人、农民、军人、医生等“军医”?[例]农业可分为种植业、林业、牧业、副业和渔业,下列产品何种属于种植业产品()A、茶叶B、桑叶C、鸡蛋D、蜂蜜第二章统计资料的搜集和整理STAT[例]下列货物中哪些属于固定资产()A、奶牛B、矿物勘探C、种牛D、蛋鸡(2)数量分组[例]企业按产值分组、人口按年龄分组。2、按分组标志的多少分类(1)简单分组:只按一个标志分组。[例]对中国人口进行简单分组女男性别平行分组体系:对同一总体进行若干次简单分组。蒙等回汉民族军人等农民工人职业第二章统计资料的搜集和整理STAT(2)复合分组:按两个或两个以上的标志层叠起来进行分组。[例]对人口按性别、文化程度进行复合分组。女性男性人口复合分组体系:对某一总体进行复合分组。文盲半文盲小学中学大学及以上文盲半文盲小学中学大学及以上第二章统计资料的搜集和整理STAT第六节次(频)数分布※一、概念及类型(一)概念1、次数:分布在各组的单位数(f);2、频率:各组次数占总次数的比重f/f;3、次数分布(表、图)。(二)类型1、属性(品质)次数分布;2、变量数列。(1)变量x;(2)次数f;(3)频率f/f。性别人数f频率%男生女生20304060合计50100年龄x人数f频率171819202161418930.120.280.360.180.06合计501.00第二章统计资料的搜集和整理STAT二、变量数列的种类1、单项式数列:一个变量值代表一组。2、组距式数列:依组距分组等距数列、异距数列。A班学生年龄分布表年龄人数频率171819202161418930.120.280.360.180.06合计501.00某地人口分布表年龄人数(万人)0—1010—2020—3030—4040—507112482合计52不足:丧失了原有信息;所得:减少了组数。第二章统计资料的搜集和整理STAT三、变量数列的编制1、组限上组限(U)、下组限(L)。2、组距(i)=U–L。3、全距(R)=Xmax–Xmin。[例]某班某门课的考试成绩最高为98分,最低为45分R=53分成绩(分)人数(人)50—6060—7070—8080—9090—100371352合计30我国人口年龄阶段的分组年龄段男性女性婴幼儿少年儿童中青年老年0—67—1718—5960及以上0—67—1718—5455及以上第二章统计资料的搜集和整理STAT4、组数(n)=全距/组距=R/i[例]某班某门课的考试成绩最高为98分,最低为45分R=53分。(1)i=10分,n=R/i=53/10=5.3;(2)i=20分,n=R/i=53/20=2.65。[例]30名同龄儿童身高(cm):106,99,85,121,84,94,106,105,110,119,101,95,91,87,105,106,109,118,96,128,91,97,105,111,111,107,103,101,107,106。解:R=128–84=44cm;i=10cmn=5组。[经验]i5、10或其倍数;n5~7组。成绩人数40—5050—6060—7070—8080—9090—100首组第二组第三组第四组第五组末组第二章统计资料的搜集和整理STAT5、组中值=(上限+下限)/2推测本组平均水平。(1)闭口组;(2)开口组。首组组中值=(U+L)/2=[U+(U-i)]/2=U-i/2=U-邻组i/2假定:数据均匀分布或对称分布。第四组均匀分布时:111,113,115,117,119;对称分布时:112,114,115,116,118。末组组中值=(U+L)/2=[L+(L+i)]/2=L+i/2=L+邻组i/2身高(cm)人数(人)90以下90—100100—110110—120120以上371352合计30第二章统计资料的搜集和整理STAT6、次数密度=次数/组距[例]第三组:13人/10分=1.3人/分。7、对连续变量,只可编制组距式数列,且相邻组限必须重叠。8、对重叠组限,组限值单位数遵循“上组限不在内”的原则。组限值单位:取值正好是某组组限(上限或下限)的单位。[例]第二组的取值范围[90、100);第三组的取值范围[100、110)。第五组的取值范围[120、130]。身高人数次数密度70—9090—100100—110110—120120—1303713520.150.71.30.50.2合计300.5第二章统计资料的搜集和整理STAT四、次数分布图15129638090100110120130x身高(一