第二章统计数据的搜集整理和显示主要内容•2.1统计数据的搜集•2.2调查数据的整理•2.3频数分布•2.4数据显示统计数据搜集的概念概念统计数据搜集是根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地向客观实际采集数据的过程。直接向调查对象搜集反映调查单位的统计资料根据研究目的,搜集已经加工、整理过的、说明总体现象的资料从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。原始资料二手资料方式意义1.统计数据搜集的理论方法统计调查方案的设计1.确定调查的目的:为什么调查?(why)2.确定调查对象和调查单位:向谁调查?(Who)3.确定调查项目:调查什么?(what)4.调查表格和问卷的设计:怎么调查?(How)5.确定调查时间:什么时候调查?(when)6.确定调查的组合实施计划方案设计用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化。具体内容包括:•确定调查的目的–解决为什么(why)调查?•例如:去股票市场调查。•确定调查对象、调查单位和填报单位–解决向谁(who)调查?由谁来具体提供资料?•调查对象:指需要调查的现象总体,该总体是由性质相同的许多调查单位组成的;•调查单位:指所要调查的具体单位,它是进进调查登记的标志的承担者;–可以是人、企事业单位、物•报告单位(填报单位):负责向上报告调查内容、提交统计资料的单位。–报告单位一般在行政上、经济上具有一定的独立性。例1:调查福建省乡镇企业经营状况。调查对象:全省所有的乡镇企业,调查单位:每个乡镇企业,填报单位:每个乡镇企业。例2:调查目的是为了掌握全国炼钢设备情况调查对象:全国所有炼钢设备,调查单位:每台炼钢设备,填报单位:具有炼钢设备的每个冶金企业。•确定调查项目–解决向调查单位调查什么(what)?–调查项目是指总体要用哪些指标来反映,以及这些指标要怎样落实到总体单位的标志上。–调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志构成。•调查表格和问卷的设计(how)–调查表:各调查项目按照一定的顺序排列的表格。调查表主要有两种形式:•一览表:把许多调查单位填写在一张表上•单一表:每个调查单位填写一份,可容纳较多标志,一般用于调查项目较多的场合–问卷:是根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以文字或表格形式了解被调查者的意见•被调查者自愿、自由地回答问卷中所提出的问题。•确定调查时间(when)–调查时间有两种涵义,即调查资料所属时间和调查工作期限。•调查时间是指调查资料所属的时间:时点现象─规定标准时刻,时期现象─规定现象的起止时间。•调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间,应尽可能缩短。统计数据的搜集方法数据搜集方法•直接观察法•报告法(通讯法)•强制性•我国现行的统计报表制度采用这种方法•采访法•口头询问法•被调查者自填法•登记法•当事人在事发后进行登记填写•实验设计调查法•通过科学实验取得资料•其它方法:•如网络、卫星遥感法、GIS等•任何一种调查都必须采用一定的调查方法去搜集原始资料,即使调查的组织形式相同,其调查方法也可以不同。•应根据调查目的与被调查对象的具体特点,选择合适的调查方法观察记录法调查者强制、约束报告法访问调查调查者被调查者平等合作按调查单位的范围大小分为全面调查非全面调查一次性调查经常性调查统计报表专门调查按调查时间是否连续分为按调查的组织方式不同分为普查抽样调查典型调查重点调查概念•指组织搜集数据资源的方式方法2.统计调查的组织形式详见图2-1•非全面调查:–对调查对象其中的一部分单位进行调查,以取得调查对象的一部分资料,用来推断总体或反映总体的基本情况。•全面调查:–对调查对象的所有单位一一进行调查。•经常性调查是连续性的调查,它随着事物在时间上的发展变化而连续不断地进行登记。–一般调查时期现象,如:产值、产量、原料消耗等。•一次性调查是不连续登记的调查,它是对事物每隔一段时间后在一定时点上的状态进行登记。–一般调查时点现象,如:例如:人口数,固定资产总值。指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度统计报表制度统计调查的组织方式统一的表式,统一的指标项目,统一的报送时间和报送程序•在报表资料的来源建立在各个基层单位的原始记录为基础上;•统计报表是逐级上报和汇总的;•统计报表属于经常性调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析特点统计报表制度优点局限能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资料质量统计调查的组织方式一种专门组织的、一次性的全面调查,用来调查属于一定时点上或一定时期内的社会经济现象的总量。主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。特点普查统计调查的组织方式组织方式普查一般用来调查属于一定时点上社会经济现象的总量普查比任何其它调查都更能掌握大量全面的统计资料。专门组织的普查机构派出调查人员,直接登记。利用调查单位的原始记录和资料,发一定的调查表格,由调查单位填报。作用局限可以为抽样调查提供抽样框可以收集统计报表所不能提供的反映重大国情国力的基本统计信息,如:人口普查、工业普查、第三产业普查由于需要大量的人力、物力和财力,不宜经常进行普查统计调查的组织方式为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式作用局限能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料只适用于客观存在着重点单位的情况重点调查这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况统计调查的组织方式例如,为了掌握全国钢铁生产的基本情况,可以选出宝钢、鞍钢、首钢、马钢、武钢等几个大型钢铁企业调查。典型调查在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式一定条件下能估计总体指标数值可以补充全面调查的不足可以用来研究新生事物不能确定推断的把握程度,无法计算和控制推断误差作用指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量局限统计调查的组织方式按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式抽样调查指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会特点优点按随机原则抽取样本单位目的是推断总体的数量特征是运用概率的估计方法抽样误差可以事先计算并控制能用较少的人力、物力和时间达到全面调查的目的调查资料的准确性较高、受人为干扰的可能性较小统计调查的组织方式为什么要抽样?•不可能或不必要进行全面调查的社会现象–无限总体的调查。–破坏性的产品质量检验。–总体单位数过大。–没必要全面调查,如城乡居民家计调查、民意测验等。–实际情况的约束,如时间,成本等–特殊情况,如战备物资调查、矿产调查等•对普查资料进行必要的修正项目重点调查典型调查抽样调查定义在调查对象中选择一部分重点单位进行调查在对调查对象进行全面了解基础上,有意识选择若干具有典型意义或代表性单位进行调查按照随机原则从总体抽取一部分单位为样本进行调查,据此推断总体组织形式专门调查或调查表专门调查或调查表专门调查目的掌握总体某些指标的基本情况了解具体问题,描述总体的本身和规律性从数量上推断总体并具有一定把握计算产生的误差调查单位的选择有意识地选择重点单位有意识选择代表性或典型单位按随机原则选择代表性单位调查结果只能说明结果的基本情况可以描述总体结果,但如总体数值要求不高,也可推断能从数量上推断总体结果三种非全面调查的主要区别总体单位调查单位统计调查的组织方式指构成调查对象的每一个总体单位注意调查单位与填报单位的区别:当调查单位自己负责向上报告时,它同时也是填报单位;当调查单位的资料由它的上级组织收集整理并向上报告时,填报单位与报告单位则不一致。负责报告调查内容的单位总体单位调查单位报表制度可以全面调查,但通常是调查限定规模以上的总体单位统计调查的组织方式总体单位调查单位普查统计调查的组织方式对全部单位进行调查总体单位调查单位重点调查只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位)统计调查的组织方式总体单位调查单位典型调查对典型单位进行调查,典型单位的选择并不一定按规模统计调查的组织方式总体单位调查单位抽样调查按随机原则选择调查单位,各单位被选中的机会相同。统计调查的组织方式关于统计调查误差调查误差指收集来的数据资料与真实情况间的差异调查值调查误差真值?研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。调查误差的种类由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除登记误差代表性误差由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加以控制(随机误差)关于统计调查误差体重1.8.8.832.52.53.31.8.84.132.52.56.654.14.110.71.8.811.621.71.713.21.8.814.032.52.516.51613.213.229.832.52.532.232.52.534.754.14.138.854.14.143.0108.38.351.21.8.852.121.71.753.721.71.755.41.8.856.21915.715.771.91310.710.782.6129.99.992.621.71.794.243.33.397.51.8.898.321.71.7100.0121100.0100.02540414345464748495051525354555657585960616263656667TotalValidFrequencyPercentValidPercentCumulativePercent登记误差体重1.8.8.832.52.53.31.8.84.132.52.56.654.14.110.71.8.811.621.71.713.21.8.814.032.52.516.51613.213.229.832.52.532.232.52.534.754.14.138.854.14.143.0108.38.351.21.8.852.121.71.753.721.71.755.41.8.856.21915.715.771.91310.710.782.6129.99.992.621.71.794.243.33.397.51.8.898.321.71.7100.0121100.0100.02540414345464748495051525354555657585960616263656667TotalValidFrequencyPercentValidPercentCumulativePercent从全部学生中随机抽取20人组成样本并计算平均体重:样本一:52.35样本二:50.26样本三:53.19…真值:51.18代表性误差表头表体表脚名称、编号、制表单位、填表日期等等被调查者的基本情况、调查项目等等备注、指标解释等调查表的基本结构:•我国建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。3.统计调查体系现有统计资料主要是指次级资料次级资料指已经被收集、加工整理成型的数据信息次级资料的主要收集渠道:⒈查阅公开出版物;⒉向政府统计机构咨询;⒊向其他机构咨询;⒋网上查询。4.统计资料的来源常用的统计数据来源•《中国统计年鉴》•《中国统计摘要》•中国统计信息网(国家统计局网站)常用的统计数据来源•美国经济分析局•美国人口普查局•美