第二章_统计数据的收集、整理与显示

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章统计数据的收集、整理与显示1①理解统计数据收集要求,掌握统计数据收集方案设计;②熟悉常用的统计数据收集方法;③掌握调查问卷设计技能;④理解统计数据整理的含义、要求与步骤;⑤理解统计分组的意义,正确掌握统计分组方法;⑥了解统计表的结构、种类和编制方法;⑦了解统计图的意义,掌握常用统计图的绘制方法;⑧掌握Excel在统计数据整理与显示中的应用学习要求2统计数据的收集1统计数据的整理2统计数据的显示3主要内容3第一节统计数据的收集一、统计数据收集的要求统计数据收集的基本要求准确性及时性完整性4案例1:2016台湾大选民调民调机构调查时间有效样本置信水平抽样误差两岸政策协会12月27日-28日121095%2.82%台湾智库12月27日-28日108595%3%新台湾国策智库12月25日-26日106995%3%台湾指标民调12月27日-29日100295%3.1%苹果日报1月1日-2日106995%3%国民党1月2日87695%3.31%壹电视1月2日至3日107695%2.99%三立1月2日至3日80095%3.5%52016台湾大选民调6案例2:《文学文摘》预测美国大选在美国1936年的选举中,两位竞争者为民主党的罗斯福和共和党的兰登。《文学文摘》杂志:发放了1000万份调查问卷,并通过电话和俱乐部进行调查。根据已回收的240万份问卷和电话调查,预测兰登将获得57%的选票。盖洛普公司:对5万人问卷调查,预测罗斯福胜。结局:罗斯福以61比37的压倒性优势获胜。疑问:5万人―小‖抽样,战胜了240万的―大‖调查,为什么?7追根溯源1.《文学文摘》采用电话和俱乐部进行调查。样本抽选有偏。兰登的支持者主要是富人阶层;罗斯福的支持者都是工薪阶层、底层平民。2.没有考虑缺失样本的影响。发放1000万份样本,只回收240万份样本。忙于生计的底层平民多数拒绝回应。8数据收集目的(WHY)数据收集对象和观测单位(WHOM)调查表(WHAT)数据所属时间和数据收集期限(WHEN)9二、统计数据收集方案设计(一)数据收集目的中国健康与养老追踪调查(ChinaHealthandRetirementLongitudinalSurvey,CHARLS)旨在收集一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。(调查宣传片)CHALRS全国基线调查于2011年开展,覆盖150个县级单位,450个村级单位,约1万户家庭中的1.7万人。这些样本以后每两年追踪一次,调查结束一年后,数据免费公开。网址:(三)数据收集对象和观测单位数据收集对象:即调查对象,调查研究的总体。观测单位:也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。报告单位:也称填报单位,是提交调查资料的单位,一般是基层企事业组织。11调查对象观测单位确定调查对象和调查单位第五次人口普查的调查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人。第六次全国人口普查对象是指普查标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的境外人员。思考:两次调查有区别吗?12注意观测单位与报告单位的区别:当观测单位自己负责向上报告时,它同时也是报告单位;当观测单位的资料由它的上级组织收集整理并向上报告时,观测单位与报告单位则不一致。负责上报调查资料的单位。13观测单位与报告单位有时一致,有时不一致!例:规模以上企业注:规模以上工业企业在2010年之前是指年主营业务收入在500万元及以上的法人工业企业;2011年是指年主营业务收入在2000万元及以上的法人工业企业。观测单位与报告单位(四)调查表调查表是用来表现调查项目的表格,其目的是保证统计资料的规范化和标准化。15单一表:“一户一表”,一张表格只列一个调查单位。一览表:“多户一表”,一张表格列多个调查单位。(五)数据所属时间和数据收集期限数据所属时间指调查资料所属时间。数据收集期限是进行调查工作的期限,包括收集资料和报送资料的整个工作所需要的时间。调查地点指登记统计调查资料的地点。16[例]调查时间是指()。A.调查资料所属的时间B.进行调查的时间C.调查工作的期限D.调查资料报送的时间[例]某市工业企业2008年生产经营成果年报呈报时间规定在2009年1月31日,则调查期限为()A.1日B.1个月C.1年D.1年零1个月三、统计数据收集方式统计调查普查抽样调查重点调查典型调查统计推算171.普查特点:一次性、全面性目的:全面系统掌握国情、国力等情况。两种方式:从上至下直接对调查单位进行登记;从下至上向调查机构上报。18我国的普查制度人口普查(10年一次,逢0年份);农业普查(10年一次,逢6年份)。经济普查(每10年两次,逢3、8年份),192.抽样调查非全面调查,从总体中抽取样本,以样本推断总体;目前应用最广泛的统计调查方式。样本总体样本统计量(均值、比例、方差)20抽样调查的分类21抽样调查概率抽样简单随机抽样分层抽样整群抽样等距抽样多阶段抽样非概率抽样任意抽样典型抽样定额抽样流动总体抽样(1)概率抽样遵循随机原则进行的抽样,总体中每个单位都有机会被选入样本。排除主观上有意识的抽取调查单位每个单位被抽中的概率是已知或可计算的22①简单随机抽样从总体中任意抽取n个单位作为样本特点:每个样本单位被抽中的概率相等样本的每个单位完全独立缺点:不能充分利用总体的已知信息只适用于总体单位数量有限的情况,否则编号工作繁重;23②分层抽样先分类后抽样,即先按特征分类(层),从每一层内进行单纯随机抽样。优点:减小各抽样层变异性的影响,样本具有代表性适用条件:适用于组内差异小、组间差异大的情况。24全校教师教授副教授讲师助教③整群抽样先按特征分群,以群为单位进行抽样优点:方便、成本低;缺点:抽样误差较大适用条件适用于组内差异大、组间差异小的情况。25全校教师经济学院管理学院法学院外语学院医学院…….④等距抽样(或系统抽样、机械抽样)步骤:首先将总体中各单位排序;然后,随机确定起点,并确定抽选间隔;最后,每隔一定的间隔抽取一个单位的一种抽样方式。优点:方便、成本低缺点:抽样误差较大案例:按门牌号每隔10户抽取1户进行入户调查26············⑤多阶段抽样步骤:先从总体中抽取范围较大的单元,称为一级抽样单元,再从每个抽得的一级单元中抽取范围更小的二级单元,依此类推,最后抽取其中范围更小的单元作为调查单位案例:某省100多万农户抽取1000户调查收入:第1阶段:从该省所有县中抽取5个县;第2阶段:从被抽中的每个县中各抽4个镇;第3阶段:从被抽中的每个乡中各抽5个村;第4阶段:从被抽中的每个村中各抽10户;总样本量n=5¬4¬5¬10=1000(户)27(2)非概率抽样又称为不等概率抽样或非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法。不能从数量上推断总体。28非概率抽样任意抽样典型抽样定额抽样流动总体抽样①任意抽样调查人员本着随意性原则去选择样本的抽样方式最常见的方法:“街头拦人法”29②典型抽样根据调查人员的主观经验从总体样本中选择具有代表性的单位进行调查例如,要对浙江省小微企业的经营情况进行调查30③定额抽样也称作划类选典抽样。它是先对总体按一定标志分类,并按比例分配每类应调查单位的定额,然后由抽样者在每类依主观判断选择代表性的商品进行抽样。例如,要对浙江省小微企业的经营情况进行调查。先按照企业规模进行分类,然后从每一类中选择少数代表性的企业进行调研。思考:定额抽样和分层抽样有区别吗?31④流动总体抽样也称“捕获——标记——再捕获”(Capture-Tag-Recapture)抽样,即抽样者先从流动总体中获取部分单位,加以标记后放回总体,过一段时间后再获取部分单位,然后根据再获取单位中有标记单位的比例来推算总体的数量。应用:养殖人员希望估计某大型水库中的鱼的数量,怎么办?32解决方案1000002000201000从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,将鱼全部放回水库。过一段时间,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断水库中鱼的总数大致为:3.概率抽样与非概率抽样的比较概率抽样非概率抽样抽样原则特点非随机原则,统计量的分布不确定,无法进行参数估计.操作简便、时效快、成本低抽样原则特点随机原则,可以据以对总体参数进行估计更精确,技术含量高,调查成本高34概率抽样的分类概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样。重复抽样:又被称作重置抽样、有放回抽样不重复抽样:又被称作不重置抽样、不放回抽样思考:从1、2、3中重复抽取(或不重复抽取)2个数字组成新的数,分别可以组成多少个数?35从总体N个单位中,用重复抽样的方法,随机抽取n个单位构成一个样本,则共可抽取Nn个样本。【例】从1、2、3中重复抽取2个数字组成新的数,可以组成多少个数。11,12,13;21,22,23;31,32,33。共32=9个36重复抽样从总体N个单位中,用不重复抽样的方法,抽取n个单位样本,全部可能抽取的样本数目为=N(N-1)…(N-n+1)。重复抽样的样本个数总是大于不重复抽样的样本个数。nNP【例】从1、2、3中不重复抽取2个数字组成新的数,可以组成多少个数。12,13;21,23;31,32,一共6个37不重复抽样只选择一部分重点单位进行调查的一种非全面调查组织方式这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况383.重点调查权重股39权重股:在股市市场占有的份额比较大。例如上证50指数所包含的股票。【例】小市值公司一个涨停也许对指数只带来0.01点的影响;工商银行涨停,指数上涨60点。1.以客观性原则来确定调查单位2.能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料1.只适用于客观存在重点单位的情况2.不能用于推断总体优点局限403.重点调查414.统计推算统计推算是以已掌握的各种统计数据为基础,根据事物之间的内在联系或发展规律,对被研究现象数量特征做出估算或测算的一种间接统计调查方式。插值推算法回归推算法42四、统计数据收集方法数据收集直接观察登记法采访法通讯法网上调查法直接观察法就调查对象的行动和意识,调查人员边观察边记录以收集所需信息优点:调查人员不是强行介入,能够在被调查者不察觉的情况下获得资料例如:红灯、摄像头采访法1:个人面访一次只有一名受访者参加、针对特殊问题的调查适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,如政治方面的问题侧重于定性研究您有过几次恋爱经历?采访法2:集体座谈也称集体访谈将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料参加座谈会的人数不宜过多,一般为3~10人侧重于定性研究小明同学平时表现怎样?通讯法也称邮寄问卷调查调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点问卷或表格的发放方式有:邮寄宣传媒介传送专门场所分发登记法当事人按照规定到有关机构登记,填写表格,提供统计信息工商注册登记、税务登记、经济普查登记、人口普查登记、户籍登记具有一定的强制性五、调查问卷设计问卷的基本结构引言问候语填写说明问卷编号被调查者基本情况主体部分问题答案背景部分48开头部分(问候语)¬¬女士/先生:您好!我是¬¬市场调查公司访问员

1 / 129
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功