统计学STATISTICS2-1第2章统计调查与统计整理主要内容:1.统计调查方案2.统计误差3.统计数据的整与理数据显示4.本章小结统计学STATISTICS2-2学习目标1.认识统计调查与统计整理的地位和作用2.了解各种统计调查方法的特点及应用范围3.掌握数值型数据的整理方法4.掌握统计调查方案的设计5.掌握统计表和统计图的使用6.掌握统计分组理论和变量数列的编制方法统计学STATISTICS2-3抽样调查方案确定调查目的(为什么调查)确定调查对象和调查单位确定调查项目设计调查问卷选择调查方法确定调查时间和调查期限制定调查的组织实施计划统计学STATISTICS2-4统计调查的组织方式普查统计报表抽样调查重点调查:重点单位是指在全体中虽然数目不多,所占比不大,但调查标志值却占很大的比重。典型调查:有意识地选择有典型意义或具有代表性的单位。统计学STATISTICS2-5普查(census)1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄总体统计学STATISTICS2-6统计报表是我国定期搜集基本统计资料的一种重要形式。特点:来源于基层单位的原始记录项目稳定,有利于资料积累和动态比较种类:国家、部门和地方统计报表全面统计报表和非全面统计报表定期报表和年报基层表表和综合报表电讯报表和书面报表统计学STATISTICS2-7抽样调查(samplingsurvey)1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。总体随机样本2.具有经济性、时效性强、适应面广、准确性高等特点。统计学STATISTICS2-8间接取得的数据Internethttp//统计部门和政府部门公布的有关资料,如各类统计年鉴2.各类经济信息中心、信息咨询机构、专业调查机构等提供的数据3.各类专业期刊、报纸、书籍所提供的资料4.各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料5.从互联网或图书馆查阅到的相关资料统计学STATISTICS2-9提供统计数据的部分政府网站中国政府及相关机构网址数据内容国家统计局统计年鉴、统计月报等国务院发展研究中心信息网宏观经济、财经、货币金融等中国经济信息网国家统计局授权的数据中心中国决策信息网三农信息、论坛及相关网站统计学STATISTICS2-10提供统计数据的部分政府网站美国政府机构网址数据内容人口普查局货币供应、信誉、汇率等预算编制办公室财政收入、支出、债券等商务部商业、工业等统计学STATISTICS2-11数据的误差抽样误差抽样框误差回答误差无回答误差调查员误差非抽样误差数据的误差统计学STATISTICS2-12抽样误差(samplingerror)1.由于抽样的随机性所带来的误差2.所有样本可能的结果与总体真值之间的平均性差异3.影响抽样误差大小的因素样本量的大小总体的变异性统计学STATISTICS2-13非抽样误差(non-samplingerror)1.相对于抽样误差而言2.除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异3.存在于所有的调查之中概率抽样,非概率抽样,全面性调查4.有抽样框误差、回答误差、无回答误差、调查员误差、测量误差统计学STATISTICS2-14误差的控制1.抽样误差可计算和控制2.非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制调查结果进行检验、评估现场调查人员进行奖惩的制度统计学STATISTICS2-15统计数据的整理一、统计数据的分组与次数分配三、次数分配直方图四、洛伦茨曲线统计学STATISTICS统计分组根据统计研究的需要,将统计总体按照一定的标志区分为若干个组成部分的一种统计方法。统计学STATISTICS2-17分配数列分配数列概念:在统计分组的基础上,将总提案组归类整理,并按一定顺序排列,形成总体各单位在各组建的分布。分配数列种类:品质数列和变量数列变量数列种类:单项数列与组距数列统计学STATISTICS2-18组距分组(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组~~~~~统计学STATISTICS2-19组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的2.确定组距:组距(classwidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值—最小值)÷组数3.统计出各组的频数并整理成频数分布表统计学STATISTICS2-20组距分组(几个概念)1.下限(lowlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值下限值+上限值2组中值=统计学STATISTICS2-21次数分配表的编制(例题分析)【例】某车间30名工人每周加工某种零件件数如右表试对数据进行分组。统计学STATISTICS2-22次数分配表统计学STATISTICS2-23使用Excel做频数函数(FREQUENCY)Excel的“直方图”工具的缺陷是:频数分布和直方图没有与数据联系起来,这样,如果你改变任何一个数据,频数分布表和直方图不会跟着改变。使用Excel中的统计函数“FREQUENCY”来创建频数分布表和直方图,可解决这一问题。创建频数分布表的步骤是:•选择与接受区域相临近的单元格区域,作为频数分布表输出的区域;•选择统计函数中的“FREQUENCY”函数;•在对话框Date-array后输入数据区域,在Bins-array后输入接受区域;•同时按下ctrl-shift-Enter组合键,即得到频数分布。统计函数—幻灯片15FREQUENCY统计学STATISTICS次数分配直方图Excel统计学STATISTICS2-25直方图(histogram)1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图3.直方图下的总面积等于1。统计学STATISTICS2-26分组数据的图示(直方图的绘制)某车间工人周加工零件直方图我一眼就看出来了,周加工零件在100~110之间的人数最多!809010011012013004812统计学STATISTICS2-27折线图(frequencypolygon)1.折线图也称频数多边形图。2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。3.折线图的两个终点要与横轴相交,具体的做法是:第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的统计学STATISTICS2-28分组数据的图示(折线图的绘制)折线图与直方图下的面积相等!某车间工人周加工零件折线图809010011012013004812统计学STATISTICS2-29次数分配的类型对称分布右偏分布左偏分布正J型分布反J型分布U型分布常见的频数分布类型统计学STATISTICS洛伦茨曲线统计学STATISTICS2-31洛伦茨曲线1.20世纪初美国经济学家、统计学家洛伦茨(M.E.Lorentz)根据意大利经济学家巴雷特(V.Pareto)提出的收入分配公式绘制而成2.描述收入和财富分配性质的曲线分析国家或地区分配的平均程度。AB累积的人口百分比累积的收入百分比绝对公平线统计学STATISTICS2-32基尼系数1.20世纪初意大利经济学家基尼(G.Gini)根据洛伦茨曲线给出了衡收入分配平均程度的指标2.A表示实际收入曲线与绝对平均线之间的面积3.B表示实际收入曲线与绝对不平均线之间的面积4.如果A=0,则基尼系数=0,表示收入绝对平均5.如果B=0,则基尼系数=1,表示收入绝对不平均6.基尼系数在0和1之间取值7.一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。AB=AAB基尼系数统计学STATISTICS2-33本章小结1.统计调查方案2.统计误差3.统计数据的整与理数据显示