教学内容与要求统计调查与整理第二章1.了解统计调查的主要类型及其特点2.认识制定统计调查方案的内容3.掌握统计调查的常见的组织形式4.了解我国统计调查体系的改革方向一、统计调查的意义和要求向客观实际搜集数据资料的过程。特点:大量的、以数字为主的信息要求:准确、及时、全面、系统地位:基础环节第一节统计调查方案统计调查(一)确定调查目的调查方案的首要问题(二)确定调查对象和调查单位调查对象---应搜集资料的许多单位的总体调查单位---调查对象包含的具体单位报告单位(填报单位)---提交调查资料的单位(三)确定调查项目调查项目是所要调查的具体内容。二、统计调查方案设计列出调查项目的表格形式就是调查表。单一表:每个调查单位一份一览表:许多单位填列在一张表上(四)确定调查时间和调查期限调查时间:调查资料所属的时点或时期。调查期限:完成调查工作的期限。(五)制定调查的组织实施计划(六)选择调查方法资料搜集方法直接观察法、登记法报告法、采访法、网上调查法第二节统计调查的组织形式一、按调查对象包括的范围分类全面调查非全面调查调查范围普查全面统计报表典型调查重点调查抽样调查1、普查特点:一次性、全面调查意义:◎掌握基本国情国力资料,为长期规划提供依据;◎为其它非全面调查提供总体单位的基本信息要求:1、确定标准调查时间2、各调查单位应同时进行3、调查项目不能任意更改2、统计报表制度特点:分类:统一性基层性周期性稳定性按实施范围不同:国家、部门地方报表按调查范围不同:全面、非全面报表按报送周期长短:日、旬、月、季、半年、年报按填报单位不同:基层、综合按报送方式不同:电讯报表、书面报表自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度3、抽样调查特点:作用:1.解决全面调查无法或难以解决的问题2、补充修正全面调查的结果1.以随机取样为基础2.由部分推算整体的认识方法3.抽样推断是运用概率估计方法4.抽样误差可以事先计算并加以控制优越性:经济性、时效性、准确性、灵活性组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样4、重点调查5、典型调查选择重点单位进行调查,了解总体基本情况统计报表、重点调查、科学推算相结合必要的周期性普查为基础经常性的抽样调查为主体我国新的统计调查方法的目标模式有意识选择典型单位调查,分析总体情况二、按调查的组织形式分类组织方式统计报表专门调查普查抽样调查典型调查重点调查三、按登记事物的连续性分类事物的连续性经常调查一时调查一、判断对错1、全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的。()2、对某市下岗职工生活状况进行调查,要求在一个月内报送调查结果。所规定的一个月时间是调查时间。()3、我国人口普查的总体单位和调查单位都是每一个人,而填报单位是户。()4、典型调查既可以搜集数字资料,又可以搜集不能用数字反映的实际情况。()5、重点调查与抽样调查的目的是一致的,即都是通过对部分单位的调查,来达到对总体数量特征的认识。()××√√×思考与练习1、在统计调查中,调查内容的承担者是()A.调查对象B.调查单位C.填报单位D.统计报表2、对我国各铁路交通枢纽的货运量调查以了解铁路货运的总体状况,这属于()A.普查B.重点调查C.抽样调查D.典型调查思考与练习BB二、单项选择题3.在国营工业企业设备普查中,调查单位是()A.国营工业企业的每台设备B.每个国营工业企业C.国营工业企业的全部设备D.所有国营工业企业4、抽样调查是一种()A.非全面调查B.周期性调查C.全面调查D.经常性调查E.大量观察法AA5、对一批商品进行质量检验,最适宜采用的方法是()A、全面调查B、抽样调查C、典型调查D、重点调查B6、下列调查中,调查单位与填报单位一致的是()A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查D7、抽样调查的主要目的是()A、计算和控制抽样误差B、推断总体数量特征C、对调查单位作深入研究D、广泛运用数学方法B三、多项选择题1、在工业设备普查中()A、工业企业是调查对象B、每个工业企业是填报单位C、每台设备是填报单位D、每台设备是调查单位E、工业企业的全部设备是调查对象BDE2、制定统计调查方案,应确定()A、调查目的和调查对象B、调查单位和填报单位C、调查项目和调查表D、调查资料的使用范围E、调查的时间和时限ABCE3、抽样调查和重点调查的共同点是()A、两者都是非全面调查B、两者选取单位都不受主观因素的影响C、两者都按随机原则选取单位D、两者都按非随机原则选取单位E、两者都可以用来推断总体指标AB4、调查单位是()A、需要调查的总体B、需要调查的总体单位负责人C、调查项目的承担者D、负责报告调查结果的单位E、调查对象所包含的具体单位CE多项选择练习题1、普查属于()A、一次性调查B、经常性调查C、全面性调查D、非全面性调查E、专门调查ACE2、下列情况调查单位与填报单位不一致的是()A、工业企业生产设备调查B、人口普查C、工业企业现状调查D、农产量调查E、城市零售商店销售情况调查ABD3、我国按年序每逢“5”的一年进行1%的人口调查是()A、经常性调查B、专门调查C、一次性调查D、抽样调查E、典型调查BCD多项选择练习题4、下面属于非全面调查的有()A、抽样调查B、普查C、典型调查D、重点调查E、专门调查5、对某城市职工家庭生活情况进行调查,适宜采用()A、全面调查B、经常性调查C、抽样调查D、重点调查E、采访法CEACD6、第五次全国人口普查()A、调查对象是每一户家庭B、调查项目较多时应采用单一表C、一览表可同时填列若干个调查单位D、调查单位是每个人E、我国人口普查属专门调查BCDE一、统计整理的意义和内容资料的积累和保管审核原始资料对数据的分组、汇总绘制统计图表检查统计误差整理的中心工作显示数据的基本特征深入分析的基础第三节统计分组起着承前启后的作用统计整理的内容二、统计分组的意义和作用(一)统计分组的意义根据统计研究的需要,将总体按照一定的标志区分为若干个组成部分的一种统计方法。目的:组内同质性、组间差异性(二)统计分组的作用划分现象的类型揭示现象内部结构分析现象之间的依存关系•根据研究问题的目的来选择•选择最能反映被研究现象本质特征的标志•结合现象的历史或经济条件选择分组标志数量标志品质标志三、分组标志的选择简单分组复合分组对总体只按一个标志分组;只反映现象在某一标志特征上的差异选择两个及以上标志层叠起来分组;从不同角度反映总体内部的差异分组体系用一系列标志对总体的多种分组结合成的体系。四、四、简单分组、复合分组和分组体系一、分配数列的概念和种类:某地区从业劳动者产业分组统计产业从业人数(万人)频率(%)第一产业第二产业第三产业合计42836412992146.4739.5214.01100第四节分配数列构成要素反映总体结构分布状况及特征总体的各个组各组的单位数(频数)、频率品质分配数列变量分配数列单项式分配数列组距分配数列等距数列不等距数列分配数列种类二、组距数列的编制调查得到40家个体餐饮企业上月的营业额如下(元):899、975、1258、1879、1988、2270、2593、2889、3012、34583598、3688、3954、4015、4115、4228、4332、4402、4557、4682、4689、4794、4856、5105、5112、5234、5581、5622、5645、5876、5987、6078、6250、6315、6384、6572、6850、7224、7753、8874顺序排列数字资料,观察其中的集中与变异情况,确定数列形式,计算全距(全距=8874–899=7975)确定组数、组距、组限(等距分组)重叠组限----“上组限不在内”原则kRi(一)组距和组数R-全距K-组数i-组距计算各组频数、频率(等距分组)营业额(元)1000元以下1000~20002000~30003000~40004000~50005000~60006000~70007000元以上合计企业个数(个)23351086340频率5%7.5%7.5%12.5%25%20%15%7.5%100%(二)等距分组和异距分组频数(率)密度=频数(率)/组距年生产能力(百吨)企业个数(个)频数密度(个/百吨)1百吨以下10101~52055~2030220~50100.3合计70(异距分组)等距分组不等距分组各组组距均相等。如:10—2020—3030—40以上各组组距均为10。这种分组适用于均匀分布的总体。各组组距不一定相等。如:10—2020—5050—6060—70以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。(三)组限和组中值1、组限组限就是每一组两端的数值。10—2020—3030—40下限上限确定组限的方法有两种:间断式确定和重叠式确定职工人数(人)99以下100—199200—299300—399固定资产额(万元)50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量2、组中值每组上限与下限之间的中点数值,是各组的假定平均数。组中值=(上限值+下限值)÷2开口组组中值的计算:缺下限:组中值=本组上限—相邻组组距/2缺上限:组中值=本组下限+相邻组组距/2例如产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。向上累计向下累计三、累计次数分布某市居民家庭储蓄统计表家庭储蓄额(万元)储蓄总额(万元)储蓄额累计比重家庭比重家庭累计比重0~11581.45%18%18%1~53254.43%29%47%5~10156818.81%35%82%10~50538068.16%12%94%50万以上3470100%6%100%合计10901-----------020406080100(%)20406080(%)100累计频率累计标志比重(一)钟型分布(二)U型分布(三)J型分布钟形分布J形分布U形分布四、次数分布的主要类型各类节目收视情况统计表一、统计表宾词节目类型收视率满意率新闻节目类82.3%85%教育讲座类42.6%75.8%体育比赛类80.7%89.4%综合文艺类88.4%77.3%总标题纵栏标题横行标题数值主词第五节统计图表统计表的构成统计表的种类复合表简单表分组表主词未经任何分组的统计表主词按一个标志分组的统计表主词按两个及以上标志分组的统计表二、统计图:直方图与折线图1000200030004000500060007000营业额(元)企业个数410862曲线图钟形分布J形分布U形分布条形图20.512.634.524.145.805101520253035404550电视机微波炉电冰箱洗衣机家用空调系列1饼形图电视机15%微波炉9%电冰箱25%洗衣机18%家用空调33%一、判断对错1、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。()×2、分配数列的实质是把总体单位总量按照总体所分的组进行分配。()√3、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。()×4、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。()√5、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%。()×6、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。()√1.某连续变量数列,末组为500以上,其邻组的组中值为480,则末组的组中值为()。A、510B、520C、530D、540思考与练习二、单项选择题B