0102030405060708090第一季度第二季度第三季度第四季度东部西部北部统计数据的整理概述分类数据的统计整理顺序数据的统计整理数值型数据的统计整理统计表概述将统计调查得到的原始资料进行科学的分组和汇总形成综合统计资料的工作过程是统计调查的继续,又是统计分析的基础。统计整理还是积累历史资料的必要手段。统计整理的程序---1审核审核。对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误。数据的审核完整性主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写是否齐全等。准确性一是检查数据资料是否真是地反映了客观实际情况,内容是否符合实际二是检查数据是否有错误,计算是否正确等。逻辑检查侧重于定性资料的审核首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查内容是否合理,各项目或数字之间有无相互矛盾的地方。计算检查侧重于定量资料的审核检查调查表中的各项数据在计算结果和计算方法上有无错误审核数据准确性的方法通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:(1)对于可以肯定的一般错误,应及时代为更正,并通知原报单位。(2)对于可疑之数或无法代为更正的错误,应要求原单位复查更正。(3)如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。(4)对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。统计审核后的订正统计整理的程序—2分组分组(类)。根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。统计分组是根据现象总体内在特点和统计研究的目的要求,按照一定标志把总体各单位划分为不同类型或不同性质的几个部分。统计总体的特点表明,总体的同质性是相对的。总体内各个单位有许多可变标志,是人们把总体进一步区分为性质不同几个部分的客观依据。统计分组的目的与含义统计分组的目的是按照不同的标志,把总体划分为一个个性质不同、范围更小的总体,从而把统计研究对象的本质特征正确地反映出来,保持组内的同质性和组间的差异性,以便进一步运用各种统计方法,研究总体的数量表现和数量关系统计分组具有两个方面的含义:对总体而言是“分”,即将总体中的各个个体按照他们的差异性区分为若干部分,对个体而言是“合”,即将性质相同的个体组合在一起。统计分组的作用划分社会现象的不同类型统计分组的根本作用在于区别事物的质社会经济现象存在着复杂多样的类型,各有其本身的特点和发展规律,在整理大量资料时,有必要运用分组法将所研究现象划分为不同的类型组来进行研究。第五次人口普查结果按性别分男65355女61228按城乡城市45594农村80739合计129533统计分组的作用揭示社会现象的内部结构总体的同质性只是研究问题的前提,要深刻认识总体,就必须通过分组,从总体的构成认识总体各部分的地位,借助于总体各部分数量上的差别和联系,进而对现象总体做出正确的评价。任何统计分组都有研究现象结构的意义。8270311.848.739.56978.89.858.23278177.256.536.362885.953.940.210966.576.151.742.2gdp第一产业第二产业第三产业中国20940711.848.739.5山东21846.79.858.232江苏21548.47.256.536.3浙江156495.953.940.2广东25968.66.151.742.2统计分组的作用分析社会现象之间的依存关系一切现象总是处于相互联系、相互依存中,通过统计分组来研究现象之间的依存关系,是统计分析的一种重要方法。为研究依存关系的分组,称为分析分组。原因标志/结果标志统计分组的作用统计分组是一切统计研究的基础,应用于统计工作的全过程,是统计研究的基本方法之一。分组标志统计分组的关键是分组标志的选择和各组界限的划分。分组标志是将统计总体进行分组时所依据的标志或标准。【企业规模/性别/工龄】分组标志选择正确与否,关系到能否正确地反映总体的性质特征,实现统计研究的目的任务。分组标志一经选定并据以进行分组,就突出了在此标志下的性质差异,掩盖了总体在其他标志下的差异分组标志按品质标志分组。按事物的品质属性进行分组。事物品质特征的差异是客观存在的,按品质标志分组一般来说概念比较明确,分组也相对稳定。分组标志一经确定,组名称和组数也就确定,不存在组与组之间界限区分的困难。复杂的品质分组,通常称为分类法。按数量标志分组按事物的数量特征进行分组按数量标志分组的目的并不是单纯确定各组的数量差别,而是要通过数量变化来区分各组的不同类型和性质按数量标志分组,应注意如下两个问题:分组时各组数量界限的确定必须能反映事物质的差别。应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。分组标志分组的类型按分组标志性质品质标志分组数量标分组列名尺度顺序尺度间隔尺度比例尺度分组界限确定分组界限的原则是,将不同类的单位分别归入不同的组,每一个单位只能归入一组穷尽原则和互斥原则。分组统计整理的程序—3汇总汇总。在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。统计整理的程序—4编制统计表编制统计表。统计资料的显示。即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。统计整理的程序审核分组(类)汇总编制统计图表统计整理的基本问题1.要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法2.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据3.统计整理的结果一般表现为统计图或统计表分类数据的整理与图示分类数据整理—频数分布表分类数据本身就是对事物的一种分类,因此,在整理时首先列出所分类的类别,然后计算出每一类别的频数、频率或比例、比率等,即可形成一张频数分布表,最后根据需要选择适当的图形进行展示,以便对数据及其特征有一个初步的了解。分类数据的整理(频数分布)1.频数(次数)(frequency):分布在各类别(组)中的单位个数2.在分类的基础上,将总体的所有单位按类归并,并将各类的类别和次数依次编排而成的分布称为频数分布或次数分布。3.频率(比重、比例)(proportion):某一类别频数占全部频数之和的比值4.比率(ratio):不同类别数值的比值分类数据的整理(频数分布)次数分布是统计整理的一种重要形式,也是统计描述和统计分析的一种重要方法。它可以表明总体的分布特征、结构情况,并据以研究总体某一标志的平均水平及其变动的规律性。分组标志分类数据的频数分布性别人口数(万人)比重(%)男6535551.63女6122848.37合计126583100.00第五次人口普查按性别分资料来源:第五次人口普查公告(2000)。频数比重分类数据的整理(基本过程)1.列出各类别2.计算各类别的频数3.制作频数分布表分类频数比例百分比比率ABCDE4.用图形显示数据例某班学生按性别分组按性别分组人数百分比%男生3060女生2040合计50100分类数据整理—频数分布表(例题分析)【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次。右边就是记录的原始数据绿色健康饮品某班学生按考试成绩分组按考试成绩分组人数百分比优510良1020中2040及格1020不及格510合计50100某班学生按年龄分组按年龄分组人数百分比17612181428191836209182136合计50100分类数据整理—频数分布表饮料品牌频数比例百分比可口可乐150.3030旭日升冰茶110.2222百事可乐90.1818汇源果汁60.1212露露90.1818合计501.00100分类数据整理—频数分布表【例】一家电脑公司为对比不同品牌的电脑在一季度和二季度的销售情况,收集到下列数据。电脑品牌一季度二季度联想256468IBM285397康柏247328戴尔563688分类数据的图示—条形图(barchart)1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图(columnchart)分类数据的图示—条形图(例题分析)15119690481216频数可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布分类数据的图示—帕雷托图(Paretochart)1.按各类别数据出现的频数多少排序后绘制的柱形图2.主要用于展示分类数据的分布不同品牌饮料的帕雷托图11996150481216可口可乐旭日升冰茶百事可乐露露汇源果汁品牌频数分类数据的图示—对比条形图(side-by-sidebarchart)1.分类变量在不同时间或不同空间上有多个取值2.对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑销售量的对比条形图2562852475634683973286880100200300400500600700800联想IBM康柏戴尔电脑品牌销售量一季度二季度分类数据的图示—饼图(piechart)1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题3.绘制圆形图时,样本或总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,按各部分数据百分比占3600的相应比例确定分类数据的图示—饼图(例题分析)不同品牌饮料的构成可口可乐30%旭日升冰茶22%汇源果汁12%百事可乐18%露露18%顺序数据的整理与图示顺序数据的整理(可计算的统计量)1.累积频数(cumulativefrequencies):各类别频数的逐级累加2.向上累积(较小制累积)/向下累积(较大制累积)3.累积频率(cumulativepercentages):各类别频率(百分比)的逐级累加,累积频数除以频数总和累计频数与累计频率较小制累积,又称向上累计,即先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数(或频率)。某组向上累计频数表明该组上限以下的各组单位数之和是多少,某组向上累计频率表明该组上限以下的各组单位数之和占总体单位数的比重。较大制累积(向下累积)即先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(或频率)。某组向下累计频数表明该组下限以上的各组单位数之和是多少,某组向下累计频率表明该组下限以上的各组单位数之和占总体单位数的比重。累计频数与累计频率顺序数据的频数分布表(例题分析)【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————顺序数据的频数分布表(例题分析)乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.0