统计学基础课件(第三章统计数据的整理与展示)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

FundamentalsofStatistics第三章统计数据的整理与展示第三章统计数据的整理与展示FundamentalsofStatistics第三章统计数据的整理与展示教学目的与要求:本章阐述统计整理的理论与方法,包括统计分组、汇总和统计表的设计。学习本章,要求:1.明确统计整理在统计研究中承前启后的地位。2.掌握分组方法和汇总技术。3.认识统计分布是统计整理的重要表现形式。4.学会统计表的编制并能熟练运用统计学原理(第三讲)FundamentalsofStatistics第三章统计数据的整理与展示第一节统计的整理整理一、统计数据整理的概念根据统计研究的任务与要求,对统计调查阶段所搜集到的原始资料进行加工与汇总,使其条理化、系统化的工作过程称统计整理。统计整理包括对原始资料和次级资料的整理。统计整理是统计调查的继续,统计分析的前提和基础。FundamentalsofStatistics第三章统计数据的整理与展示(二)统计数据整理的程序制定统计整理方案统计资料的审核进行统计分组进行加工汇总编制分配数列编制统计表和绘制统计图统计数据资料的积累保管和公布FundamentalsofStatistics第三章统计数据的整理与展示二、统计分组根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。(一)统计分组的概念例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。FundamentalsofStatistics第三章统计数据的整理与展示统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。例如,要了解我国人口状况,只知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度……等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。FundamentalsofStatistics第三章统计数据的整理与展示(二)统计分组的分类按分组标志的多少简单分组只按照一个标志进行分组复杂分组按照两个或两个以上的标志进行分组,并且层叠在一起。FundamentalsofStatistics第三章统计数据的整理与展示如企业按经济类型,隶属关系、规模、轻重工业分组均属于简单分组:按经济类型分组国有经济集体经济私营经济个体经济联营经济股份制经济外商投资经济港澳台投资经济按隶属关系分类中央企业地方企业按轻重工业分类轻工业重工业按企业规模分类大型工业企业中型工业企业小型工业企业FundamentalsofStatistics第三章统计数据的整理与展示复合分组是先按一个标志分组,在此基础上再按第二个标志分组,又再此基础上按照第三个标志分组,依次类推。如工业企业先按轻重工业分组,在此基础上又按企业规模分类轻工业大型企业中型企业小型企业重工业大型企业中型企业小型企业复合分组的特点是可以从不同的角度了解总体内部的差别和关系,比简单分组更全面更深入的研究问题注意两点1、分组的标志不宜过多2、只有在总体包含的单位数很多的情况下,适当采取分组才有意义FundamentalsofStatistics第三章统计数据的整理与展示按分组标志的性质品质分组按品质标志进行分组。主要反映被研究现象的质的属性或特征变量分组按照数量标志进行的分组。主要反映的是总体单位的数量特征。FundamentalsofStatistics第三章统计数据的整理与展示二、统计分组的原则统计分组必须遵循穷尽和互斥两条原则。穷尽原则就是总体中的每一个单位都有组可归,无一遗漏。互斥原则就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属几个组。FundamentalsofStatistics第三章统计数据的整理与展示(三)、分组标志的选择分组标志是将现象总体划分为不同类型的组的标准或依据。统计分组的关键是分组标志的选择,因为选择什么样的分组标志就有什么样的分组,什么样的分组体系。分组标志选择的是否正确,关系到能否正确地反映总体的性质特征,能否实现统计研究的目的和任务。分组标志一旦选定,就必然突出了总体在该标志下性质差异掩盖了总体在其他标志下的差异。分组标志选择不当,就无法显示现象的根本特征,歪曲社会经济的真实情况。正确选择分组标志是保证实现统计分组任务的关键,是统计研究获得正确结论的前提。FundamentalsofStatistics第三章统计数据的整理与展示恰当得选择分组标志,须注意一下问题:1、根据统计研究的目的进行选择2、若干个标志,要选择最能反映事物本质特征的标志作为分组标志另:同一标志在某以历史条件下最能反映事物的本质特征,而在另一历史条件下不一定能反映事物的本质特征。FundamentalsofStatistics第三章统计数据的整理与展示(三)、关于分组标志的选择问题1.为什么说统计分组的关键是分组标志的选择?2.怎样正确选择分组标志?FundamentalsofStatistics第三章统计数据的整理与展示四、统计分组的方法1、品质分组的方法按品质标志分组就是选择反映事物属性差异性的品质标志作分组标志,并在品质标志的变异范围内划分各组界限,将总体划分为若干性质不同而又有联系的几个部分。例如,人口按性别、文化程度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。FundamentalsofStatistics第三章统计数据的整理与展示2、变量分组的方法变量分组就是选择反映事物数量差异的数量标志作为分组标志,并在数量标志的变动范围内划分各界限,将总体划分为若干性质不同而又有联系的组成部分。例如,地区经济按国内生产总值分组、企业按销售收入分组等FundamentalsofStatistics第三章统计数据的整理与展示(1).单项分组与组距分组单项式分组一个变量作为一组组距式分组一个区间作为一组如果变量值的变动幅度较小,就可采用单项式分组。如果变量值的变动幅度较大,采用组距式分组。FundamentalsofStatistics第三章统计数据的整理与展示单项式分组组距式分组家庭按儿童数分组职工按月工资分组0700---8001800---9002900---1000FundamentalsofStatistics第三章统计数据的整理与展示2.等距分组与不等距分组区间的距离叫组距。在组距式分组中,如果每组的组距相等,则称为等距分组;不相等则称为不等距分组应用条件:标志值变动比较均匀的情况下,采用等距分组。如产品合格率、企业按职工人数分组、职工按月工资分组等。标志值变动不均匀,变动幅度较大时,采用不等距分组。如人口普查,将人口按年龄分组为:0-14岁、15-64岁和65岁以上三个组。FundamentalsofStatistics第三章统计数据的整理与展示3.组限与组中值在进行组距式分组时,组距两边的数据称为组限。每组的起点值称为下限,每组的终点值称为上限。组距就是上限与下限之差。组中值是上限与下限的中点数值,它是各组上下限数值的简单平均,用来代表组标志值的一般水平。计算方法是(上限+下限)/2或(下限+组距/2).FundamentalsofStatistics第三章统计数据的整理与展示统计学原理(第三讲)按学生人数分组按工资分组50---59400---50060---69500---60070---79600---70080---90700---800FundamentalsofStatistics第三章统计数据的整理与展示按工资分组组中值人数300元以下25010300—40035020400—60050025600元以上70012组中值的计算FundamentalsofStatistics第三章统计数据的整理与展示离散变量相邻两组的上下限既可以间断,也可以重叠;连续变量相邻两组的上下限只能重叠。在确定组限时应该注意:第一,最下组的下限应低于最小变量值,最大组的上限应高于最大变量值第二,组限的确定应该有利于反映总体分布的规律性第三,如果组距为5,10,---、100,则每组的下限最好是他们的倍数。FundamentalsofStatistics第三章统计数据的整理与展示(一)分配数列的概念、构成要素在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。分配数列中,分布在各个组的总体单位数叫次数,又称频数。如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。五、分配数列FundamentalsofStatistics第三章统计数据的整理与展示2000年我国人口性别构成情况人口性别分组人口数(万人)占人口的比重(%)男女653556122851.6348.37合计126583100分组名称次数(频数)比率(频率)FundamentalsofStatistics第三章统计数据的整理与展示(二)品质数列与变量数列它是按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。如上表就是品质数列。品质数列的编制比较简单,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。FundamentalsofStatistics第三章统计数据的整理与展示某班级统计学成绩分布表考试分数人数(人)频率(%)60以下60—7070—8080—9090—10027111285.018.027.030.020.0合计40100.0(各组变量值)(次数)或(频数)比率(变量分组)FundamentalsofStatistics第三章统计数据的整理与展示第一步,将原始资料按数值大小依次进行排列第二部确定变量的类型和分组的方法(如单项式分组或组距式分组第三步,确定组数和组距:组距=全距/组数全距=最大值-最小值第四步,确定组限以及表示方法第五步,汇总各组出现的次数,并计算频率(三)变量数列的编制方法FundamentalsofStatistics第三章统计数据的整理与展示[例]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)98819584938691102100103105100104108107108106109112114109117125115120119118116129113可以通过编制变量数列来反映工人的完成情况,步骤如下第一步:计算全距将各变量值由小到大排序,确定某最大值,最小值,并计算全距。变量的最大值是129最小值是81全距=最大值-最小值=129-81=48第二步:确定组数和组距在等距分组时,组距与组数的关系是:组数全距组距:或,组距全距组数本例中根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下:组距=48/5=9.6为了符合习惯和计算方便,组距近似地取10FundamentalsofStatistics第三章统计数据的整理与展示第三步:确定组限关于组限的确定,应注意如下几点:第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。FundamentalsofStatistics第三章统计数据的整理与展示某企业30个工人劳动定额完成情况分布图表劳动定额完成程度

1 / 104
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功