第三章统计数据的

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

本章主要内容第一节统计整理概述第二节统计分组第三节分配数列第四节统计表0102030405060708090第一季度第二季度第三季度第四季度东部西部北部第一节统计整理概述一、统计整理的意义二、统计整理的步骤一、统计整理的意义统计整理:根据统计研究的目的,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。对于已整理过的初级资料进行再整理,也属于统计整理。意义:整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。加工整理,归并汇总,重新排列调查得到的原始统计资料发现数据的规律性,作进一步的统计分析二、统计整理的步骤1.统计资料的审核包括对资料的完整性和准确性审核。2.统计资料的分组和汇总分组和汇总是统计整理的中心工作3.编制统计图表统计图表是统计整理成果最常用的表现形式,也是整理统计资料的重要工具4.统计资料的积累和保管第二节统计分组一、概念和原则二、作用三、种类四、分组标志的选择五、统计分组的原则六、统计分组的方法一、统计分组的概念和原则统计分组:就是根据统计研究的需要,将统计总体按照某种标志区分为若干组成部分的一种统计方法。统计分组同时具有两方面的含义:对总体而言,是“分”,即将总体区分为性质相异的若干部分;对个体而言,是“合”,即将性质相同的个体组合起来。分组前分组后25%33%42%例:某某班学生基本情况调查表姓名性别民族年龄身高政治面貌张三男汉211.52中共党员李四女汉211.43中共党员王五男回231.58团员贾六女汉231.51团员刘七男汉221.69团员杨小男回211.75中共党员孙非男回201.81团员王继男满231.65团员赵可女汉231.65中共党员武思男汉211.76团员兰第女汉231.48中共党员拉达女汉231.43团员向乐男回221.58中共党员项于女汉211.61团员可人男汉231.71团员梁草女回231.52团员保安男汉201.46中共党员马宝男汉201.82团员姜清女满201.58中共党员林可男满201.73团员按性别分组例:某班学生(20人)总体按性别标志分组情况分组前分组后女生8人占40%男生12人占60%汉族12人,占60%回族5人,占25%满族3人,占15%1.按民族分组20岁5人,占25%21岁5人,占25%22岁2人,占10%2.按年龄分组中共党员8人,占40%团员12人,占60%3.按政治面貌分组23岁8人,占40%4.按性别分组(参前例)统计分组的原则1.穷尽原则:必须使总体中每个单位都有组可归。2.互斥原则:在某一特定分组下,总体中每一单位只能属于某一组。1324……二、统计分组的作用1.划分现象类型2.揭示总体内部结构3.分析现象间的依存关系类型0~14岁人口比重(%)65岁及以上人口比重(%)老少比(%)年龄中位数(岁)年轻型40以上4以下15以下20以上成年型30-404-715-3020~30老年型30以下7以上30以上30以上根据2008年人口抽样调查结果推算,2008年我国65岁及以上人口已占总人口的8.3%,意味着中国已经进入了老龄化国家行列。人口类型按年龄进行分组28.247.923.928.442.928.727.141.331.624.541.833.719.947.232.915.145.939.012.247.740.111.348.740.011.148.540.411.348.640.10%20%40%60%80%100%1978198519901991199520002005200620072008第三产业第二产业第一产业中国一些特殊年份的三次产业结构揭示经济现象的内部构成。三、统计分组的种类1.按分组标志性质分品质标志分组数量标志分组数量标志分组例:年龄20岁以下21~35岁36~50岁51~55岁55岁以上品质标志分组例文化程度大专及大专以上中专及技工高中初中小学、文盲及识学不多2.简单分组:对研究现象按一个标志进行分组举例:班级学生按性别、民族、年龄等分组。复合分组:对研究对象用两个或两个以上的标志进行重叠分组。举例按分组标志多少分简单分组复合分组男女按别政治面貌团员中共党员团员中共党员政治面貌3.按分组的作用分类型分组分析分组结构分组四、分组体系1.概念:统计分组体系是指在统计整理中,为研究现象总体的情况而运用多个分组标志对总体进行分组,从而形成一系列相互联系、相互补充的分组体系。2.分类:平行分组体系和复合分组体系。平行分组体系就是对同一总体进行若干次简单分组。复合分组体系就是对某一总体进行某种复合分组。汉族12人,占60%回族5人,占25%满族3人,占15%1.按民族分组20岁5人,占25%21岁5人,占25%22岁2人,占10%2.按年龄分组中共党员8人,占40%团员12人,占60%3.按政治面貌分组23岁8人,占40%平行分组体系五、分组标志的选择选择分组标志时,一般应考虑原则:(1)根据研究问题的目的和任务选择分组标志;(2)在若干标志中,要抓住具有本质性的或主要的标志作为分组的依据;例如:所得税征收的依据:根据个人收入分组?家庭平均收入分组?(3)要考虑到现象所处的具体历史条件或经济条件进行分析。六、统计分组的方法1.品质标志分组的方法:一般比较简单,分组标志一经确定,组的名称和组数也随之确定。例如:高等学校教师按职称分组:助教、讲师、副教授、教授。按性别分:男、女。2.数量标志分组的方法连续组距式分组间断组距式分组异距分组等距分组组距式分组单项式分组数量分组单项式分组:一个变量值作为一组。适用于离散型变量且变量变动范围不大的场合。年龄有时也可做单项式分组。例如:城市居民按其家庭成员数分:1,2,3,4,5等五组。再如:某班学生按年龄分为:8,19,20,21,22等五组。(1)单项式分组(2)组距式分组组距式分组:将变量值划分为若干区间,每一段区间作为一组。适用于连续型变量变动范围比较大的离散型变量成绩人数(人)60以下260~70970~801580~901190以上3合计40某班考试成绩统计表组距式分组可以根据各组组距是否相等,分为等距分组和异距分组。等距分组:变量值在各组保持相等的组距。适于变量值变动比较均匀的场合。举例:学生按成绩分组。等距分组便于计算和绘制统计图。等距分组和异距分组异距分组:各组的变量值变动范围不同。用于变量值分布很不均匀的场合如某企业职员年龄集中在30-45岁之间,而其他年龄段的职工人数较少,可对年龄采用如下分组:20以下,20-30,30-35,35-40,40-45,45-55,55以上。标志值相等的量具有不同的意义例如,人口普查中人口的年龄分组是:不满周岁,1~3岁,4-6岁,7~12岁,…,60~64岁,65~79岁,80~99岁,100岁以上。标志值按一定比例发展变化举例:大城市商店按营业额分组:5~50万,50~500万,500~5000万等。根据组距式分组相邻组的组限是否重叠可分为间断组距式分组和连续组式分组。(1)间断组距式分组:组限不相连的分组,适用于离散型变量。例如:将某地区高校按人数分组可分为999人以下,1000-2999人,3000-4999人,5000人以上等四组。连续组距式分组:组限重叠的分组,适用于连续型变量。例如:学生按考试成绩分组:60分以下,60~70,70~80,80~90,90以上。间断组距式分组和连续组距式分组为了保证穷尽原则,连续变量必须采用连续组距式分组,即每一组的上限同时是下组的下限。为避免计算总体单位分配数值的混乱,一般原则是把到达上了限值的单位数计入下一组内,即称为“上限不在内”原则。年龄是一个连续型变量,但习惯上常把它作为离散型变量处理。注意:等距分组表:上下组限间断某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计50100等距分组表(上下组限重叠,上组限不在内)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计50100等距分组表:(使用开口组)某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110以下110~115115~120120~125125~130130~135135以上358141064610162820128合计50100七、统计分组中的几个基本概念(一)全距(Range)反映变量值的最大差异程度,计算公式为:全距(R)=最大值—最小值(二)组距和组限组限:组距两端的变量值,一组中最大值为上限,一组中最小值为下限。组距:每一组上、下限之间的距离。连续型组距式分组的组距=上限-下限间断型组距式分组的组距=本组上限-本组下限+1(3)组数:组数即分组的个数,当全距一定时,组数多少由组距来确定.对于等距分组,有:可见:在全距一定时,组数与组距成反比关系!组数不能太多,也不宜过少。美国学者斯特杰斯有确定组数的经验公式k=1+3.32lgN式中:k为组数,N为总体单位数。组数全距组距=(4)组中值:各组上限与下限的中点值,用以代表各组标志的一般水平。闭口组计算公式:组中值=(上限+下限)/2开口组计算公式:按“以相邻组组距计算”为原则注意:组中值并不是各组变量的平均值。2邻组组距=下限+缺上限的开口组组中值2邻组组距=上限缺下限的开口组组中值-第三节频数分布(分配数列)一、频数分布的概念二、频数分布的种类三、变量数列的编制四、变量数列的表示方法五、统计分布的类型一、频数分布的概念频数分布:是在分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,又称分布数列或统计分布。频数分布有两个构成要素:1.统计分组2.频数(f)或频率(f/∑f)频数即分布在各组的个体单位数。频率即各组次数占总次数的比重。频率大于0小于1各组频率之和等于1二、频数分布的种类频数分布品质数列变量数列单项数列组距数列等距数列异距数列品质数列:某班学生的性别构成情况按性别分组绝对数人数比重(%)男女1286040合计20100分组频数比率或频率按性别分组绝对数人数比重(%)汉回满1253602515合计20100分组频数比率或频率某班学生的民族构成情况单项式数列某班学生年龄情况表按年龄分组(岁)人数(人)比重(%)20212223552825251040合计20100分组频数频率按身高分组(米)人数(人)比重(%)1.4-1.51.5-1.61.6-1.71.7-1.81.8-1.9464422030202010合计20100某班学生身高情况表分组频数频率等距数列人口按年龄分组人口数(万人)比重(%)1岁以下1岁-6岁7岁-15岁16岁-60岁60岁以上15122522.2211.1126.6755.564.44合计45100某地区人口分布状况异距数列:分组频数频率三、变量数列的编制(一)单项式变量数列的编制在此种数列中,一个变量值就是一组,不存在组距问题,组数即等于变量值的数目。(见前面的例子)(二)组距式变量数列的编制1.等距数列的编制2.异距数数的编制1.等距数列的编制步骤(1)先对数据进行排序,以了解全部数据的变动范围,即全距(最大值-最小值);(2)确定分组的组距,组数,组限,组中值(3)确定频数和频率,整理编制次数分布表。确定组数k找出xmin与xmax计算组距h确定每组上下限将相应数据归并到各组maxminxxhkXmin最小值

1 / 85
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功