统计学第三章统计整理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章统计整理§1统计整理的意义和内容§2统计分组§3分配数列§4统计表一、统计整理的意义二、统计整理的内容§1统计整理的意义和内容通过统计调查可以搜集到大量的统计资料,是统计研究的基础。但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。统计数据整理将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体的特征。是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。地位一统计数据整理的意义根据研究目的的设计整理汇总方案。根据汇总方案,对各个调查项目的资料进行汇总,通过汇总计算各项指标。通过统计表或统计图的形式,描述整理的结果。二统计数据整理的内容统计资料的审核资料的分组和汇总编制统计表或绘制统计图数据整理的程序统计资料的积累、保管和公布数据审核统计工作的基本程序收集数据科学地计算与分析得出结论真实数据正确结论虚假数据错误结论假数真算一、统计分组的意义二、统计分组的作用三、统计分组的标志和种类§2统计分组指根据事物的内在特点和统计研究的需要,按一定的标志将统计总体划分为不同类型或者性质不同的几部分。使得组和组之间具有差别性,而同一组内的单位具有同质性。(一)统计分组的概念对总体而言,是“分”,即将总体区分为性质相异的若干部分。对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。一、统计分组的意义统计分组(二)统计分组的原则互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组。穷尽原则:就是使总体中的每一个单位都应有可归,或者说各分组的空间足以容纳总体中所有单位。二统计分组的作用分组前分组后25%33%42%1、类型分组,区分事物的性质,反映各类型的特点例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济2、结构分组,反映总体内部结构例:上海市按GDP计算的三次产业结构(%)1980年1990年1996年1997年GDP100100100100第一产业3.24.32.52.3第二产业75.763.854.552.2第三产业21.131.943.045.53、分析分组,研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)2003004005006008001000恩格尔系数(%)64.960.256.754.450.549.943.6三统计分组的种类1、简单分组2、复合分组即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。复合分组是指对所研究的总体按两个或两个以上的标志层叠或交叉起来分组。可用于对事物多方面、多层次的分析研究。(一)按分组所选择的标志的个数1、简单分组按性别分组按民族分组按年龄分组男生汉族<18岁女生满族18-20岁回族20-22岁22-24岁>24岁2、复合分组男男生生本科学生组本科学生组女女生生理科学生组理科学生组男男生生专科学生组专科学生组女女生生高校学生高校学生男男生生本科学生组本科学生组女女生生文科学生组文科学生组男男生生专科学生组专科学生组女女生生1、品质分组2、数量分组品质分组就是按品质(或属性)标志的分组。数量分组就是按数量标志的分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。(二)按分组标志的特征不同1、品质分组例:某高校学生性别分布表性别人数(人)频率(%)男73257.14女54942.86合计1281100.002、按数量标志分组①单项式分组指用单一的数值作为分组标志分组。每个数值作为一个组。如某班学生按年龄分组:17岁,18岁,19岁,20岁,21岁,22岁。②组距式分组将数量标志的取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。某班学生统计学成绩分组60分以下60—70分70—80分80—90分90分以上组距式分组中的一些概念组限上限下限区间数值的最大值区间数值的最小值组距每一组的区间长度组距=上限-下限组中值每一组中点位置的数值组中值=(上限+下限)÷2开口组缺少上限数值或下限数值的组注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)组距式分组中的一些概念等距分组异距分组各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距分组。例如60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55组中值为(90+100)÷2=95上限不在内原则间断式分组凡是组限不相连,以整数位断开的分组,称为间断组距式分组。连续式分组凡是组限相连,即相邻组上、下限重叠,称为连续式分组。60分以下60—70分70—80分80—90分90分以上300以下301—400人401—500人501—600人601人以上间断式分组连续式分组统计分组的方法(1)选择分组标志根据统计研究的目的选择分组标志根据现象的本质特征选择分组标志根据现象所处的历史条件选择分组标志正确选择分组标志是做好统计分组的前提。即决定分成哪些组,各组的内容、名称和界限。原则互斥性包容性指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。按品质标志分组按数量标志分组选择反映事物属性差异的标志作为分组依据。选择反映事物数量方面的差别的标志作为分组依据(2)拟定分组数目(三)统计分组体系指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。各分组标志表现交叉结合使用。平行分组体系交叉分组体系平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2复合分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类一、分配数列的概念和种类二、频率与累积频率三、次数分布的主要类型§3分配数列变量数列品质数列在统计分组基础上,将总体所有单位按组归并整理排列,形成总体中各个单位在各组间的分布,称为分配数列或次数分布。分配数列分类总体按某标志所分的组各组的次数或频率构成要素异距数列等距数列组距数列单项数列一分配数列的概念和种类射击射击体操体操乒乓球举重乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道中国体育代表团在悉尼奥运会上获金牌的项目品质数列的编制获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357品质数列品质数列的编制单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:变量X次数f数量数列组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班35个学生统计学期末考试成绩如下,单位(分)4450566062636565696969707374767778787980838485858687888990919192939494要求编制组距数列。原始数据计算组中值排序确定组限计算变异全距确定组数、组距汇总各组单位数制作组距数列统计表编制步骤编制步骤:⒈求变异全距)(504494minmax分XXR⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(n)⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法4、计算各组次数5、制作组距数列按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上38897合计35某班统计学考试成绩表6、画出次数分配曲线图405060708090100图1某班学生统计学考试成绩次数分配曲线图121086420考分人数累计次数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。频率各组单位数占总体单位总数的比重二频率与累积频率销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100fff1005016销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向上累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——fff销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向上累计向下累计向上累计向下累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————图2销售额累计次数分布折线图0204060801001205以下5~1010~1515~2020~2525以上销售额(百万元)商店数(个)钟形分布J形分布和U形分布对称分布右偏分布左偏分布正J型分布反J型分布U型分布三、次数分布的主要类型一、统计表的概念二、统计表的形式三、统计表的分类四、编制统计表应注意的问题五、统计图§4统计表1.它是由纵横线交叉组成的一种表格,表格内所列的是整理后的统计资料。2.统计表一般采用开口式,即表的左右两条线不画。3.用统计表来显示统计资料,具有条理清晰、简明扼要的特点,便于从各方面进行比较、分析所表现的现象。一、统计表的概念统计表是用规范的表格来表现统计资料的一种形式。纵栏标题是统计指标的名称,说明纵栏所列各项资料的内容,写在表内右上方。二、统计表的形式总标题(也称统计表的名称),它用概括性的文字简单明了地说明统计资料的时间、基本内容和范围。一般写在表的上部中端。横行标题反映统计表的主要项目,写在表的左方。有些统计表还需要在下端增加注解,以说明资料的来源、某些指标数值的计算方法、填表单位和其他需要说明问题。数字资料也称指标数值,它是统计表的具体内容,列在各横行标题和各纵栏标题的交叉处。任何一个具体数值都由横行标题和纵栏标题所限定。某市2001年工业总产值按企业规

1 / 67
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功