第三章统计整理第一节、统计整理概述第二节、统计分组第三节、分布数列第四节、绝对数与相对数第五节、统计表与统计图统计整理统计调查客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计推断分析描述分析《统计学》第三章统计整理通过统计调查可以搜集到大量的统计资料,是统计研究的基础。但是这些资料只是反映总体单位具体情况的分散的、不系统的资料,不能用以反映总体的特征。统计整理将统计调查得到的原始资料进行科学的分类和汇总,使之成为系统化、条理化的综合资料,以反映研究总体的特征。是统计调查的继续,统计分析的前提和基础,起着承前启后的作用。地位第一节统计整理概述统计整理的种类定期统计资料的整理专题统计资料的整理历史统计资料的整理根据定期统计报表资料进行综合整理一般是根据专门调查资料进行整理的,是为研究某项专门问题而进行的,目的性明确,政策性强,时效性也很强利用年报(或定期报表)资料,系统地综合汇总、积累资料的一种整理工作《统计学》第三章统计整理编制整理纲要统计资料的审核统计资料的分类汇总编制统计表三、统计资料整理的基本程序《统计学》第三章统计整理是指原始资料是否准确可靠.准确性一是逻辑检查,检查调查资料内容是否合理,各个项目之间有没有相互矛盾的地方,答案是否合乎逻辑.是指所有的调查表格或问卷是否都已收齐,所有的问题是否都有答案。完整性二是计算检查,检查调查表格或问卷中各项数字在计算方法和计算结果上有无错误,数字的计量单位有没有差错,等等。审核方法统计资料的审核《统计学》第三章统计整理数据审核统计工作的基本程序收集数据科学地计算与分析得出结论真实数据正确结论虚假数据错误结论假数真算《统计学》第三章统计整理数据审核数据完整性审核准确性审核单位缺失项目缺失口径、方法、计量单位等等审核种类审核内容审核方法与调查方案比较逻辑审核平衡校验经验判断全员劳动生产率工人劳动生产率销售收入-销售成本费用=利润某指标是否符合正常水平《统计学》第三章统计整理第二节统计分组指根据事物的内在特点和统计研究的需要,按一定的标志将统计总体区分为若干性质不同的组成部分的统计研究方法统计分组对总体而言,是“分”,即将总体区分为性质相异的若干部分。《统计学》第三章统计整理对总体单位而言,是“合”,即将性质相同的个体组合起来,在同一组内则保持着相同的性质。分组分组前分组后25%33%42%1·区分事物的性质作用:例:按所有制性质划分,我国现有8种经济类型:国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济《统计学》第三章统计整理2·反映总体内部结构例:上海市按GDP计算的三次产业结构(%)1980年1990年1996年1997年GDP100100100100第一产业3.24.32.52.3第二产业75.763.854.552.2第三产业21.131.943.045.53·研究现象之间的依存关系例:中国农民家庭按收入分组的恩格尔系数(1984年)按收入分组(元)2003004005006008001000恩格尔系数(%)64.960.256.754.450.549.943.6《统计学》第三章统计整理年份项目19781980198519891990(一)国民生产总值中三次产业比例第一产业28.430.429.726.627.5第二产业48.64945.245.745.3第三产业2320.624.827.727.2(二)国民收入使用额中积累与消费比例积累36.531.53534.734.2消费63.568.56565.365.8(三)工农业总产值中农轻重比例农业24.827.227.122.924.3轻工业32.434.334.337.737.5重工业42.838.538.639.438.2表3—l我国国民经济主要比例关系(%)资料来源:国家统计局:《中国统计年鉴(1995)》,116页,l版,北京,中国统计出版社,1995。4·描述统计变量的分布状况《统计学》第三章统计整理研究贫富差别的基本方法:将人口按收入水平等分为5组,观察收入差别。20%20%20%20%20%中国九十年代:最富的20%家庭拥有全部财富的48%,最穷的20%家庭拥有全部财富的4%。《统计学》第三章统计整理统计分组的方法选择分组标志根据统计研究的目的选择分组标志根据现象的本质特征选择分组标志根据现象所处的历史条件选择分组标志正确选择分组标志是做好统计分组的前提。《统计学》第三章统计整理统计分组的程序与原则选择分组标志确定分组体系总体单位归类科学性:组间差异大,组内差异小。完备性和互斥性:每个单位均能且只能归到某个组中。《统计学》第三章统计整理对大学生月生活费支出情况进行分组研究:按家庭收入水平分组;按城乡分组;按性别分组;按年龄分组。?统计分组的方法对父母亲下岗情况进行分组研究单亲下岗;双亲下岗;双亲在岗。不符合科学性不符合完备性和互斥性城乡区别离退休是否健在?《统计学》第三章统计整理拟定分组数目即决定分成哪些组,各组的内容、名称和界限。原则互斥性包容性指各组之间界限明确,总体中的每一个单位,都只应属于其中的一个组。指在一个分组方案中拟定的所有组,能够包容总体的全部单位,不能排斥和遗漏任何一个单位。按品质标志分组按数量标志分组选择反映事物属性差异的标志作为分组依据。选择反映事物数量方面的差别的标志作为分组依据《统计学》第三章统计整理按数量标志分组的形式单项式分组指用单一的数值作为分组标志的分组。每个数值作为一个组。如某班学生按年龄分组:17岁,18岁,19岁,20岁,21岁,22岁。组距式分组将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。某班学生统计学成绩分组60分以下60—70分70—80分80—90分90分以上《统计学》第三章统计整理组距式分组中的一些概念组限上限下限区间数值的最大值区让数值的最小值组距每一组的区间长度组距=上限-下限组中值每一组中点位置的数值组中值=(上限+下限)÷2开口组缺少上限数值或下限数值的组注意开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。《统计学》第三章统计整理某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2=(100+200)/2=150(万元)《统计学》第三章统计整理组距式分组中的一些概念等距分组异距分组例如60分以下60—70分70—80分80—90分90分以上组中值为(60+50)÷2=55组中值为(90+100)÷2=95各组组距相等的分组称为等距分组。各组组距不全相等的分组称为异距分组。上限不在内原则《统计学》第三章统计整理1、简单分组2、复合分组即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。复合分组是指对所研究的总体按两个或两个以上的标志层叠起来分组。可用于对事物多方面、多层次的分析研究。统计分组的形式《统计学》第三章统计整理统计分组体系指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。各分组标志表现交叉结合使用。平行分组体系交叉分组体系《统计学》第三章统计整理平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年共计7组2+3+2《统计学》第三章统计整理复合分组体系按性别分类按职称分类按年龄分类男女高级中级初级青年中年共计12组2×3×2对教师的分类《统计学》第三章统计整理第三节分布数列变量数列品质数列在统计分组基础上,将总体所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分布数列.分布数列分类总体按某标志所分的组各组的次数或频率构成要素异距数列等距数列组距数列单值数列射击射击体操体操乒乓球举重乒乓球羽毛球举重乒乓球羽毛球举重举重跳水跳水跳水乒乓球跳水射击体操羽毛球柔道柔道举重田径羽毛球跆拳道中国体育代表团在悉尼奥运会上获金牌的项目《统计学》第三章统计整理品质数列的编制获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357品质数列《统计学》第三章统计整理品质数列的编制获金牌项目金牌数占总数比例跳水5枚0.1786举重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429体操3枚0.1071射击3枚0.1071柔道2枚0.0714田径1枚0.0357跆拳道1枚0.0357变量值x次数(频数)f频率f/∑f《统计学》第三章统计整理品质数列的编制单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量数列的编制变量是离散变量变量的不同取值个数较少编制条件:【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。《统计学》第三章统计整理日产量(件)X工人数(人)f202122232425263564321合计24编制结果如下:《统计学》第三章统计整理组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列《统计学》第三章统计整理编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班35个学生统计学期末考试成绩如下,单位(分)4450566062636565696969707374767778787980838485858687888990919192939494要求编制组距数列。《统计学》第三章统计整理组距数列的编制原始数据《统计学》第三章统计数据的整理与显示计算组中值排序确定组限计算变异全距确定组数、组距汇总组单位数制作组距数列统计表编制步骤或内容编制步骤:⒈求变异全距)(504494minmax分XXR⒉确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R≤组距(d)×组数(m)编制等距数列《统计学》第三章统计整理计算组数(组数不宜过多,也不宜太少)上例中,取d=10,则有组)(5550dRm编制等距数列1dRmdRm(当的结果为整数时)dR(当的结果为小数时)dR《统计学》第三章统计整理⒊确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法编制等距数列《统计学》第三章统计整理《统计学》第三章统计整理4、计算各组次数5、制作组距数列按考试成绩分组(分)学生人数(人)60以下60~7070~8080~9090以上38897合计35某班统计学考试成绩表累计次数(频率)从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计向下累计从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。频率各组单位数占总体单位总数的比重《统计学》第三章统计整理频率与累积频率销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820