统计资料的整理(精)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第章统计资料的整理2学习目的与要求:本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。重点要求为:明确统计资料整理的概念,了解统计整理的步骤。通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。运用分配数列对原始数据进行系统整理。掌握统计表的具体编配方法。3第三章统计资料的整理第一节统计整理的意义和步骤第二节统计分组第三节分配数列第四节统计表和统计图实训部分4第一节统计整理的意义和步骤统计整理的意义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。统计整理是统计工作过程的重要阶段,是实现从个体单位标志值向总体数量特征值过渡的必要阶段。5统计资料整理的步骤第一步,设计和制定统计整理方案。它是对资料整理工作的各个方面各步骤做出具体的安排与规定。第二步,对原始资料进行审核。审核被调查单位的资料是否全部收齐,填报是否缺漏与差错,发现问题,及时解决,以保证资料汇总计算能顺利进行。第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。第五步,对统计资料妥善保存,系统积累。6第二节统计分组统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。7统计分组的作用统计分组的主要作用具体表现在以下几个方面。(一)区分现象的不同类型各种现象千差万别,多种多样,并在其发展中表现出不同的性质和特征。通过统计分组,就可以将不同类型现象的性质和特征区分开来,并且经过比较和研究,揭示其发展变化的规律,达到深刻认识总体的目的。8例如将我国的经济单位按照所有制性质划分为全民所有制、集体所有制、个体所有制、中外合资和外商独资企业五种类型;国民经济三种产业分为第一产业、第二产业和第三产业;对同一行业的企业按照其生产规模大小划分为大、中、小三种不同的类型;从业人员按三种产业分、按地区分、按城乡分、按行业分等。表3—1是1997年我国社会固定资产投资按投资主体性质分组的情况,从中可以反映出它们之间的差异。9表3—11997年社会固定资产投资分布情况资料来源:《1997年国民经济和社会发展统计公报》,国家统计局按投资主体性质分组投资额(亿元)比重(%)国有经济集体经济城乡居民个人其他1341938733427458153.015.313.618.1合计25300100.010(二)研究总体的内部结构按照某种标志将总体划分为若干个不同的组,可以计算出各组数值在总体中所占的比重,或各组之间的比例关系,从而反映出总体的结构状况,加深对现象总体的认识。11例如按照地理位置不同将我国划分为东部、中部和西部三个地区,可以观察东、中、西三个不同地区经济发展水平和经济资源的差异,以及它们在整个国民经济中所处的不同地位;对人口按照文化程度分组,计算大学及大学以上、大学肄业及在校、高中、初中、小学、不识字或识字很少各组人口所占的比重,就能反映社会人口的文化素质构成情况。如果将不同时期的同一总体的结构相互比较,还可以揭示出总体现象的发展变化规律。12表3—2三次产业增加值结构变化资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。010000200003000040000500006000019981999200020012002年均第一产业第二产业第三产业13从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。14(三)分析现象间的依存关系一切事物都是普遍联系、相互依存的。一种现象的表现,既是它与其他现象相互作用的结果,也会对其他现象的表现产生一定的影响。通过统计分组,可以反映出现象之间的这种依存关系。15例如将商品流通企业按照流转额分组,可以观察商品流通企业的规模与商品流转费用率之间的关系;将农作物播种面积按施肥量分组,用以观察农作物单产与施肥量之间的关系;将人口按人均收入分组,以观察收入与储蓄之间的关系等等。表3—3就反映了我国电力增长与国内生产总值(GDP)增长之间的依存关系。16表3—3我国与部分发达国家高技术产业增加值率的比较单位:%中国2001美国1999日本1997英国1998法国1998加拿大1997韩国1999全部制造业26.436.536.637.732.331.628.5高技术产业25.243.036.136.430.133.827.2航空航天制造业26.437.139.833.422.144.9——计算机与办公设备制造业19.656.149.042.032.830.835.9电子与通信设备制造业23.532.824.526.029.914.221.2医药制造业35.449.536.637.628.534.628.2医疗设备及仪器仪表制造业29.636.744.446.639.3——29.917统计分组的方法统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。(一)分组标志选择的原则要选择能够反映事物本质或主要特征的标志应根据研究的目的与任务选择分组标志根据现象所处的历史条件的变化选择分组标志(二)统计分组的方法按品质标志分组按数量标志分组18统计分组体系简单分组与平行分组体系将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。复合分组与复合分组体系复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如文盲及半文盲小学文化初中文化高中文化大学及大学以上文化男文盲及半文盲小学文化初中文化高中文化大学及大学以上文化女19如果多个复合分组组成的体系就形成了复合分组体系。例如同时选择学科、本科或专科、性别三个标志进行复合分组.理科学生本科学生男学生女学生专科学生男学生女学生文科学生本科学生男学生女学生专科学生男学生女学生20第三节分配数列一、分配数列的概念与种类二、分配数列的编制方法三、次数分布的类型21一、分配数列的概念与种类分配数列:又称次数分配或次数分布是在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字。频数:分配数列中,分布在各个组的总体单位数叫次数。频率分布不受总体单位总数大小的影响,能够正确地反映现象在总体的分布特征、结构状况,是分析总体特征及其变动规律的重要手段。22分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。品质数列:按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。例变量数列:将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。例需要明确以下概念23二、变量数列的编制方法举例说明:某工厂生产车间30人工人日产量原始数据如下:20212124232220212223242024212222232422212223222121222223222324单项式变量数列,可以直接将每一变量值作为一组,汇总计算各组相应的单位数(次数),并采用表格形式列示即可,例如表3—6表3—6某工厂生产车间工人按日产量分布(各组变量值)(次数)(频率)日产量工人数比率(%)202122232437106410.023.333.320.113.3合计30100.025组距变量数列的编制[例1]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)98819584938691102100103105100104108107108106109112114109117125115120119118116129113第一步:计算全距。(将各变量值由小到大排序,确定某最大值,最小值,并计算全距。)8184869193959810010010210310410510610710810810910911211311411511611711811912012512926变量的最大值是129%最小值是81%全距=最大值-最小值=129%-81%=48%第二步:确定组数和组距组距和组数的确定没有顺序规定,即可以先根据数据的变化特征确定组数,也可以在事先对研究对象的性质比较了解的情况下,先确定组数,然后确定组距,但组数必须是整数。在等距分组时,组距与组数的关系是:组数全距组距:或,组距全距组数27本例中的数据为劳动定额的完成情况,属于工作成绩的评定。根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下:为了符合习惯和计算方便,组距近似地取10%。第三步:确定组限第一,最小组的下限(起点值)应低于最小变量值,最大组的上限(终点值)应高于最大变量值。第二,组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化。第三,为了方便计算组限应尽可能取整数,最好是5或10的整倍数。第四,由于变量有连续型变量和离散型变量两种,其组限的确定方法是不同的。%6.95%48组距28第四步:编制频数(频率)分布表。计算本例中各组的频数(工人数)和频率,编制某企业30个工人劳动定额完成情况的分布表3—7表3—7某企业30个工人劳动定额完成情况分布图表劳动定额完成程度(%)频数(人)频数(%)80—9090—100100—110110—120120—13034128310.013.340.026.710.0合计30100.029从此表可以看到,30名工人中,劳动定额完成主要集中在100%—120%之间,占66.7%,在变量数列中标志值构成的数列表示标志值的变动幅度,而频数构成的数列则表示相对的作用程度。频数愈大则组的标志值对于全体标志水平所起的作用也愈大;反之,频数愈小则各组标志值所起的作用也愈小。因此,在整理和分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志的作用大小,即频数的大小。将各组单位数和总体单位数相比既可以表明各组标志值对总体的相对作用程度,也可以表明各组标志,也可以表明各组标志值出现的频率的大小。30第五步:计算累计频数和累计频率为了更详细的认识变量的分布特征,还可以计算累计频数和累计频率,编制累计频数和累计频率数列。累计频数和累计频率有向上累计频数(频率)和向下累计频数(频率)两种。向上累计数的意义是:小于各组的该组上限的各组的频数或频率之和;相反,由变量值大的组向变量值小的组累计各组的频数或频率,称为向下累计频数或向下累计频数。向下累计数的意义是:大于及等于该组下限的各组的频数或频数或频率之和。31根据某企业工人完成劳动定额的资料编制的向上累计频数(频率)和向下累计频数(频率)分布如表3—8。劳动定额完成情况(%)频数(人)频率(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)80~9090~100100~110110~120120~1303412

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功