分配数列_统计表_统计图(PPT86页)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《统计学》第2章统计整理菏泽学院经济系第5节分配数列2019年9月20日/上午1时7分课程回顾一、统计分组的概念二、统计分组的目的三、统计分组的作用四、统计分组标志选择的原则五、统计分组的分类2019年9月20日/上午1时7分一、分配数列的概念和种类(一)分配数列的概念是在分组的基础上,把总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布,又称次数分配。次数:分布在各组的个体单位数,又称为频数;总次数:全部总体单位数;比率:各组次数与总次数之比,又称为频率。2019年9月20日/上午1时7分分组标志的具体表现各组的次数或频率构成要素(二)分配数列构成要素2019年9月20日/上午1时7分例月工资分组(元)工人数(人)占总数比重(%)2000以下21039.62000-250018735.32500以上13325.1合计530100.0组别(变量)频数(次数)频率(比率)2019年9月20日/上午1时7分思考:分配数列与分组的区别?分配数列是在分组的基础上加上次数(频数)的分布。2019年9月20日/上午1时7分(三)分配数列的分类1.品质分配数列指按品质标志对总体分组形成的数列,简称为品质数列。2.变量分配数列指按数量标志对总体分组形成的数列,简称为变量数列。按照标志的性质不同2019年9月20日/上午1时7分(三)分配数列的分类异距数列等距数列变量数列离散型变量数列连续型变量数列变量数列单项数列组距数列2019年9月20日/上午1时7分(一)品质数列二、分配数列的编制编制品质数列,只要根据统计研究目的,正确选择分组标志,确定分组标准,则事物性质的差异可以明确地表现出采,也就容易划分总体中各组的性质界限。因此,在通常情况下,品质数列能够较准确地反映总体各单位的分布状态和特征。2019年9月20日/上午1时7分某班学生的性别构成情况例按性别分组绝对数人数比重(%)男3075女1025合计40100组别次数频率2019年9月20日/上午1时7分(二)变量数列按数量标志分组,就是将变量值即数量标志值划分为不同的区段,通过各组的数量差别和变化来区分现象的不同性质,反映总体各单位在各组间的分布状态和特征。2019年9月20日/上午1时7分1.单项数列指每个组值只用一个具体的变量值表现的数列同时具备变量是离散变量变量的不同取值个数较少(2)编制条件:(1)概念(3)编制步骤a.将原始资料按照变量值大小顺序排列。b.按变量值分为若干组。c.设计综合表(整理表),整理出变量值出现的次数。2019年9月20日/上午1时7分己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。【例】20,20,20,21,21,21,21,21,22,22,22,22,22,22,23,23,23,23,24,24,24,25,25,26,排序后2019年9月20日/上午1时7分日产量(件)X工人数(人)f20212223242526合计编制结果如下:3564321242019年9月20日/上午1时7分2.组距数列指每个组的变量值用一个区间来表现的变量数列变量是连续变量;或:总体单位数较多变量不同取值个数也较多的离散变量。(2)编制条件:(1)概念2019年9月20日/上午1时7分2.组距数列(3)组距数列编制的步骤:a.排序,计算全距。b.确定组数、组距。c.确定组限及其表示法。d.计算频数、频率。e.制作组距数列统计表。2019年9月20日/上午1时7分组距式分布数列的有关概念指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限。组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值组中值2下限上限组中值2019年9月20日/上午1时7分开口式组距数列组中值的计算:首组假定下限=首组上限-相邻组组距末组假定上限=末组下限+相邻组组距先计算开口组的假定上、下限:因此有:22相邻组组距上限首组首组假定下限首组上限22相邻组组距下限末组末组假定上限末组下限首组组中值末组组中值2019年9月20日/上午1时7分某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5组中值=U-d/2=50-25=25组中值=L+d/2=300+100/2=3502019年9月20日/上午1时7分组距数列的几个具体步骤解释a.求全距minmaxXXRb.确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5,10,50,100,500的整数倍R≤组距(d)×组数(k)2019年9月20日/上午1时7分等距数列与异距数列等距数列各组组距均相等,一般适用于变量值比较均匀的情况。异距数列各组组距不全相等,不常用。2019年9月20日/上午1时7分异距数列适用于1.标志值分布很不均匀的场合,在分布比较密集的区间内使用较短的组距,在分布比较稀少的部分使用较长的组距。2.等量的标志值具有不同意义的场合例:进行人口疾病研究的年龄分组,应采用异距分组,即:1岁以下按月分组,1-10岁按照年龄分组,11-20按照5年分组,21岁以上按照10年分组等。2019年9月20日/上午1时7分异距数列适用于3.标志值按一定比例发展变化的场合例:大城市百货商店营业额差别很大的,比如营业额从5万到5千万元,可采取公比为10的不等距分组,即:5-50万元,50-500万元,500-5000万元,如果采用等距分组,即便组距为100万元,也得分50组,显然是不合适的。2019年9月20日/上午1时7分计算组数(组数不宜过多,也不宜太少)1dRkdRk(当的结果为整数时)dR(当的结果为小数时)dR2019年9月20日/上午1时7分组数的经验公式如果现象近似于正态分布,则可参考美国统计学家斯特杰斯提出的分组数的经验公式:组数(K)=1+3.322lgN其中,N为总体单位数。2019年9月20日/上午1时7分c.确定组限及其的表示方法对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;符合“上组限不计入”原则;首末两组可使用“××以下”及“××以上”的开口组。组限的表示方法2019年9月20日/上午1时7分例工业企业按照职工人数分组可以表示为:499人以下,500-999人,1000-1999人,2000人以上等。工业企业按照职工人数分组可以表示为:500人以下,500-1000人,1000-2000人,2000人以上等.2019年9月20日/上午1时7分实例2019年9月20日/上午1时7分己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。2019年9月20日/上午1时7分编制步骤:⒈求变异全距百万元)(27229minmaxXXR⒉确定组距及组数R≤组距(d)×组数(k)上例中,取d=5,则有组)(615271dRk⒊确定组限2019年9月20日/上午1时7分编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某地区某年50个商店商品销售额的资料如下(单位:百万元):7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求编制组距数列。2019年9月20日/上午1时7分⒋计算次数编制结果:销售额(百万元)商店数5以下5~1010~1515~2020~2525以上合计50f4101613432019年9月20日/上午1时7分销售额(百万元)商店数频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100fff频率各组单位数占总体单位总数的比重11/0ffff2019年9月20日/上午1时7分2019年9月20日/上午1时7分休息是为了走更长的路,累了,迷茫时,就坐下来,静静地,想想未来路的方向…2019年9月20日/上午1时7分从变量值低的组开始,将各组次数和比率逐次向变量值高的组累计。组距数列中的向上累计,表明各组上限以下总共所包含的总体次数和比率有多少。三、累计次数分布(一)向上累计(以下累计、或较小制累计)2019年9月20日/上午1时7分从变量值高的组开始,将各组次数和比率逐次向变量值低的组累计。组距数列中的向下累计,表明各组下限以上总共所包含的总体次数和比率由多少。(二)向下累计2019年9月20日/上午1时7分销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)5以下5~1010~1515~2020~2525以上410161343820322686合计50100fff2019年9月20日/上午1时7分销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向下累计向下累计5以下5~1010~1515~2020~2525以上41016134382032268641430434750828608694100合计50100——fff2019年9月20日/上午1时7分销售额(百万元)商店数频率(﹪)累计次数累计频率(﹪)向下累计向上累计向下累计向上累计5以下5~1010~1515~2020~2525以上410161343820322686414304347505046362073828608694100100927240146合计50100————fff2019年9月20日/上午1时7分按完成定额分组工人人数频率(﹪)累计次数累计频率(﹪)100以下100~110110~120120~130130~140140~150150~16051011832112.52527.5207.552.5合计40100————2019年9月20日/上午1时7分按完成定额分组工人人数频率(﹪)累计次数累计频率(﹪)向下累计向上累计向下累计向上累计100以下100~110110~120120~130130~140140~150150~16051011832112.52527.5207.552.551526343739404035251463112.537.5658592.597.510010087.562.535157.52.5合计40100————2019年9月20日/上午1时7分当我们所关心的是标志值较小的现象的次数分布情况时,通常用向上累计;当我们所关心的是标志值较大的现象的次数分布情况时,通常用向下累计;2019年9月20日/上午1时7分四、图示法即用统计图来表示次数分配直方图多边形图2019年9月20日/上午1时7分(一)直方图用矩形的宽度和高度来表示次数分配的图形。它是最常用的次数分配的图示法。绘制直方图时,横轴表示各组组限,纵轴表示频数(一般标在图的左方)和频率(一般标在图的右方),如没有频率则只保留左侧频数。按分布在各组的频数及频率确定各组在纵轴上的坐标,并依据各

1 / 86
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功