第三章 集中趋势和离散程度的测定

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章集中趋势和离散程度的测度一、众数二、平均数三、中位数四、众数、中位数和平均数的比较第一节集中趋势的测定一、众数(mode)众数是指总体中最常见的标志值,也即重复出现次数最多的标志值。众数的计算方法:单项数列:出现次数最多的标志值就是众数。对于分组数据,众数通常采用下面的近似公式计算(下限公式:)MO:表示众数L:表示众数组的下组限表示众数组次数与前一组次数之差表示众数组次数与后一组次数之差i表示众数组的组距对于分组数据,众数通常采用下面的近似公式计算(上限公式:)MO:表示众数U:表示众数组的上组限表示众数组次数与前一组次数之差表示众数组次数与后一组次数之差i表示众数组的组距一、众数的特点1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.在组距数列中,当变量数列不等距分组时,众数的位置不好确定。M0M0M0M0M0若有两个次数相等的众数,则称复众数。①只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。下三图无众数:②在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的。众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242总体标志总量算术平均数总体单位总数1.算术平均数的基本公式二、算术平均数XXn式中:——算术平均数X——各单位的标志值n——总体单位数——总和符号X2.简单算术平均数XfXf式中:——算术平均数X——各组数值f——各组数值出现的次数(即权数)X3.加权算术平均数设某厂职工按日产量分组后所得组距数列如下,据此求平均日产量。按日产量分组(千克)组中值X(千克)工人数f(人)Xf60以下551055060–706519123570–807550375080–908536306090–10095272565100–110105141470110以上1158920合计-16413550)(62.8216413550千克平均日产量ffXX例fXfXXff在掌握比重权数的情况下,可以直接利用权数系数来求加权算术平均数,其公式为:按日产量分组(千克)组中值X(千克)工人数f(人)ff/∑f60以下55100.063.360–7065190.127.870–8075500.3022.580–9085360.2218.790–10095270.1615.2100–110105140.099.45110以上11580.055.75合计-1641.0082.7ffX加权算术平均数受两因素的影响:-变量值大小的影响。-次数多少的影响。而简单算术平均数只反映变量值大小这一因素的影响。加权算术平均数与简单算术平均数不同在于:①各个变量值与算术平均数离差之和等于零4.算术平均数的数学性质0)(XX简单平均数:加权平均数:0fXX)(②各个变量值与算术平均数离差平方之和等于最小值22()()XXfXX简单平均数:最小值加权平均数:最小值△算术平均数的特点算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。XX调和平均数是各个变量值倒数的算术平均数的倒数。三、调和平均数(又称“倒数平均数”)其计算方法如下:1hnXX1(1).先计算各个变量值的倒数,即X1(2).计算上述各个变量值倒数的算术平均数,即Xn(3).,1再计算这种算术平均数的的倒数,就是调和平均数即nX1在加权的情况下:hfXfX在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:m是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。1式中:,hXfXfmXXmfXfXXmmXffX已知某商品在三个集市贸易市场上的平均价格及销售额资料如下:市场平均价格(元)X销售额(元)m=Xf销售额(元)÷平均价格(元)(即销售量)甲1.003000030000乙1.503000020000丙1.403500025000合计-9500075000fXm)(27.1000,75000,951元总平均价格mXmXh1.由平均数计算平均数时调和平均数的应用:例某公司有四个工厂,已知其计划完成程度(%)及实际产值资料如下:工厂计划完成程度(%)X实际产值(万元)m=Xf实际产值÷计划完成程度(%)(即计划产值)(万元)甲9090100乙100200200丙110330300丁120480400合计-1,1001,000fXm%110000,1100,11mXm平均完成计划程度2.由相对数计算平均数时调和平均数的应用:例从以上计算平均数的例子来看,当掌握的资料是变量值X和总体的标志总量M时,则权数就是标志总量,这时就采用加权调和平均数公式计算平均数。反之,如果已掌握变量值X及其相应的总体单位数f,则权数就是总体单位数,就可以直接采用加权算术平均数法计算平均数。△调和平均数的特点如果数列中有一标志值等于零,则无法计算;hX它作为一种数值平均数,受所有标志值的影响,它受极小值的影响大于受极大值的影响,但较之算术平均数,受极端值的影响要小。1.简单几何平均数四、几何平均数(又称“对数平均数”)nnnGXXXXX21nXXGlglg计算时要进行对数变换,即:几何平均数就是n个变量值Xi连乘积的n次方根。计算公式为:例某机械厂有铸造车间、加工车间、装配车间三个连续流水作业车间。本月份这三个车间产品合格率分别为95%、92%、90%,求平均车间产品合格率。3321XXXXG解:%.%%%31929092953这说明该厂车间产品平均合格率为92.31%式中:为各变量值的次数或权数将公式两边取对数,则为:121212112212lglglglglg(lg)LLLLnnGGGGffffffffnnnnXXXXXffXfXfXfXXffffXarcX2.加权几何平均数△几何平均数的特点如果数列中有一个标志值等于零或负值,就无法计算;受极端值的影响较和小,故比较稳健;几何平均数的适用范围较小,主要适用于比率平均和速度平均,即计算平均发展速度,进行时间数列分析等。GXXhX1.排序后处于中间位置上的值Me50%50%将总体单位的某一数量标志的各个数值按其大小顺序排列,处于中间位置的标志值就是中位数。中位数是根据标志值所处的中点位次来确定,不受极大或极小数值的影响,所以可以用来代替变量值的一般水平。六、中位数Me①由未分组资料确定中位数1()2中位数的位置为总体单位数nn2.中位数的计算方法⑴n为奇数时,则居于中间位置的那个标志值就是中位数。)(262633215213029262320件件产品为中位数:位工人日产即,第中位数位置,,,,件数,按序排列如下:有五个工人生产某产品eMn例⑵n为偶数时,则中间位置的两个标志值的算术平均数为中位数。)(5.27229265.321621323029262320件至第四人的平均数:这表明中位数是第三、中位数位置,,,,,序排列如下:人生产某产品件数,按上例中,假如有六个工eMn②由单项数列确定中位数某企业按日产零件分组如下:按日产零件分组(件)工人数(人)较小制累计较大制累计26338031101377321427673427545336187226418808合计80--)(34402802件即中位数位置eMf例③由组距数列确定中位数按日产量分组(千克)工人数(人)较小制累计较大制累计50–60101016460–70192915470–80507913580–90361158590–1002714249100-1101415622110以上81648合计164--组距内。即中位数在中位数位置90808221642fdfSfXMmmLe12下限公式(较小制累计时用):)(.千克8380103679216480上限公式(较大制累计时用):)(.千克8380103649216490dfSfXMmmUe12①中位数不受极端值及开口组的影响,具有稳健性。②各单位标志值与中位数离差的绝对值之和是个最小值。③对某些不具有数学特点或不能用数字测定的现象,可用中位数求其一般水平。minmin即:或eeXMXMf3.中位数的特点众数、中位数和均值的比较众数、中位数和算术平均数之间有着一定的关系,这种关系决定于总体次数分布的状况。当次数分布呈对称的钟形分布时,算术平均数位于次数分布曲线的对称点上,而该点又是曲线的最高点和中心点,因此众数、中位数和算术平均数三者相等。当次数分布呈非对称的钟形分布时,由于这三种平均数受极端值影响程度的不同,因而它们的数值就存在一定的差别,但三者之间任然有一定的关系。如下图所示:众数、中位数和均值的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值众数、中位数、均值的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用hGXXX、、(一)三者的关系hGXXX表示为:七、各种平均数之间的相互关系87.716.75.8121084GhXXX,,,变量值例f如图:0MMXe0eXMM、(二)三者的关系0即eXMM1.当总体分布呈对称状态时,三者合而为一,0(1).如果分布右偏,则eXMM如图:fXX0MeM2.当总体分布呈非对称状态时0(2).如果分布左偏,则eXMM如图:fXX0MeM所以0)(oMX如果,则说明分布右偏(或上偏)0)(oMX如果,则说明分布左偏(或下偏)0)(oMX如果,则说明分布对称1、标志变动度是评价平均数代表性的依据。第二节标志变动度2.作用:1.概念:标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度。一、标志变动度的意义、作用和种类甲、乙两学生某次考试成绩列表语文数学物理化学政治英语甲959065707585乙1107095508075甲、乙两学生的平均成绩为80分,集中趋势一样,但是他们偏离平均数的程度却不一样。乙组数据的离散程度大,数据分布越分散,平均数的代表性就越差;甲组数据的离散程度小,数据分布越集中,平均数的代表性越大。例2、标志变动度可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。供货计划完成百分比(%)季度总供货计划执行结果一月二月三月钢厂甲100323434乙100203050例3、标志变动度可以揭示总体变量分布的离中趋势,是研究总体分布的重要特征值。平均指标揭示了总体变量分布的集中趋势,成为研究总体分布的重要特征值。而标志变动度则从另一个侧面揭示了以平均数为中心,各标志值偏离中心的程度。4、标志变动指标可以确定推断总体的准确程度。例如,在抽样调查中,根据样本指标来推断总体指标,只有计算标志变动指标,才能确定推断的准确程度及误差大小。3.种类即测定标志变动度的方法,主要有:全距、四分位差、平均差、标准差、离散系数等。全距R四分位差Q.D.平均差A.D.标准差S.D.(σ)离散系数Vσ①优点:计算方便,易于理解。②缺点:全距只考虑数列两端数值差异,它是测定标志变动度的一种粗略方法,不能全面反映总体各单位标志的变异程度。maxminRX-X即:1.全距是总体各单位标志值最大值和最小值之差,2.全距的特点二、全距R1.概念:将总体各单位的标志值按大小顺序排列,然后将数列分为四等分,形成三个分割点(Ql、Qe、Qu),

1 / 75
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功