第5章平均指标与变异指标(2)II.变异度指标•变异度指标又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标。平均指标:集中趋势变异度指标:内部差异,离中趋势二、变异度指标的作用•1、衡量平均数代表性的大小•变异度指标值与平均数的代表性大小成反比。•2、衡量现象变动的稳定性和均衡程度。•变异度指标越小,现象变动的稳定性和均衡程度越高•3、计算抽样误差和确定样本容量的依据。一、变异度指标的概念1、衡量平均数代表性的高低(1)七个人的工资分别为:634元,634元,634元,634元,634元,634元,634元。平均工资为634,平均代表性高(2)七个人的工资分别为:320元,320元,400元,400元,500元,500元,2000元。平均工资为634元,最高和最低之差为1680元,平均代表性低2、衡量现象变动的稳定性和均衡程度本季度计划书各月完成数1月2月3月甲车间100323434乙车间100203050三、变异度指标的种类•1、全距•2、四分位差•3、平均差•4、标准差•5、方差•6、离散系数•7、偏度•8、峰度•全距是总体各单位标志值中最大值与最小值之差,又称极差。•全距R=最大值xmax-最小值xmin•优、缺点:计算简便,意义清楚,反映现象的差异程度较粗略,实用价值甚小。1、全距例:12位工人的日产量:10,20,22,24,25,26,27,28,30,32,34,352、四分位差Q(1)四分位差是四分位数中间两个分位之差。四分位差Q=第三个四分位数Q3—第一个四分位数Q1Q=Q3-Q1Q3=3*(n+1)/4Q1=(n+1)/4(2)优缺:计算简单,意义清楚,反映现象的差异程度较粗略和不全面,实用价值甚小。例:12位工人的日产量:10,20,22,24,25,26,27,28,30,32,34,353、平均差A.D.1、平均差是总体各单位标志值对其算术平数的离差绝对值的算术平均数。平均差(简单式)(加权式)2、含义明确,计算也较简便,能充分、客观反映总体各单位标志值之间的差异程度,但以绝对值为计算基础不利于进一步的代数运算。nxxDA..ffxxDA..甲组乙组日产量离差离差绝对值日产量离差离差绝对值20-4410-141422-2220-4425112511262230662733351111合计-12--36𝑥𝑖−𝑥𝑥𝑖−𝑥𝑥𝑖−𝑥𝑥𝑖−𝑥甲组平均差:12/5=2.4乙组平均差:36/5=7.2例:𝑥𝑖−𝑥𝑥𝑖−𝑥fi例:某车间100个工人日产量日产量(件)工人数(人)组中值Xi10以下1055018.8188.010-2024153608.8211.220-30402510001.248.030-40203570011.2224.040以上64527021.2127.2合计100-2380-798.4xififi8.23100/2380ffXXn1iin1iii98.7100/4.798..ffxxDA例:某车间100个工人日产量4、标准差和方差(1)标准差是总体各单位标志值对其算平均数离差平方的算术平均数的平方根又称均方差或均方根差。标准差的平方即为方差。(2)计算公式:标准差(简单式)方差nxx2nxx22标准差=(加权式)方差(加权式)(3)优缺:最常用、最重要的测定变异度指标,计算繁杂。ffxx2ffxx224、标准差和方差总方差、组间方差和平均组内方差总方差:反映总体各单位之间的差异程度。n)(122niiinxxnxx22组间方差:组距数列中,反映各组平均(组中值)与总体平均数之间的平均离散程度的方差。4、标准差和方差总方差、组间方差和平均组内方差平均组内方差:组距数列中,反映各组内部标志之间的差异程度的方差。•总方差=组间方差+组内方差nnniii122日产量(件)xi24467891112合计(𝑥𝑖−𝑥)2𝑥=7第一步骤:计算总方差:日产量(件)xi22549496170819411161225合计90(𝑥𝑖−𝑥)2𝑥=7109/9022nxx第一步骤:计算总方差:(𝑥𝑖−𝑥)2𝑥=7第二步骤:计算组间方差日产量工人数组平均数2—56—910—12合计(𝑥𝑖−𝑥)2fi(𝑥𝑖−𝑥)2𝑥=7第二步骤:计算组间方差日产量工人数组平均数2—533.3340.416—947.501.0010—12211.5040.50合计9-81.91(𝑥𝑖−𝑥)2fi1.99/91.81n)(122niiinxx(𝑥𝑖−𝑥)2x1=3.33第三步骤:计算组内方差日产量21.7740.4540.45合计2.67第一组方差计算(𝑥𝑖−𝑥)2x2=7.5日产量62.2570.2580.4592.25合计5.00第二组方差计算(𝑥𝑖−𝑥)2x1=11.5日产量110.25120.25合计0.50第三组方差计算89.03/67.22125.02/50.02325.14/00.5229.09/17.892*25.04*25.13*89.0122nnniii5、离散系数(变异系数)1、离散系数又称标志变动度指标,它是各变异度指标与其算术平均数对比得到的相对数。平均差系数标准差系数2、作用离散系数用于对比分析不同数列变异度大小。%100....xDAVDA%100xV甲品种乙品种平均公顷产量(kg)1200014250标准差(kg)570630例:问:甲品种的每公顷产量稳定程度比乙品种高吗?%75.412000/570%100甲甲甲xV%42.414250/630%100乙乙乙xV甲乙稳定性高于VV例:问:1.计算各组的平均差和标准差2.比较两组工人平均日产量稳定性?甲组:20,40,60,80,100,120乙组:67,68,69,71,72,73例:问:甲、乙哪个品种的亩产量有较大的稳定性?甲品种乙品种面积(公顷)产量(吨)面积(公顷)产量(吨)1.2181.5251.1151.3201.0161.3170.9121.0180.8140.9105.0756.0906、偏度(1)偏度的概念•反映总体次数分布偏斜程度的指标(2)偏度的种类:右偏分布(正偏)左偏分布(负偏)(3)偏度的测算:算术平均数与众数比较法、动差法•A.偏度=算术平均数-众数若偏度0,则右偏;若偏度0,则左偏B.偏态系数--用于比较不同的分布数列•偏态系数SKp公式为:•SKp越大,则偏斜程度越大。0pxMSK偏态系数是偏度与总体标准差之比。例甲车间300工人,日产量资料如表所示:日产量(件)工人数(人)50以下1150-601360-707070-8012080-905090-10030100-1105110以上1合计300求偏态系数。225001155252850425090004550715495xf452001600450012000500007000520099002xxf组中值x455565758595105115表明甲车间日产量的分布右偏,偏斜程度为0.07。其偏态系数较小,说明工人日产量的众数接近平均数水平。2101202250075(3004520012.27(300(12070)701074.17(12070)(12050)7574.170.0712.27pxfxfxxffMLixMSK件)=件)(件)C.动差法•动差--矩。•原点的K阶动差,以Mk表示。•234xffxffxffxff1234一阶原点动差M=二阶原点动差M=三阶原点动差M=四阶原点动差M=234()0()()()xxffxxffxxffxxff1234一阶中心动差M=二阶中心动差M=三阶中心动差M=四阶中心动差M=•常采用三阶中心动差作为测定偏度的依据•偏态系数为:•偏态系数=0为对称分布•偏态系数0为右偏分布•偏态系数0为左偏分布33m=例采用动差法计算偏态系数。日产量(件)工人数(人)50以下1150-601360-707070-8012080-905090-10030100-1105110以上1合计300组中值x455565758595105115-30-20-10010203040-297000-104000-700000500002400001350006400018000xx3xxf因此,该分布数列是轻微右偏分布333375((12.27)1847.281800060300600.0321847.28xxxfmfm件)偏度系数7、峰度描述对称分布曲线峰顶尖峭程度的指标峰度的正态峰度尖顶峰度平顶峰度扁平分布尖峰分布标准正态分布•峰度的测定方法(四阶中心动差m4为基础,计算相对指标)22444mmmnm44222nm其中:=3标准正态曲线3平顶峰曲线,离散程度大3尖顶峰曲线,离散程度小1.8U形曲线1.8一条水平线常用的几种次数分布类型偏度和峰度指标值曲线类型偏度0峰度33左偏平顶曲线左偏尖顶曲线偏度0峰度33右偏平顶曲线右偏尖顶曲线偏度=0峰度=333正态曲线平顶曲线尖顶曲线偏态与峰度(从直方图上观察)户数比重(%)252015105农村居民家庭村收入数据的直方图按纯收入分组(元)1000500←15002000250030003500400045005000→结论:1.为右偏分布2.峰度适中练习题2:•计算该公司职工身高分布的偏度和峰度。按身高分组(厘米)职工人数(人)150-1554155-16012160-16518165-17028170-17522175-18010180-1854185-1902合计100