1第四章平均指标与标志变异指标第一节平均指标第二节标志变异指标第三节偏度与峰度2基本要求:平均指标和标志变异指标是进行统计描述的重要指标。通过本章的学习,要求学生深刻理解平均指标和变异指标的基本概念和分析方法;掌握各种平均指标的计算方法和运用原则以及几种平均数的关系,并能对平均指标进行分析;了解影响平均指标大小的因素;明确平均指标与标志变异指标的区别;掌握各种标志变异指标的计算方法,并能运用标志变异指标说明平均指标的代表性。3第一节平均指标一、平均指标概述二、数值平均数三、位置平均数4一、平均指标概述(一)含义反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所到达的一般水平的综合指标,概括地表明各种统计数列的基本数值特征,显示数列的一般水平或分布的集中趋势。5平均指标在统计中的作用1.可以消除因总体不同而带来的总体数量上的差异,从而使不同总体可以对比。2.可以对比现象在不同时间的一般水平的变化,反映现象发展变化的趋势及规律性。3.可以分析现象之间的依存关系。4.可以进行数量上的估计推断。6基本特点1.必须应用于同质总体2.是一种代表值,把总体单位数量标志值间的差异抽象化,反映总体分布的集中趋势3.说明一定历史条件下的一般水平4.以大量观察法为基础7平均指标的种类㈠算术平均数㈡调和平均数㈢几何平均数㈣中位数㈤众数数值平均数位置平均数8二、数值平均数算术平均数调和平均数几何平均数9总体单位总数总体标志总量平均数算术基本形式:总产量总成本平均成本人数总成绩平均成绩例:直接承担者※注意区分算术平均数与强度相对数算术平均数101.简单算术平均数——适用于总体资料未经分组整理、尚为原始资料的情况nXnXXXXniin121算术平均数的计算方法11平均年龄为:岁247168733232221242520nXX算术平均数的计算方法某小组共7人,其年龄分别为20、25、24、21、22、23、33(岁)【例】122.加权算术平均数——适用于总体资料经过分组整理形成变量数列的情况fxfffffXfXfXXnnn212211算术平均数的计算方法13【例】某生产小组某日工人的日产量资料如下:日产量(件)x工人人数(人)fxf1011121314701003801501007001100456019501400合计8009710计算该小组该日全部工人的平均日产量。14件)(14.12800971010015038010070100141501338012100117010fxfX若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算;以组中值作为各组的代表值,假定各组标志值在组内分布是均匀的。所以求得的算术平均数只是其真值的近似值。说明152.某班同学英语考试成绩如下,计算其平均成绩成绩分组(X)人数(f)比重(%)组中值Xf60以下60—7070—8080—9090—10059158312.522.537.5207.555657585952755851125680285合计40100—2950分)(75.73402950fxfX16加权算术平均数的另一公式ffxffxffxffxfxfxxnnnn22112211ffx(分)75.73%5.795%2085%5.3775%5.2265%5.1255ffxx17a)加权算术平均数受两个因素的影响,一个是分配数列中各组的标志值xi,另一个是各组标志值出现的次数fi或频率f/∑fb)各组标志值出现的次数在计算平均数的过程中起着权衡轻重的作用,故常将其称作“权数”。c)权数的形式:次数和频率权数尽管可以以绝对数或相对数的形式出现,但权数的实质是结构相对数。(3)权数的作用和形式18d)下列情况,分组资料可以不考虑权数,而用简单算术平均数。当各组的权数相同时。nxnAxAffxfxfxxnn221119⒈变量值与其算术平均数的离差之和等于零,即:⒉变量值与其算术平均数的离差平方和为最小,即:0)(xx最小值2)(xx算术平均数的主要数学性质20【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:⒉再求算术平均数:481614121⒈求各标志值的倒数:,,,21416181⒊再求倒数:816141214是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数调和平均数21A.简单调和平均数——适用于总体资料未经分组整理、尚为原始资料的情况XnXXXnHn111121式中:为调和平均数;为变量值的个数;为第个变量值。iiXnH调和平均数的计算方法22B.加权调和平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为第组的变量值;为第组的标志总量。imiXiimXmXmXmXmmmmHmmm122112123例:某工厂工人日产零件数资料:日产量(件)各组工人日总产量(件)Xm35556065707001650456019501470合计10330计算该企业该日全部工人的平均日产量。件36.5870147035700103301mXmH24加权调和平均数可以作为算术平均数的变形使用。因为:XfXfXfXXfmXmHXfm11,则设25(三)几何平均数是n项标志值连乘积的n次方根1.简单几何平均数:应用:平均发展速度的计算nnxxxxGn21ffffnffxxxxGn21212.加权几何平均数26【例1】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95﹪、92﹪、90﹪、85﹪、80﹪,求整个流水生产线产品的平均合格率。%24.88%80%85%90%92%955nxG27【例2】某金融机构以复利计息。近12年来的年利率有4年为3﹪,2年为5﹪,2年为8﹪,3年为10﹪,1年为15﹪。求平均年利率。平均年利率为=106.85%-100%=6.85%%85.1062154.215.110.108.105.103.1121213224ffxG28(四)三者的关系算术平均数受极大值的影响较大,调和平均数受极小值的影响较大同一资料而言,其结果有如下关系:HGX29三、位置平均数指总体中出现次数最多的变量值,用表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。0M众数30有时众数是一个合适的代表值比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。31日产量(件)工人人数(人)101112131470100380150100合计800【例1】已知某企业某日工人的日产量资料如下:0M众数的确定1.单项数列计算该企业该日全部工人日产量的众数。322.组距数列先确定众数组,然后计算:021100mmdLM下限公式:021200mmdUM上限公式:1001mmff式中:1002mmff众数组的组距:0md33例:上年某市80个中型工业企业资料按工业总产值分组(百万元)企业数10以下10—2020—3030—4040—5050—601025201582合计80)(5.1710)2025()1025(1025100百万元M)(5.1710)2025()1025(2025200百万元M10mf0mf10mf34当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。众数的应用35(二)中位数(Me)将总体各单位按其标志值大小顺序排列,处于中点位置那个单位的标志值,即为中位数。1.由未分组资料确定中位数。确定方法:首先将各总体单位的标志值,按照大小顺序排列,然后确定中位数的位置,处于中位数的位置的标志值就是中位数。36212221nnnexxxm(当n为奇数,中位数为处于中间位置的标志值)(当n为偶数,中位数为处于中间位置的两个标志值的平均数)例:(1)7个人的身高为:165.168、169、170、172.173、175cm,则中位数为:170cm(2)若8个人的身高为:165.168、169、170、172、173、175、179cm,则中位数为(170+172)/2,即171cm。372.由单项式分组资料确定中位数。确定方法:单项式分组已经将资料序列化,这时总体单位数n=∑f,确定确定中位数的位置要通过累计次数计算。212221fffexxxm(当∑f为奇数)(当∑f为偶数)38日产量(件)工人数f向上累计向下累计22025026028032047107241121283030261992合计30——中位数例如,某工厂工人的日产量分配数列如下表。∑f=30为偶数(件)260221615122xxxxmeff393.由组距分组数列确定中位数(1)确定“中位数组”向上累计次数等于(2)假定中位数组内分布是均匀的,计算出中位数。2f40eeeemmmemdfSfLM12eeeeemmmmdffSUM2向上累计时向下累计时eeeeemmmdfmSfUM12中位数计算公式41按工业总产值分组(百万元)企业数f向上累计向下累计10以下10—2020—3030—4040—5050—60102520158210355570788080704525102合计80——百万元)(5.22102354020Me)(5.221020405530百万元Me554035,402f∴中位数组为“20-30”42众数、中位数、算术平均数的关系当次数分布呈对称的钟分布时,三者相等;当次数右偏时,当次数左偏时,皮尔逊经验公式:XMMe0XMMe2300MMXe43(三)其他分位数有四分位数、十分位数和百分位数意义:反映总体分布的位置特征,作为考察分布的集中趋势和变异状况的有效工具,尤其在强调“稳健性”和“耐饥性”等数据分析中有重要运用。44四分位数(Quartile):将全部总体单位按标志值大小等分为四部分的三个数值,分别记为Q1、Q2、Q3,分别叫做“下分位数”、“中位数”和“上分位数”。4)1(3214)1(241321nQnnQnQ的位次的位次的位次45第二节标志变异指标一、标志变异指标概述二、极差与分位差三、平均差四、标准差与方差五、成数指标六、变异系数46语文数学英语总成绩平均成绩甲乙丙606555656565706575195195195656565某班三名同学三门课程的成绩如下:请比较三名同学学习成绩的差异。47一、标志变异指标的概述(一)概念:反映总体各单位标志值之间差异程度的综合指标。反映总体变量的分布特征、变动范围或离散程度。标志变异指标和平均指标是一对相互联系的对应指标,平均指标反映总体各单位标志值的集中趋势,而标志变异指标则是总体各单位标志值的离中趋势48用来衡量和比较平均数代表性的大小变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大用来反映社会经济活动过程的均衡性和稳定性(二)作用49测定标志变异度的绝对量指标测定标志变异度的相对量指标全距平均差标准差全距系数平均差系数标准差系数标志变异指标的种类:50(一)全距(极差)特点:minmaxXXR优点:计算方法简单、易懂;缺点:易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往