第四章统计资料的初步描述(二)第一节平均指标一、平均指标的概念平均指标又称统计平均数,是反映总体内部各单位在某一数量标志上的一般水平。它是统计分析中最常用的指标之一。平均指标的特点是一个抽象化的数值。将总体各单位之间的数量差异抽象化;是一个代表性的数值,代表总体各单位数量特征的一般水平。二、平均指标的作用平均指标可以反映总体的一般水平可以对同类现象不同时间和空间的平均指标进行比较可以反映总体分布的集中趋势。三、平均指标种类算术平均数几何平均数调和平均数中位数众数数值平均数位置平均数从计算方法上看,社会经济领域中使用的平均指标有两大类:从考核内容上看,有静态平均数和动态平均数四、平均指标的计算和应用(一)、算术平均数1、算术平均数的基本公式从这个基本公式可以看到:分子与分母是同一总体的两个总量指标,分子中的每个标志值须由分母的每一个总体单位来承担。总体标志总量的标志是数量标志。总体单位总数总体标志总量算术平均数直接承担者算术平均数和强度相对数的区别:虽然都是两上有联系的总量指标之比,平均指标是同一总体的标志总量与总体单位总数之比,即分子是分母(总体单位)所具有的标志,标志总量是随着总体单位数的变动而相应变动;强度相对指标则是两个性质不同而有联系的总量指标之比,作为分子的总量指标数值并不随着作为分母的总量指标数值的变动而变动。(分子与分母是一一对应的)(分子与分母不是一一对应的)某村人均耕地2亩某地区人均耕地2亩2、分类在实际中,上述公式中的两个数值往往不能直接掌握,而必须要根据所掌握的资料来计算,根据掌握的资料不同,可将算术平均数分为简单算术平均数和加权算术平均数。(1)简单算术平均数(simplemean)将各单位的标志值(xi)直接相加得出标志总量,再除以总体单位数n,就得到简单算术平均数。用公式表示为总和符号总体单位数各单位标志值,,,算术平均数nxxxxn21式中:nxnxxxxniin121例1:有6名学生的《英语》考试成绩分别为:81、82、85、89、92、93分,则平均考试成绩为:181+82+85+89+92+9387(6niixxn分)应用条件:①原始资料:没有经过分组的资料;②已整理分组了,但各组的单位数都相等。(2)加权算术平均数(weightedmean)当掌握的资料是经过加工整理的变量数列,并且各组的单位数不相等时,就需要采用加权的办法计算平均指标。在分组的基础上,把各组标志值与相应的单位数乘积之和与总体单位数相除。计算公式:设各组的单位数为niniiiinnnffxffffxfxfxx1121221112n,,,fff•说明:a、对于单项式分组数列,是各组标志值;b、对于组距式数列,是各组的组中值。ixix例2:某厂金工车间20名工人加工某种零件的产量资料如下:试计算这20名工人的平均日产量20名工人零件生产数量分组资料iixf产量(件)人数(人)141516171824851合计2031915.9520iiixff总产量平均产量(件)人数ifix总产量(件)28601288518319要有计量单位如果掌握的资料是组距式数列,应先计算各组的组中值以代表该组内各单位的一般水平,而后按上述方法计算其平均数例3:某贸易公司60名员工月工资分组资料如下:655001091.67()60iiixfxf元iixf60ix工资总额(元)42001260028600135006600合计61426104800以下800~10001000~12001200~15001500以上人数(人)工资(元)if组中值700900110013501650-65500注:(1)、加权算术平均数公式的另一种表现形式1111221211=niniiinnniniiniiixfxfxfxfxfffffxf其中:1iniiff各组单位数总体单位数频率(比重,比率),又称为权数权数的作用:对平均数起一个权衡轻重的作用(是影响平均数变动的两个因素之一)例4:某贸易公司60名员工月工资分组资料工资(元)组中值(元)X人数比重(%)ƒ/∑ƒ工资×比重800以下800~10001000~12001200~15001500以上70090011001350165010.023.343.316.76.770.00209.70476.30225.45110.55合计—100.0109211()1092()niiniiifxxf元(2)、加权算术平均数受两个因素的影响:各组标志值x和各组次数占总单位数的比重(权数)若标志值小的一方权重大,计算结果就将偏向于小的一方;若标志值大的一方权重大,计算结果就将偏向于大的一方。各组标志值不变,各组次数扩大或缩小相同的倍数,其平均数值不变。(3)、如果各组次数相等,加权算术平均数=简单算术平均数。xfAxxXfnAn当f1=f2=……=fn=A“权数失效”简单平均数:各组标志值对总体起的作用一样4、算术平均数的数学性质①各个变量值与平均数离差之和等于零0xx0xxnxnxxnxxx证明加权算术平均数简单算术平均数0fxx证明0xfxfffxfxffxxffxxffxx②各个变量值与平均数离差平方之和为最小值min2xxmin2fxx证明:设x0为不等于平均数的任意值,则:cxx0cxx0cxx0代入以x0为中心的离差平方和,得222222222022ncxxncxxcxxcxxcxxcxxcxxxx2220xxncxx220xxxx00ncc平均数的这一性质说明:以任意不为平均数的数值为中心计算的离差平方和总大于以平均数为中心计算的离差平方和,因此,算术平均数是误差最小的总体代表值。二、调和平均数调和平均数是变量值倒数的算术平均数的倒数,所以又称倒数平均数。【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:⒉再求算术平均数:481614121⒈求各标志值的倒数:21416181⒊再求倒数:816141214根据所掌握的资料不同,调和平均数有简单和加权两种。1、简单调和平均数例5:有一种蔬菜,早晨的价格每千克0.5元,中午0.2元,晚上0.1元。如果早、中、晚各买1元钱的蔬菜,则当天所买的蔬菜平均价格是多少?元商品销售量商品销售额平均价格18.01.012.015.01111以公式表示xnxxxnHn1111212、加权调和平均数简单调和平均数是在各标志总量对平均数起同等作用的条件下应用的,但在许多条件下,各标志总量对平均数的作用是不同的例6前进化工厂2004年11月购进三批A原料,每批的价格及金额如下:批次价格(元/公斤)x金额(元)m第一批第二批第三批505560110002750018000合计—565005650055.3961020mHmx公斤A原料的购入价格和金额资料购进数量(公斤)m/x2205003001020总金额平均价格总重量,iiimfx,iiimxfiiiiiimxfHmfx则,3、由相对数或平均数计算平均数一般原则:根据算术平均数的基本公式,如果掌握了基本公式的分母资料,缺少分子资料,应以分母资料作权数(fi),采用加权算术平均法;如果掌握了基本公式的分子资料,缺少分母资料,应以分子资料作权数(mi),采用加权调和平均法。计划完成程度(%)计划产值(万元)上半年下半年实际产值(万元)计划完成程度(%)企业12345100400150300500103105100100102124.8459160.8367.5618104102100.5105103求:分别计算上半年、下半年及全年的平均计划完成程度基本公式:实际完成数计划完成数ixixif上半年:iixfiiixfxf下半年:imiimxiiimxmx103420150300510120450160350600步骤:1、确定变量X,---求谁的平均数谁是X2、写出平均数的基本公式3、根据资料,若已知分母-----加权算数平均数;若已知分子----加权调和平均数•由平均数计算平均数其计算基本思路和方法与由相对数计算平均数的思路和方法相同例7精益科技公司所属三个子公司本年度的员工人数月工资水平及工资总额资料如下,求全公司的平均工资。平均工资和工资总额资料平均工资(元/人)x工资总额(元)m员工人数(人)m/x甲乙丙650700730195000140000365000300200500合计——7000001000人)(元员工总数工资总额平均工资/70010007000000xmm例:2001年郑州市对700户城镇居民家庭的人均每月可支配收入进行了调查,结果如表,计算700户城镇居民家庭人均每月可支配收入。2001年郑州市700户城镇居民家庭按月人均收入分组及计算表按户平均每人每月可支配收入分组(元)调查户数(户)总人数(人)200以下200—400400—600600—800800—10001000—12001200以上3817021512481432914859968535821411264合计——7002180可支配总收入(元)14800179700342500250600192600123200832001186600但如果掌握居民可支配总收入,而缺少家庭人口数资料,就应采用加权调和平均法计算人均每月可支配收入。问,为什么不用家庭户数做权数?(元)人均每月可支配收入31.54421801196600fxf(元)31.544218011966001111kiiikiikiiiikiiixmmxfxfxH1、简单几何平均数简单几何平均数是N个变量值(比率)连乘积的N次方根,计算公式为:nnnxxxxG212、加权几何平均数当计算几何平均数的每个变量值(比率)的次数不相同时,则应用加权几何平均法,其计算公式为:fnififfnffinxxxxG12121三、几何平均数(Geometricmean)2001200220032004GDP(亿元)80100150180发展速度—3、应用条件:凡是变量值的连乘积等于总比率或总速度的场合都适宜用几何平均法计算平均比率或平均速度。例:10080150100180150求:平均发展速度3年的发展速度连乘:1001501808010015018080总速度平均发展速度:318080=例8希望机械厂生产的机床要经过四个连续作业车间才能完成。2003年一季度第一车间铸造产品的合格率为95%,第二车间粗加工产品的合格率为93%,第三车间精加工产品的合格率为90%,第四车间组装的合格率为86%,则该企业的产品合格率为多少?%94.906838.0%86%90%93%9544G如是4个企业的合格率:企业产品合格率(%)甲85乙82丙83.5丁841、与上述4个车间的合格率有什么不同?注:无论是算数平均数、调和平均数还是几何平均数,都有一个缺点即容易受极端值的影响。其中算术平均数最易受极端值的影响。例如四个人的工资(元):1000120012004600四个人的平均工资为:2000元△算术平均数的特点算术平均数适合用代数方法运算,因此运用比较广泛;易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。XX△调和平均数的特点如果数列中