第四章 数据分布特征的描述

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章数据分布特征的描述1、2、3平均是21、1、1…..1、100000,1亿个数平均和除以项数1亿和除以项数1亿-1第一节集中趋势--数值平均数集中趋势亦称为趋中性、集中性,是指变量分布以某一数值为中心的倾向变量分布的集中趋势要用平均指标反映平均指标是将随机变量的各变量值差异抽象化、以反映变量值的一般水平或平均水平的指标,也就是反映变量分布中心值或代表值的指标。平均数因计算方法不同可分为数值平均数和位置平均数两类。数值平均数主要有算术平均数、调和平均数和几何平均数等三种位置平均数主要有中位数和众数置查找平均部数据,只需要根据位位置平均不一定用到全数据进行计算数值平均就是用到全部一、算术平均数算术平均数也称为均值,是总体标志总量与总体单位总量对比的结果。算术平均数是最为常用的用以描述集中趋势的指标,因为它的计算方法客观上符合许多现象个体与总体之间存在的数量关系,即总体中每个个体标志值的算术和等于总体标志总量,用总体标志总量除以总体单位总量,就可以消除个体标志值之间的差异而体现出总体的一般水平。)()(变量值个数总体单位总量变量值总量总体标志总量算术平均数=在实际工作中,由于所掌握的统计资料的不同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平均数两种。(一)简单算术平均数简单算术平均数是根据未分组数据计算的,即直接将变量的每个变量值相加,除以变量值的个数。设某随机变量的各变量值为x1,x1,…xn,则简单算术平均数的计算公式如下:nxnxxxxnin1i21=+++=nxx=简写为例4-1某IT企业人员年薪样本资料如表计算该企业的平均年薪。491004930048700486005120050300499505100049000488004940049800472005140048900499005180048650513504960051300546005340051900)(58.502142451900534004930049100元nxx(二)加权算术平均数加权算术平均数是根据单项数列或组距数列计算的,即以各组变量值乘以相应的频数求出各组标志总量,除以总频数得到的。其计算公式为fxfffffxfxfxxnnn212211=【例4-2】某企业50名工人加工零件样本资料,分组后如表4-2。计算该企业50名工人的平均日产量。按零件数分组频数105~110110~115115~120120~125125~130130~135135~140358141064合计50(件)==2.123506160fxfx算术平均数的数学性质1、算术平均数与其总体单位总数的乘积等于总体标志总量2、如果每个变量值都加(或减)一个任意数值A,则其算术平均数也要增多(或减少)这个常数A3、如果每个变量值都乘以(或除以)一个任意数值A,则其算术平均数也乘以(或除以)这个常数A4、各个变量值与其算术平均数离差之和为零5、各个变量值与算术平均数离差平方之和最小调和平均数(一)简单调和平均数我们以H表示调和平均数。与算术平均数类似,调和平均数也有简单的和加权的两种形式。简单调和平均数的计算公式为:xnxxxnHn111121【例4-4】某市场上白菜早中晚的价格各不相同,其中,早上2.5元/斤、中午2元/斤、晚上1.5元/斤。如果早中晚各买1斤,求平均价格;如果早中晚各买1元,求平均价格斤)(元=++++=总的菜量总的金额平均价格/58.19.1311215.21111斤)(元=++++=总的菜量总的金额平均价格/2361115.11215.21公式(加权)这是调和平均数的简单将上式推广得到xnxxxnHn111121(二)加权调和平均数简单调和平均数是在各标志总量对平均数起同等作用的条件下应用的,但在更多的场合,各标志总量对平均数的作用是不同的。这时就应以各标志总量作权数,计算加权调和平均数。加权调和平均数的公式为xmmxmxmxmmmmHnnn221121【例4-5】某企业分别购进原材料三批,价格及采购金额资料见表,试计算购入材料的平均价格批次单位价格x(元/千克)采购金额m(元)第一批203600第二批226600第三批255000合计—15200)/(35.2268015200255000226600203600500066003600千克元xmmH)/(35.2268015200千克元材料量材料金额x算术平均和调和平均根本就是一回事最主要的区别在权数的不同区别权数就看单位就可以了。12乘就算术13除就调和批次1单位价格(元/千克)2各批采购材料数量(千克)3采购金额m(元)第一批201803600第二批223006600第三批252005000合计—68015200三、几何平均数几何平均数是n个变量值连乘积的n次方根几何平均数用来计算平均比率、平均速度、产品平均合格率、复利法的平均利率几何平均数分为简单几何平均数、加权几何平均数(一)简单几何平均数直接将n个变量值连乘,然后对其连乘积开n次方根所得的平均数即为简单几何平均数。它是几何平均数的基本形式。计算公式为xxxxxGnn321GGnXnxxxGn,需要转成注意最终的答案为同取习惯加减,将上式两边lglglg...lglglglg21【例4-6】某厂有三个车间,进入第一车间的原件有100000件,第一车间的合格率为50%,出车间的为50000件,进入到第二车间;第二车间的合格率为10%,出车间的为5000件,进入到第三车间;第三车间的合格率为2%,出车间的为100件。求其平均合格率。1.0001.002.01.05.033G【例4–7】生产某种产品要经过铸造、机加工和电镀3个车间进行连续加工,各车间产品合格率分别为95%,92%,90%,求各车间产品平均合格率。%2996.929.092.095.03=法一:nxG%率为所以各车间的平均合格=所以次方的再求=法二:2996.922996.92)9653.110(9652.1390lg92lg95lglglgGnxG(二)加权几何平均数资料中的变量值重复出现时,简单几何平均数就变成了加权几何平均数ffffnfffxxxxxGn321321GGfXffxfxfxffxxxGnnfnffn,需要转成注意最终的答案为同取习惯加减,将上式两边lglglg...lglglg...lglglglg22112121【例4-8】投资银行某笔投资的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。0360.225115lg2110lg10108lg8105lg4103lg1lglg=++fXfG6.108=G几何平均用连乘而不用连加某投资者持有股票,初始投资10000,2001-2004四年的收益率为4.5%2.1%25.5%1.9%,求平均收益率%%收益率0787.80787.1089.1015.1251.1025.1044G%%收益率5.85.10849.1015.1251.1025.104G59.138585.1081000057.136449.1015.1251.1025.104100005.1251.1025.104100001.1025.104100005.1041000010000,4=%)(算术法本利和=第四年末第三年末第二年末第一年末初始模拟真实投资第二节集中趋势--位置平均数位置平均数是根据标志值在分配数列中所处的位置来确定的代表值与数值平均数相比具有不受极端数值影响的特点对于整个总体来说,具有非常直观的代表性,所以常被用来反映分布的集中趋势常用的位置平均数有众数、中位数一、众数(一)众数的含义统计上把这种在一组数据中出现次数最多的变量值叫做众数,用M0表示(Mode)主要用于品质标志数据的集中趋势测量,也适用于作为数量标志数据集中趋势的测量(二)众数计算1、根据单项数列确定众数根据单项数列确定众数比较容易,出现次数最多的变量值即为众数。【例4-9】某院入校新生资料如表,求众数。按年龄分组人数(人)1710818693199852017621432217合计2022190M2、由组距数列计算众数组距式数列,只能按一定的方法来推算众数近似值首先要根据各组次数确定众数组,即众数所在的组其次,利用公式计算众数dLM2110dUM2120【例4-10】某企业50名工人加工零件本资料。计算众数按零件数分组频数f105~110110~115115~120120~125125~130130~135135~140358141064)(1235)1014()814(8141202110件dLM)(1235)1014()814(10141252120件dUM二、中位数(一)中位数的含义中位数是指按数据大小顺序排列起来所形成的分配数列中,居于中间位置的变量值中位数的作用与众数相近,也是研究数据的代表值中位数用Me表示(Middle)从定义知,所研究的数据中有一半小于中位数,一半大于中位数(二)中位数的计算确定中位数,必须将总体各单位的标志值按大小顺序排列。1.根据未分组资料计算121222ennnxnxxnM当为奇数时当为偶数时2.由单项数列计算单项式数列,首先,要求计算权数和的一半;然后对各组次数顺序做累计,确定中为数所在的组,与此对应的变量值即为中位数【例4-13】某村人均亩产量情况如表4-7,计算中位数。人均亩产(千克)户数(户)1000以下301000150300025050005070001010000以上10合计50025025002f所以,Me=30003、由组距数列计算组距数列确定中位数,应先按权数和的一半求出中位数组,然后再按下限公式或上限公式确定中位数dfsfUMdfsfLMmmemme1122::上限公式下限公式【例4-14】某农村信用社按定期存款账号进行每隔10户的系统抽样,得到如下资料,计算其中位数存款金额(元)户数(户)1000以下301000—30001503000—50002505000—7000507000—100001010000以上10合计500356020002501802300021fdfSfLMmme众数、中位数和算术平均数的比较算术平均数、众数和中位数之间的关系与次数分布数列有关次数分布对称时,算术平均数、众数和中位数都是同一数值在尾巴拖在右边的正偏态(或右偏态)分布中,众数最小,中位数适中,算术平均数最大在尾巴拖在左边的负偏态(或左偏态)分布中,众数最大,中位数适中,算术平均数最小课堂练习1、某乡甲乙两村的粮食生产情况如下,求哪个村的总平均亩产高按耕地自然条件分组甲村乙村平均亩产(千克/亩)粮食产量(千克)平均亩产(千克/亩)播种面积(亩)山地丘陵平原地100150400250001500005000001502004501250500750产高于乙村,所以,甲村的平均亩亩千克亩千克乙甲乙甲XXfxfXxmmH)/(25075050012507504505002001250150)/(27040050000015015000010025000500000150000250002、某超市周调查销售数据如表,求众数不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮

1 / 68
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功