应用经济统计学数据的集中趋势

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章集中趋势和离中趋势数据分布的特征和测度峰度偏态数据的特征和测度分布的形状集中趋势离散程度众数中位数变异系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数数据集中趋势算术平均数几何平均数调和平均数中位数及四分位数众数算术平均数(概念要点)集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响算术平均数(计算公式)设一组数据为:简单算术平均值的计算公式为设分组后的数据为:相应的频数为:加权算术平均值的计算公式为121niniXXXXXnn1122111211()kiikkkiiikkikiiiiXfXfXfXffXXfffff12,,,nXXX12,,,kXXX12,,,kfff简单算术平均数(算例)原始数据:10591368112345661059136868.5niiXXXXXXXXn加权算术平均数(算例)【例4.1】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。拿这三种工资的人数分别为:14人、10人、2人,则该公司雇员的平均工资为:___6.5147.5108.521837.0381410226X加权算术平均数(分组数据算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(fi)Xifi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例4.2】根据表4-1中的数据,计算50名工人日加工零件数的均值116160123.250kiiikiiXfXf(个)算术平均数的数学性质1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小2211()min()nniiCRiiXXXCniiXX10)(1()0niiiXXf2211()min()nniiiiCRiiXXfXCf几何平均数(概念要点)1.集中趋势的测度值之一2.主要用于计算平均比率及平均发展速度3.计算公式为简单几何平均数加权几何平均数4.数据都为正数时才可计算几何平均数5.可看作是均值的一种变形121..nnnniiGMXXXX112log1log..(logloglog)niinXGMXXXnn12121..kikffffffkiiGMXXXX几何平均数(算例)【例4.3】设某建筑公司承建的四项工程的利润分别为3%、2%、4%、6%。问这四项工程的平均利润率是多少?124..3%2%4%6%3.46%nnGMXXX几何平均数(算例)【例4.4】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。124..104.5%102.0%103.5%105.4%103.84%nnGMXXX平均收益率=103.84%-1=3.84%几何平均数(算例)【例4.5】设某银行有一笔20年的长期投资,其利率是按复利计算的,有1年为2.5%,有3年为3%,有5年为6%,有8年为9%,有2年为12%,有1年为5%,求平均年利率。358220355220..(12.5%)(13%)(16%)(19%)(112%)(15%)1.025(1.03)(1.06)(1.09)(1.12)(1.05)1.070881.0708810.070887.088%GMr调和平均数(概念要点)集中趋势的测度值之一均值的另一种表现形式易受极端值的影响计算公式为简单调和平均数加权调和平均数1(1/)niinHX11(/)kiiiiikiiimHmxfmx,其中调和平均数(说明)加权调和平均111111,(/)(/)kiiiiiikiiikkiiiiikkiiiiiiimHmxfxmxmxfHmxffm,其中而不是变量值出现的次数,故事实上就是加权算术平均数的变形,它主要用于每个数值次数未知,而总量已知情形的数据求平均.调和平均数(算例)【例4.6】某人开车,前10公里以时速50公里驾驶,后10公里以时速30公里驾驶。则此人跑这20公里的平均时速为:101021010115030503037.5(/V总路程S总时间T公里小时)【例4.7】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别购买的金额是1元(m1)、2元(m2)、3元(m3),求平均价格。解:平均价格=总金额/总数量调和平均数(算例)12360.24/12325.50.400.250.20mHmx元元斤斤【例4.8】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别买2.5斤(f1)、8斤(f2)、15斤(f3),求平均价格。解:平均价格=总金额/总数量调和平均数与算术平均数的区别0.42.50.2580.20150.24/2.5815xfxf总金额总数量元斤中位数(概念要点)1.集中趋势的测度值之一2.排序后处于中间位置上的值Md50%50%3.不受极端值的影响4.各变量值与中位数的离差绝对值之和最小,即11minnnidiCRiiXMXC中位数(位置的确定)未分组数据:中位数位置组距分组数据:2∑f中位数位置12n未分组数据的中位数(计算公式)1212212ndnnXMXX当n为奇数时当n为偶数时数值型未分组数据的中位数(5个数据的算例)原始数据:2422212620排序:2021222426位置:12345中位数22151322n位置数值型未分组数据的中位数(6个数据的算例)原始数据:10591268排序:56891012位置:123456位置=中位数8+928.51613.522n1.根据位置公式确定中位数所在的组,设落入第组2.采用下列近似公式计算数值型分组数据的中位数(要点及计算公式)1/2idiiinFMLdfi11iiiiLiFifidi其中为第组的下限为前组的累积次数为第组的频数为第组的组距数值型分组数据的中位数(算例)表4-2某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.9】根据第三章表3-3中的数据,计算50名工人日加工零件数的中位数501621205123.21()14dM个四分位数(概念要点)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响QLQMQU25%25%25%25%四分位数(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=n+14上四分位数(QU)位置=3(n+1)4下四分位数(QL)位置=∑f4上四分位数(Qu)位置=3∑f4数值型未分组数据的四分位数(7个数据的算例)原始数据:23213032282526排序:21232526283032位置:1234567n+1QL=237+1QL位置=4=4=2QU位置=3(n+1)43(7+1)4==6QU=30数值型未分组数据的四分位数(6个数据的算例)原始数据:232130282526排序:212325262830位置:123456QL=(21+23)/2=22QL位置=n+14=6+14=1.75QU位置=3(n+1)43(6+1)4==5.25QU=(28+30)/2=29数值型分组数据的四分位数(计算公式)上四分位数:134iUiiifFQLdf14iLiiifFQLdf下四分位数:上式仍是利用线性插值得到数值型分组数据的四分位数(计算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表4-3某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例4.10】根据表4-3中的数据,计算50名工人日加工零件数的四分位数。)(81.117588450115个LQ)(75.128510304503125个UQ众数(概念要点)1.集中趋势的测度值之一2.出现次数最多的变量值:一组数据分布的最高峰点3.不受极端值的影响4.可能没有众数或有几个众数众数(众数的不唯一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242计算该企业该日全部工人日产量的众数。日产量(件)工人数(人)1011121314合计70100380150100800单值型数列的众数(算例)【例4.11】已知某企业某日工人的日产量资料如下:数值型分组数据的众数(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算1011()()iiiiiiiiffMLdffffMoMo数值型分组数据的众数(算例)【例4.12】某市公寓房租金的统计资料如下表4-4,试求房租金的众数表4-4某市公寓房屋租金资料表每周租金(元)房屋套数(套)累计房屋套数(套)7.5~12.512.5~17.517.5~22.522.5~27.527.5~32.532.5~37.537.5~42.542.5~47.512264560371352123883143180193198200111()()604522.55(6045)(6037)24.4(iioiiiiiiffMLdffff元)众数、中位数和算术平均数的关系左(负)偏分布算术平均数中位数众数右(正)偏分布众数中位数算术平均数对称分布算术平均数=中位数=众数注:对称图形,重叠左右偏时,均值变化最快,中位值次之,众值不变众数、中位数和算术平均数的经验关系式中位数大约位于均值与众数之间距离的1/3处,用关系式表示如下:从而可以利用均值、中位数、从数三者中的任意两个数值按以上公式推出另一个数值。______3()odXMXM众数、中位数和算术平均数的经验关系式(算例)【例4.13】某车间生产的一批零件中,直径大于402厘米的占一半,众数为400厘米,试估计其平均数,并判定其偏斜方向。解:已知402,4003()233402400806403,.dooddoodMMXMXMXMMXMMX由于该零件的直径分布为右偏

1 / 39
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功