当前位置:首页 > 商业/管理/HR > 管理学资料 > 数据分布特征的统计描述
1除了统计图和统计表之外,还可以用少量的特征值(代表值)对数据分布的数量规律进行精确、简洁的描述。第三章数据分布特征的统计描述2大量的数据经过整理后,已经能初步反映总体分布的特征。为了更加准确的了解数据分布的特征和规律,需要找到反映数据分布特征的代表值三类:集中趋势、离中趋势、分布形态说明:3集中趋势:即反映各数据向中心值靠拢的程度返回本节首页集中趋势(位置)4离中趋势:即反映各数据远离中心值的程度离中趋势(分散程度)两个不同的曲线表示两个不同的总体,它们的集中趋势相同但离中趋势不同。因为即使现象的集中趋势相同,其离中趋势也可能不同。5实际中还会遇到:集中趋势和离中趋势均相同的现象,其分布的形态也可能不同。这表明:除了集中和离中趋势外,分布还有其他方面的特征:分布的形态。指:数据分布的对称程度和扁平(高低)程度测度指标是偏度测度指标是峰度是相对于对称分布而言相对于正态分布而言6偏度:测定分布的偏斜程度的指标偏斜是相对于对称分布而言峰度:测定分布的高低(尖峭)程度的指标尖峭是相对于正态分布而言7偏态(形状)峰态(形状)正态分布2~(,)X对称分布8扁平分布尖峰分布峰态左偏分布右偏分布与正态分布比较!偏态与对称分布比较9正态分布中有两个参数:2~(,)XN一般记为:2和μ、σ2是正态分布的参数,不确定常数。不同的μ、不同的σ2对应不同的正态分布10标准正态分布是正态分布中的一种1,0~NX记为:11本章内容第一节集中趋势的测度第二节离散程度的测度第三节偏度与峰度12第一节集中趋势的测度集中趋势是指一组数据向其中心值靠拢的倾向测度集中趋势就是寻找一组数据的代表值或中心值,在统计中是使用平均指标来测度的。13本节内容一、平均指标含义二、平均指标的计算(一)算术平均数(二)调和平均数(三)几何平均数(四)众数(五)中位数三、各种平均数之间的相互关系数值平均位置平均14一、平均指标含义1、定义:又称平均数。是将同质总体内各单位的数量差异抽象化,以反映总体的一般水平。被平均的对象必须具有同质性152、平均指标有两大类数值平均:位置平均:根据总体内全部数据计算:算术平均、调和平均、几何平均。根据数据在分配数列中的位置确定:众数、中位数。163、平均指标作用a、反映总体各单位变量值分布的集中趋势b、比较同一现象在不同空间或不同时间的发展水平c、分析现象间的依存关系17集中趋势:总体中各单位某一标志值的具体表现是各不相同的,但一般呈正态分布,即很小或很大的标志值出现的次数较少,接近平均数的标志值出现的次数较多,大多数的标志值都围绕着平均数左右波动。返回本节首页18商场按销售额分(万元)商场数(家)各组商品流通费用率(%)50以下50~200200~400400~600600~800800~10001000以上25701307540181011.210.49.96.75.95.55.0注:流通费用率=费用额/销售额现象间的依存关系:19二、平均指标计算(一)算术平均数又称均值。根据掌握的资料不同:简单法和加权法。20nxxxnxxn...211、简单法:适用于没有分组的原始数据均值,即算术平均数x标志值或变量值见49页例题212、加权法:分组且各组标志值出现的次数(权数f)不相等时,公式:nnnffffxfxfxfxfx......212211返回本节首页x为标志值,又称变量值;f为各组标志值出现的次数22日产量(件)工人人数(F)19~21121~23423~25625~27827~291229~3110合计41某厂工人生产情况计算平均日产量23件)(73.2641/1096fxfx产量(件)x人数fxf19~2121~2323~2525~2727~2929~31202224262830146812102088144208336300合计--41109624用统计功能的计算器计算:2ndF,ON,201M+224M+246M+268M+2812M+3010M+,x→M结果为26.7325例1:用计算器对下列数据求平均xf25354555合计1070903020026mode2Shiftscl=25Shift;10DT35Shift;70DT45Shift;90DT55Shift;30DTShift注意:DT是储存功能的加号42x27注意:当各组权数均相等时,加权算术平均数等于简单算术平均数:nxnAxAffffxfxfxxnnn......212211返回本节首页28产量(x)人数(f)1213141510101010合计40可用简单式计算均值各组权数都相等的数列29对称数列:产量(x)人数(f)121314151531030103合计56可用简单式计算均值303、权数加权均值的大小受两个因素的影响:各组变量值(x)各组次数,即权数(f)31(1)权数的定义权数:即次数,分布在各组间的总体单位数,因为它对均值的大小起权衡轻重的作用,故又称权数。出现次数多的标志值对平均数的影响大32(2)权数的表现及应用绝对数权数f相对数权数ffffff第一、权数表现:有两种形式:33fxfxffxx绝对权数:相对权数:计算公式:例题见教科书51页表3~334第二、权数的实质是相对数权数。即权数对均值的影响作用,取决于相对权数而非绝对权数。举例:35(元)25.98221121fxffxfxx计算平均奖金额等级奖金额(X)人数(F1)人数(F2)一等120812二等1004263三等903045合计—80120虽然各组绝对人数变化了,但各组人数的比重未变比重%1037.552.5100364、平均数应用举例:统计中有三大综合指标:总量指标、相对指标和平均指标反映现象总规模、总水平,用绝对数表示如:2019年中国GDP39.8万亿元人民币相对指标是两个有联系的指标值对比的比率,如:三次产业比重、企业劳动生产率、产出的计划完成百分数、经济发展速度和增长速度…37例1、10个企业资金利润率资料:资金利润率%企业数n企业资金(万元)f0-1010-2020-30532100500800合计101400求:10个企业的平均利润率%202.01400280fxfx资金利润率%企业数n企业资金(万元)fx%xf利润额0-1010-2020-3053210050080051525575200合计101400---280“企业的平均利润率”等同于“企业的总利润率”企业的总利润率=利润总额/资金总额39%202.01400280fxfx利润总额资金总额40计划完成百分数%企业数n计划产值fx%xf实际值105~110110~120120~130307050570020500225001.0751.151.256127.52357528125合计15048700---57827.5计算150个企业的平均计划完成百分数例2、150个企业的资料:%74.1181874.1487005.57827fxfx计划完成百分数%企业数n计划产值fx%xf实际值105~110110~120120~130307050570020500225001.0751.151.256127.52357528125合计15048700---57827.5“150个企业的平均计划完成百分数”就是“150个企业总的计划完成百分数”。企业总计划完成百分数=总实际数/总计划数42%74.1181874.1487005.57827fxfx实际产值计划产值435、算术平均数的数学性质见52页44(二)调和平均数1、含义:总体内各个变量值倒数的算术平均数的倒数,又称倒数平均数。如有三个变量值:8、10、12,求调和平均数。步骤如下:45、、12110181;;312110181121+101+813即为调和平均数xnxxxxnxnH11111321公式:46(1)简单式:(2)加权式:各变量值出现次数相等各变量值出现次数不等xnxxxxnxnH11111321设m为次数mxmmxmxmxmxmmmxnnnH11111...332211212、调和平均数的计算47举例:某蔬菜单价早中晚分别为0.5、0.4、0.25(元/斤)(1)早中晚各买1元,求平均价格(2)早中晚各买1斤,求平均价格(3)早中晚各买2元、3元、4元,求平均价格(4)早中晚各买2斤、3斤、4斤,求平均价格48(1)问:用调和平均。先求早、中、晚购买的斤数。早1/0.5=2(斤)、中1/0.4=2.5(斤)、晚1/0.25=4(斤)元35.05.8325.014.015.01111HX(2)问:用算术平均元38.0325.04.05.0X49元33.05.27925.044.035.02432Hx(3)问:用加权调和平均元36.092.343225.044.035.02x(4)问:用加权算术平均503、调和平均数和算术平均数间的关系fxfxxfHxmmm/xf,m则设调和平均数是一种特殊的均值(1)两者存在着变形关系:51(2)当掌握的资料无法直接计算算术平均数时,可用调和法计算。这时两者计算结果相同,只是根据已知条件不同,需选择不同的公式。52已知对比分母,将分母定为f,求分子xf,然后用加权算术公式,即:fxfxmxmxH1已知对比分子,将分子定为m,求分母m/x用加权调和公式,即:53某公司下属三个部门销售利润资料部门销售利润率(%)x利润额(万元)m销售额m/xA121201000B102002000C71051500合计-4254500求三个部门的平均利润率。54%44.945004251mxmxH思考:如果已知销售利润率和销售额资料,该如何计算?55部门销售利润率(%)x销售额(万元)利润额A121000B102000C71500合计-450056商品销售计划完成%商店实际销额(万元)流通费用率%80~90345.914.890~100468.413.2100~110834.412110~120594.311合计20243某地区20个商店某年第四季度资料计算:20个商店平均销售计划完成程度及总的流通费用率。57计划完成百分数%计划百分数的组中值%(x1)实际销售额(万元)(M或f)计划销售额(M/x)流通费用率%(x2)流通费用额(万元)(xf)80~9090~100100~110110~120859510511545.968.434.494.354.072.032.882.014.813.212.011.06.799.034.1310.37合计---243.024.08---30.3258(1)20个商店的平均销售计划完成程度243100.9%1240.8HMxMx30.3212.48%243xfxf(2)20个商店总的流通费用率59(三)几何平均数nnGxxxx...211.定义:n个变量值乘积的n次方根603、计算方法nniinnGxxxxx121简单法:加权法:fnGxxxxfffn...212161例1:2019-2019年我国某工业品产量环比发展速度分别为107.6%、102.5%、100.6%、102.7%、102.2%。计算平均每年的发展速度%1.103031.1022.1027.1006.1025.1076.1...521nnGxxxx62%1.103031.1022.1027.1006.1025.1076.1...521nnGxxxx按计算器:1.076,,1.025,,1.006,,1.027,,1.022,=,2ndF,x
本文标题:数据分布特征的统计描述
链接地址:https://www.777doc.com/doc-4751257 .html