第三章集中趋势的度量

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/3/6商学院1统计学statistics李欣先Email:lixinxian2005@126.comtongjxxx@163.com2020/3/6商学院2第三章集中趋势的度量(Measuresofcentraltendency)第一节平均数(Themean)第二节中位数(Themedian)第三节众数(Themode)第四节分组数据的平均数、中位数以及众数(Themean,median,andmodeofgroupeddata)第五节平均数、中位数以及众数的相对位置(Therelativepositionsofthemean,median,andmode)2020/3/6商学院3第一节平均数(Themean)一、总体平均数(Thepopulationmean)二、样本平均数(Thesamplemean)三、算术平均数的特点(Thepropertiesofthearithmeticmean)四、加权平均数(Theweightedmean)五、几何平均数(Thegeometricmean)2020/3/6商学院4(Centraltendency)1.一组数据向其中心值靠拢的倾向和程度2.测度集中趋势就是寻找数据一般水平的代表值或中心值3.不同类型的数据用不同的集中趋势测度值4.低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据5.选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定2020/3/6商学院5用总体中各单位某一数量标志值之和除以单位总数一、总体平均数(Thepopulationmean)(一)概念2020/3/6商学院61、设一组数据为:X1,X2,…,XN,简单均值的计算公式为NXNXXXNiiN121(二)计算方法Anymeasurablecharacteristicofapopulationiscalledaparameter.2020/3/6商学院7用样本中各单位某一数量标志值之和除以样本容量二、样本平均数(Thesamplemean)(一)概念2020/3/6商学院81、设一组数据为:x1,x2,…,xn,简单均值的计算公式为nxnxxxxniin121(二)计算方法Anymeasurebasedonsampledataiscalledastatistic.2020/3/6商学院9原始数据:4457106510754421nxxxxn2020/3/6商学院10三、算术平均数的特点(Thepropertiesofthearithmeticmean)1、变量值与其均值的离差之和等于零。即:01niixx)min(12最小值nixxi2、各变量值与其均值的离差平方和为最小值。即:2020/3/6商学院11四、加权平均数(Theweightedmean)权数除用总体各组单位数即频数的形式外,还可以用比重即频率的形式表示。因此,便有另一种加权均值的形式,就是将各组的变量值乘以相应的比重(即频率),然后求和,即得加权均值。其计算公式为(仅以样本为例,总体以次类推)。112212nnwnwxwxwxx2020/3/6商学院12例假设附近的一家餐厅分别以0.9元,1.25元和1.5元出售小杯、中杯和大杯饮料,某天共卖出100杯,其中30小杯,40中杯和30大杯。这100杯的均价。2020/3/6商学院13五、几何平均数(geometricmean)(一)概念要点1、集中趋势的测度值之一2.N个变量值乘积的N次方根3、适用于特殊的数据4、主要用于计算平均发展速度ExcelGEOMEAN(二)计算方法NNiiNNMXXXXG1212020/3/6商学院14例一位投资者持有一种股票,2003年、2004年、2005年和2006年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。%84.103%4.105%5.103%0.102%5.104421NNMXXXG平均收益率=103.84%-1=3.84%2020/3/6商学院15六、调和平均数(harmonicmean)(一)概念调和是被研究对象中变量值倒数的算术平均数的倒数。因此,又称为倒数的平均数。一般用H表示。(二)计算方法根据所掌握资料的不同也有简单式和加权式两种。ExcelHARMEAN2020/3/6商学院161、根据未经分组整理的原始数据计算调和平均数,采用简单式。总体调和平均数和样本调和平均数的计算公式为:niinxNxxxNH1211111niixnnh1n211x1+…+x1+x1(二)计算方法2020/3/6商学院172、加权调和平均数分别为:xm+…+xm+xmnn221121nmmmH2020/3/6商学院18在社会经济统计学中经常用到的仅是一种特定权数的加权调和平均数。即有以下数学关系式成立:m是一种特定权数,它不是各组变量值出现的次数,而是各组标志值总量。1式中:,hXfXfmXXmfXfXXmmXffX2020/3/6商学院19例1有三种蔬菜,甲每千克1元,乙每千克0.8元,丙每千克0.5元,现各买1元,求平均价格。2020/3/6商学院20例2有三种蔬菜,甲每千克1元,乙每千克0.8元,丙每千克0.5元,现甲买2元,乙买4元,丙买5元,求平均价格。2020/3/6商学院21某日三种蔬菜的批发成交数据蔬菜名称批发价格(元)Xi成交量(公斤)Fi成交额(元)XiFi甲乙丙1.200.500.801500025000800018000125006400合计—4800036900【例题】某蔬菜批发市场三种蔬菜的日成交数据如表4-2,计算三种蔬菜该日的平均批发价格(元)769.04800036900iiiiiMXFXFXH2020/3/6商学院22切尾均值(trimmedmean)2020/3/6商学院23第二节、中位数(median)(一)概念要点1、集中趋势的测度值之一2、排序后处于中间位置上的值Me50%50%3、不受极端值的影响4、主要用于定序数据,也可用数值型数据,但不能用于定类数据5、各变量值与中位数的离差绝对值之和最小,即min1nieiMX2020/3/6商学院241、未分组数据:21N中位数位置(二)位置的确定二、中位数2020/3/6商学院25为偶数时当为奇数时当NXXNXMNNNe1222121(三)计算方法2020/3/6商学院26数值型未分组数据的中位数计算方法举例1、5个数据的算例原始数据:2422212620排序:2021222426位置:12345中位数22321521N位置2020/3/6商学院272、6个数据的算例原始数据:10591268排序:56891012位置:123456位置N+126+123.5中位数8+928.52020/3/6商学院28第三节众数(mode)(一)概念:众数是一组出现次数最多的变量值,一般用M0来表示。(二)确定方法:根据掌握资料的不同,众数的确定方法两种:方法一:根据未分组数据或单项变量数列计算众数,只需找出出现次数最多的变量值即为众数。2020/3/6商学院29无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:2528283642422020/3/6商学院30第四节分组数据的平均数、中位数以及众数(Themean,median,andmodeofgroupeddata)一、平均数二、中位数三、众数2020/3/6商学院31一、平均数设分组后的数据为:X1,X2,…,XK,相应的频数为:F1,F2,…,FK,加权均值的计算公式为KiiKiiiNNNFFXFFFFXFXFXX112122112020/3/6商学院32某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例题】根据表中的数据,计算50名工人日加工零件数的均值(个).FFXXKiiKiii2123506160112020/3/6商学院33(1)根据位置公式确定中位数所在的组(2)采用下列近似公式计算:ifSNLMmme12二、中位数12memN-SMUif2020/3/6商学院34某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)累计频数i105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064381630404650合计—50—【例题】根据表中的数据,计算50名工人日加工零件数的中位数21.1235141625012021ifSNLMmme2020/3/6商学院35三、众数1、众数的值与相邻两组频数的分布有关4、该公式假定众数组的频数在众数组内均匀分布2、相邻两组的频数相等时,众数组的组中值即为众数Mo3、相邻两组的频数不相等时,众数采用下列近似公式计算MoMoiLM21102020/3/6商学院36等价公式:iU-M2120式中,U表示众数组的上限值,其他符号与上同。2020/3/6商学院37某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例题】根据表中的数据,计算50名工人日加工零件数的众数)(1235)1014()814(8141200个M2020/3/6商学院38第五节平均数、中位数以及众数的相对位置(Therelativepositionsofthemean,median,andmode)(一)众数、中位数和均值的关系从分布角度看,对同一组数据计算众数、中位数和均值,三者之间有以下关系:1、如数据具有单一众数,且分布是对称的。2、如数据是左偏的分布,则3、如数据是右偏分布的,则XMMe0XMMe0XMMe02020/3/6商学院39众数、中位数和均值的关系对称分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值2020/3/6商学院404、从数值上的关系来看,当数据分布偏斜程度不是很大时,可以得出:例根据某校统计学期末考试的成绩资料得到众数为78分,算术平均数为67分,那么中位数为多少,其频数分布呈何形态?02()eeMMMX2020/3/6商学院41算术平均数易受极端值(outlier)影响,使的代表性变小;当组距数列为开口组时,由于组中值不易确定,使的代表性变得不可靠。几何平均数适用于各个变量值的连乘积等于其发展总速度时,求算其平均数;求等比数列的平均数。众数适用于总体的单位数较多,各标志值的次数分配又有明显的集中趋势的的情况。中位数属于位置平均数,它与众数一样,都是从数据位置的角度来反映数据的代表水平,中位数不受极端值的影响,各个变量值相对其中位数的绝对离差之和为最小。2020/3/6商学院42预习P332.3和2.42020/3/6商学院432020/3/643

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功