统计数据的汇总

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1以Excel和SPSS为工具的管理统计同济大学经济与管理学院管理科学与工程系张建同教授2本章主要介绍以下3类综合统计指标:度量中心(集中)趋势的平均指标度量离散程度的指标度量偏斜程度的指标度量两种数值变量关系的指标第2章统计数据的描述度量3平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势。平均指标按计算方式可分为数值平均数和位置平均数两大类。§2.1度量集中趋势的平均指标4——是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。(一)算术平均数1.算术平均数的基本公式总体单位总数总体单位标志总量算术平均数一.数值平均数5(1)简单算术平均数niixnx112.算术平均数的计算n—总体单位总数;xi—第i个单位的标志值。(2)加权算术平均数xi—第i组的代表值(组中值或该组变量值);fi—第i组的频数。iiiffxx6使用Excel函数求加权算术平均数利用Excel“数学和三角函数”中的SUMPRODUCT函数可以方便地计算出分组数据的加权算术平均数。语法规则:格式:SUMPRODUCT(区域1,区域2,…)功能:返回两个或多个区域中对应元素乘积之和。例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。7(二)几何平均数当统计资料是各时期的发展速度等前后期的两两比环数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是n个数连乘积的n次方根。1.简单几何平均数nnGxxxx212.加权几何平均数ffnffGnxxxx2121fi—各比率出现的频数8例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一:1992199319941995成本200228239.4244.2年增长率(%)1452302.105.114.1Gx解二:3200/2.244Gx年平均增长率=1.0688-1=6.88%0688.10688.193.使用Excel求几何平均数可以使用Excel统计函数中的GEOMEAN函数返回几何平均数。语法规则:格式:GEOMEAN(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的几何平均数。10位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一)中位数——将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。比如有5笔付款:9元,10元,10元,11元,60元付款的均值为20元,显然这并不是一个很好的代表值,而中位数Me=10元则更能代表平均每笔的付款数。二.位置平均数111.使用Excel的统计函数返回未分组数据的中位数可以使用Excel统计函数中的MEDIAN函数返回未分组数据的中位数。格式:MEDIAN(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的中位数。122.分组数据中位数的确定对于分组数据的统计资料,中位数要用插值法来估算。(1)计算各组的累计频数;(2)确定中位数所在的组——是累计频数首次包含中位数位次Σf/2的组。dfSfLMmme121其中:L—中位数所在组的下限;Sm-1—中位数所在组前一组的累计频数;fm—中位数所在组的频数;d—中位数所在组的组距。13例:计算下表数据的中位数解:Σf/2=27.5,中位数在“15-25”的组中,分组各组频数累计频数0-5225-156815-25202825-35154335-4585145455dfSfLMmme121102085.271575.2414(二)众数——是总体中出现次数最多的标志值,记为M0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。151.未分组数据众数的确定在数据量很大的时候,可以使用Excel统计函数中的MODE函数返回众数。格式:MODE(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的众数。162.分组数据众数的确定对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算dLM2110其中:L—众数组的下限Δ1—众数组与前一组的频数之差Δ2—众数组与后一组的频数之差d—众数组的组距Δ1Δ2众数Ld17例:计算下表数据的众数解:众数组是“15-25”的组,则分组各组频数0-525-15615-252025-351535-458454dLM211010)1520()620(6201537.2218三.算术平均数和位置平均数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同。0xf(Me,M0)X0xfMeXM00xfMeXM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数。3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数。19补充习题补充题3:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。注册资金(万元)50以下50~100100~150150~200200~250250以上企业数2035422615520补充题3答案注册资金(万元)企业数累计企业数组中值50以下20202550~100355575100~1504297125150~20026123175200~25015138225250以上5143275(万元)6.123iiiffxx(万元)64.1195042555.711002/1dfSfLMmmeΣf/2=143/2=71.5,中位数所在组为“100~150”的组,众数组为“100~150”的组,)(22.11550)2642()3542(35421002110万元dLM21四分位数(概念要点)1.集中趋势的测度值之一2.排序后处于25%和75%位置上的值3.不受极端值的影响4.可用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%22四分位数(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(QL)位置=3N423数值型未分组数据的四分位数(7个数据的算例)原始数据:23213032282526排序:21232526283032位置:1234567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=3024数值型未分组数据的四分位数(6个数据的算例)原始数据:232130282526排序:212325262830位置:123456QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)=28.525数值型分组数据的四分位数上四分位数:UUUUUifSNLQ43LLLLLifSNLQ4下四分位数:26数值型分组数据的四分位数QL位置=50/4=12.5QU位置=3×50/4=37.5表某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据第三章表中的数据,计算50名工人日加工零件数的四分位数)(81.117588450115个LQ)(75.128510304503125个UQ27使用Excel统计函数中的QUARTILE函数在数据量很大的时候,可以使用Excel统计函数中的QUARTILE函数返回四分位数,语法规则如下:格式:QUARTILE(数据集,第nthquart分位数)功能:返回不同nthquart的四分位数。如果nthquart等于函数QUARTILE的返回值0最小值1第一四分位数(第25个百分点值)2中位数(第50个百分点值)3第三四分位数(第75个百分点值)4最大值28五数汇总和箱线图五数汇总包括最小值、第一分位数、中位数、第三分位数和最大值这样五个数据,即X最小1QMe3QX最大箱线图(亦称箱须图)提供了基于五数汇总的几何图形30354045501????Me数据集X最小Q1Q3X最大值29箱线图和四种不同类型分布图的联系c)右偏分布a)钟形分布b)左偏分布d)矩形分布30xx频数要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差和变异系数。§2.2度量离散程度的指标31【案例】道格拉斯公司应如何选择供应商道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?道森公司:克拉克公司:交货天数次数交货天数次数9271106821129310411312213132一.极差极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据的信息,因而是一种比较粗糙的变异指标。33二.平均差平均差是各数据与其均值离差绝对值的算术平均数,通常记为A.D。||1XXNDAi.平均差越大,反映数据间的差异越大。但由于使用了绝对值,其数学性质很差,因而很少使用。34四分位差1.离散程度的测度值之一2.也称为内距或四分间距3.上四分位数与下四分位数之差QD=QU-QL4.反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性35三.方差和标准差方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。应注意总体方差、标准差与样本方差、标准差是有区别的。1.总体方差和总体标准差总体方差是各总体数据与其均值离差平方的均值,记为2,总体标准差记为。22)(1XXNi2)(1XXNi362.样本方差与样本标准差样本方差记为S2,样本标准差记为S,在推断统计中,它们分别是总体方差和标准差的优良估计。2)(11XXnSi其中:n为样本容量,Xi为样本观察值为样本均值。X22)(11XXnSi37变异系数当需要比较不同总体的离散程度时,如果使用的度量单位不同,或它们在数量级上相差很大,则用绝对数值表示的方差和标准差就缺乏可比性,此时就应使用相对变异指标(变异系数)。例如,对汽车发动机的汽缸而言,0.05毫米的标准差就很大了,但对建筑工程而言则可完全忽略不记。相对变异指标中最重要的是标准差系数,是标准差与均值之比,记为V。XV38未分组数据方差和标准差的计算方差和标准差的手工计算非常烦琐,只要求掌握以下两种方法。⑴使用计算器的统计功能(SD或STAT功能)⑵使用Excel的统计函数①VARP(区域或数组1,区域或数组2,…)功能:返回所有参数中数据的总体方差。②STDEVP(

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功