第五章离中趋势和集中趋势的度量第一节集中趋势指标概述第二节数值平均数第三节位置平均数第四节离中趋势的度量第五节偏度与峰度(选讲)①明确平均数和标志变异指标的概念和作用②熟练掌握数值平均数和标准差计算方法③了解众数、中位数的概念、特点及其计算方法④了解几种平均数之间的关系⑤了解计算平均数和离中趋势指标应注意的问题。学习目的和要求1平均数和标志变异指标的概念众数、中位数、数值平均数和标准差的特点及其计算方法学习重点2众数、中位数、数值平均数(算术平均数、调和平均数、几何平均数)等度量方法的选择问题学习难点3本节重点平均数的概念本节难点平均数的特点、分类第一节集中趋势指标概述集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势即要寻找数据一般水平的代表值或中心值。第一节集中趋势指标概述集中趋势指标即统计平均数,是反映若干统计数据一般水平或集中趋势的综合指标。它可能表现为总体内各单位某一数量标志的一般水平,也可能表现为总体在某一段时期内的数量一般水平。统计平均数的特点统计平均数是一个代表值统计平均数是一个抽象值第一节集中趋势指标概述数据集中区变量xx统计平均数的作用两个同类现象而范围不同的总体一般水平。将同一总体、同一性质的平均数按时间先后顺序排列起来可以反映现象发展变化的过程、趋势、规律性。和统计分组结合,揭示现象之间的依存关系。第一节集中趋势指标概述类型第一节集中趋势指标概述动态平均数静态平均数统计平均数数值平均数位置平均数算术平均数调和平均数几何平均数众数分位数本节重点算术平均数、调和平均数的概念、性质及其计算方法本节难点众数、中位数、数值平均数等度量方法的选择问题第二节数值平均数一、算术平均数基本公式由于掌握的资料不同,在实际计算时又可以分别采用简单算术平均数和加权算术平均数的方法。第二节数值平均数总体标志值总数算术平均数总体单位数简单算术平均数资料未分组时可以采用简单算术平均数的方法。第二节数值平均数∑和号12nxxxxxnnxx第二节数值平均数n算术平均数变量值变量值的个数(三)加权算术平均数当资料已经分组则采用加权算术平均数的方法第二节数值平均数121221............nnnxxffxffffxxxfff其中,为各组变量值或组中值,各组为次数(四)需要注意的几个问题⒈加权算术平均数不仅受各个变量值大小的影响,而且受权数大小的影响。⒉权数可以用比重形式。第二节数值平均数1212......()nnfxxfffffffxxx(四)需要注意的几个问题⒊简单算术平均数是加权算术平均数的特例。第二节数值平均数121212122112......,..................)......nnnnnnfxfnfnffffffxxxfffxxxxxx若则有:((五)算术平均数的数学性质⒈各变量值与算术平均数的离差之和为零。这一性质说明算术平均数是一组数据的重心。第二节数值平均数()0()0xxxxf或(五)算术平均数的数学性质⒉各变量值与算术平均数的离差平方和为最小。第二节数值平均数22()min()minxxxxf或二、调和平均数又叫倒数平均数,即各变量值的倒数的算术平均数的倒数。调和平均数用表示。第二节数值平均数12121212121211111111mnHnnnnnmmmmxmmmmmmxxxxxxxmmmHx调和平均数上述公式是加权调和平均数的公式。若各变量值的权数都相等时,加权调和平均数简化为简单调和平均数。即:第二节数值平均数121111......Hnnnxxxxx调和平均数公式中的权数是各组的标志总量(算术平均数的分子数据)。当已知各组的变量值和算术平均数的分子数据,而缺乏分母数据时,可以采用调和平均数的形式来计算。调和平均数mxf第二节数值平均数f几何平均数几何平均数是n个变量值连乘积的n次方根,适应于计算平均比率和平均速度。根据掌握的资料不同,有简单几何平均数和加权几何平均数两种。简单几何平均数适应于已知每个比率或每个速度求平均数的情况。第二节数值平均数12......nnnGxxxxx几何平均数加权几何平均数适应于比率或速度已分组的情况。第二节数值平均数1212nffffffGnxxxxx本节小结本节主要讨论了算术平均数、调和平均数、几何平均数三种数值平均数的应用条件和计算方法,其中最常用的是算术平均数。第二节数值平均数本节重点众数、中位数的概念与计算方法本节难点众数、中位数的的定义第三节位置平均数一、众数第三节位置平均数众数是一组数据中出现次数最多的标志值。0m一、众数众数不仅适应于变量数列,也适应于品质数列。如销售量最多的服装款式或色彩,即通常所讲的“流行款式”,就属于这种意义上的众数。第三节位置平均数众数的确定⒈如果各标志值分布很均匀,无明显的变化,则数列无众数。2.如果是单项式数列或未分组的数据,出现次数最多的那一个标志值就是众数。3.由组距式数列确定众数,先根据次数的多少确定众数组,然后可按下述公式之一计算:第三节位置平均数112()mmdMoL下限公式计算公式212()mmdMoU上限公式第三节位置平均数二、中位数(Median)第三节位置平均数中位数是指将总体各单位标志值按照大小顺序排列后,处于中间位置的那个标志值,用Me表示。第三节位置平均数中位数将变量数列分为相等的两部分,一部分的标志值小于中位数,另一部分的标志值大于中位数。如何确定中位数?1.由未分组的数据确定中位数2.由单项数列确定中位数3.由组距数列确定中位数1.由未分组的数据确定中位数根据未分组的数据确定中位数时,首先将总体各单位的标志值资料按大小顺序排列,然后按照12n(n表示资料的项数)来确定中位数的位次,再根据中位数的位次找出对应的标志值即可。第三节位置平均数2.由单项数列确定中位数由单项数列确定中位数时,先向上或向下累计次数,然后按下式确定中位数的位次:12f根据中位数的位次,将累计次数刚好超过中位数位次组确定为中位数组,该组所对应的标志值即为中位数。第三节位置平均数3.由组距数列确定中位数由组距数列确定中位数,先向上或向下累计频数,然后按确定中位数的位次,再用公式计算中位数的近似值。方法同单项数列第三节位置平均数112()immmmfSdfMeU下限公式计算公式012()immmmfSdfMeL下限公式第三节位置平均数三、众数、中位数计算示例分组数据按年销售额分组营业员人数向上累计次数向下累计次数下限上限50-6060-7070-8080-9090-100100以上2448105603726合计第三节位置平均数三、众数、中位数计算示例计算过程(用EXCEL计算)按年销售额分组营业员人数向上累计次数向下累计次数下限上限50-6060-7070-8080-9090-100100以上244810560372624721772372743003002762281236326506070809010060708090100-合计300第三节位置平均数本节小结本节主要学习了众数和中位数两种位置平均数的应用场合、特点、确定方法。特别需要注意的是数列的集中趋势比较明显的时候计算众数才有意义,还要注意组距数列时众数和中位数的确定方法。第三节位置平均数本节的重点是:标志变异指标的概念标准差的计算方法本节的难点是:标志变异指标的定义和测度第四节离中趋势的度量一、离中趋势:含义离中趋势是指一组数据中各数据值以不同程度的距离偏离其中心(平均数)的趋势,又称标志变动度。第四节离中趋势的度量离中趋势指标是用来综合反映数据的离中程度的一类指标。极差分位差平均差方差标准差离散系数极差(Range)极差=最大变量值-最小变量值组距数列极差可近似值为:极差=最大组的上限-最小组的下限第四节离中趋势的度量优点计算简便含义清楚缺点没有考虑到中间变量值的变动情况,测定离中趋势时不准确。第四节离中趋势的度量分位差是从一组数据中剔除了一部分极端值之后重新计算的类似于极差的指标。常用的有四分位差、八分位差和十分位差等四分位差是第三个四分位数减去第一个四分位数的差的一半2第三个四分位数-第一个四分位数四分位差=第四节离中趋势的度量平均差平均差(Meandeviation)是数据组中各数据值与其算术平均数离差绝对值的算术平均数,常用符号“M.D”表示。简单平均式.xxMDn加权平均式.xxfMDf由于平均差是根据数列中所有数值计算出来的,受极端值影响较小,所以对整个统计数列的离中趋势有较充分的代表性。但是在计算过程中,数学处理方法不够理想,所以,其应用受限第四节离中趋势的度量方差Variance与标准差Standarddeviation方差是数据组中各数据值与其算术平均数离差平方的算术平均数。方差的平方根就是标准差。简单平均式2xxn加权平均式2xxff标准差是应用最广泛的离中趋势指标第四节离中趋势的度量离散系数(Coefficientofvariation)上述三个指标带有计量单位,而且其离中趋势大小与变量平均水平的高低有关。要比较数据平均水平不同的两组数据的离中程度的大小,就有必要计算它们的相对离中程度指标,即离散系数。常用的离散系数指标是标准差系数。第四节离中趋势的度量标准差系数是将一组数据的标准差与其算术平均数对比的结果。标准差系数100%Vx第四节离中趋势的度量本节小结标志变异指标的意义与测定既是本章的重点,也是整个统计学中的重要问题。特别要弄清楚标准差的计算原理、计算方法和离散系数的应用条件。第四节离中趋势的度量