第三节总体变量集中与离中趋势的统计描述统计原理第三章第三节二、离中趋势的代表值一、集中趋势的代表值三、变量值、平均值与标准差的关系一、集中趋势的代表值统计原理第三章第三节(一)算术平均数算术平均数是最常用的平均指标和方法,表现形式为有名数。根据内容,其计量单位有时全部表示出来,是一种复合单位。有时只写出一个,表现为单名数。算术平均数的基本计算公式是:总体标志总量总体单位总量算术平均数=依据资料的条件不同,具体计算方法可分为简单算术平均数和加权算术平均数。一、集中趋势的代表值统计原理第三章第三节(一)算术平均数1.简单算术平均数式中:简单算术平均数就是将总体各个单位的标志值相加除以总体单位数求得。如果用字母表示,其计算公式为:一、集中趋势的代表值统计原理第三章第三节(一)算术平均数2.加权算术平均数(1)根据单项变量分布数列计算算术平均数。用字母表示为,其计算公式为:加权算术平均数是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得。计算公式为:一、集中趋势的代表值统计原理第三章第三节(一)算术平均数利用分组数据计算算术平均数的过程是:①表内,根据x栏与f栏内数值计算出xf栏内数值。xf栏为各组变量总值,xf栏的合计数为总体变量总值。②表外,将Σxf(变量总值)和Σf(总频数)代入公式,计算出算术平均数。式中:fi——第i组的变量值出现的次数,即频数。一、集中趋势的代表值统计原理第三章第三节(一)算术平均数某生产组10名工人生产甲产品,日产量分组资料如表3-5所示,计算工人的平均日产量。举例表3-5算术平均数计算表之一一、集中趋势的代表值统计原理第三章第三节(一)算术平均数根据资料,可以计算该生产组10名工人的平均日产量为:由此可见,平均日产量26件趋向于工人人数最多,即频数最大的那个变量值--30件。如果上例中变量数列的各个变量值x不变,各组的工人分布有所变化,则可得表3-6的分布数列。解答一、集中趋势的代表值统计原理第三章第三节(一)算术平均数表3-6算术平均数计算表之二根据资料,可以计算该生产组10名工人的平均日产量为:解答一、集中趋势的代表值统计原理第三章第三节(一)算术平均数由上例可以看出,用分组数据计算平均数,平均值的大小受两个因素影响:一个是各组变量值x,另一个是各组次数即频数f的影响。当各组变量值x不变时,各组次数即频数f对平均值的大小起着权衡轻重的作用。因此,次数f称为权数,这种方法称为加权算术平均法。权数不仅可以用绝对数f表示,也可用相对数即频率f/Σf表示。即:解答一、集中趋势的代表值统计原理第三章第三节(一)算术平均数仍用表3-5中的资料,用频率作权数来计算加权算术平均数,结果见表3-7。举例一、集中趋势的代表值统计原理第三章第三节(一)算术平均数根据资料,计算加权算术平均数为:解答一、集中趋势的代表值统计原理第三章第三节(一)算术平均数2.加权算术平均数(2)根据组距变量分布数列计算算术平均数。若掌握组距数列资料,计算方法是:先计算组中值xi,然后再按上述方法计算加权算术平均数。如表3-8所示。一、集中趋势的代表值统计原理第三章第三节(一)算术平均数2.加权算术平均数日产量(件)组中值(件)x工人数(人)xfx·f/Σfff/Σf400以下35050.083175029.05400~500450130.217585097.65500~600550180.3009900165.00600~700650150.2509750162.50700~80075070.117525087.75800以上85020.033170028.05合计—601.00034200570.00表3-8组距数列加权算术平均数计算表一、集中趋势的代表值统计原理第三章第三节(一)算术平均数2.加权算术平均数组中值的一般计算方法是:闭口组(上下限齐全)的组中值,可按下列公式计算:缺上限或下限的开口组的组中值,可按下列公式计算:一、集中趋势的代表值统计原理第三章第三节(一)算术平均数2.加权算术平均数根据资料,计算平均日包装量的过程为:缺上限或下限的开口组的组中值,可按下列公式计算:综上,简单算术平均数与加权算术平均数之间没有根本区别,它们的基本公式都是相同的:算术平均数=变量值总量/单位总量一、集中趋势的代表值统计原理第三章第三节(二)调和平均数在实际统计工作中,有时由于资料的原因不能直接计算算术平均数,可采用调和平均数的形式间接计算出算术平均数,其计算结果与算术平均数相同。因此,在这种情况下,我们把对调和平均数形式的应用,看成是算术平均数的变形形式。*一、集中趋势的代表值统计原理第三章第三节(二)调和平均数在市场经济中,商品价格放开,同一种商品售价可以在一定范围内上下浮动。现有某种商品在三个不同商场某期的单位价格及销售量资料,如表3-9所示。*举例商场名称价格(元)x销售额(元)m甲0.8020000乙1.0021000丙1.2018000合计—59000表3-9某期某商品价格及销售量资料要求计算该种商品的平均价格。计算过程见表3-10。一、集中趋势的代表值统计原理第三章第三节(二)调和平均数根据资料计算:*解答一、集中趋势的代表值统计原理第三章第三节(二)调和平均数调和平均数有以下特点:(1)调和平均数由于是根据所有变量值计算的,所以易受极端值的影响。当数列分布呈明显偏态时,调和平均数的代表性也会受到影响。(2)当数列中有一数据值为0时,无法计算调和平均数。*一、集中趋势的代表值统计原理第三章第三节(三)众数*众数概念众数是指在总体各单位的某一数量标志上,出现次数最多的那个标志值。众数也是变量值集中趋势的代表值。1.根据单项数列确定众数在分组整理的单项式变量分布数列中,可以通过观察直接寻找到众数。2.根据组距数列确定众数在组距数列中,众数是频数最多一组的组中值。一、集中趋势的代表值统计原理第三章第三节(四)中位数*中位数概念中位数是指把总体中的各个单位,按某一数量标志值的大小顺序排列,处于中间位置的那个标志值。一、集中趋势的代表值统计原理第三章第三节(四)中位数*1.根据原始数据计算中位数根据原始数据计算中位数的过程是:将一组原始数据按照从大到小(或从小到大)的顺序排列,那么位居中点位置上的那个变量值就是中位数。中点位置用下列公式确定:中点位置=n+1/2式中n代表总频数。如果数列项数为奇数,中位数就是中点位置的变量值。一、集中趋势的代表值统计原理第三章第三节(四)中位数*2.根据单项式数列计算中位数在单项式数列中,先计算各组的累计次数,然后根据中点位置的计算公式确定中位数所在的组,该组的变量值就是中位数。中点位置=Σf/2二、离中趋势的代表值统计原理第三章第三节(一)离中趋势统计描述的意义和作用1.离中趋势统计描述的意义变量的离散状况可以用变量的离散范围和离散程度来反映,它们是变量数量特征的另一个方面。要进一步描述和刻画变量分布的数量特征,就需要计算变量的离中趋势,它是与集中趋势相辅相成,共同反映变量分布规律性的一对对立统一的数量代表值。二、离中趋势的代表值统计原理第三章第三节(一)离中趋势统计描述的意义和作用2.离中趋势统计描述的作用4321能够反映总体各单位标志值分布的离中趋势可以说明和比较平均指标代表性的高低可以说明和比较社会经济现象的均衡、稳定和协调性的高低变异指标是推断统计的重要依据二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法1.极差极差也称为全距,是变量分布中最大值与最小值之差。它是描述变量离散状况最简单的测量值,用公式可表示为:全距(R)=最大变量值-最小变量值式中:R表示极差。二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法2.标准差标准差是测定标志变动程度的主要指标。标准差是总体单位各变量值与其平均数的离差平方的算术平均数的平方根。习惯上用字母“σ”表示。标准差的计量单位与变量值的计量单位相同。由于算术平均数有简单算术平均数和加权算术平均数之分,与算术平均数的这种区分相对应的标准差,也有简单式和加权式两种。二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法2.标准差(1)简单式标准差如果算术平均数是采用简单平均法计算的,则标准差也采用简单式。其计算公式如下:二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法2.标准差(2)加权式标准差如果算术平均数是采用加权平均法计算的,则标准差也就是加权式。计算公式如下:二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法3.离散系数离散系数有几种,常使用的是标准差系数,它是利用反映某种现象变量分布状况的标准差除以平均数来表明每单位平均数的离散程度,用百分数表示,是变量分散性的一个相对度量。标准差系数习惯上用字母“Vσ”表示。计算公式为:二、离中趋势的代表值统计原理第三章第三节(二)离中趋势代表值的计算方法离散系数的用途(1)(2)(3)比较总体相同,而计量单位不同的两组变量数列的离散程度。比较计量单位相同,而平均数差异悬殊的两组变量的离散程度。比较总体不同,计量单位也不相同的两组变量的离散程度。三、变量值、平均值与标准差的关系统计原理第三章第三节平均数通常被用来寻找变量分布的中心值;标准差度量了各变量值对于平均数的离散程度。中心值与各变量值分布的关系可通过正态分布方式来展示。标准差可以直接地、概括地、平均地描述变量的离散程度,是变量分布中各变量值xi距离它们的中心值平均数x远近的一种尺度。概率论指出:在正态分布中,有68%(近似值)的变量值分布在离平均数1个σ范围内,95%的变量值分布在离平均数2个σ范围内,其余的5%的变量值则离得较远,如图3-3所示。*三、变量值、平均值与标准差的关系统计原理第三章第三节*