STAT第四章变量数列分析★•集中趋势的测定•离中趋势的测定STAT第一节集中趋势的测定一、集中趋势的涵义二、平均指标的种类及计算方法★指总体中各单位的次数分布从两边向中间集中的趋势,用平均指标来反映。集中趋势可以反映现象总体的客观规定性;可以对比同类现象在不同的时间、地点和条件下的一般水平;可以分析现象之间的依存关系。测定集中趋势的意义:指同质总体中各单位某一数量标志的一般水平,是对总体单位间数量差异的抽象化STAT二、平均指标的种类及计算方法㈠算术平均数㈡调和平均数㈢几何平均数㈣中位数㈤众数数值平均数位置平均数★总体单位总数总体标志总量平均数算术基本形式:总产量总成本平均成本职工人数工资总额平均工资例:直接承担者※注意区分算术平均数与强度相对数算术平均数A.简单算术平均数——适用于总体资料未经分组整理、尚为原始资料的情况NXNXXXXNiiN121式中:为算术平均数;为总体单位总数;为第个单位的标志值。iiXNX算术平均数的计算方法平均每人日销售额为:元558527905440750480600520NXX算术平均数的计算方法某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则【例】B.加权算术平均数——适用于总体资料经过分组整理形成变量数列的情况miimiiimmmffXffffXfXfXX11212211式中:为算术平均数;为第组的次数;为组数;为第组的标志值或组中值。XiXifimi算术平均数的计算方法【例】某企业某日工人的日产量资料如下:日产量(件)工人人数(人)101112131470100380150100合计800Xf计算该企业该日全部工人的平均日产量。算术平均数的计算方法件)(1375.1280097101007010014701011miimiiiffXX解:算术平均数的计算方法若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。说明miimiiiffXX11分析:成绩(分)人数(人)甲班乙班丙班603915010013950平均成绩(分)619980起到权衡轻重的作用算术平均数的计算方法决定平均数的变动范围表现为次数、频数、单位数;即公式中的fXfXf表现为频率、比重;即公式中的ffXfXfXff算术平均数的计算方法指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度权数绝对权数相对权数⒈变量值与其算术平均数的离差之和衡等于零,即:⒉变量值与其算术平均数的离差平方和为最小,即:0)(xxmin)(2xx算术平均数的主要数学性质【例】设X=(2,4,6,8),则其调和平均数可由定义计算如下:⒉再求算术平均数:481614121⒈求各标志值的倒数:,,,21416181⒊再求倒数:816141214是总体各单位标志值倒数的算术平均数的倒数,又叫倒数平均数调和平均数A.简单调和平均数——适用于总体资料未经分组整理、尚为原始资料的情况XmXXXmXmH111121式中:为调和平均数;为变量值的个数;为第个变量值。iiXmHX调和平均数的计算方法B.加权调和平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为第组的变量值;为第组的标志总量。imiXiimXmXmXmXmmmmXmmmH1221121调和平均数的计算方法——当己知各组变量值和标志总量时,作为算术平均数的变形使用。因为:XfXfXfXXfmXmXXfmH11,则设调和平均数的应用日产量(件)各组工人日总产量(件)10111213147001100456019501400合计9710【例】某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。调和平均数的应用Xm件1375.1280097101414001070097101mXmXH即该企业该日全部工人的平均日产量为12.1375件。调和平均数的应用解:求解比值的平均数的方法由于比值(平均数或相对数)不能直接相加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比设比值iiifmX分子变量分母变量则有:miXmffXmiiiiii,,2,1,,mXmfXffmX1求解比值的平均数的方法己知,采用基本平均数公式fm、己知,采用加权算术平均数公式fX、己知,采用加权调和平均数公式mX、比值iiifmX【例A】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900计算该公司该季度的平均计划完成程度。求解比值的平均数的方法【例A】某季度某工业公司18个工业企业产值计划完成情况如下:计划完成程度(﹪)组中值(﹪)企业数(个)计划产值(万元)90以下90~100100~110110以上8595105115231038002500172004400合计—1824900计算该公司该季度的平均计划完成程度。求解比值的平均数的方法fmX计划产值实际产值程度计划完成分析:Xf应采用加权算术平均数公式计算﹪12.10524900261754400800440015.180085.0fXfX【例B】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):组别企业数(个)计划产值(万元)实际产值(万元)12342310380025001720044006802375180605060合计182490026175计算该公司该季度的平均计划完成程度。求解比值的平均数的方法【例B】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分组):组别企业数(个)计划产值(万元)实际产值(万元)12342310380025001720044006802375180605060合计182490026175计算该公司该季度的平均计划完成程度。求解比值的平均数的方法fmX计划产值实际产值程度计划完成分析:fm应采用平均数的基本公式计算﹪12.1052490026175fmX是N项变量值连乘积的开N次方根几何平均数用于计算现象的平均比率或平均速度应用:各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不为零或负值。应用的前提条件:A.简单几何平均数——适用于总体资料未经分组整理尚为原始资料的情况式中:为几何平均数;为变量值的个数;为第个变量值。iiXNGXNNNGXXXXX21几何平均数的计算方法【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95﹪、92﹪、90﹪、85﹪、80﹪,求整个流水生产线产品的平均合格率。分析:设最初投产100A个单位,则第一道工序的合格品为100A×0.95;第二道工序的合格品为(100A×0.95)×0.92;……第五道工序的合格品为(100A×0.95×0.92×0.90×0.85)×0.80;因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为100A×0.95×0.92×0.90×0.85×0.80;则该流水线产品总的合格率为:80.085.090.092.095.0100A80.085.090.092.00.95100A总产品总合格品即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为100A×0.95×0.92×0.90×0.85×0.80;则该流水线产品总的合格率为:80.085.090.092.095.0100A80.085.090.092.00.95100A总产品总合格品即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。﹪24.885349.080.085.090.092.095.055GX解:B.加权几何平均数——适用于总体资料经过分组整理形成变量数列的情况式中:为几何平均数;为第组的次数;为组数;为第组的标志值或组中值。GXiXifimimiiimiimfmififfmffGXXXXX1121121几何平均数的计算方法【例】某金融机构以复利计息。近12年来的年利率有4年为3﹪,2年为5﹪,2年为8﹪,3年为10﹪,1年为15﹪。求平均年利率。设本金为V,则至各年末的本利和应为:第1年末的本利和为:﹪31V﹪﹪3131V第2年末的本利和为:………………﹪﹪﹪﹪﹪1511018151313224V第12年末的本利和为:分析:第2年的计息基础第12年的计息基础15.010.05130.01V15.010.05130.01V2424本金总的本利和则该笔本金12年总的本利率为:即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。﹪﹪平均年利率﹪85.6185.106185.1062154.215.0105.0103.011212424GGXX解:是否为比率或速度各个比率或速度的连乘积是否等于总比率或总速度是否为其他比值ffGNGXXXX是否否是否是几何平均法fXfXNXX算术平均法mXmfXffmX1求解比值的平均数的方法数值平均数计算公式的选用顺序指标STAT将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用表示eM中位数不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。中位数的作用:二、平均指标的种类及计算方法中位数的位次为:321521N即第3个单位的标志值就是中位数元520eM【例A】某售货小组5个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元,则中位数的确定(未分组资料)中位数的位次为:5.321621N中位数应为第3和第4个单位标志值的算术平均数,即元5602600520eM【例B】若上述售货小组为6个人,某天的销售额按从小到大的顺序排列为440元、480元、520元、600元、750元、760元,则中位数的确定(未分组资料)【例C】某企业某日工人的日产量资料如下:日产量(件)工人人数(人)向上累计次数(人)10111213147010038015010070170550700800合计800—Xf计算该企业该日全部工人日产量的中位数。中位数的位次:5.40021800eM中位数的确定(单值数列)中位数的确定(组距数列)【例D】某车间50名工人月产量的资料如下:月产量(件)工人人数(人)向上累计次数(人)200以下200~400400~600600以上373283104250合计50—计算该车间工人月产量的中位数。XfdfSfLMmme12件75.4934006003210250400eM中位数的确定(组距数列)共个单位2f共个单位2f共个单位1mS共个单位1mSLU中位数组组距为d共个单位mf假定该组内的单位呈均匀分布共有单位数12mSf中位数下限公式为dfSfLMmme12该段长度应为dfSfmm12STAT指总体中出现次数最多