《统计学》-单薇主编-第3章数据特征的度量.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学STATISTICS2-1第3章数据特征的度量3.1数据集中程度的度量3.2数据离散程度的度量3.3数据分布的偏度与峰度的度量3.4SPSS在描述统计中应用-描述统计与数据分布特征的测度本章小结统计学STATISTICS2-2学习目标•掌握集中趋势测度方法及意义•掌握离散趋势测度方法及意义•了解偏态与峰度的测度方法及意义统计学STATISTICS数据集中程度的度量数据集中程度的度量反映的是数据一般水平的代表值或者数据分布的中心值。从不同的角度考虑,集中程度的测度值有多个,我们将一一介绍。统计学STATISTICS3.1.1均值3.1.2调和平均数3.1.3几何平均数3.1.4中位数3.1.5分位数3.1.6众数3.1.7众数、中位数和均值的关系3.1数据集中程度的度量统计学STATISTICS2-53.1.1均值(mean)1.集中程度的最常用测度值2.一组数据的均衡点所在3.易受极端值的影响4.用于数值型数据,不能用于分类数据和顺序数据统计学STATISTICS2-6简单均值(simplemean)设一组数据为:x1,x2,…,xn总体均值NxNxxxniiN121样本均值nxnxxxxniin121统计学STATISTICS2-7加权均值(weightedmean)设一组数据为:x1,x2,…,xk相应的频数为:f1,f2,…,fk总体均值niikiiikkkffxffffxfxfxx11212211样本均值KiiKiiiKKKffxffffxfxfx11212211统计学STATISTICS2-8统计学STATISTICS2-9均值(数学性质)1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小niixx12min)(niixx10)(统计学STATISTICS2-103.1.2调和平均数(Harmonicmean)1、集中程度的测度值之一,又称为倒数平均数2、易受极端值的影响3、常用于特定数据的计算统计学STATISTICS2-11计算公式设一组数据为:x1,x2,…,xnniinnxnxxxnnxxxH1212111...111...111统计学STATISTICS2-12调和平均数例题(Harmonicmean)统计学STATISTICS2-133.1.3几何平均数(geometricmean)1.n个变量值乘积的n次方根2.适用于对比率数据的平均3.主要用于计算平均增长率统计学STATISTICS2-14计算公式设一组数据为:x1,x2,…,xnnniinnxxxxG121...统计学STATISTICS2-15几何平均数(例题分析)【例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率%0787.81%9.101%5.125%1.102%5.1044G统计学STATISTICS2-163.1.4中位数(median)1.排序后处于中间位置上的值Me50%50%2.不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能用于分类数据4.各变量值与中位数的离差绝对值之和最小,即min1eniiMx统计学STATISTICS2-17中位数(位置的确定)未分组数据:分组数据:21n中位数位置2n中位数位置统计学STATISTICS2-18数值型数据的中位数(5个数据算例)【例】5个工人日产量原始数据:38549排序:34589中位数5321521n位置统计学STATISTICS2-19数值型数据的中位数(6个数据的算例)【例】:6个工人日产量原始数据:3854911排序:34589115.321621n中位数5.6285位置统计学STATISTICS2-20分组数据的中位数公式ifSNLMmme12N/2表示中位数所在位置;L表示中位数所在组的下组限;Sm-1表示中位数所在组以前各组的累积次数;fm表示中位数所在组的次数;i表示中位数所在组的组距统计学STATISTICS2-21分组数据中位数例题统计学STATISTICS2-223.1.5分位数中位数是将统计分布从中间分成面积(即数据个数)相等的两部分,与中位数性质相似的还有四分位数(quartile)、十分位数(decile)、和百分位数(percentile)。显然,四分位数就是将数据分布4等分的三个数值,其中中间的四分位数就是中位数。十分位数和百分位数分别是将数据分布10等分和100等分的数值。统计学STATISTICS2-23四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据Q1QMQ325%25%25%25%统计学STATISTICS2-24四分位数(位置的确定)未分组数据:4)1(34131nQnQ分组数据:43431nQnQ统计学STATISTICS2-25数值型数据的四分位数(11个数据的算例)统计学STATISTICS2-26数值型数据的四分位数(12个数据的算例)统计学STATISTICS2-273.1.6众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据统计学STATISTICS2-28众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242统计学STATISTICS2-29分组数据的众数的计算公式iLM21100M表示众数L表示众数所在组的下组限21,分别表示众数组次数与前一组次数之差和与后一组次数之差i表示众数组的组距统计学STATISTICS2-30分组数据众数例题统计学STATISTICS2-31众数、中位数和均值的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值统计学STATISTICS2-32众数、中位数、均值的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.均值易受极端值影响数学性质优良数据对称分布或接近对称分布时应用统计学STATISTICS3.2.1极差3.2.2内距3.2.3方差和标准差3.2.4离散系数3.2数据离散程度的度量统计学STATISTICS2-343.2.1极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910R=max(xi)-min(xi)5.计算公式为统计学STATISTICS2-353.2.2内距(Inter-QuartileRange,IQR)1.也称四分位差2.上四分位数与下四分位数之差内距=Q3–Q13.反映了中间50%数据的离散程度4.不受极端值的影响5.可用于衡量中位数的代表性统计学STATISTICS2-363.2.3标准差和方差(VarianceandStandarddeviation)1.离散程度的主要测度值2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012x=8.3统计学STATISTICS2-37总体方差和标准差(PopulationvarianceandStandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式NxNii122)(NfxKiii122)(NxNii12)(NfxKiii12)(统计学STATISTICS2-38样本方差和标准差(simplevarianceandstandarddeviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!1)(122nxxsnii1)(122nfxxskiii1)(12nxxsnii1)(12nfxxskiii统计学STATISTICS2-39样本方差自由度(degreeoffreedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量统计学STATISTICS2-40样本标准差计算例题统计学STATISTICS2-413.2.4离散系数(coefficientofvariation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为vxsvs统计学STATISTICS2-42离散系数(例题分析)统计学考试成绩分析专业平均成绩(分)标准差(分)会计学金融学76.574.310.89.212.03.742.914.05.768.1021xvxv结论:计算结果表明v1v2,说明金融专业的同学成绩分布比较均匀,平均成绩的代表性更强。统计学STATISTICS2-433.3数据分布偏度和峰度的度量通过计算偏度和峰度系数可以全面了解数据分布的形状偏度----数据分布偏斜方向和程度峰度----数据分布的尖峭程度统计学STATISTICS2-441.偏度的计算313)(nsfxxSKkiii当sk=0时,分布对称当sk0时,分布右偏当sk0时,分布左偏3.3.1偏度2.偏度的判别统计学STATISTICS偏度峰度计算例题结论:日产量为左偏平峰分布统计学STATISTICS2-463.3.2峰度414()3,kiiixxfKnsK是峰度系数。统计学STATISTICS2-473.4SPSS在描述统计中应用统计学STATISTICS2-48统计学STATISTICS2-49统计学STATISTICS2-50统计学STATISTICS2-51本章小结1.数据集中趋势的测度。均值、众数、中位数的意义及计算2.数据离散程度的测度。标准差,离散系数的意义和计算统计学STATISTICS2-52思考题某百货公司冬天连续60天的销售额数据分组如下页表(单位:万元),试计算该组数据的平均数、中位数、众数。统计学STATISTICS2-53按销售额分组频数()组中值()280~2901285290~3003295300~3109305310~32010315320~33013325330~34011335340~3508345350~3605355ififix

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功