BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-1第3章数值描述度量商务统计学(第5版)BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-2在本章中你将学到:描述数值型数据的集中趋势、变异程度和分布形状的特性计算总体的描述性总结度量构建和解释盒须图描述协方差和相关系数学习目标BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-3定义集中趋势(centraltendency)是一个所有的数据观测值组在一个典型或中心值周围的范围。变异程度(variation)是观测值与一个中心值散布或分散的量。分布形状(shape)是观测值从最低值到最高值分布的模式。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-4集中趋势的度量:算术平均数算术平均数(算术平均数又称为平均数,平均数)是最常见的集中趋势的度量。对于包含n个观测值的样本样本数nXXXnXXn21n1ii观测值第i个值读作x拔BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-5集中趋势的度量:算术平均数最常见的集中趋势的度量平均数=观测值的和除以观察值的个数受极端值的影响(异常值)(续)012345678910平均数=3012345678910平均数=4351555432145205104321BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-6集中趋势的度量:中位数中位数(中位数)是从最小到最大按顺序排列的数据正中间的数据值。(一半的观测值小于或等于中位数而一半的观测值大于或等于中位数。)中位数不受数据集中极端值的影响。012345678910中位数=3012345678910中位数=3BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-7集中趋势的度量:中位数的位置从最小到最大按顺序排列观测值,中位数的位置:如果数据集的观测值项数为奇数,中位数是排列在中间位置上的观测值。如果数据集的观测值项数为偶数,中位数介于数据集正中位置上两个观测值之间。中位数是两个中间观测值的算术平均数。需注意不是中位数的值,只是中位数在排序数据中的位置。位的21序排列在第按大小中位数观测值顺n21nBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-8集中趋势的度量:众数众数(mode)是在数据中发生频数最高的数据值。众数不受极端值的影响。可用于数值和属性数据。众数可能不存在。众数可能有多个。01234567891011121314众数=90123456没有众数BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-9集中趋势的度量:复习例子住房价格:$2,000,000$500,000$300,000$100,000$100,000总和$3,000,000平均数:($3,000,000/5)=$600,000中位数:排序数据的中间值=$300,000众数:出现最多的值=$100,000BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-10集中趋势的度量:选择哪种度量?平均数最常使用,除非存在极端值(异常值)。因为中位数对极端值不敏感,中位数也经常使用。例如,可能公布一个地区住房价格中位数,其对异常值比较不敏感。在某些情况下,同时公布平均数和中位数是有意义的。.BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-11集中趋势的度量:总结集中趋势算数平均数中位数众数nXXnii1有序数组的中间值最经常出现的观察值BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-12同样的中心,不同的变异程度变异程度的度量变异程度度量数据集中的观测值的离散程度(中位数),或散布程度(dispersion)。变异程度标准差变异系数全距方差BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-13变异程度的度量:全距变异程度最简单的度量。最大值和最小值之间的差异:全距=X最大–X最小01234567891011121314全距=13-1=12例子:BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-14变异程度的度量:为什么全距可能会误导忽略数据分布的方式对异常值敏感789101112全距=12-7=5789101112全距=12-7=51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120全距=5-1=4全距=120-1=119BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-15观察值相对其算术平均数的离差平方和样本方差:变异程度的度量:方差1-n)X(XSn1i2i2其中=算术平均数n=样本容量Xi=变量X的第i个观测值XBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-16变异程度的度量:标准差变异程度最常用的度量显示与平均数的变异程度方差的平方根与原始数据有相同的单位样本标准差:1-n)X(XSn1i2iBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-17变异程度的度量:标准差计算标准差的步骤:1.计算每一个观测值与平均数的差。2.计算差的平方。3.加总差的平方。4.将加总的和除以n-1得到样本方差。5.取样本方差的平方根得到样本标准差。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-18变异程度的度量:样本标准差:计算例子样本数据(Xi):1012141517181824n=8平均数=X=164.309571301816)(2416)(1416)(1216)(101n)X(24)X(14)X(12)X(10S22222222度量在平均数附近的“平均”散布BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-19变异程度的度量:比较标准差s平均数=15.5S=3.33811121314151617181920211112131415161718192021数据B数据A平均数=15.5S=0.9261112131415161718192021平均数=15.5S=4.570数据CBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-20变异程度的度量:比较标准差s较小的标准差较大的标准差BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-21变异程度的度量:特征汇总数据分布的越广,全距,方差和标准差就越大。数据分布的越集中,全距,方差和标准差就越小。如果所有的观测值都一样(没有变异程度),这些度量均为0。这些度量均不为负。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-22变异程度的度量:变异系数对变异程度的相对度量。总是表现为百分数(%)。度量的是数据相对于平均数的离散程度。变异系数可以用来比较两组或更多组用不同单位度量的数据。100%XSCVBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-23变异程度的度量:比较变异系数股票A:去年平均价格=$50标准差=$5股票B:去年平均价格=$100标准差=$5两只股票有相同的样本标准差,但是股票B相对其价格变化更小。10%100%$50$5100%XSCVA5%100%$100$5100%XSCVBBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-24识别极端异常值:Z值计算数据观测值的Z值,减去平均数后除以标准差。Z值是一个数据观测值距离平均数的标准差数。一个Z值如果小于-3.0或大于3.0被认为是异常值。Z值的绝对值越大,距离平均数越远。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-25识别极端异常值:Z值其中X表示数据观测值X为样本平均数S为样本标准差SXXZBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-26识别极端异常值:Z值假如数学成绩平均数是490,标准差是100。计算数学成绩620的Z值。3.1100130100490620SXXZ数学成绩620在平均数之上1.3标准差,不认为是异常值。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-27分布形状描述数据是如何分布的。分布形状的度量对称或有偏的。平均数=中位数平均数中位数中位数平均数右偏左偏对称BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-28用MicrosoftExcel进行统计描述1.选择Tools.2.选择DataAnalysis.3.选择DescriptiveStatistics并且点击OK.BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-29用MicrosoftExcel进行统计描述4.输入全距.5选中SummaryStatisticsbox.6.点击OKExcel输出使用住房价格数据,MicrosoftExcel统计描述输出:住房价格:$2,000,000500,000300,000100,000100,000Chap3-30BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Minitab输出BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-31DescriptiveStatistics:HousePriceTotal