商务统计学Ch03

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-1第3章数值描述度量商务统计学(第5版)BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-2在本章中你将学到:描述数值型数据的集中趋势、变异程度和分布形状的特性计算总体的描述性总结度量构建和解释盒须图描述协方差和相关系数学习目标BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-3定义集中趋势(centraltendency)是一个所有的数据观测值组在一个典型或中心值周围的范围。变异程度(variation)是观测值与一个中心值散布或分散的量。分布形状(shape)是观测值从最低值到最高值分布的模式。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-4集中趋势的度量:算术平均数算术平均数(算术平均数又称为平均数,平均数)是最常见的集中趋势的度量。对于包含n个观测值的样本样本数nXXXnXXn21n1ii观测值第i个值读作x拔BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-5集中趋势的度量:算术平均数最常见的集中趋势的度量平均数=观测值的和除以观察值的个数受极端值的影响(异常值)(续)012345678910平均数=3012345678910平均数=4351555432145205104321BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-6集中趋势的度量:中位数中位数(中位数)是从最小到最大按顺序排列的数据正中间的数据值。(一半的观测值小于或等于中位数而一半的观测值大于或等于中位数。)中位数不受数据集中极端值的影响。012345678910中位数=3012345678910中位数=3BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-7集中趋势的度量:中位数的位置从最小到最大按顺序排列观测值,中位数的位置:如果数据集的观测值项数为奇数,中位数是排列在中间位置上的观测值。如果数据集的观测值项数为偶数,中位数介于数据集正中位置上两个观测值之间。中位数是两个中间观测值的算术平均数。需注意不是中位数的值,只是中位数在排序数据中的位置。位的21序排列在第按大小中位数观测值顺n21nBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-8集中趋势的度量:众数众数(mode)是在数据中发生频数最高的数据值。众数不受极端值的影响。可用于数值和属性数据。众数可能不存在。众数可能有多个。01234567891011121314众数=90123456没有众数BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-9集中趋势的度量:复习例子住房价格:$2,000,000$500,000$300,000$100,000$100,000总和$3,000,000平均数:($3,000,000/5)=$600,000中位数:排序数据的中间值=$300,000众数:出现最多的值=$100,000BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-10集中趋势的度量:选择哪种度量?平均数最常使用,除非存在极端值(异常值)。因为中位数对极端值不敏感,中位数也经常使用。例如,可能公布一个地区住房价格中位数,其对异常值比较不敏感。在某些情况下,同时公布平均数和中位数是有意义的。.BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-11集中趋势的度量:总结集中趋势算数平均数中位数众数nXXnii1有序数组的中间值最经常出现的观察值BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-12同样的中心,不同的变异程度变异程度的度量变异程度度量数据集中的观测值的离散程度(中位数),或散布程度(dispersion)。变异程度标准差变异系数全距方差BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-13变异程度的度量:全距变异程度最简单的度量。最大值和最小值之间的差异:全距=X最大–X最小01234567891011121314全距=13-1=12例子:BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-14变异程度的度量:为什么全距可能会误导忽略数据分布的方式对异常值敏感789101112全距=12-7=5789101112全距=12-7=51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120全距=5-1=4全距=120-1=119BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-15观察值相对其算术平均数的离差平方和样本方差:变异程度的度量:方差1-n)X(XSn1i2i2其中=算术平均数n=样本容量Xi=变量X的第i个观测值XBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-16变异程度的度量:标准差变异程度最常用的度量显示与平均数的变异程度方差的平方根与原始数据有相同的单位样本标准差:1-n)X(XSn1i2iBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-17变异程度的度量:标准差计算标准差的步骤:1.计算每一个观测值与平均数的差。2.计算差的平方。3.加总差的平方。4.将加总的和除以n-1得到样本方差。5.取样本方差的平方根得到样本标准差。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-18变异程度的度量:样本标准差:计算例子样本数据(Xi):1012141517181824n=8平均数=X=164.309571301816)(2416)(1416)(1216)(101n)X(24)X(14)X(12)X(10S22222222度量在平均数附近的“平均”散布BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-19变异程度的度量:比较标准差s平均数=15.5S=3.33811121314151617181920211112131415161718192021数据B数据A平均数=15.5S=0.9261112131415161718192021平均数=15.5S=4.570数据CBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-20变异程度的度量:比较标准差s较小的标准差较大的标准差BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-21变异程度的度量:特征汇总数据分布的越广,全距,方差和标准差就越大。数据分布的越集中,全距,方差和标准差就越小。如果所有的观测值都一样(没有变异程度),这些度量均为0。这些度量均不为负。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-22变异程度的度量:变异系数对变异程度的相对度量。总是表现为百分数(%)。度量的是数据相对于平均数的离散程度。变异系数可以用来比较两组或更多组用不同单位度量的数据。100%XSCVBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-23变异程度的度量:比较变异系数股票A:去年平均价格=$50标准差=$5股票B:去年平均价格=$100标准差=$5两只股票有相同的样本标准差,但是股票B相对其价格变化更小。10%100%$50$5100%XSCVA5%100%$100$5100%XSCVBBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-24识别极端异常值:Z值计算数据观测值的Z值,减去平均数后除以标准差。Z值是一个数据观测值距离平均数的标准差数。一个Z值如果小于-3.0或大于3.0被认为是异常值。Z值的绝对值越大,距离平均数越远。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-25识别极端异常值:Z值其中X表示数据观测值X为样本平均数S为样本标准差SXXZBusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-26识别极端异常值:Z值假如数学成绩平均数是490,标准差是100。计算数学成绩620的Z值。3.1100130100490620SXXZ数学成绩620在平均数之上1.3标准差,不认为是异常值。BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-27分布形状描述数据是如何分布的。分布形状的度量对称或有偏的。平均数=中位数平均数中位数中位数平均数右偏左偏对称BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-28用MicrosoftExcel进行统计描述1.选择Tools.2.选择DataAnalysis.3.选择DescriptiveStatistics并且点击OK.BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-29用MicrosoftExcel进行统计描述4.输入全距.5选中SummaryStatisticsbox.6.点击OKExcel输出使用住房价格数据,MicrosoftExcel统计描述输出:住房价格:$2,000,000500,000300,000100,000100,000Chap3-30BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Minitab输出BusinessStatistics:AFirstCourse,5e©2009Prentice-Hall,Inc.Chap3-31DescriptiveStatistics:HousePriceTotal

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功