统计学第2章用图表展示数据

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据分析(方法与案例)作者贾俊平统计学2-2统计学STATISTICS(第五版)2019-9-20图并没有说谎,是说谎者在画图。——BenjaminDisraeli统计名言第2章用图表展示数据2.1用图表展示定性数据2.2用图表展示定量数据2.3合理使用图表2-4统计学STATISTICS(第五版)2019-9-20学习目标定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用Excel和SPSS作频数分布表和图形合理使用图表2-5统计学STATISTICS(第五版)2019-9-20用哪些图形展示奖牌?2009年7月26日至8月3日第13届世界游泳锦标赛在意大利罗马举行。美国的泳坛霸主地位难以撼动,中国军团也创造了史上第二的佳绩在本届游泳世锦赛上,中国代表团取得金牌数和奖牌与美国并列第一、奖牌榜排名第二的好成绩,而且中国男子游泳首次夺得世界性大赛的冠军并一举打破世界纪录。本届游泳世锦赛共设有奖牌227枚,其中金牌75枚、银牌75枚、铜牌77枚。下表是本届游泳世锦赛金牌总数取得前三名的国家所获得奖牌的分布情况2-6统计学STATISTICS(第五版)2019-9-20用哪些图形展示奖牌?根据上面的数据,你认为可以选择哪些图形来展示三个国家所获得的奖牌情况?学完本章的图表展示技术,这样的问题就会迎刃而解2-7统计学STATISTICS(第五版)2019-9-20统计应用把数据画图之后,要用用脑袋沃德(AbrahamWald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航资料来源:DavidS.Mroore2.1用图表展示定性数据2.1.1生成频数分布表2.1.2定性数据的图示第2章用图表展示数据2.1.1生成频数分布表2.1用图表展示定性数据2-10统计学STATISTICS(第五版)2019-9-20生成频数分布表(定性数据)1.列出各类别2.计算各类别的频数3.生成频数分布表分类频数比例百分比比率ABCDE2-11统计学STATISTICS(第五版)2019-9-20定性数据的描述统计量1.频数(frequency):落在各类别中的数据个数2.比例(proportion):某一类别数据个数占全部数据个数的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值个数的比值2-12统计学STATISTICS(第五版)2019-9-20生成频数分布表(定性数据)【例2-1】为研究人们对不同类型软饮料的偏好情况,一家调查公司在某超市随机调查了50名消费者。右表是顾客性别及其所偏好的饮料类型记录。生成频数分布表,观察不同性别的消费者及其所偏好的饮料类型的分布状况,并进行描述性分析制作频数分布表2-13统计学STATISTICS(第五版)2019-9-20生成频数分布表(列联表—Excel)不同类型饮料和不同性别消费者的频数分布用数据透视表生成定性数据的频数分布2-14统计学STATISTICS(第五版)2019-9-20生成频数分布表(定性数据—SPSS)生成频数分布表2-15统计学STATISTICS(第五版)2019-9-20列联表的描述性分析(例题分析—SPSS)列联表的统计描述2-16统计学STATISTICS(第五版)2019-9-20列联表的描述性分析(例题分析—SPSS)列联表的统计描述2-17统计学STATISTICS(第五版)2019-9-20数据透视表(pivottable)1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题数据透视表2-18统计学STATISTICS(第五版)2019-9-20生成频数分布表(列联表—Excel)大学生生活费支出的频数分布2.1.2定性数据的图示2.1用图表展示定性数据2-20统计学STATISTICS(第五版)2019-9-20条形图(barChart)1.用宽度相同的条形的高度或长短来表示各类别数据2.各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(columnchart)2-21统计学STATISTICS(第五版)2019-9-20复式条形图(barChart)饮料类型和消费者性别的条形图(SPSS的输出)2-22统计学STATISTICS(第五版)2019-9-20帕累托图(paretochart)1.按各类别数据出现的频数多少排序后绘制的柱形图2.用于展示分类数据的分布2-23统计学STATISTICS(第五版)2019-9-20简单饼图(pieChart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题2-24统计学STATISTICS(第五版)2019-9-20复式饼图(pieChart)主要用于展示两个或多个分类变量的构成比较,比如,在男女分类的基础上又增加了饮料类型的分类。2-25统计学STATISTICS(第五版)2019-9-20环形图(doughnutchart)1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究2-26统计学STATISTICS(第五版)2019-9-20环形图(doughnutchart)【例2-2】2011年北京、天津、上海和重庆地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较四个地区的生产总值构成绘制环形图2-27统计学STATISTICS(第五版)2019-9-20环形图(doughnutchart)北京、天津、上海和重庆地区按收入法计算的地区生产总值2.2用图表展示定量数据2.2.1生成频数分布表2.2.2定量数据的图示第2章用图表展示数据2.2.1生成频数分布表2.2用图表展示定量数据2-30统计学STATISTICS(第五版)2019-9-20生成频数分布表(例题分析)【例2-3】某电脑公司120天的销售额数据(单位:万元)。生成一张频数分布表观察销售额分布的特征2-31统计学STATISTICS(第五版)2019-9-20生成频数分布表(例题分析)1.确定组数:组数的确定应以能够显示数据的分布特征为目的。一般来说,组数大致等于样本量的平方根比较合适。本例可考虑分为10组2.确定组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数例如,本例最大值为237,最小值为141,组距=(237-141)÷10=9.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取103.统计出各组的频数。每个组的数据满足axb(上限值不在内(Excel的计数规则是axb)2-32统计学STATISTICS(第五版)2019-9-20分组中的几个概念1.下限(lowerlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值下限值+上限值2组中值=制作频数分布2-33统计学STATISTICS(第五版)2019-9-20用SPSS生成分组数据频数分布表(命令:重新编码为不同变量)第一步:点击【转换】【重新编码为不同变量】第二步:将变量选入【输入变量-输出变量】,并在【输出变量】【名称】中写入输出变量的名称(如“分组区间”),单击【更改】第三步:单击【新值和旧值】。在【旧值】下单击【范围】,并写入分组区间的下限和上限值(注意,计数时每个组包含下限和上限值,即a=X=b)。单击【输出变量为字符串】。在【新值】后输入分组的区间,如140-150等(注意:为了和传统的统计分组相适应,这里不包含上限值。也可以输入140-149等),并单击【增加】……重复上一步骤,直至将所有分组区间增加完毕。单击【继续】。单击【确定】(此时“分组区间”变量会保存在SPSS的【数据视图】窗口中)第四步:单击【分析】【描述统计】【频率】。将分组区间变量选入【变量】。单击【确定】(注:在【频率】中选择【图表】可以绘制条形图,修改条形图的宽度至100%即为直方图)2-34统计学STATISTICS(第五版)2019-9-20用SPSS生成频数分布表(命令:重新编码为不同变量)2-35统计学STATISTICS(第五版)2019-9-20用SPSS生成分组数据频数分布表(命令:可视离散化)第一步:点击【转换】【可视离散化】第二步:将变量选入【要离散的变量】,单击【继续】第三步:在【离散的变量】后输入离散后要保存的变量名称,如“所属组别”。单击【生成分割点】,在【第一个分割点】后输入第一组的上限值,如149(注意,隐含为【包含】,计数时每个组包含下限和上限值,即a=X=b;如果输入上限值为150,则应该选择【排除】);在【分割点数量】后输入要分的组数,如10;在【宽度】后输入分组的组距,如10。单击【应用】返回主对话框,并单击【生成标签】。单击【确定】(注:也可以直接在【网格】【值】中输入组的上限值,在【标签】中输入分组的区间。这样比较麻烦,不推荐使用)第四步:单击【分析】【描述统计】【频率】。将“所属组别”变量选入【变量】。单击【确定】(注:在【频率】中选择【图表】可以绘制条形图,修改条形图的宽度至100%即为直方图)2-36统计学STATISTICS(第五版)2019-9-20用SPSS生成频数分布表(命令:重新编码为不同变量)2.2.2定量数据的图示2.2用图表展示定量数据Excel2-38统计学STATISTICS(第五版)2019-9-20分组数据看分布—直方图(histogram)1.用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图4.直方图下的总面积等于12-39统计学STATISTICS(第五版)2019-9-20分组数据看分布—直方图(SPSS绘制的直方图)绘制直方图2-40统计学STATISTICS(第五版)2019-9-20分组数据看分布—直方图(直方图与条形图的区别)1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列3.条形图主要用于展示定性数据,而直方图则主要用于展示定量数据2-41统计学STATISTICS(第五版)2019-9-20未分组数据看分布—茎叶图(stem-and-leafplot)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留最后一位数字5.茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数据2-42统计学STA

1 / 71
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功