应用统计学--第2章数据的图表展示

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

陈小慧管理学院应用统计学经过《喜羊羊与灰太狼》全集统计,灰太狼一共被红太狼的平底锅砸过9544次,被喜羊羊捉弄过2347次,被食人鱼追过769次,被电过1755次,捉羊想过2788个办法,奔波过19658次,足迹能绕地球954圈,至今一只羊也没吃到,他并没有放弃。想想灰太狼,我们现在的一点苦又算什么呢?本·拉登的英文名字是0sama,奥巴马的英文名字是0bama,一字之差,天壤之别。一个是s,一个是b,加起来是sb。。。沃德(AbrahamWald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种沃德被咨询飞机上什么部位应该加强钢板时,开始研究从战役中返航的军机上受敌军创伤的弹孔位置。他画了飞机的轮廓,并且标识出弹孔的位置。资料累积一段时间后,几乎把机身各部位都填满了。于是沃德建议,把剩下少数几个没有弹孔的部位补强。因为这些部位被击中的飞机都没有返航1.了解数据预处理的内容和目的2.掌握分类和顺序数据的整理与显示方法3.掌握数值型数据的整理与显示方法4.用Excel和SPSS作频数分布表和图形5.合理使用图表问卷调查:又称为民意调查,是以社会成员对一定社会经济现象的看法和意愿为对象,从而推断社会心态动向的一种调查。问卷通常由3部分组成:说明词:列于问卷前面,说明调查目的、内容和要求等主题问句:用来搜集资料的一系列问句,是问卷的主体作业记录:问卷执行完成情况的记录说明词:列于问卷前面,说明调查目的、内容和要求等主题问句:用来搜集资料的一系列问句,是问卷的主体作业记录:问卷执行完成情况的记录例如:说明词员工满意度问卷调查尊敬的员工:每年我们都对员工进行调查以有助于我们为您提供最好的工作环境。请花费一点时间填写如下简短的调查表。对您的回答内容我们会绝对保密。提前谢谢您对本研究的参与和支持!问卷编排顺序时间顺序内容顺序,先易后难类别顺序:静态、行为、态度先封闭后开放等问卷的类型按结构分类无结构型问卷即问卷的内容结构较为松散或较为简单的问卷,便于被调查者自由发表意见结构型问卷即根据调查研究的目的和调查对象的特点而设计的具有结构的问卷,易于量化和进行数据的统计处理结构型问卷按提问方式分:封闭型提问对问卷的调查项目都列出备选答案由被调查者选择例如:您家里安装了空调吗安装了没有安装目前的工作给我一种成就感。很同意同意很难说不同意您的年收入是多少?2万元以下2万-3万3万-4万4万元以上非结构型问卷开放型提问即指所提问题不列出备选答案,答题类型也不作出任何具体规定,而由被调查者根据自己的想法用文字表达自己的意见。例如:您认为当前我国股票市场存在的主要问题是什么?您的主要投资意向是什么?您认为应用统计学这门课该怎么上才有好的效果?影响问卷效果的因素被调查者的主观倾向测量工具即问卷本身的问题如:问卷问题过多,使人疲乏;问句选项内容层次不清,设计不科学;问句涉及个人情感、隐私等。问卷环境如:问卷现场的条件和特点,避免被调查者交头接耳,相互影响;*问卷组织者的行为和态度,不能对被调查者产生引导作用。问句常用的方式是否式:用是、否、能、不能表示;例:这种学习方式是否帮助您解决了学习矛盾?是()否()选择式:包括类别型、条件型、等距型等;例:类别型如:您最喜欢的面对面的教学方式是:系统讲授()总结归纳()讨论()答疑()辅导()其他()例:等距型如:学校提供的上网服务适合您的需要吗?适合()基本适合()一般()基本不适合()不适合()例:条件型如:1)您是否在网上学习?是()否()如果是,请回答第二题;如果不是请回答第三题;2)您在哪里上网学习?家里()工作单位()学校()其他()例:5点量表型如:您利用图书馆网站上的教学信息吗?从未利用很少利用有时利用较多利用一直利用12345例:表格型很满意满意不满意很不满意您对统计学的教材是否满意您对统计学的老师是否满意您对统计学的课件是否满意您对统计学的软件是否满意排序式:列出对某一问题不同层次的答案,由被调查者排出次序,表示自己的态度和倾向;例:请按您喜欢的程度,对下面的教学方式排序系统讲授()总结归纳()答疑()辅导()填空式:适用于对静态的情况提问,如基本情况:姓名、年龄、性别、学历、条件、设施、制度、机构等。态度量表通过逐个问题的回答,量化主观态度,获取整个态度的总分。其量化的结果,一是态度的方向,如对某种商业服务满意或不满意的基本倾向;二是态度的深度,即被调查者所持某种态度的数量程度。李克特量表(LikertScales)语句非常满意满意一般不满意很不满意产品质量54321售后服务54321………………1.数据的预处理2.品质型数据的整理与显示3.数值型数据的整理与显示4.如何合理使用统计图表1.数据审核检查数据中的错误2.数据筛选找出符合条件的数据3.数据排序升序和降序寻找数据的基本特征4.数据透视按需要汇总LX:统计成绩考核表2.1数据的预处理1.完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全2.准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要2.时效性审核尽可能使用最新的数据3.确认是否有必要做进一步的加工整理2.1数据的预处理1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成1.分类数据的排序字母型数据,习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n)递减排序:可表示为:x(1)x(2)…x(n)2.1数据的预处理1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除2.1数据的预处理1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题2.2.1分类数据的整理与图示2.2.2数值型数据的整理与图示1.要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法2.对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据1.频数(frequency):落在各类别中的数据个数•比例(proportion):某一类别数据个数占全部数据个数的比值•百分比(percentage):将对比的基数作为100而计算的比值1.比率(ratio):不同类别数值个数的比值1.在2008年8月北京举办的第29届奥运会上,中国体育代表团共获得51枚金牌,占中国队获得奖牌总数的51%。这里的“51%”是()A.平均数B.频数C.比例D.比率2.某地区2008年新生婴儿中,男性婴儿为25万,女性婴儿为20万。男性婴儿与女性婴儿的人数之比为1.25:1,这个数值属于()A.比例B.比率C.频数D.平均数CB1.列出各类别2.计算各类别的频数3.生成频数分布表分类频数比例百分比比率ABCDE【例2.3】为研究不同类型的软饮料的市场销售情况,一家市场调查公司对随机抽取的一家超市进行调查。下面的表2—1是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录。生成频数分布表,观察饮料类型和消费者性别的分布状况,并进行描述性分析制作频数分布表绿色健康饮品第1步:选择【插入】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置。然后选择【布局】第5步:在【向导—布局】对话框中,依次将“分类变量“(这里是“饮料品牌”)连续拖放两次:一次拖至左边的“行”区域,一次拖至“数据”区域第6步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表1.整理EXCEL文件“例2-1.xls”2.将“例2-1.xls”转换成SPSS文件3.分析—描述统计—频率4.分析—描述统计—交叉表不同类型饮料和顾客性别的频数分布绿色健康饮品1.用宽度相同的条形的高度或长短来表示各类别数据2.各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(columnchart)饮料类型和顾客性别的条形图(SPSS的输出)1.按各类别数据出现的频数多少排序后绘制的柱形图2.用于展示分类数据的分布用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题练习题按各类别数据出现的频数多少排序后绘制的柱形图称为()。下面图形中最适合描述结构性问题的图形是()。A、条形图B、饼图C、帕累托图D、对比条形图1.累积频数(cumulativefrequencies):各类别频数的逐级累加•2.累积频率(cumulativepercentages):各类别频率(百分比)的逐级累加例:频数频率向上累计向下累计年龄人数181219202010218合计50124232385085018——向上累计向下累计【例2.4】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————甲城市家庭对住房状况评价的累积频数分布1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示2.与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究4.用于展示分类和顺序数据练习题下列哪个图形适合于比较研究两个或多个总体或结构性问题的图形是()。A、环形图B、饼图C、帕累托图D、对比条形图2.3.1数据分组2.3.2数值型数据的图示分组方法等距分组异距分组单变量值分组组距分组1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组~~~~~“上限不在内”原则当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。例如:150不算在“140~150”150算在“150~

1 / 116
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功