3-1经济、管理类基础课程统计学第三章统计数据的整理与显示3-2经济、管理类基础课程统计学第三章统计数据的整理与显示第一节数据的预处理第二节品质数据的整理与显示第三节数值型数据的整理与显示第四节统计表3-3经济、管理类基础课程统计学学习目标1.了解数据预处理的内容和目的2.掌握品质数据整理与显示的方法3.掌握数值型数据整理与显示的方法4.用Excel作频数分布表和形图5.合理使用统计表3-4经济、管理类基础课程统计学第一节数据的预处理一.数据的审核与筛选二.数据的排序3-5经济、管理类基础课程统计学数据的审核、筛选与排序1.数据的审核发现数据中的错误2.数据的筛选找出符合条件的数据3.数据排序发现数据的基本特征升序和降序3-6经济、管理类基础课程统计学数据的审核(原始数据)审核的内容1.完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全2.准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等3-7经济、管理类基础课程统计学数据的审核(原始数据)审核数据准确性的方法1.逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核2.计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核3-8经济、管理类基础课程统计学数据的审核(第二手数据)1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要2.时效性审核应尽可能使用最新的统计数据3.确认是否必要做进一步的加工整理3-9经济、管理类基础课程统计学数据的筛选1.对审核过程中发现的错误应尽可能予以纠正2.当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选3.数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出3-10经济、管理类基础课程统计学数据的排序(要点)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成3-11经济、管理类基础课程统计学数据的排序(方法)1.定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.定距和定比数据的排序递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)X(2)…X(N)递减排序可表示为:X(1)X(2)…X(N)3-12经济、管理类基础课程统计学第二节品质数据的整理与显示一.定类数据的整理与显示二.定序数据的整理与显示3-13经济、管理类基础课程统计学定类数据的整理与显示3-14经济、管理类基础课程统计学定类数据的整理与显示(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对定类数据和定序数据主要是做分类整理3.对定距数据和定比数据则主要是做分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据3-15经济、管理类基础课程统计学定类数据的整理(基本过程)1.列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据3-16经济、管理类基础课程统计学定类数据的整理(可计算的指标)1.频数:落在各类别中的数据个数2.比例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比率:不同类别数值的比值3-17经济、管理类基础课程统计学定类数据整理—频数分布表(实例)【例3.1】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。表3-1某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计20011003-18经济、管理类基础课程统计学定类数据的图示—条形图(条形图的制作)1.条形图是用宽度相同的条形的高度或长短来表示数据变动的图形2.条形图有单式、复式等形式3.在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图3-19经济、管理类基础课程统计学定类数据的图示—条形图(由Excel绘制的条形图)人数(人)5191610211204080120商品广告服务广告金融广告房地产广告招生招聘广告其他广告广告类型图3-1某城市居民关注不同类型广告的人数分布3-20经济、管理类基础课程统计学定类数据的图示—圆形图(圆形图的制作)1.也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形2.主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用3.在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的4.例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为3600×25.5%=91.80,其余类推3-21经济、管理类基础课程统计学定类数据的图示—圆形图(由Excel绘制的圆形图)其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%图3-2某城市居民关注不同类型广告的人数构成3-22经济、管理类基础课程统计学定序数据的整理与显示3-23经济、管理类基础课程统计学定序数据的整理(可计算的指标)1.累计频数:将各类别的频数逐级累加2.累计频率:将各类别的频率(百分比)逐级累加3-24经济、管理类基础课程统计学定序数据频数分布表(实例)【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计300100.0————3-25经济、管理类基础课程统计学定序数据频数分布表(实例)表3-3乙城市家庭对住房状况评价的频数分布回答类别乙城市户数(户)百分比(%)向上累积向下累积户数(户)百分比(%)户数(户)百分比(%)非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————3-26经济、管理类基础课程统计学定序数据的图示—累计频数分布图(由Excel绘制的累计频数分布图)243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向下累积27616830300750100200300400非常不满意不满意一般满意非常满意累积户数(户)(b)向上累积图3-3甲城市家庭对住房状况评价的累积频数分布3-27经济、管理类基础课程统计学定类数据的图示—环形图(环形图的制作)1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用于进行比较研究4.环形图可用于展示定类和定序的数据3-28经济、管理类基础课程统计学品质数据的图示—环形图(由Excel绘制的环形图)8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意图3-4甲乙两城市家庭对住房状况的评价3-29经济、管理类基础课程统计学第三节数值型数据的整理与显示一.数据的分组二.数值型数据的图示三.频数分布的类型3-30经济、管理类基础课程统计学频数分布表的编制3-31经济、管理类基础课程统计学编制频数分布表的步骤确定组数编制频数分布表的步骤确定组距计算频数编制表格3-32经济、管理类基础课程统计学频数分布表的编制(实例)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。3-33经济、管理类基础课程统计学分组方法分组方法等距分组异距分组单变量值分组组距分组3-34经济、管理类基础课程统计学单变量值分组(要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况3-35经济、管理类基础课程统计学单变量值分组表(实例)表3-4某车间50名工人日加工零件数分组表零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221123-36经济、管理类基础课程统计学组距分组(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.必须遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组~~~~~3-37经济、管理类基础课程统计学组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K2.确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数3.根据分组整理成频数分布表)2lg()lg(1nK3-38经济、管理类基础课程统计学组距分组(几个概念)1.下限:一个组的最小值2.上限:一个组的最大值3.组距:上限与下限之差4.组中值:下限与上限之间的中点值下限值+上限值2组中值=3-39经济、管理类基础课程统计学等距分组表(上下组限重叠)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计501003-40经济、管理类基础课程统计学等距分组表(上下组限间断)表3-6某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合计501003-41经济、管理类基础课程统计学等距分组表(使用开口组)表3-7某