第三章数据分类汇总分析第三章讲稿第2页内容简介基础篇数据分类汇总分析的意义和作用数据分类汇总的四种方法数据透视表D函数和模拟运算表提高篇利用DSUM函数和控件控制分类汇总结果分类汇总数据的应用Excel中的多维数据分析——OLAP第三章讲稿第3页第一节数据分类汇总分析的意义和作用获得销售额分类统计值ABC公司1995年不同省份不同类别商品的销售额总计值01000020000300004000050000艺术品自行车服装食品儿童用品体育用品瓷器类别销售额山东安徽江西江苏广东福建浙江第三章讲稿第4页第一节数据分类汇总分析的意义和作用(续)获得各类销售额排行榜Northwind公司前十大客户销售额03000600090001200015000正人资源五洲信托嘉业艾德高科技幸义房屋迈多贸易百达电子悦海上河工业池春建设客户公司名称销售额Northwind公司前十大产品销售额03000600090001200015000猪肉猪肉干鸭肉绿茶白米苏澳奶酪运动饮料山渣片墨鱼牛肉干产品名称销售额第三章讲稿第5页第一节数据分类汇总分析的意义和作用(续)获得各类销售额的时间序列Northwind公司不同产品的销售额时间序列y=39.401x-39.299R2=0.4649020040060080010001200140016001996年7月1996年9月1996年11月1997年1月1997年3月1997年5月1997年7月1997年9月1997年11月1998年1月1998年3月时间销售额花生第三章讲稿第6页第一节数据分类汇总分析的意义和作用(续)获得各经济量之间的相关性Northwind公司分段平均运货费与平均销售金额的依赖关系y=3.0652x+292.37R2=0.846902004006008001000020406080100120140160180200平均运货费平均销售额第三章讲稿第7页第一节数据分类汇总分析的意义和作用(续)获得各种产品需求量的频率分布Northwind公司1997年白米月销量分布图012345203550658095110125140155170185200销量分组销售发生次数第三章讲稿第8页第二节数据分类汇总的四种方法数据查询的统计值功能数据清单功能数据透视表D函数与模拟运算表第三章讲稿第9页第二节数据分类汇总的四种方法汇总字段:待汇总的变量或字段。销售额、销售数量、工作时间等。分类字段:对数据进行汇总时,以某个变量或字段的不同值为参考来对汇总字段进行汇总。参考不同产品类别(分类字段)汇总销售额(汇总字段)参考不同的生产人员姓名(分类字段)汇总工作时间(汇总字段)第三章讲稿第10页第二节数据分类汇总的四种方法(续)ABC公司1995各省份、各类别商品净销售额总计值(图3-7)类别安徽广东江苏江西山东儿童用品3968652420444025524367服装1625547196食品3285547228561640419269体育用品1085010805113139703869艺术品42009289341194393224990自行车12522746421120383247281995年ABC公司各省各类别商品的销售额第三章讲稿第11页一、数据查询的统计值功能从Excel中启动MicrosoftQuery,利用Query的统计值功能,将数据汇总后返回Excel【例3-1】ABC公司销售数据.dbf中保存着公司从1994年到1997年三年的销售数据,利用Query软件的统计值功能汇总该公司的销售数据,并按照图3-7的形式,汇总出1995年不同省份、不同类别商品的净销售额。第三章讲稿第12页一、数据查询的统计值功能(续)123456789101112131415161718ABC省份类别总和净销售额安徽儿童用品39686安徽服装16255安徽食品32855安徽体育用品10850安徽艺术品42009安徽自行车12522广东儿童用品524广东食品472广东体育用品1080广东艺术品2893广东自行车746江苏儿童用品2044江苏食品2856江苏体育用品5113江苏艺术品4119江苏自行车4211江西儿童用品40255第三章讲稿第13页二、Excel数据清单功能数据清单数据清单是包含相关数据的一系列工作表数据行。数据清单的首行为字段名,首行下的各行是各个记录,数据清单中不能出现空行。数据清单的基本功能排序筛选分类总计第三章讲稿第14页二、Excel数据清单功能(续)利用Excel数据清单处理功能进行分类汇总的一般步骤:获得数据清单;设定筛选条件;筛选数据,将筛选结果复制到工作表其他位置;对经过筛选的数据按分类字段进行排序;对排序后的数据进行分类汇总。第三章讲稿第15页二、Excel数据清单功能(续)【例3-2】利用Excel的数据清单功能,将ABC公司的销售数据按照图3-7的形式,汇总出1995年不同省份、不同类别商品的净销售额总计值。第三章讲稿第16页第三节数据透视表数据透视表的基本功能数据透视表结构的灵活性数据透视图的灵活性利用数据透视表生成时间序列统计不同规模销量的发生次数以及概率分布计算占同列数据总和的百分比第三章讲稿第17页一、数据透视表的基本功能数据透视表分类汇总的两种方法先将数据导入Excel成为数据清单,利用数据透视表汇总对数据清单进行汇总利用数据透视表直接从数据库中查询、并汇总数据第三章讲稿第18页一、数据透视表的基本功能(续)【例3-3】利用Excel获取外部数据功能,获取ABC公司1995年的销售数据,使用Excel数据透视表功能制作如图3-7所示的分类汇总表。【例3-4】直接利用Excel数据透视表功能从数据库中查询数据,并根据查询结果汇总,制作出如图3-7所示的分类汇总表。第三章讲稿第19页一、数据透视表的基本功能(续)第三章讲稿第20页一、数据透视表的基本功能(续)05000100001500020000250003000035000400004500050000儿童用品服装食品体育用品艺术品自行车安徽广东江苏江西山东请将页字段拖至此处求和项:净销售额类别省份第三章讲稿第21页二、数据透视表结构的灵活性改变数据透视表的行列结构利用页域对数据进行分页汇总新增、删除和修改行域、列域或页域字段(分类字段)新增、删除和修改汇总字段改变汇总字段的汇总方式同一个字段既作分类字段又作汇总字段第三章讲稿第22页二、数据透视表结构的灵活性(续)改变分类字段值的位置对分类字段的值加以合并隐藏行域、列域的字段值展开汇总值,显示详细数据第三章讲稿第23页三、数据透视图的灵活性变换分类字段的位置将行、列分类字段换成页分类字段新增、删除分类字段新增、删除汇总字段改变被汇总方式显示分类字段的部分值第三章讲稿第24页四、利用数据透视表生成时间序列时间序列:按照一定时间间隔汇总的数据序列【例3-5】利用数据透视表,对NorthwindTrader公司的销售数据按月汇总种各产品销售额。产品名称(全部)求和项:销售额年订购日期汇总1996年7月27861.898月25485.279月26381.4010月37515.7211月45600.0412月45239.631997年1月61258.072月38483.63第三章讲稿第25页五、统计不同规模销量的发生次数及频率分布【例3-6】利用数据透视表,对Northwind公司的销售数据按照不同产品、不同时间段,统计不同规模销售数量的发生次数,并计算其频率分布。产品名称(全部)年(全部)订购日期(全部)计数项:数量数量汇总1-1028.28%11-2029.49%21-3019.19%31-409.92%41-505.75%51-603.34%61-701.76%71-800.88%81-900.28%91-1000.51%101-1100.14%111-1200.37%121-1300.09%第三章讲稿第26页Northwind公司不同规模销量的频率分布0%5%10%15%20%25%30%35%1-1011-2021-3031-4041-5051-6061-7071-8081-9091-100101-110111-120121-130汇总产品名称(全部)年(全部)订购日期(全部)计数项:数量数量在此处放置系列字段五、统计不同规模销量的发生次数及频率分布第三章讲稿第27页六、计算占同列数据总和的百分比【例3-7】NorthwindTrader公司根据客户总销售额将客户划分为不同级别,20000元以上为黄金客户,10000元~20000元为重要客户,10000以下为普通客户。按照客户的不同级别汇总各级客户的总销售额、销售额占总销售额的百分比,以及该级客户销售次数占总销售次数的比重,如图3-69所示,并绘制数据透视图。订购年(全部)数据客户级别求和项:销售额销售额占总销售额百分比占总销售次数比重黄金客户761622.940760.17%43.95%重要客户298225.501223.56%24.90%普通客户205995.296316.27%31.15%第三章讲稿第28页第四节D函数和模拟运算表D函数模拟运算表生成时间序列统计不同规模销量的发生次数以及概率分布第三章讲稿第29页一、D函数D函数:对数据清单或数据库中的数据进行分析有12个数据库内建函数。常用的D函数包括:DSUM()DAVERAGE()DCOUNT()DCOUNTA()第三章讲稿第30页一、D函数(续)D函数名称(数据清单,统计字段,条件范围)数据清单:包含相关数据的工作表中的一系列数据行统计字段:汇总字段。可以使用字段名、字段名所在的单元格、或者字段在数据清单中所在列的序号。条件范围:规定函数的匹配条件的一个工作表区域。D函数只对满足该条件范围所规定条件的记录进行汇总。第三章讲稿第31页一、D函数(续)【例3-8】利用ABC公司的销售数据,应用DSUM()函数,生成一个与图3-7相同的数据分类汇总表,列出ABC公司不同省份不同类别净销售额总计值。第三章讲稿第32页一、D函数(续)12345678910111213141516171819ABCDEFGHIJKLMN日期日期省份类别安徽广东江苏江西山东=95/1/1=95/12/31安徽儿童用品儿童用品3968652420444025524367服装1625500047196日期日期省份类别食品3285547228561640419269=95/1/1=95/12/31安徽服装体育用品1085010805113139703869艺术品42009289341194393224990日期日期省份类别自行车1252274642112038324728=95/1/1=95/12/31安徽食品日期日期省份类别=95/1/1=95/12/31安徽体育用品日期日期省份类别=95/1/1=95/12/31安徽艺术品日期日期省份类别=95/1/1=95/12/31安徽自行车1995年ABC公司各省各类别商品的销售额第三章讲稿第33页二、模拟运算表模拟运算表用于计算一系列自变量给定值对应的函数值。自动计算函数值。一维模拟运算表,计算一个自变量的一系列给定值的一个或若干个函数的函数值。二维模拟运算表,计算两个自变量的系列给定值的一个函数的函数值。第三章讲稿第34页二、模拟运算表(续)【例3-9】在例3-8的基础上,利用DSUM()函数和模拟运算表计算ABC公司不同省份不同类别净销售额总计值。123456789ABCDEFGHI日期日期省份类别39686=95/1/1=95/12/31安徽儿童用品儿童用品39686服装16255净销售额的总计值39686食品32855体育用品10850艺术品42009自行车12522123456789ABCDEFGHIJKLM日期日期省份类别39686