第1页共52页《数据分析》实验报告册2015-2016学年第一学期班级:学号:姓名:授课教师:实验教师:第2页共52页目录实验一网上书店的数据库创建及其查询实验1-1“响当当”网上书店的数据库创建实验1-2“响当当”网上书店库存、图书和会员信息查询实验1-3“响当当”网上书店会员分布和图书销售查询实验二企业销售数据的分类汇总分析实验2-1Northwind公司客户特征分析实验2-2“北风”贸易公司销售业绩观测板实验三餐饮公司经营数据时间序列预测实验3-1“美食佳”公司半成品年销售量预测实验3-2“美食佳”公司月管理费预测实验3-3“美食佳”华东分公司销售额趋势预测实验3-4“美食佳”公司会员卡发行量趋势预测实验3-5“美食佳”火锅连锁店原料年度采购成本预测实验四住房建筑许可证数量的回归分析实验4-1“家家有房”公司建筑许可证一元线性回归分析实验4-2“家家有房”公司建筑许可证一元非线性回归分析实验4-3“家家有房”公司建筑许可证多元线性回归分析实验4-4“家家有房”公司建筑许可证多元非线性回归分析实验五手机用户消费习惯聚类分析实验六新产品价格敏感度测试模型分析第3页共52页实验一网上书店的数据库创建及其查询实验1-1“响当当”网上书店的数据库创建实验类型:验证性实验学时:2实验目的:•理解数据库的概念;•理解关系(二维表)的概念以及关系数据库中数据的组织方式;•了解数据库创建方法。实验步骤:这个实验我们没有直接做,只是了解了一下数据库的概念。实验1-2“响当当”网上书店库存、图书和会员信息查询实验目的•理解odbc的概念;•掌握利用microsoftquery进行数据查询的方法。实验步骤:1..建立odbc数据源:启动microsoftofficequery应用程序,在microsoftofficequery应用程序窗口中,执行“文件/新建”命令,出现“选择数据源”对话框,单击“确定”按钮,出现“创建新数据源”对话框,按照要求做相应的操作。选择数据源对话框创建新数据源窗口做图上所示的选择odbcmicrosoftaccess安装对话框第4页共52页选择数据库对话框选择数据源对话框2.查询设计1—低库存量图书信息查询:选择“bookstore”数据源,点击“确定”,进入“添加表”窗口,添加书表后,在“查询设计”窗口的“表”窗格中,分别双击“书”表中需要查询的“书名”、“isbn”、“库存量”等字段,执行“视图/条件”命令,在“条件”窗格的“条件字段”行的第一列中选择“库存量”,并在下一行中输入“10”后回车,即可在“查询结果”窗格中显示响当当网上书店中库存量小于10的图书信息。选择bookstore数据源选择好表后点击“添加”查询设计窗口-查询的相关数据查询设计窗口-输入条件3.查询设计2—低库存量图书信息以及出版社信息查询:分别添加“书”和“出版社”表,双击“书”表的“书名”和“isbn”字段以及“出版社”表的“出版社名称”、“电话”和“地址”字段,再输入相应的条件即可进行查询。添加了表后的查询设计窗口第5页共52页实验小结:因为我们没有尝试建立数据库,直接开始数据查询,所以实验时遇到了很多问题。比如我们在选择数据源时就遇到了麻烦,弄了半天才开始查询设计,而且不是很熟练,一直做了四五个查询设计才慢慢熟练起来。实验思考:1、在数据查询过程中,如果所选的某个表与其他表之间没有联系的话,会产生什么问题?答:所选的查询数据将会全部显示在查询窗口,与其它表的数据没有直接联系。这样就不能表现出表与表数据之间的关联性,数据也就失去赋予的意义。2、若“响当当个”网上书店的某个会员了解自己最近2年的图书订购情况,请为他设计一个查询。答:分别添加“书”、“会员”、“订单明细”和“订单”表,双击“书”表的“书名”、“会员”表的“姓名”和“订单明细”表的“订购数量”以及“订单”表的“订购日期”字段,在向查询条件窗口中输入某一会员姓名以及相应的订购日期.实验1-3“响当当”网上书店会员分布和图书销售查询实验目的•掌握复杂的数据查询方法:多表查询、计算字段和汇总查询实验步骤:1.查询设计1—会员分布信息查询:添加“会员”表到查询设计窗口,在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”和“会员号”字段。然后双击“会员号”字段的列标,在“编辑列”对话框中输入列标“会员人数”,并选择汇总方式:“计数”,单击“确定”按钮后即可看到查询结果,其中显示了各城市的会员人数,再设置相应的条件,进行相应的查询。选择汇总方式查询结果2.查询设计2—图书总订购量和总销售金额查询:添加“订单”、“订单明细”和“书”表。在“查询设计”窗口的“表”窗格中,双击“订单”表的“订购日期”、“订单明细”表的“订购数量”字段。另外还要构造一个计算字段“销售金额”,方法是直接在某空白列的列标中输入公式;在上面的字段中,“订购数量”和“销售金额”是汇总字段,分类字段是“订购年份”,双击“订购日期”列的列标,在编辑列对话框的字段项中输入公式“year(订购日期)”,在其中的列标项中输入“订购年份”然后分别双击“订购数量”和“订购数量*单价”字段的列标,在编辑列对话框的列标项中分别输入“总订购数量”和“总销售金额”字样,并在总计项中选择“求和”。第6页共52页在“条件”窗格的“条件字段”行的第一列中选择“订购日期”,并在下一行中输入“=2005-7-1and=2006-6-30”后回车,即可在“查询结果”窗格中显示2005上半年和2006下半年的图书总订购量和总销售金额。此时,若想了解各月份的图书总订购量和总销售金额,只要再查询设计窗口中增加一个“订购月份”分类字段即可增加了订购月份后的查询结果排序对话框3.查询设计3—会员订购图书详细信息查询:添加“会员”、“订单”、“订单明细”和“书”表,在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”、“会员号”、“姓名”字段,“订单”表的“订单号”字段、“书”表的“书名”字段和“订单明细”表的“订购数量”字段。选择“记录”菜单的“排序”命令,在随后出现的“排序”对话框中设置排序方式查询结果共84条记录4.查询设计4—各城市会员图书订购数量和销售金额统计:添加“会员”、“订单”、“订单明细”和“书”表,在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“会员”表的“城市”、“订单明细”表的“订购数量”字段。分别双击“订购数量”和“订购数量*单价”字段的列标,在编辑列对话框的列标项中分别输入“总订购数量”和“总销售金额”字样,并在总计项中选择“求和”。按“确定”按钮后即可查看结果。第7页共52页5.查询设计5—被订购图书的作者和出版社信息查询:添加“会员”、“订单”、“订单明细”、“书”、“作者”和“出版社”表。在表之间建立合适的联系。在“查询设计”窗口的“表”窗格中,双击“书”表的“书名”、“作者”表的“姓名”和“出版社”表的“出版社名称”字段。在条件窗格中添加关于订购日期和会员姓名的条件。可以查看到结果为会员“刘丹”在2007年共订购了7本图书。实验小结:实验1-3的实验比较难,但是经过前面的练习还是比之前快一点,不过还是遇到一些困难,比如查看到结果为会员“刘丹”在2007年共订购了几本书的查询设计就在输入指令时卡住了,经过几个同学讨论还是做出来了。一直到晚上天黑了才把一共十个实验做完。实验思考:1、在进行汇总查询的过程中,如果被选择的字段除了分类字段以外还包含了其他字段。第8页共52页查询结果是否正确?为什么?请举例说明。答:不正确,如果被选择的字段除了分类字段以外还包含了其他字段,那么query将把多余的字段自动作为分类字段。2、“响当当”网上书店的管理人员想了解最近2年中那位作者的书是最畅销,请你设计一个查询找到相关作者。答:查询近两年的总订购量。实验二企业销售数据的分类汇总分析实验2-1Northwind公司客户特征分析实验类型:验证性实验学时:2实验目的:•理解数据分类汇总在企业中的作用与意义;•掌握数据透视表工具的基本分类汇总功能;•掌握建立分类汇总数据排行榜、生成时间序列、绘制praetor曲线图、计算各地区客户分布、统计各地区客户的平均销售额和大宗销售时间序列的方法和步骤。实验步骤:一、汇总客户销售额排行榜为了汇总客户销售额的排行榜,首先要获得客户每笔销售的销售额、所购买产品的类别以及销售发生的时间,然后再利用数据透视表工具将销售额按照客户名称、产品类别和销售时间加以汇总。步骤1:获取各客户每笔销售的销售额、销售产品的类别和时间。在一张空白的工作表中,选择菜单“数据”→“数据透视表和数据透视图”→“外部数据源”,单击“获取数据按钮”,随后启动了MicrosoftQuery,选择所建立的连接到Northwind.mdb数据库的ODBC数据源——“NW”,并选择“确定”,选择“客户”表中的的“公司名称”、“订单”表中的“订购日期”、以及“类别”表中“类别名称”,随后Query弹出窗口“‘查询向导’无法继续,因为该表格无法链接到您的查询中。您必须在MicrosoftQuery中的表格之间拖动字段,人工链接。”这是因为类别表无法同订单表建立联系。单击“确定”。要查询销售额,需要在Query中首先增加“订单明细”表,利用其中的“单价”、“数量”与“折扣”字段中的数据,才能计算销售额。在数据窗格中,在一个空白字段的名称处输入公式:“订单明细.单价*数量*(1-折扣)”。键入回车后就可以计算出销售额。见图2-7。随后,将“产品”表也添加到查询中,虽然查询结果中并不包括任何“产品”表中的字段,但是该表的能够建立“类别”表与“订单明细”表之间的联系(“订单明细”表指明所订购产品的ID,“产品”表指明该产品属于哪一个类别)。此时,查询中的表都建立了正确的联系,并在查询结果中包括了汇总所需要的数据。如图2-7。第9页共52页图2-7查询各客户每笔销售的销售额、销售产品的类别和时间将计算销售额的字段的列标命名为“销售额”。选择Query菜单中的“文件”→“将数据返回MicrosoftOfficeExcel”,此时Query已经关闭,我们的操作对象回到了Excel,单击“下一步”,指定位置在“现有工作表”,单元格A3,单击完成。步骤2:汇总客户销售额排行榜,并排序。此时,在工作表的区域A1:G16的位置,出现了数据透视表的框架,数据透视表的浮动工具栏和数据透视表的字段列表。为了能对销售的时间——“订购日期”进行组合以获得各年的销售额,首先将“订购日期”拖至行域,将“销售额”拖至数据域,“类别名称”拖至列域,得到如图2-8所示的数据透视表。图2-8按订购日期与类别汇总销售额为了能将销售额按照年度汇总,将光标停留在“订购日期”下方的任何单元格,右击鼠标,选择“组合及显示明细数据”→“组合”,选择组合的步长为年。然后将单元格A4当中的字段名称“订购日期”改为“订购年”,将它推至页域,将字段列表中的“公司名称”拖到行域,让透视表按照列总计,从大到小排列,就得到了如图2-9所示的数据透视表。它能够反映了三年或者各年度,各个客户的销售额的大小,以及排列名词的先后,还能够观察到各客户订购的产品类别和该类别的销售额。第10页共52页图2-9按照订购年、客户公司名称、类别名称汇总的销售额排行榜二、汇总前三大客户各月销售额,并绘制图形在前一部分实验的基础上,选择前三个最重要的客户,进一步观察购买情况,他们购买情况的变化将对公司整体销售业绩产生很大影响。所以,将前三大客户的销售数据加以展开,按月显示其销售的变化。步骤1:将实验要求1所汇总的数据透视表复制到新的工作表。步骤2:利用数据透视表,汇总前三大客户的销售额时间序列。按照实验要求1汇总的数据透视表,反映出“高上补习班、正人资源、大钰贸易”是公司的前三大客户。点开“公司名称”字段,选中这三个公司名称,并拖到列域。将列域的字段“类别名称”拖出数据透视表。将页域的字段“订购年”旋转到行域,将其重新组合。选择组合的步长为“月”和“年”,把字段名称修改为“订购年