实验(实训)报告项目名称神经网络、logistics回归与聚类分析所属课程名称客户关系管理项目类型操作型实验(实训)日期2011-11-15班级10信息C1班学号1001041301姓名指导教师陈远高浙江财经学院教务处制一、实验(实训)概述:【目的及要求】目的:熟悉Clementine数据流的构建过程,掌握logistic、神经网络与聚类分析模型的应用。要求:根据实验步骤完成数据流建立,并获得分析结果。实验结束后提交实验报告。【基本原理】数据挖掘流程;logistic模型;神经网络模型、聚类分析模型【实施环境】(使用的材料、设备、软件)Windows操作系统,Clementine11.1二、实验(实训)内容:【项目内容】应用Clementine11.1中的神经网络模型、logistics模型、聚类分析模型进行数据分析。【方案设计】注意:在建模操作过程中,请将生成的模型名称改为自己的学号和姓名。1应用GOODS1n数据,对于产品类型、促销等因素对于销售影响情况进行分析。a)增加Increase字段,表示销售变化率;b)通过散点图进行探索性分析;c)使用神经网络节点生成预测模型;d)使用该模型预测GOODS2n中的销售变化率;2应用Satisf.sav数据,应用以下模型进行分析:a)应用特征选择模型,找出影响消费者购买与否(Purchase)主要因素,然后通过Logistic模型生成预测消费是否购买的预测模型;b)应用神经网络模型,根据消费者个人基本信息(gender、agecat、distance)和满意因素(price、numitems、org、service、quality)预测顾客总体满意度(overall);3应用NewsChan.sav数据,通过聚类模型对于有线电视客户进行分类(NEWSCHAN字段不作为分类的输入变量),看看不同类的客户具有哪些特征,哪些类别的客户更愿意预订有线电视服务(即NEWSCHAN字段为真值)。【实验(实训)过程】(步骤、记录、数据、程序等)问题1使用神经网络模型预测GOODS1n中的销售变化率①新建数据源可变文件,导入数据GOODS1n②增加Increase字段,表示销售变化率;③新建字段选项类型,读取值,修改字段类型和方向④新建图形散点图,X字段选Promotion,Y字段选Increase,颜色选Class⑤执行散点图Promotionv.Increase的结果⑥新建建模神经网络,并命名为100104130103龚杨春神经网络⑦执行神经网络的结果⑧执行表的结果使用该模型预测GOODS2n中的销售变化率①导入数据GOODS2n②执行散点图Promotionv.Increase的结果③执行神经网络的结果④执行表的结果问题1实验结果分析:产品类型是消费者最关注的购买因素。其次是促销,促销投入越大,销量增长越快。问题2使用Logistic模型生成预测消费是否购买的预测模型①新建数据源SPSS文件,导入数据satisf.sav②新建字段选项类型,读取值,修改字段类型和方向③新建建模特征选择,在“选项”选项卡上,选择最重要的10个变量④执行特征选择的结果⑤新建建模Logistic,在“注解”选项卡上命名为100104130103龚杨春Logistic,在“模型”选项卡上过程选择二项式,然后进行Logistic模型预测⑥执行Logistic的结果问题2实验结果分析:影响消费者购买的10个重要性因素:Regular、Followup、Contact、Dept、Quality、Overall、Gender、Agecat、Service、Distance。在分类表中,可以看到模型中加入10个变量后购买率达到69.6%神经网络模型预测顾客总体满意度①新建数据源SPSS文件,导入数据satisf.sav②新建字段选项类型,读取值,修改字段类型和方向③新建建模神经网络,在“注解”选项卡上命名为100104130103龚杨春神经网络,然后进行神经网络模型预测④执行神经网络结果问题2实验结果分析:从神经网络模型看,消费者个人基本信息和满意因素对顾客总体满意度预测准确性只有39.13%。问题3问题3实验结果分析:从图中可以看出预订有线电视服务客户群提分类:聚类-1聚类-5聚类-2聚类-3聚类-4【结论】(结果、分析)三、指导教师评语及成绩:评语:成绩:指导教师签名:批阅日期: