数据挖掘在决策支持系统中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据挖掘在决策支持系统的应用计算机智能与科学秦勤201121155704511011【摘要】:本文介绍了数据挖掘和决策支持系统的概念以及分析方法,讨论了基于数据挖掘的决策支持系统,构建了一个应用于实际的基于数据挖掘的企业管理决策支持系统构架。【关键词】:数据挖掘;数据仓库;决策支持系统前言在市场经济环境下,企业竞争越来越激烈,如何有效地提高企业管理水平和经济效益,挖掘市场潜力,是现代企业面对的一个重要课题。对此,企业信息化建设是提高企业管理水平的有效方法,而且企业信息化已经从最初的简单整合企业信息资源,发展到现在建立大型的企业信息数据库,并从数据库中发现知识,以提供给决策层应用,从而达到辅助企业管理及决策的目的。1.基于数据挖掘的决策支持系统构建决策支持系统(DSS)是利用大量信息数据结合众多模型,通过人机交互,辅助各级决策者实现科学决策的系统。该系统是一个融计算机技术、信息技术、人工智能、管理科学、决策科学等学科和技术于一体的技术继承系统。在企业没有建立起决策支持系统前,各个部门基本上具备各自的数据信息和独立的信息处理系统,但是各个部门间信息不兼容,即使部门之间有交叉业务,但是由于信息不统一,也无法做到信息的一致性,不能有效地达到共享,造成所谓的信息孤岛。即使建立了大型的、集成的、信息统一的数据仓库,但怎样才能在大量的数据中发现有用知识呢?这就需要一个全面的解决方案,解决数据的一致性和集成性,并在这些经过处理的数据中发现知识,以协助企业进行有效的决策和管理。基于数据挖掘的决策支持系统就是把传统的决策支持系统和数据挖掘有机地结合在一起,通过数据挖掘技术来提高系统的智能性,在海量的数据中有效地提取有用数据,发现有用知识。决策支持系统由两部分组成(见图1.1):数据仓库、分析系统(即数据挖掘方法)。21.1数据仓库数据仓库的设计首先要满足决策支持系统的要求,决策支持系统数据库所要求的数据要具备三方面特点:概括性、抽象性、统一性。所以在图2.1中数据仓库和部门数据库之间还应有一个虚拟层,用来为数据仓库提取有用数据,这个层的功能实现由数据挖掘的数据清洗过程完成。数据仓库设计的关键是数据库的结构设计,包括逻辑设计和物理设计。(1)数据库逻辑设计逻辑设计前需要首先建立一个涉及企业各个方面的详细商业模型,即概念模型。概念模型是独立于任何一种数据模型的信息结构,逻辑设计的任务就是把商业模型转换为数据库系统所支持的数据模型相符合的逻辑结构。由于大多数的商用数据库系统是关系型数据库,所以逻辑设计的主要问题就是把概念模型中各个实体与实体属性的联系转换为关系模式。在企业中涉及很多实体,如部门实体:人力资源部、生产部、财务部、市场部等等。而各个部门中还涉及部门内部的多个实体,如市场部门中涉及的实体有:客户、客户经理、产品、订单、销售业绩,以及城市信息等等,这些实体都有自己的属性。(2)数据库物理设计3数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,优秀的物理结构设计能使数据库上运行的各种事务响应时间小、存储空间利用率高、事务吞吐率大。优秀的物理设计最重要的是有一个高效率的存取方法,常见的存取方法有索引存取方法、HASH存取方法等,存取方法本文不再详细叙述。1.2数据挖掘方法数据挖掘从本质上说是一种新的商业信息处理技术。数据挖掘技术把人们对数据的应用,从低层次的联机查询操作,提高到决策支持、分析预测等更高级应用上。它通过对这些数据进行微观、中观乃至宏观的统计分析、综合和推理,发现数据的关联性、未来趋势以及一般性的概括知识等。数据挖掘作为一门数据处理的新兴技术,它具有的特征是处理海量数据,并且即使这些数据是不完全的、冗余的、随机的、复杂数据结构的、维数大的,都可以通过数据清洗来选择有用数据,建立知识模型。数据挖掘是多学科交叉,涉及计算机科学、统计学、数学等学科的技术。(1)联机分析挖掘OLAMOLAM(OnLineAnalyticalMining)联机分析挖掘的概念是OLAP(OnlineAnalyticalProcessing,联机分析处理)的发展。用户的决策分析需要对数据库中的数据进行大量的分析计算才能得到结果,而普通的数据处理系统对数据库的简单查询,已经不能满足决策者提出的需求,因此就出现了多维数据库和多维分析的概念,即OLAP。OLAP是联机交互式数据分析一个良好的框架,但是它只能处理数值型数据,对决策支持系统来说是一个较大的局限性。OLAM是在数据立方体上进行多层次的数据挖掘,OLAM分成若干个抽象层,每个抽象层都有各自的抽象任务。主要包括数据集层:它包括相关的数据库和数据仓库等,同时也是OLAM的数据源,通过数据清洗和集成,生成结构化的便于分析的数据环境。数据立方层:形成支持OLAP和OLDM的多维数据集,它是相关数据的综合和多维化处理,主要由数据立方和元数据集组成。OLAP和OLDM应用层:这一层接受数据请求,通过访问多维数据集和元4数据,完成数据挖掘和分析。用户接口层:承担用户请求的理解以及挖掘结果的解释和表达等。(2)数据挖掘过程数据库中发现知识是一个有明确学习目标的需要多次反复的过程,因此数据挖掘是一个目标和数据不断优化的过程。a.问题定义和数据抽取对于多异构的数据源,需要根据源数据的结构特点进行相应的数据抽取工作。不同类型的源数据,在结构上差异很大。这就需要以问题定义为基础来界定数据抽取的原则和规则。b.数据预处理数据预处理是对数据再加工的过程。经过处理后,数据具有某种标准格式,可以提供给后续的数据挖掘。数据预处理的任务主要有数据清洗和数据选择等。对于备选数据先噪声清洗,然后根据模式要求确定数据选择的原则和策略。选择出满足模式要求的数据,必要时进行数据格式的转换。c.数据挖掘和知识库数据挖掘是在规格化的目标数据集中根据特定的模型和算法进行数据抽象,生成知识。它应该能反复利用获得的知识和用户互动,这就需要知识库的支持,达到满足用户要求的知识模式。决策支持系统是一个多策略的挖掘系统,所以数据挖掘包含诸如描述、关联、分类、聚类、时间序列分析以及进化和偏差分析等功能在内的数据挖掘工具。挖掘出来的中间或者最终知识存储在知识库中。这些知识具有不同的抽象层次、适合不同的决策层次的数据分析和决策。2.数据挖掘决策支持系统在企业中的构建数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。用于决策支持,则是提高企业在面对不断变换的市场条件下的应变能力,以及挖掘自身潜力,增强自身竞争力的有效手段。2.1数据准备完备的信息来源是决策支持系统的基础,在企业中商业决策需要多样化的5信息,如实时信息、历史信息、社会信息、企业内部信息、行业信息等等。因此在整理信息的时候,需要做到全面、准确、及时。按企业信息的业务属性,信息可以分为以下几类:a.财务信息:主要包括效益分析所需的销售收入与销售支出,运营决策所需的成本、管理支出等信息,根据不同的决策对数据的需求,从企业财务信息数据库提取。b.销售信息:主要包括产品类别、价格、业务信息、客户、交通信息、运输费用、销售人员个人信息、销售业绩、货款回收等。c.仓储信息:主要包括库存量,仓库信息、产品类别、产品分类储量、出库信息,入库信息、存储时间、安全存储量、预警存储量、盘盈盘亏额等。d.生产信息:主要包括产品类别、生产成本、原材料供应、生产时间、产品生产效率、历史生产信息、车间信息等。e.采购信息:主要包括合同信息、供应商、采购价格、运输信息、历史采购信息、应付货款等。f.人事信息:包括人员信息,工资信息、部门、学历等。这些来自企业和相关行业的各个方面的大量信息,通过收集、整理、存储在数据库中作为原始数据,这些数据是离散的、模糊的。2.2系统功能模块根据企业的关键部门,如财务、生产、销售、仓储、采购、人事,分析各个部门的业务决策需求,在部门信息数据的基础上结合企业外部数据,建立各部门相关的决策分析子系统。除了各个部门的决策分析子系统外,还需要建立宏观的战略分析子系统。财务部门:财务分析、集团财务分析、经营财务分析等。生产部门:生产计划分析、物料需求分析、成本分析、生产调度分析等。销售部门:合同分析、销售分析、竞争对手分析、产品市场分析、客户群体划分、客户背景分析、客户流失分析、欺诈发现等。仓储部门:库存结构分析、库存预警分析、库存盘点分析、产品流量分析等。6采购部门:采购合同分析、供应商分析、应付款分析、采购价格变动分析、原材料市场分析等。人事部门:人员结构分析、工资结构分析、员工负荷分析、企业人员培训分析等。这里的战略分析子系统主要可以实现以下功能:行业吸引力分析、行业机会威胁分析、行业结构分析、客户战略分析、供应商战略分析、企业竞争力分析、产品市场强度分析、企业经济效益分析、财务危机分析、人力资源战略分析等。2.3系统总架构为了满足企业内部不同部门的决策需求,以及企业战略决策需求,决策系统可以根据企业的具体情况分为两个层次,第一层为部门决策层,第二层为战略决策层,整体架构如图2.1所示。3.结束语基于数据挖掘的决策支持系统在技术上有效地解决了企业决策难以进行预测和分析的问题,从已经投入使用的数据挖掘工具表明,数据挖掘方法给企业带来了巨大的社会效益和经济效益。基于数据挖掘的决策支持系统是在更高层次上的系统整合,数据来源更广泛,集成度更高,挖掘目标更细化和抽7象化,这些对用户来说具有很大的应用价值,能给企业的管理与决策提供可靠的数据支撑,从而利于企业对市场的准备判断,提高经济效益。参考文献1.汤九斌,基于数据挖掘技术的决策支持系统及其关键技术研究(博士学位论文,南京理工大学)2.孙永剑,李仁旺,基于数据挖掘的服装决策支持系统(计算机工程,第31卷第16期,P194-196)3.RoigerRJ,GeatzerMW.翁敬农译.数据挖掘教程.北京:清华大学出版社,20034.BerryMJA,LinoffGS.袁卫译.数据挖掘—客户关系管理的科学与艺术.北京:中国财政经济出版社,20045.FayyadUM,Piatetsky-ShapiroG.KnowledgeDiscoveryandDataMining:TowardsaUnifyingFramwork[C].In:Proc.ofKDD—96,MenloPark,CA:AAAIPress,19966.陈文伟.决策支持系统教程[M].北京:清华大学出版社,2004.7.杨善林.智能决策方法与智能决策支持系[M].北京:科学出版社,2005.8.CalvaneseD,DragoneL,NardiD,etal.EnterprisemodelingandDataWarehousinginTeleeoItalia[J].InformationSystem,2006,31(1):l一32.9.TrisoliniSM,LenzeriniM,NardiD.DataintegrationandwarehousinginTeleeomItal[A].Philade1Phia,Pennsylva,USA,1999:538-539.10.段云峰,杨凤年.移动通信业务中的业务关联分析[J].电信科学,2001,17(n):17-1911.廖里,余英泽.数据挖掘和数据仓库及其在电信中的应用[J].重庆邮电学院学报,2000,12(4):31-34,78.

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功