专业文献综述(说明:以下所有红色、蓝色文字仅供参考,学生在写作论文时请保留字体、字号,改写或删除掉文字,黑色文字请保留。每一页的上方(天头)和左侧(订口)分别留边25mm,下方(地脚)和右侧(切口)应分别留边20mm,页眉和页脚为0。论文题目使用黑体三号字,小标题使用黑体小四号字,正文使用宋体小四号字;首行缩进2个字符,行距为单倍行距,段前段后为0.5行,字符间距为标准。为保证打印效果,学生在打印前,请将全文字体的颜色统一设置成黑色。以上说明参阅后请自行删除,包括本文本框!!!)题目:基于数据仓库的决策支持系统姓名:冯君娜学院:信息科学技术学院专业:计算机科学与技术班级:计科14班学号:1921406指导教师:黄芬职称:副教授200年月日南京农业大学教务处制基于数据仓库的决策支持系统(3号黑体)作者:冯君娜指导老师:黄芬(小四宋体)摘要:随着社会对信息需求的增加,传统的决策支持系统已不能满足需要。本文就近几年正快速发展的新型决策支持系统――基于数据仓库的决策支持系统进行了讨论。文中给出了决策支持系统的概念及特点,分析了传统决策支持系统的不足之处,并在此基础上提出了基于数据仓库的决策支持系统,介绍了它的体系结构,最后对构成这种新型DSS的技术――数据仓库(DW)技术、联机分析处理(OLAP)技术、数据挖掘(DM)技术作了更深一步的探讨。摘要:×××××××××(200—300字,小四宋体)××××××××………关键字:决策支持系统;数据仓库;联机分析处理;数据挖掘(×;××;3-5个,小四宋体)DecisionSupportSystemAndDataWarehouse(3号TimesNewRomar)FENGJun-na,HUANGfen(小四TimesNewRomar)(NanjingAgriculturalUniversity,CollegeofInformationScienceandTechnology,JiangsuNanjing210095)Abstract:Astheincrementofthesociety'srequirementofinformation,thetraditionaldecisionsupportsystemcan'tsatisfythedemand.ThispaperdiscussesanewtypeofDSSwhichdevelopsquicklyinrecentyears――theDSSbasedondatawarehouse.InthispapertheconceptandfeaturesofDSSaregivenandthedrawbacksofthetraditionalDSSisanalyzed.Onthebasisofthese,theDSSbasedondatawarehouseisproposed,andthearchitecturestructureisintroduced.Finally,thedatawarehousetechnique,theonlineanalyticalprocessingtechniqueandthedataminingtechniqueisdiscussedfurtherinthearticlewhichmakeupofthenewtypeofDSS.(小四TimesNewRomar,200—300个实词)Keywords:decisionsupportsystem;datawarehouse;onlineanalyticalprocessing,;datamining×××××;×××(3-5个,小四TimesNewRomar)引言:随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库的数据量和规模也在急剧增长。企业要想在当今日益激烈的竞争环境下生存和发展,建立一个企业的决策支持系统(DecisionSupportSystem,简称DSS)非常必要。但企业决策者目前已不仅仅满足于对数据的简单维护和查询,而是更希望能有效地对变化的商业环境进行分析,使信息不仅能反映市场变化的瞬间状态,而且还能反映它的历史及趋势,得到数据更深层次的信息,以利于决策支持。数据仓库的出现及决策支持系统工具的充分利用,无疑给决策支持系统的发展注入了新的活力。(前言(引言):标题用小四号黑体,其它文字用小四宋体)正文:×××××(标题用小四号黑体,其它文字用小四宋体)××××××××1□决策支持系统的概念及特点决策支持系统(DSS),是以管理科学、运筹学、控制论和行为科学为基础,以计算机仿真技术和信息技术为手段,针对半结构化的决策问题,支持决策活动的智能作用,为决策者提供数据和信息,帮助明确决策目标和问题的识别,建立基本决策模型,提供各种备选方案,并且对各种评价和优选,通过交互功能进行分析、比较和判断,为正确决策提供必要的支持的系统[5]。决策支持系统的主要特点:1)系统是面向决策者的,在运用DSS的过程中,参与者都是决策者。2)系统解决半结构化的决策问题,模型和方法的使用是确定的,但是决策者对问题的理解存在差异,特定的环境,问题的条件也不确定,这使得决策结果具有不确定性。3)系统是支持的概念,帮助加强决策作出科学决策的能力。4)系统的驱动力来自模型和用户,模型是系统完成各环节转换的核心。2□传统的决策支持系统传统的决策支持系统由数据库、模型库、知识库及人机交互接口四大部分组成,通过这四部分的集成来完成其决策支持[1]。然而随着社会对信息需求的增加,传统的DSS已不能满足要求。主要原因有以下几个方面:1)决策支持涉及大量历史数据和半结构化问题,而在传统数据库管理系统基础上建立决策支持系统只能提供辅助决策过程中的数据级支持,难以求解复杂的半结构化决策问题。2)决策支持系统以集成数据为基础,然而现实中的数据往往分散管理且大多分布于异构的数据平台,数据集成不易。3)决策支持系统的建立需要对数据、模型、知识和接口进行集成,而数据库语言数值计算能力较低,因而采用数据库管理技术建立决策支持系统知识表达和知识综合能力比较薄弱,难以满足人们日益提高的决策要求[2]。3□基于数据仓库的决策支持系统体系结构九十年代初,数据仓库(DW)技术的发展为传统决策支持系统所面临的问题的解决带来了新的契机。当数据仓库以及随之发展的联机分析处理(OLAP)和随后发展的数据挖掘(DM)技术被融入到传统DSS时,一种新型的DSS――基于数据仓库的决策支持系统便随之出现了。数据仓库、OLAP和数据挖掘技术是目前信息科学最前沿的3个研究方向。虽然最初它们是作为3种独立的信息技术出现的,但是由于三者之间存在着内在的联系性和互补性,把它们结合起来构建出基于数据仓库的新型决策支持系统,就可以更加充分发挥它们各自的优势,为决策提供更加有效的支持[6]。3.1基于数据仓库的决策支持系统的体系结构基于数据仓库的决策支持系统的体系结构,如图1所示。基于数据仓库的决策支持系统是以数据仓库为基础,以联机分析处理与数据挖掘为工具的新的决策支持系统,其中数据仓库从源数据库中抽取数据,并对其进行综合、集成与转换,提供面向全局的数据视图。联机分析处理实现多维数据分析,它从集成的数据仓库中的数据出发,通过构建多维的数据模型对信息从多种可能的角度进行快速、一致、交互性地存取,进而实现对数据进行深入的分析。数据挖掘自动地挖掘数据中隐藏的模式和信息,预测未来的趋势,并可以直接用于指导联机分析处理。数据仓库、联机分析处理和数据挖掘技术是相辅相成的,它们相互结合共同支持决策。随着企业竞争的日趋激烈,这种新型的DSS方案受到越来越多企业的青睐[3]。图1基于DW的DSS的体系结构[3]3.2数据仓库技术数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用以支持企业或组织的决策分析处理[4]。它作为决策支持系统的基础,对业务数据进行了有效的组织。DW不是业务数据的简单堆积,而是从大量的事务型数据库中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据聚合在一种特殊的格式中。DW有以下四个特征:(1)面向主题:面向主题的数据组织方式,就是在较高层次上对分析对象的各项数据以及数据之间的联系作一个完整一致的描述。所谓主题,就是企业某一宏观领域所涉及到的分析对象,如一家商场应有的主题包括客户、供应商、产品、销售、利润等。(2)集成:数据仓库中的数据并非由自身生成,而是来源于其它数据系统,这些系统相对于数据仓库称为数据源。而这些数据源中的数据存在许多矛盾之处,如字段的字长不一致、单位不统一、同名异义、异名同义等。数据仓库通过对各种系统的数据进行重新组织和集中存储,实现了对不同格式和重复内容的数据的统一,从而为决策分析提供了一致的高质量的数据来源。(3)不可更新:数据仓库中的数据主要用于决策分析,所涉及的操作主要是数据查询,且数据一经确定,就很少变更。数据的变化反映为新数据被补充到数据仓库,而不是替代原数据,这样确保了数据的稳定性,符合决策分析的要求。(4)随时间不断变化:对于系统(而不是用户)而言,由于数据源的变化,必须不断地操作数据OLTP数据业务数据外部数据数据仓库数据集市OLAP服务器数据挖掘DSS应用更新数据仓库中的数据以反映这种变化。这一点通过以下三方面表现出来:数据仓库随时间变化不断增加新数据到库中;数据仓库随时间变化不断删除旧数据;数据仓库中包含有大量的综合数据,其中很多跟时间有关,要随着时间的变化不断对它们进行重新综合。数据仓库系统的具体结构可分为:数据源、后端加工、前端服务以及数据仓库的管理。数据源为DW提供源数据,如各种生产系统数据库、联机事务处理系统的事务数据、外部数据源等都可以作为DW的数据源。后端加工工具即数据ETL(抽取、转换、装载):其功能是从数据源中抽取数据,对数据进行检验和整理,并根据DW的设计要求,对数据进行重新组织和加工,装载到DW的目标数据库中,并且可以周期性地刷新DW以反映源的变化以及将DW中的数据作转储。数据仓库管理主要是通过元数据来实现的,元数据仓储用于存储数据模型和元数据,其中,元数据描述了DW中源数据和目标数据本身的信息,定义了从源数据到目标数据的转换过程,这些可以通过数据建模工具管理以适应企业业务的发展,来满足企业决策和综合分析的需要;DW监控和管理工具对DW的运行提供监控和管理手段,包括系统资源的使用情况、用户操作的合法性、安全管理、存储管理等多方面的内容。DW存储经检验、整理、加工和重新组织后的数据,它可以是关系数据库(ROLAP)或多维数据库(MOLAP)。前端工具主要是删工具和OLAP分析工具,这些工具从数据仓库获取数据通过OLAP服务器,OLAP服务器存储数据立方体,它是功能强大的多用户的数据操纵引擎,特别用来支持和操作多维数据结构[2]。3.3联机分析处理技术联机分析处理(OLAP)是一类以DW为基础的C/S方式软件技术,能够帮助分析人员、管理人员以多种角度从原始数据中转化出来的、能够真正为用户所理解的、并真实反映数据维持性的信息,进行快速、一致、交互地访问,从而获得对数据的更深入的了解。它侧重于数据仓库中的数据分析,并将其转换成辅助决策信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系[5]。另一个特点是在线性,体现为对用户请求的快速响应和交互式操作,它的实现是由C/S这种体系结构来完成的[2]。OLAP技术中比较典型的应用是对多维数据的切片和切块、钻取、旋转等,它便于使用者从不同角度提取有关数据。OLAP技术还能利用分析过程对数据进行深入分析和加工。例如关键指标数据常常用代数方程进行处理,更复杂的分析则需要建立模型进行计算。3.4数据挖掘技术数据挖掘(DM)是决策支持系统的重要组成部分,是一种决策支持过程,是知识发现的核心部分。它从大型数据库或数据仓库的数据中,提取人们感兴趣的知识,即正确的、非平凡的、未知的、有潜在应用价值的并最终可为用户理解的模式[3]。DM的分析过程分为4个步骤[5]: