商务智能的考试重点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1.商务智能的基本概念(简答)对工业界来说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强企业竞争力。对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识,有效的解决企业面临的管理和决策问题,支持企业的战略实施。2.商务智能系统的开发过程技术选择构建数据集市识别业务需求识别信息需求时间成本规划详细的需求分析数据定义实现设计需求分析增强查询报表在线分析处理数据挖掘算法构建数据仓库规划数据仓库数据集市OLAP设计数据挖掘设计3.在线分析处理和在线事务处理(简答)在线事务处理在线分析处理用户普通职员管理人员和分析人员功能日常业务处理决策支持数据库设计高度规范化非规范化数据处理在线插入、删除、修改批量加载和删除使用方式重复操作即时的、图表形式的交互查询执行单元短的事务处理复杂的查询数据当前的、细节的数据历史的汇总数据性能指标事务吞吐量查询响应时间事务特性并发控制和事务恢复很重要并发控制和事务恢复不重要4.决策支持系统的系统架构(1)模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。用户利用该系统可以方便快捷的构建和操纵模型。系统提供对模型的分类、删除、复制等维护功能,可以将已有模型进行合并,以及对模型的执行情况进行跟踪、分析和评价,如对变量进行敏感度分析等。(2)知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。(3)对话产生与管理系统主要负责用户与系统之间的交互。接受用户的输入,能够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。对话产生与管理系统用户知识库管理系统知识库数据库管理系统模型库管理系统数据库模型库6.回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。线性回归方法不仅用于预测,也可以用作解释模型,以探寻变量之间的关系。另外还有回归树和模型树等模型。7.回归系数的显著性检验:回归系数的显著性检验可以采用t检验。对于每个回归系数bi(i=1,2,....k),显著性检验的两个假设分别为H0:bi=0和H1:bi≠0。若bi=0说明自变量xi的变化对因变量没有线性影响,即变量xi对因变量的影响不显著。为每个回归系数bi构造变量tbi如式所示:式中cii是对矩阵C=(XTX)-1的对角线上的第i个值。给定显著性水平α,查自由度为(n-k-1)的t分布表,得到tα(n-k-1),若tbitα(n-k-1),则拒绝假设H0,即回归系数bi显著。在通过以上显著性检验之后,给定一个因变量位置的样本(xt1,xt2,...xtk)将其带入式^y=b0+b1xi+.......+bkxk中的各个自变量取值中就可以得到因变量的一个预测值。8.回归树和模型树:都是通过自顶向下分而治之的思想,将训练集不断分割成子数据集来不断扩展树枝,当满足一定条件时停止树的生长。9.聚类效果衡量方法:(概念)凝聚度:是用于衡量簇内各对象紧密程度的常用度量。分离度:用于衡量簇间各对象的相异程度。轮廓系数:也是将凝聚度和分离度相结合的一种度量。10.4类主要的数据预处理任务:(简答)1)数据规范化2)数据离散化3)数据清洗4)特征提取与特征选择11.数据清洗的主要任务是数据缺失的处理、噪音数据的处理以及数据不一致的识别和处理。填补数据缺失方法:将属于同一类的对象的该属性值的均值赋予此缺失值;还可以将其转换为分类问题或数值预测问题。噪音的处理方法可以分为两类:一类是识别出噪音,将其去除;另一类是利用其他非噪音数据降低噪音的影响,起到平滑的作用。12.多维数据模型(名):又称维度数据模型,由维度表和事实表两种类型的表构成。为了解企业内业务过程的绩效,通常可以通过多种度量指标加以衡量。对于每个度量,可以从多种视角和方位进行分析,这就是不同维度。度量通常是定量属性(还有数值型属性),存放于事实表中;维度属性综合起来限定了度量的取值粒度。13.在线分析处理OLAP的定义:在线分析处理是一类软件技术,利用它可以使分析人员、管理人员以及主管从多种信息视角通过快速、一致和交互地访问数据,达到对数据的洞察。这些视角是从原始数据转换过来的,反映了企业的真实维度,易于被用户理解。14.积分卡和仪表盘(名词解释):是常用的两种展示企业关键业务业务指标和度量的可视化工具。积分卡用于显示企业的关键性能指标(KPI),仪表盘综合各种类型的图形和报表,提供丰富的可视化界面,提供一个企业在某个时间的业务状态。15.云计算的定义:是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。1.商务智能的系统构成(填空/简答/论述)(1)数据源商务智能的根本是数据。数据的来源主要包括企业内部的操作型系统,即支持各业务部分日常运营的信息系统,以及企业外部的信息。(2)数据仓库各种数据源的数据经过抽取、转换之后需要被放到一个供分析使用的环境,以便对数据进行管理,这就是数据仓库。数据仓库可以将分析数据与实现业务处理的操作型数据隔离,一方面不影响业务处理系统的性能,另一方面为数据的分析提供了一个综合的、集成的、统一的数据管理平台。(3)在线分析处理数据仓库中的数据可以通过不同的方法进行分析。在线分析处理是其中的方式之一。利用该法,业务性能度量可以通过多个维度、多个层次进行多种聚集汇总,通过交互的方式可以发现业务运行的关键性能指标的异常之处。(4)数据探查数据探查包括灵活的查询、即时报表以及统计方法等。该类方法属于被动分析方法,因为这些分析方法需要基于分析者对于问题的假设。(5)数据挖掘数据挖掘是从大量数据中自动发现隐含的信息和知识的过程,属于主动分析方法,不需要分析者的先验假设,可以发现未知的知识。数据挖掘可以作用于结构化数据,也可以对文本数据以及多媒体数据进行分析。常用分析方法包括分类、聚类、关联分析、数值预测、序列分析、社会网络分析等。(6)业务绩效管理业务绩效管理,又称为企业绩效管理,是对企业的关键性能指标(如销售、成本、利润以及可盈利性等)进行度量、监控和比较的方法和工具。2.数据仓库的体系结构:(论述)数据源部分:支持企业日常业务的操作性系统中的数据以及已经存档的数据都是数据仓库的数据来源。各种数据源中的数据通过一定的处理才能储存到数据仓库中,处理一般利用ETL(抽取转换加载)工具完成。抽取过程:从不同的数据源把需要的数据读取出来就是抽取过程,不同的数据源的数据结构可能不同,因此,需要针对不同的数据源采用不同的抽取工具,可直接使用商品化的工具来抽取常见数据结构的数据。转换过程:主要涉及数据清洗、数据集成、数据汇总等功能。加载过程:分为两种情况:一种是数据仓库建成之初,需要将各种数据源中的数据大批量的一次性导入到数据仓库中;另一种是数据仓库正常运作之后,需要将操作性系统的数据更新定期加载到数据仓库中。不同的数据的加载频率可以不同。元数据部分:是对数据仓库中数据的描述信息。主要描述三方面的信息:数据源数据信息、数据抽取与转换方面的信息以及数据仓库中的信息。数据仓库部分:数据仓库中的数据通常利用关系数据库系统进行存储和管理。也可以采用多维数据库存储和管理。是数据仓库中的数据可以根据部门或分析主题的要求导入数据集市中,或通过多维数据服务器创建立方体数据,这些不同形式的数据可以利用各种不同的前端工具进行分析和展现。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功