BI基础概念培训

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

让数据变为财富——商务智能平台交流目录•商务智能(BI)简介•介绍术语•OLTP和OLAP的区别•OLAP的整体框架•数据仓库的内部结构•数据立方和数据仓库的关系•多维数据集组成•数据仓库的维度表在OLAP里的表现形式。•查询立方什么是商务智能(BI)?•现代化的业务操作,通常会产生大量的数据,如何从如此繁多的业务数据中提取有用的信息,然后根据这些信息来采取明智的行动,这是决策者面临的最大问题,这也就是商务智能解决的问题。什么是商务智能(BI)?•商业智能能够辅助业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。•商业智能是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力(insight),促使他们做出对企业更有利的决策。理解商务智能•目标:数据信息转化为商务价值•方法:转储、监控、分析和展现海量数据•过程:知识决策价值数据信息行动什么是商务智能(BI)?•商业智能的关键:是根据企业发展需要,建立业务模型,从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性.•然后对数据经过抽取(Extraction)、转换(Transformation)和装载(Loading),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图.•在此基础上利用合适的查询和分析工具、数据挖掘工具、联机分析处理(OLAP)工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。BI的基本框架什么是商务智能(BI)?•所需技术:ETL数据仓库、联机分析处理(OLAP)工具数据挖掘等技术。•商务智能的实现涉及到软件、硬件、咨询服务及应用商务智能发展历程•1964年,一个叫MichaelS.ScottMorton的研究员在哈佛商业学院提出了“决策支持系统”的想法,这便是BI商务智能萌芽。•20世纪70年代之后,当企业建立了大量的IT系统,信息已经不再缺乏而是泛滥,而企业国际化、消费者需求的多样化与苛刻、竞争对手数量的增加和竞争层次的提高,无不要求企业更加关注对企业内部知识、外部信息的提炼和洞察,以保证企业决策的快速与准确。•80年代,“商业智能”的标准是能容易地获得想要的数据和信息。•90年代是商业智能真正起步的阶段。商务智能发展•当前,商务智能(BI)市场正处于一个重要的转型期•进入二十一世纪,“应用”成为关键词之一,商务智能的深入应用也成为业界关注的焦点•2003年起,商务智能领域掀起并购热潮BI受市场关注的原因•如何利用大量数据进行决策:ERP/SCM/CRM等产生大量地数据,刺激了BI投资,其目的应用数据进行决策•绩效管理成为BI市场增长重要因素:绩效管理是驱动商业智能市场增长的重要因素之一,绝大多数公司希望在该领域做出成绩•日益严格的行业规范要求:例如萨班斯-奥克斯利(Sarbanes-Oxley)法等法案的颁布,也推动了BI工具的接受和认同商务智能的热点应用•财务–绩效评估–盈利分析–预算–风险控制–欺诈识别•市场–客户关系管理–市场促销–市场细分–品牌管理–客户忠诚度分析–客户流失分析–产品及服务目录管理•销售–销售分析–客户管理–销售漏斗管理–需求预测–关联销售分析–Web点击流和销售分析•运营–供应链优化–IT运营优化–分销商评估–质量控制–内部管理流程优化BI国内应用l企业信息化整体上处理基础建设阶段数据整合,规划基础体系架构,实施基础应用l多数企业BI应用处于较低的层次报表查询+初步分析l金融、电信、保险等企业起步早些BI应用的大好时期正在到来BI主要用途BI具有三方面的主要用途:•对组织的财务和运营健康状况进行监视。–报告、分析工具、关键性能指标(KPI)和仪表板•规范组织的运营•从数据中挖掘出新的信息–同运营系统、信息反馈系统的双向集成BI对现有系统的整合•基于现有业务系统和历史数据•通过对数据的充分运用提升现有系统价值•可以同时支持多种不同的数据库平台•面向数据分析而非过程跟踪•可以基于实时数据也可以基于非实时数据商务智能系统如何辅助决策•通过数据的整合提供更加全面的信息•通过预先计算提供更快捷的速度•通过OLAP技术可以非常灵活的以多种形式展现数据,以使管理者发现问题•通过数据挖掘模型(以历史数据为基础)预测商务的未来走势,为管理者提供决策支持商务智能应用的范围•不局限于某一个行业或局限于具体的业务–面向的是数据,不是过程–使用通用的分析方法和模型•不局限于特定的使用人–Informationworker、KnowledgeWorker–领导层和决策层–任何其他需要使用数据和报表的人•受行业发展冷热的影响不大–IT行业发展的时候需要商务智能–IT行业冬天的时候仍然需要商务智能市场份额主要由国际BI厂商占领为什么我们需要商务智能?•我们在未来的三年中将会制造出比过去三十万年更多的数据资料!!!------加州大学信息管理学院<<商业周刊>>统计,54%的人认为很难找到他们想得到的信息.43%的人认为不知道这些内部的信息是否正确.77%的人认为由于信息的缺乏,很多决定是不正确的.61%的人认为50%的决定是拍脑袋来的.为什么我们需要商务智能?•在过去的几十年里,各种机构已经花费了大量的财力和资源去构建联机事务处理系统(OLTP)和资源计划系统(ERP)等各种系统.不断累计的信息和存储在数据仓库中的数据达到了令人惊讶的规模。•当这些系统极大地改善了信息的自动处理能力时,也造就了很多“信息孤岛”(informationsilos)------大量只有很有限的获取和分析能力的数据。一项IBM的调查表明,大部分机构只利用了其存储信息的2%--4%。北京市管委IT状况•应急事件处理数据•基础地理信息数据•视频监控数据•城管通平台数据•井盖数据•市政设施数据•环卫信息数据•户外广告数据•……视频监控数据应急事件处理数据基础地理信息数据城管通平台数据环卫信息数据户外广告数据市政设施数据井盖数据?为什么我们需要商务智能?•传统的方案不能提供一个经过整合的,功能强大的分析工具给最终用户。特别是给那些非技术的商业用户。由于下图中所示的两个主要原因,传统系统不能满足商务层面的分析需要。难以获得的信息未经整合的信息获得性和整合性的空缺传统分析系统常见问题术语介绍•数据仓库:面向主题的、集成的、与时间相关且不可修改的数据集合。•维度:维度是分析中描述性的分类,通过它可以将度量值分离出来进行分析•度量:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。即,度量值是最终用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于最终用户所请求的信息类型。一些常见的度量值有salescost、和productioncount等术语介绍•粒度:数据汇总的层次或深度。•聚合:聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。•切片:由一个维的一个成员限定的分区数据,称为一个切片。•数据钻取:最终用户从常规多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个操作过程就是数据钻取。•级别:级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。OLTP与OLAP的区别•OLTP(On-LineTransactionProcessing)联机事务处理•OLAP(On-LineAnalysisProcessing)联机分析处理OLTP与OLAP的区别•OLTP系统的特征–处理实时业务–包含了为数据录入和编辑进行优化的数据结构–提供有限的决策支持能力•OLTP系统的例子–订单系统–客户服务l库存管理l财务OLTP与OLAP的区别OLTP•原始数据•细节性数据•当前值数据•可实时更新•一次处理的数据量小•面向应用,事务驱动•业务操作人员•支持日常操作•简单的事务•100MB-GB•OLAP•整理后的数据•综合性和提炼性数据•历史数据•周期性刷新更新•一次处理大量的数据•面向主题,分析驱动•决策人员,高级管理人员•分析决策•复杂的查询•100GB-TB数据仓库的特征•为商业分析过程展示数据•提供一致的历史数据存储•把数据储存为抽取和查询而优化的结构•整合异构的数据•统一有效的数据源•把数据整理为稳定、面向主题的结构数据仓库系统的创建数据仓库终端用户原始业务数据数据集结区数据的提取,转换,加载(ETL)了解数据仓库数据仓库终端用户数据集市OLAP数据仓库维度表•维度是分析中描述性的分类,通过它可以将度量值分离出来进行分析。主键•主键–唯一性–关联事实表与维度表•两个选择–应用主键(appsuffix):原业务系统的主键–代理键(keysuffix)数据仓库系统产生的数字键product_id_appproduct_dim_key在维度中分不同的层次•定义层次结构的好处–允许用户从不同的层次展示数据–在分析中采用不同的路径进行钻取•举例:日期分为,年-半年-季度-月-日期星型模型Employee_DimEmployeeKeyEmployeeID...Time_DimTimeKeyTheDate...Product_DimProductKeyProductID...Customer_DimCustomerKeyCustomerID...Shipper_DimShipperKeyShipperID...Sales_FactTimeKeyEmployeeKeyProductKeyCustomerKeyShipperKeySalesAmountUnitSales...雪花模型•在多维表中定义层次•节省存储空间•存取效率较低事实表的组成维度表customer_dim201ALFIAlfredsproduct_dim25123Chai事实表customer_keyproduct_keytime_keyquantity_salesamount_sales外键2012513440010,789事实表中的粒度就是维度表与事实表中相关联的最小级别的数据1341/1/2000time_dim度量值事实表库存数,入库数,出库数产品的销售数量,成本,销售额,订单数度量值:业务数据外键time_dim_keyproduct_dim_keycustomer_dim_keyproduct_keycustomer_keyorder_date_key外键约束•与维度表中的主键的联系•使事实表的数据与维度表发生关联外键约束外键约束数据仓库和多维立方终端用户数据存取数据集市OLAP数据仓库多维数据集的组成•度量值–用户分析的业务数据•维度–度量值的事实记录的特性–来源于维度表•Cubes–综合维度和度量值的数据模型–OLAP数据的逻辑存储介质维度表-OLAP维度YearQuarterMonth1999Q1Jan1999Q1Feb………时间维MonthQuarterYear关系表OLAP立方重庆杭州北京上海地区Q4Q3Q2苹果樱桃葡萄Q1西瓜地区维Q4Q3Q2苹果樱桃葡萄Q1西瓜查询立方重庆杭州北京上海1000销售量设计数据仓库设计数据仓库的步骤和注意点•步骤:1.确定主题2.确定分析模型3.建立数据仓库4.建立ETL过程5.建立数据立方•注意点:1.尽量采用星型模型2.事实表里的代理键在维度表里必须存在

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功