数据整合、数据质量和文本分析——SAPBusinessObjectsDataService4.0介绍曲耕辰EricQuBI&EIMSolutionPrincipalSAP创新成就未来巡展2011©2011SAPAG.Allrightsreserved.2Confidential议程1.SAP在企业信息管理方面的愿景和方案2.SAPBusinessObjectsDataServices4.0介绍1.释放信息的力量2.交付最值得信赖的信息3.成就卓越运营©2011SAPAG.Allrightsreserved.3Confidential如今管理信息面临的问题痛处不一致的和易错的数据分散管理的信息,缺乏企业范围内的协同IT负责管理数据由于数据的复杂性和分散造成的多余工作和重复劳动在数据集成商浪费大量的资源,在创新方面却投入不足需求可信赖的信息信息治理业务用户授权加速价值实现时间,更低的总拥有成本EIM套件中含有开箱即用的SAP方案集成方案©2011SAPAG.Allrightsreserved.4ConfidentialSAP对企业信息管理的愿景工具:企业信息管理的一体化方案许多用户界面元数据分散在多个资料库中多种途径确定规则多个引擎多个平台面向所有企业信息管理任务的一体化解决方案对不同类型的用户(IT和业务用户)有不同的用户界面无缝集成的元数据数据整合与数据质量文本分析元数据管理数据剖析主数据管理设计管理管理/治理语义层©2011SAPAG.Allrightsreserved.5ConfidentialSAPBusinessObjectsEIM4.0发布目标界面业务用户界面设计界面系统管理界面用户开发人员管理员数据属主和业务分析员平台BI和EIM的统一信息平台服务ETLDQProfileTDPMDM关注业务用户通常情况下,EIM产品并未关注到非IT人员需求,即使某些操作需要相当的业务知识和输入,操作界面也显得过于技术化。我们计划改变这个现状。数据治理和信赖EIM从基础信息架构方面提供了关于数据治理和提高数据可靠性方面的关键要素。从数据质量到数据剖析,再到业务元数据,我们将提供基于数据治理目标的关键EIM服务。集成的EIM套件部署EIM的高昂成本通常是因为零碎的,彼此互不连接的工具造成的。基于一个统一平台的套件则将有效降低开发成本和运维成本。©2011SAPAG.Allrightsreserved.6ConfidentialSAPEIM方案交付创新的产品和统一的方案TextAnalysisMetadataManagementDataIntegrationDataQualityManagementSBOPDataServicesSBOPDataInsightSBOPInformationStewardMasterDataManagementDataProfilingSBOPMetadataMgmtSAPNWMDMSBOPTextAnalysis现状下一版本方案©2011SAPAG.Allrightsreserved.7ConfidentialSAPEIM方案交付创新的产品和统一的方案TextAnalysisMetadataManagementDataIntegrationDataQualityManagementSBOPDataServicesSBOPDataInsightSBOPDataServicesSBOPInformationStewardMasterDataManagementDataProfilingSBOPMetadataMgmtSAPNWMDMSBOPTextAnalysis现状下一版本方案©2011SAPAG.Allrightsreserved.8ConfidentialSAPEIM方案交付创新的产品和统一的方案TextAnalysisMetadataManagementDataIntegrationDataQualityManagementSBOPDataServicesSBOPDataInsightSBOPInformationSteward4.0SAPNWMDM7.3MasterDataManagementDataProfilingSBOPMetadataMgmtSAPNWMDMSBOPTextAnalysis现状下一版本方案SBOPBIplatformSBOPDataServicesXI4.0DQMSDK4.0©2011SAPAG.Allrightsreserved.9ConfidentialDataServices(C++/JAVA)ASAPBusinessObjectsEIM4.0组件架构图DataServices和InformationSteward均依赖SAPBusinessObjects商务智能平台,以执行作业调度、安全管理和系统管理功能。此外,InformationSteward依赖DataServices提供某些关键功能,包括数据剖析,数据清洗规则的运行等。BOEORNewSecurity/SchedulingModuleInformationSteward(JAVA/FlexUI)MonitoringProfilingCleansingPackageBuilderImpactLineageSAPBusinessObjectsBusinessIntelligencePlatformDataServices(C++/JAVA)DITransformSDKDSPlatformDataServicesTDPDQDataQuality(DQ)TextDataProcessing(TDP)InformationStewardDQMSDK(C++/JAVA/.Net)DQMSDK©2011SAPAG.Allrightsreserved.10Confidential议程1.SAP在企业信息管理方面的愿景和方案2.SAPBusinessObjectsDataServices4.0介绍1.释放信息的力量2.交付最值得信赖的信息3.成就卓越运营©2011SAPAG.Allrightsreserved.11ConfidentialSAPBusinessObjectsDataServices4.0为SAP系统和非SAP系统提供开放支持业务分析(EIM,BI,EPM,GRC)内存计算(HANA)主数据管理(MDM)SAPBusinessSuiteandBWSybase第三方应用,数据库以及技术接口对非结构化数据提供内置的文本数据处理,以支持所有类型数据通过InformationSteward提供数据剖析、元数据管理、数据质量、数据质量评分,从而至支持信息治理让业务用户定义清洗规则,清洗任何数据,从而交付新一代的数据质量管理方案SAP的数据整合和数据质量平台©2011SAPAG.Allrightsreserved.12ConfidentialSAPBusinessObjectsDataServices4.0和HighPerformanceAnalyticEngine(HANA)SAPERP任意数据源BW数据加载元数据资料库服务器OpenHubSAPBusinessObjectsDataServicesHANADesignerandManagementConsoleDataServices用来将各种数据加载到NewDB(in-memory)HANAModeler将生成初始化数据加载作业Modeler使用DataServices来浏览和“导入”外部元数据Modeler生成初始化数据流实现向NewDB中加载数据通过DataServicesDesigner进一步修改数据流©2011SAPAG.Allrightsreserved.13Confidential释放信息的力量首创的、并且是唯一的内置了非结构化数据支持的企业级数据整合,数据质量和数据剖析应用通过直观的业务用户界面,使得用户能够掌控数据,定义数据标准唯一一个能够支持非结构化数据源的工具,拓展您的数据视野成就卓越运营降低成本,加速实现产品利润,简化IT基础设施,这一切均可通过一个简单易用的产品来实现,并且实现最低的总拥有成本将用户和开发的效率提至最高,通过转换组件和对象的重用,简化系统的运维对SAP系统和非SAP系统实现最深入的整合,实现最低的成本和最快的价值实现速度SAPBusinessObjectsDataServices4.0访问支撑关键业务流程所需的相关数据,而无论这些数据时什么类型,什么来源,属于什么领域提升业务决策和业务流程中的数据信心,从而实现业务的更好运营只需支持和维护一个应用,从而实现更低的总拥有成本好处提供最值得信赖的信息无论数据来自何种行业,哪个地点,还是不论是关于客户、产品、物料等哪个领域,DataServices4.0都提供了访问和提高数据质量的最完整方案。通过影响分析和数据血统分析,提供随时可用的数据追踪能力,帮助用户作出信心十足的决策共享数据质量仪表盘,监控并发现数据质量对治理规则和标准的符合程度变化趋势©2011SAPAG.Allrightsreserved.14Confidential议程1.SAP在企业信息管理方面的愿景和方案2.SAPBusinessObjectsDataServices4.0介绍1.释放信息的力量2.交付最值得信赖的信息3.成就卓越运营©2011SAPAG.Allrightsreserved.15ConfidentialGartner:数据治理方案看起来什么样?Source:Gartner,AndrewWhite,10/4/10©2011SAPAG.Allrightsreserved.16ConfidentialSAPBusinessObjectsInformationSteward产品愿景应用一个单一环境,赋予务用户和IT用户对企业数据资产的质量进行发现、评估、定义、监控和提升的权限。定义定义业务术语,验证规则,清洗规则,模型等定义数据属主:为数据分配属主,责任和角色发现发现和理解企业数据数据剖析,元数据管理数据资产分类监控和纠正在业务用户的应用程序中展现数据质量评分解决数据质量问题的工作流监控数据质量SAPBusinessObjectsInformationSteward©2011SAPAG.Allrightsreserved.17ConfidentialSAPBusinessObjectsInformationSteward4.0功能概览数据质量记分卡数据质量监控数据剖析数据血统变化影响清洗规则业务术语表©2011SAPAG.Allrightsreserved.18Confidential内置的数据质量记分卡,通过DataStewards配置:面向数据质量的记分卡方法数据质量评分指标最新的数据质量得分数据质量趋势从一个数据属主角度衡量数据质量的记分卡关键质量维度(数据质量KPI)下钻查看记分卡细节©2011SAPAG.Allrightsreserved.19ConfidentialSAPBusinessObjectsInformationSteward价值定位授权业务用户在推动信息管理方面,架起业务与IT之间的桥梁治理企业从信息通过业界第一个将数据剖析和元数据管理整合在一起的方案,实现有效的数据治理提供信息透明度通过端到端的影响分析和血统分析,提供即时的数据质量级别、起源信息提高信息治理成效,提升数据质量©2011SAPAG.Allrightsreserved.20Confidential运行时架构元数据资料库SAPBusinessObjectsDataServices4.0数据整合、数据质量和文本分析的一体化方案统一的运行时架构统一的开发用户界面统一的管理工具,同一套连接适配组件DataServices4.0清洗交付转换数据访问运行时架构元数据资料库开发用户界面管理工具和连接适配组件开发用户界面DataServic