SAP大数据探讨徐正君Zheng-jun.xu@sap.comCustomer©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.2CustomerAgenda大数据简述大数据平台•平台概览•数据库产品•数据管理产品•部分案例介绍大数据简述©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.4Customer什么是大数据?“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的5个“V”:•Volume(大量),数据体量巨大。•Variety(多样),数据类型繁多。包括日志、视频、图片、地理位置信息等等。•Veracity(精确),价值密度低,商业价值高。以视频监控为例,连续不间断监控过程中,可能有用的数据仅仅有一两分钟。•Velocity(高速),处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。•Value(价值),对管理和生产提供决策信息!©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.5Customer为什么需要大数据?快速地整合和管理不同类型的海量量数据,对原生形式的信息采用精确分析。可视化所有的可用数据,供数据挖掘使用。为构建新的分析应用程序提供了平台支撑。工作负荷的优化和调度。©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.6Customer为什么需要大数据?业务事件数据存储&集成&分析发布信息时间采取行动价值较低数据延时分析延时决策延时执行时间价值提升执行时间降低执行时间Source:RichardD.Hackathorn,BolderTechnology,Inc.©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.7Customer大数据平台的核心功能信息整合和治理海量数据仓库的快速分析传统技术结合Hadoop的增强分析支持流计算(Streamcomputing)大数据平台——概览©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.9CustomerSAP大数据平台概览Foundations●全新的数据模型和架构,覆盖全部数据处理需求●高效、简捷的数据平台,支持各类应用Benefits●无限制的存储、分析、优化、交易和调动数据。●轻松解决各类业务事务的变更。●通用的建模、集成开发环境,共享系统管理基础结构和部署独立的解决方案。●安全、统一的数据应用基础环境BusinessWarehouseBusinessIntelligenceMobile&EmbeddedERPHadoopBigDataIn-memory/real-timeSAPHANASAPReal-timeDataPlatformSAPSybaseESPstreamsSAPSybaseSQLAnywheremobileandembeddedSAPSybaseIQEDWSAPSybaseASEtransactionsSAPDataServices/SAPInformationStewardinformationmanagementCommonprogrammingAPIsSAPSybasePowerDesignermodelingSAPSybaseControlCentermonitoringHadoopBigData©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.10Customer简捷节约的数据平台SAPRTDP在复杂的数据仓库和集市中减少或消除数据聚合、索引、映射和转换的需要TransactionalDataDataWarehouseDataMarts©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.11Customer统一平台分析型数据仓库事务型数据库SAPRTDP事务分析实时统一的数据平台大数据平台——数据库产品©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.13CustomerSAPHANA的创新应用概览基于HANA的解决方案架构图()“肩并肩”的场景HANARDS(快速实施服务)●CRM客户细分●COPA●Finance&controlling●BWpoweredbyHANA●Businessplanning&consolidation(BPC)onHANA●BusinessSuiteonHANA●HANAnewanalytics●SAPHANADB●数据集市及相关应用●BOBJBI●SAPPA●文本&p预测分析●针对零售的销售分析●流动性风险管理●ERP运营报表●社交情感分析●销售管道分析●……●BusinessOneonHANA●SAPBusinessOneAnalyticsonHANA●HANAnewanalytics●BIonDemand●销售&运营计划●供应商信息网络●基于AmazonWebServices(AWS)开发环境●智能电表分析●精确零售●现金预测●来自合作伙伴的独立应用还有更多的来自SAP,ISVs和快速启动计划项目的解决方案HANA加速器HANAplatform(数据仓库/集市)HANAappsforSuite(包括:报表&分析)CloudonHANAAnyDBClientSAPBusinessSuiteHANADBAnyDBHANADBClientOD/SFsolutionsAnyDBHANADBSAPBusinessSuite&anyappDatamartSAPBOBJBI,VIAnyDBHANADBAppsSAPBusinessSuite实时分析BusinessSuiteonHANABusinessOneonHANA集成的场景HANADBCRMSCMSRMPLMERPVDLSAPBusinessSuiteBWAppsHANADBSAPBusinessOneBWonHANAAnyDBHANADBBWSAPBusinessSuite实时应用HANAnewappsHANADBApps新的领域实时平台不断创新的应用,协助企业高效,实时,安全的业务运营©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.14CustomerSAPASE—企业级的事务处理数据库信任优化成本生态圈支持拥有25年历史经严格验证的数据库技术OLTP数据库领导象限针对SAP应用优化的ASE为客户提供更优的性能,最大程度节省企业投资(软件费用,维护费用,管理成本,存储投资,后期升级费用)应用/数据库同步开发统一的技术服务SAP内置数据库管理DBACockpit有效的投资保护企业未来发展的全面保证支持对性能要求苛刻的企业级关键任务符合企业发展投资保护策略,与RS,HANA等其他关联产品和解决放案天然集成,为未来BI发展提供无缝跨接ASE可以根据应用需求,开发新的特性和功能,保持与应用的最默契关系,并推进应用的发展©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.15CustomerSybaseIQ–高效的业务分析数据库速度快速响应•基于列的存储结构,避免无效字段读取•专利索引技术实现高性能的数据访问•专门为查询分析设计,10-1000倍的快速查询响应•I/O减少90%,高效数据加载可扩展性适应大量的用户数•同时支持成百上千的用户数•从GB到上百个TB的数据•接近实时的新数据装入—数据库的用户查询几乎不受影响•与HANA和第三方BI/EIM工具的集成低TCO经济性•30-70%数据压缩,而不是数据膨胀•原生动态压缩,无需后续处理•按列存储,更高的数据压缩比•更少硬件、人员(无索引重构、调优)•更低的硬件要求(存储、主机)灵活性开放的标准•ANSISQL(ODBC,JDBC)•Unix,Linux,Windows灵活的查询•任何的查询(随机/固定)•任何的schema,无处不索引10项专利的领先技术,超过4,000独立安装点和2,000多客户业界领先的列式分析数据库成熟的列式存储全面的数据生命周期层次MPP查询,虚拟集市,和用户扩展高速数据加载结构化和非结构化数据处理©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.16CustomerSAPSybaseReplicationServer–高效的复制服务器SAPSybase复制服务器提供了从源数据库到一个或多个目标数据库的实时复制能力总是数据库–数据库(非文件–database)异构数据库的同步功能DirectConnect/ExpressConnectSybaseASESybaseIQReplicationAgentReplicationServerSybaseASENon-ASEDBs:Oracle,MSSQLServer,DB2/UDB源多地址目标支持异构数据库,提供基于日志的实时数据复制第三方数据库©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.17CustomerSAPSybaseEventStreamProcessor–事件流处理无限的输入数据流输出给应用和仪表盘捕获SAPHANA的数据等?输入流传感器数据交易事件报表工具应用Studio(Authoring)参考数据SAP®Sybase®ESPSAPHANA,SybaseIQ仪表盘消息总线转化原始数据成业务事件从原始数据流中实时捕获有用的信息过滤、合并和组织协调标示事件发生的趋势、模式持续的洞察正在发生的事件支持复杂事件处理及流式数据计算的应用大数据平台——数据管理©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.19CustomerSAPEIM-全面企业信息管理解决方案信息生命周期管理之前之后数据质量管理主数据管理内容管理企业数据建模数据集成治理与管控SAPDataServices:访问、集成、清洗、匹配和数据增强SAPSybasePowerDesigner:跨企业的模型构建SAPNWInformationLifecycleManagement:管理完整的信息生命周期SAPInformationSteward:检测、监控、以及数据质量治理SAPOpenText:在SAP商务套件内访问相关非结构化信息SAPMDM/MDG:集中化的主数据创建、维护和复制分发处理修复模型治理支持跨系统的实时信息和事件的采集,监控,处理©2014SAPAGoranSAPaffiliatecompany.Allrightsreserved.20CustomerSAPERP,SAPCRM,SAPMDG和MDM,SAPNetWeaverBW,…以及非SAP系统!BAPIs/IDocs/WebServices影响分析数据血缘分析数据检测SAPDataService高质量的数据服务管理数据服务引擎文本数据处理数据质量验证数据清洗增强Files,XML,HTML,Mainframe,Excel,文本,等等.Sybase,HANA,Oracle,SQL,DB2,HADOOPPeopleSoft,OracleApps,Siebel,SFDC,等SAPCRM,SAPERP,SAPNetWeaver,SAPBusinessOneSuccessFactors查询,报表,分析,仪表盘等数据迁移,同步,实时,…HANA,BW,Sybase业务用户界面(信息管理)技术用户界面(数据