Thinkbig,ThinkfastEMC的大数据解决方案2013-11-5Thinkbig,Thinkfast•什么是大数据?•EMCGreenplum简介•DB软件架构介绍•行业解决方案•实际案例分享22013-11-5Thinkbig,Thinkfast什么是大数据?Thinkbig,Thinkfast什么是大数据?数据大(Volume)时效性高(Velocity)种类和来源多样化(Variety)Thinkbig,ThinkfastEMC&Greenplum?2013-11-5Thinkbig,Thinkfast是一家数据库软件公司。在全球数据处理和BI/DW领域,提供容量最大、速度最快、性价比最好的数据仓库引擎产品和咨询服务Thinkbig,ThinkfastThinkbig,Thinkfast2010年EMC公司收购GreenplumEMC公司是全球信息基础架构技术与解决方案的领先开发商与提供商,是全球最大的企业存储设备和软件提供商。2013-11-5Thinkbig,ThinkfastEMCGreenplum大数据三部曲2013-11-5Thinkbig,ThinkfastGreenplumProductLine2013-11-5Thinkbig,Thinkfast典型的数据分析体系架构业务系统OracleDB2SQLServerMySQLPostgres数据移劢、抽取、转换、加载(ETL)InformaticaDataStageAbInitioPervasiveSegent报表和分析•MicroStrategy•Arcplan•BusinessObjects•Cognos•Hyperion•SAS•Insight运营系统ERPSCMCRMOA,HR…2013-11-5集成数据库、存储和硬件于一体Thinkbig,Thinkfast全球各地的代表性客户12Thinkbig,ThinkfastDB软件架构介绍2013-11-5Thinkbig,ThinkfastShare-Nothing的完全并行架构共享磁盘例如:OracleRACDBSAN/共享磁盘DBDBDB网络SAN/FC完全共享例如:SMP服务器DB磁盘完全不共享例如:GreenplumDBDBDBDB网络磁盘磁盘磁盘磁盘Master注:所有的共享资源都用蓝灰色表示Thinkbig,ThinkfastGreenplum基础架构MPP应用程序通过Master主机访问数据在存储节点和Master主机之间交换数据每一个存储节点都是独立的数据库(无共享)QueryPlan2013-11-5MPP=MassiveParallelProcessing海量并行处理结构Thinkbig,ThinkfastMPP/无共享架构的优势•最易于扩展的架构–云数据库和数据分析的最佳选择•自劢化的并行处理机制–内部处理自动化并行,无需人工分区或优化–加载与访问方式与一般数据库相同•数据分布在所有的并行节点上–每个节点只处理其中一部分数据•最优化的I/O处理–所有的节点同时进行并行处理–节点之间完全无共享,无I/O冲突•增加节点实现线性扩展–增加节点可线性增加存储、查询和加载性能Thinkbig,Thinkfast行业解决方案2013-11-5Thinkbig,Thinkfast行业商务智能解决方案政府电信金融服务信息传播公民服务国家安全电子政务人力资本管理法规实施和监管合规性报告欺诈检测客户报表电汇通知分部记分卡资产组合分析客户关系管理、收购和盈利率欺诈分析客户流失分析响应时间流量分析产品关联/捆绑零售预防亏损优化供应链存储运营分析客户忠诚度计划协作规划和预估Thinkbig,Thinkfast实际案例分享2013-11-5EMC劲霸男装BI方案Greenplum大数据分析提高商业智能效率Greenplum统一智能管理多用户查询Thinkbig,Thinkfast242013-11-5谢谢观看