大数据解决方案及产品

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

VoltDB高频大数据解决方案电信领域计费和权限管理,用户数据个性化营销广告优化,观众分组能源与传感器领域智能电网/电表,资产跟踪与管理,实时交通与地理位置证券市场风控管理,市场数据管理基础设施数据管道,批次-实时,流媒体的ETL系统中的高频数据2SmartMeter高度切合领域更快:读/写负载延时/吞吐量0123456789-50000050000100000150000200000250000300000350000Avg.Latency(ms)TPS每秒事物处理量VoltDB3.0Key/ValueVariousread/writeworkload3Node,K=1(highavailable)Cluster10%read/90%write50%read/50%write90%read/10%write电信呼叫数据记录管理网站数据分析、欺诈侦测在线游戏小额交易支付电子广告兑换服务基于位置的无线服务金融贸易监控低频率运行高频率运行数据来源资金市场写/索引所有交易,存储逐笔交易资料显示整合交易者的风险呼叫初始请求实时授权认可欺诈侦测分析入站HTTP请求访问者登陆、分析、警告流量图形分析在线游戏等级分数•定义的间隔执行•玩家“最好成绩”排行榜状态查找实时广告交易系统匹配形式因素,下单规范,竞价/询价报告广告效能无线设备位置感应器位置更新,服务品质,事物处理事物处理上的数据分析VoltDB应用案例VoltDB应用/方案的高吻合目标行业•行业–电信和网络–金融服务–广告科技–能源和应用–资本市场–电子商务/零售业–在线游戏以上绝不是仅有的行业!•其它行业种类–战略性大数据项目–早期使用者–感应器驱动的环境关键技术特性•ACID全事务支持•灵活的扩展性•错误恢复•可持久化到硬盘•内嵌OLAP导出连接器•基于网络的异步集群复制6关键特性:线性扩展7增加一个新结点到VoltDB集群可以有限提升集群的最大吞吐量,也可以增加整个集群的内存容量集群的大小对应用来说是透明的关键特性:线性扩展(续)右边表格源自于独立的测试机构Percona,标示出线性扩展到每秒150万次的运算和最高推断值达到30个服务器。这个表也表明VoltDB线性扩展具备K-Safety关键特性:内置异常恢复/HA功能9分区就是复制的单位事务复制操作(不是更改记录)使用Active/Active同步复制方式应用只有在所有复制节点都提交(或者回滚)后才会收到成功(或者失败)的响应关键特性:基于网络的数据库集群复制10VoltDB包括一个网络复制Agent这个Agent将事物异步从主集群(可读可写)复制到备集群(只读)异步的方式最大限度容忍网络可能出现的问题整合:高性能导出•并行导出–接近最大线速•基于事先建立的连接–Hadoop–CSV–JDBC(PostgreSQL,MySQL,Oracle)–Netezza–VerticaVoltDB建立了一个基于事务的,可持久化的导出框架在VoltDB完成高质量、实时分析、实时响应,并把结果数据通过VoltDBExport导出到OLAPVoltDB管理和监控•Nagios脚本•LogstoLog4j•JMX•VoltDB企业管理器•每一个节点都有一个内置网络服务器•特殊的系统程序VoltDB的一个典型架构ERPCRMHROrdersCartRecom-mendationUserMgt.ClickStreamInvPersonal-izationDatawarehouseHadoopTraditionalOLTPVelocityOLTPloginssensorsimpressionsordersauthorizationsclickstradesInteractiveReal-timeAnalyticsHistoricalAnalyticsExploratoryAnalyticsAnalyticresultsenrichdecisionmaking使用方案中会包含VoltDB的目标客户理想的销售机会IdealProspectCharacteristics•初期采用者•高速率-增长中的交易处理率•寻求竞争差异•事务处理–需要做出决策•创建新的apps•数据吞吐量用尽•水平分区Sharding–目前使用手工操作•其次–寻求削减成本-准备使用云端–ACID–不能做到最终一致性就无法生存次要销售机会•对风险抱保守的态度•使用传统数据库可以解决问题•很少使用到高速决策•非结构化数据、文件数据库•复杂的查询和分析•特别巨大的数据•J2EE,Hibernate•Windows/Unix/COBOLarchitecturebias吸引用户使用VoltDB的原因(条件)•公司的战略同大数据相关•新的应用部署,而不是在现有应用上转换数据库•额外的数据来源于在线数据•为了获取性能、分区等使用费自然的技术手段•面临来自于创新的竞争压力•Oracle不能满足性能的需求、授权或者对于降低硬件成本的需求•公司需要围绕特定技术寻求发展–实时数据分析–基于内存的数据库Datameer-从桌面到服务器可视化大数据分析平台Datameer–可视化大数据分析平台Datameer开放式结构Datameer可视化操作、分析与展示界面28.io海量数据的综合信息查询分析平台现代公司的信息量往往大爆炸种类容量速率企业数据被储存在孤立的数据仓库中28io–海量数据的综合信息查询分析平台解决方案可视化了的查询的查询及处理图层结构化数据/半结构化数据/非结构化数据JSONiq查询语言:非关联数据库的结构化查询语言自动并行运算RESTAPI实时NoSQL(MongoDB,CouchDB,...)SQLthroughJDBCFileStores(S3,GlusterFS,…)JSON,XMLRelationalText,Pdf,HTM..Otherdatastores...其它数据格式商业应用WebServices(Salesforce,Zendesk,…)JSON,XML连接与查询分析28.ioUnifiedInformationAccessPlatformContentsourcesstoringdocuments,emails,books,articles,webpages,etc.RelationalDatabaseFilesystemThird-PartyContentFeeds(XML,HTML,ZIP,etc.)NoSQLDatabaseQueryacrossdisparatecontentrepositoriesEditors,ContentCuratorsSearch,reuse,repurposecontentWebSites,Portals,WebAppsMobileAppsDynamicallyrenderanddelivercontentinmultipleformats……CustomContentFeedsSeparateTask-SpecificRepository(e.g.,MongoDB)Optionallyimportcontentintoatask-specificrepositoryContentdestinationsCuratedcontent,Masterindices,Markup/structureforrepurposing,Migratedcontentfromretiredsources查询语言JSONiqHadoop同28.io架构对比S3ETLHDFSMapReduce结果S328.io结果Hadoop28.io运行45分钟35秒几个小时数据科学家费时2小时开发MapreduceCode商业用户费时20分钟建立JSONiq查询让Web数据成为你的数据库ConnotateConnotate–智能化的Web数据抽取工具•WebAgent(数据抽取的工具)可自动自主的运行。•根据您的要求输出结构化数据集(通常是CSV格式或则是XML格式)VoltDBProprietaryConnotate使网络数据变成了您的数据库•在Connotate的帮助下,您可以在网络上获得您需要的结构化有用的数据•评价:给用户带来前所未有的商业价值28大数据厂商联盟分销推荐产品29集群优化性能优化性能优化快速部署安全管理平台优化NOSQL分析平台层数据抽取集成层Hasoop优化层

1 / 29
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功