数据尹航201410月成都BigData大数据什么是大数据大数据原理和构成大数据应用大数据价值BigData目录什么是大数据BigData什么是大数据数据数据库预测数据流运算节点机器学习AMD可视化BigData什么是大数据由多个软件、硬件部分组成的一个数据系统一个执行体系有别于传统企业数据中心,用来应对现代海量数据化的生活,商业环境。不是一个行业,而是一种新的数据处理方法是关于数据的运输和处理,以及最后有效使用的体系与云计算一样都是一种新的生产组织形式Web2.0时代的解决方案大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯BigData什么是大数据大数据的目的原始数据的处理和分类存储将存储的数据调取并分析最终提供决策依据归类数据类型有效分析组合大数据的特点4V海量高速多样精确BigData什么是大数据1KB=1024字节存储单位1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GB100万G10亿G1万亿G22亿台215万台2100台500G硬盘电脑15寸电脑排成行可以往返一次月球BigData什么是大数据Volume海量1PB=1024TB=1,048,576GB1EB=1024PB=1,073,741,824GB1ZB=1024EB=1,099,511,627,776GBIntel:人类文明开始到2003年地球共产生了5EB数据.2012年全年,全球产生数据2.7ZB是2003年以前的500倍2015年,全球估计产生数据8ZB,等于1800万个美国国会图书馆44%35ZB2000年数字信息占全球数据量的25%75%都在报纸胶片磁带等媒介2013年数字信息98%非数字信息2%BigData什么是大数据商业数据现状Twitter2007年5000条微博更新/天2008年30万条微博更新/天2009年250万条微博更新/天2010年3500万条微博更新/天2011年2亿条微博更新/天2013年4亿条微博更新/天2013年上传时长12年的视频/天2013年用户分享25亿条信息/天我国一个一线城市的健康档案数据5PB/年我国一个智慧城市的数据800PB/年一个单数据表几亿-几百亿条记录下线商品14亿件,在线商品8亿件淘宝数据库存了20PB数据平均每月增加1.5PB智能移动终端设备的巨量增长BigData什么是大数据Velocity高速6000万用户登录/天20亿次页面访问/天每天1.2亿次网站访问响应时间小于100毫秒大数据的惊人不止是在数量上,同时数据还是巨量具有动态分析价值的数据。访问响应时间的加快,数据库读写速度的加快,对电商企业来说就等于多成交。对于很多情况下,动态的数据价值远大于静态数据,比如气象预测,灾难预测,快消行业等。由于输入速度加快,所以要求输出速度也要加快BigData什么是大数据Variety多样数据:结构化数据半结构化数据非结构化数据指关系型数据表指关系结构与内容混合在一起的数据类型文档、视频、音频、图片20%结构化80非结构化企业数据2012年互联网产生的数据25%结构化75非结构化50%-70%源于人与人的互动BigData什么是大数据Veracity准确大数据的核心思想之一准确源自于对全部数据的处理分析基础数据的真实准确性,才能保证结果的有效性。BigData什么是大数据大数据VS云计算两者都是生产方式改变为主,生产资料改变为辅,提高生产效率。云计算是将计算和存储,由本地转移到了云端。大数据则是提供了一套新的计算和存储工作原理。二者有本质的不同,但却是一个完整的体系。大数据可以是云计算的心脏,云计算是大数据服务的通路。BigData什么是大数据大数据VS物联网物联网是大数据的流程中的第一层采集层物联网网关以上就进入了大数据工作范畴。局部域内的物联网应用解决方案等同于这个域内的大数据系统大数据原理和构成大数据的核心工作思路大数据系统颠覆了传统数据中心的工作逻辑传统数据系统工作逻辑:运算系统调动数据库的数据,数据的移动。大数据系统工作逻辑:运算系统直接部署至数据处,数据仅架构内移动。BigData大数据原理和构成BigData大数据原理和构成传统数据系统工作原理客户客户客户客户客户客户互联网路由器访问请求负载均衡服务器集群DBDBDBDB数据库集群数据调用请求数据移动结果反馈BigData大数据原理和构成Hadoop软件框架大数据系统核心组件MapreduceHBaseHDFSHadoop核心子项目BigData大数据原理和构成Hadoop系统工作原理BigData大数据原理和构成Hadoop系统构架BigData大数据原理和构成存储与数据库的比较传统数据中心HadoopJOBDRAID存储系统HDFS容错性扩展性某已分配任务出错,该计算必须重新执行节点灵活调整节点相对固定,扩展时会造成无法访问在任务执行中任何时候可任意添加节点SQLNoSQL数据类型平行计算系统MapReduceRAID出现坏盘后,重建阵列需要十多个小时,这在大数据时代是无法接受的BigData大数据原理和构成SAPHANAHadoop的升级内存计算技术真正的海量数据瞬间分析内存数据库实现任何地点、任何时候、可以查看实时的动态数据,任何时候都可以知道正在发生着什么。并且做出应对。利用高性能的大数据一体机服务器,将数据库直接植入大容量内存中进行实时处理。HadoopMapreduceHDFSHBaseBigData大数据原理和构成大数据的硬件32颗处理器、每颗处理器12核=384核X96个线程32TB的内存很多中型企业的数据库也只不过几TB.可以完美运行内存计算数据库大数据一体机服务器+存储+网络=融合基础架构SeaMicroSM1500064颗处理器、每颗处理器8核=512核心4TB的内存5PB本地存储10U的空间万兆以太网Systemx3650M4机架式2U2颗处理器8核心内存最大768GB本地存储9TB2.6万换算成10U的空间80核心大数据的软件数据存储管理数据处理数据分析Hadoop数据库软件BigData大数据原理和构成提取转换归类可视化BI商业智能大数据的核心价值高附加值阶段大数据应用BigData大数据应用大数据应用的意义巨量数据的产生对所有复杂数据格式的归类管理分析20%结构化数据的分析利用80%非结构化的没有发挥作用,商业洞察力的资源浪费。找出最优解决方案应用的核心大数据分析BigData大数据应用数据质量和数据管理可视化分析语义引擎数据挖掘算法预测性分析能力大数据应用的分析方法高质量的数据处理和管理是输出高质量结果的前提深入数据内部,用机器去做人工做不到的数据价值发现从非结构化数据中提取信息的方式展示数据分析结果,供使用者决策根据可视化和数据挖掘的结果做出预测BigData大数据应用大数据应用的分析逻辑DescriptivePredictivePrescriptive发生了什么?为什么?还会发生什么?还会发生什么?,如果发生了,如何应对?BigData大数据应用大数据应用的假想一给某总办公室、汽车、家里装上烟感。发现某总在办公室的抽烟数量最大,在车里和在家基本不抽。那么就可以知道,某总在工作期间香烟以及与香烟有关的产品消费多。那在家期间的消费习惯又是什么,根据人的行为习惯,不抽烟但需要其他事情分散注意力。吃东西?看电视?看书?。。。。。。。。。。。这样就可以深入了解一个人的消费行为习惯,从而提前做出应对或者积极的主动应对。BigData大数据应用大数据应用的假想二通过对某人淘宝购物的跟踪分析,挖掘出他的消费趋势。某男,在电子商务网站上长期买衣服,内衣等商品。通过消费记录可以预知其单身。用百度联盟,把世纪佳缘,花田等交友网站的广告推送给他。某男开始买女士消费品了比如衣服,鞋帽等。则说明该男找到女朋友了。通过信用卡记录可以分析出其关系进展情况。发现其买房,装修了。则该男快结婚了。之后就是孕婴用品的推荐。BigData大数据应用大数据的大应用城市智能交通智能电力照明能源管理系统智能健康医疗体系政府财政管理综合信息系统工商企业信息系统。。。。。。大数据价值BigData大数据价值大数据市场价值IDC预测中国的大数据服务市场2011年7760万美元增长到2016年6亿美元IDC预测2016年全球市场规模238亿美元31.7%服务器市场21.1%存储市场53.4%基础设备40%趋势增值服务软件BigData大数据价值大数据市场价值谢谢