大数据时代目录大数据的定义存在于我们身边的大数据大数据给我们带来了什么?大数据面临的挑战和趋势思考:我们该如何对待大数据?一、大数据的定义在2012年的IT业界中,“大数据”(BigData)成了关注度不断提高的关键词之一。和之前的一些流行语(buzzword)一样,“大数据”也是一个起源于欧美的词汇。不过,关于这个词的起源并不是十分清楚。至今为止,最具影响力的说法是2010年2月出版的«经济学家»(TheEconomist)杂志中的一篇题为“Thedatadeluge”的文章。其中,“deluge”的解释是数据洪流或海量数据。那么,究竟何为大数据?一般来说,可以从狭义和广义两个层面来进行理解。狭义的大数据狭义的大数据就是指用现在的一般技术难以管理的大量数据的集合。大数据不仅仅是容量大而已,可以用3v来描述大数据的特征:Volume(容量)、Variety(多样性)、Velocity(速度)。1.容量也就是指数据量,基本上是指从几十TB到几PB这样的数量级;甚至可能发展到EB数量级。(1TB=1012字节,1PB=1015字节,1EB=1018字节)2.多样性也就是除了传统的销售、库存等数据之外,现在企业所采集和分析的数据还包括:网站日志数据、Facebook等媒体中的文本数据,智能手机中内置的GPS所产生的位置信息,监控摄像机的视频数据等。3.速度也就是数据产生和更新的频率。广义的大数据广义的大数据是一个综合性的概念,它包括因具备3v特征而难以进行管理的数据,对这些数据进行存储、处理、分析的技术,以及能够通过分析这些数据获得实用意义和观点的人才和组织。这些人才和组织指的是目前在欧美十分紧俏的“数据科学家”这类人才,以及能够对大数据进行有效运用的组织。由此广义的概念可知,除了自身的特征外,人才的作用在大数据时代中日益突出。二、存在于我们身边的大数据在了解完大数据的定义之后,让我们来具体感受存在于生活中的随处可见的大数据。1、NikeRunPlus手机应用这个简单的手机应用,一边考虑地形和天气等外部因素,一边显示出自身的速度和燃烧的卡路里量,在慢跑界兴起了一场革命。这种软件可以最大程度的减轻使用者的负担,仅仅通过在跑步前和跑完步后点击一下屏幕,记录自己的历程,便能够全程记录下自己的点滴进步。这一软件深受运动人士的喜爱。2、MoodPanda比NikeRunPlus更具智能化的要数MoodPanda软件了。MoodPanda扩大了对自我追踪的范围,能够记录下你特别高兴和特别失落的时间等等,以便于追踪你的情绪。也就是说,它使用了智能数据,有助于使你的情绪更为愉悦。MoodPanda是从心情日记发展而来的,而且它也确实做到了用日记这种形式,使用智能手机可以很简单的上传,通过它更加详细的进行自我分析。3、OnavoCount与我们生活息息相关的要数手机的使用了,而其中一个不容忽视的方面就是手机流量的使用。OnavoCount通过追踪你智能手机上的流量使用信息,能够告诉你哪一个应用在消耗你的流量,哪一个应用运用了不必要的流量,而且,这个应用能够在这个月流量超支时发出警告。通过追踪实际流量的智能应用,OnavoCount能够向你推荐对你最为合适的流量套餐,对于节省金钱十分有效。是我们生活中不可缺少的应用软件。除了以上所举的具体软件之外,其实,大数据无处不在。案例一:你收到一封邮件,邮件中提供了一套个人电脑的报价,而你几个小时前刚刚在这家零售商的网站上搜索过电脑的信息,似乎它们已经读出了你的想法······当你驱车前往这家商店购买这套个人电脑时,你路过了一家咖啡店,你看到了这家咖啡店的一条折扣信息,你获知由于你刚来到这片区域,你可以在未来20分钟内享受10%的折扣······在你享用咖啡的时候,你收到了一家制造商关于某商品的道歉,而你昨天刚刚在你的Facebook主页和这家公司的网站上抱怨了它们的产品······最后,当你回到家之后,你又收到了一条关于购买你最喜欢的在线视频游戏升级装备的信息,有了这些装备,你才能顺利通过某些曾经苦苦挣扎的关卡······这就是我们的一天,在我们的一天中,大数据的身影随处可见,并不是遥不可及的。案例二:11.11疯狂的光棍节由于现在很多人都喜欢在网上购物,所以对于光棍节一定印象深刻。2012年,全国人民被一个新的节日震撼了,一个由无比精明干练的马云发动的光棍节”11·11”淘宝被载入史册。让我们来看下面一组难以置信的数字:2009年,淘宝网在11月11日发起“品牌商品五折”活动,当天销售额达1亿元;2010年,11月11日当天的促销活动,淘宝网总销售额增至9、36亿元;2011年,这一数字再度被刷新,光棍节成交额飙升至52亿元;2012年,11月11日13时38分,不到14小时淘宝网成交额突破100亿元,24小时活动结束后,这一数字定格在191亿元。几乎所有的媒体都记住了“淘宝疯狂”的景象:一天成交额191亿元,中国的11月11日“网购节”一举成功。而其成功的关键因素就在于电子商务的产生和发展,而电子商务本身就是大数据时代的产物,所以说,“网购节”的成功归功于大数据。如果没有电子商务,光棍节不仅不会取得成功,反而将会是一场灾难。(如交通堵塞、订单爆满、汽车碰撞、人员拥挤甚至导致死亡······),其后果是难以想象的。三、大数据带来了什么?大数据既催生出无数新的服务和商业模式,也让一些传统行业找到了新的机会,同时产生了对“数据科学家”这种新兴复合型人才的迫切需求。但是,数据运用和隐私保护之间到底应该如何权衡,也成了一个令各方势力争论不休的话题。所以,对于大数据带来的影响,必须从积极影响和消极影响两个层面来分析。积极影响首先,大数据有利于推动中国新四化转型。新四化是指新型工业化、信息化、城镇化和农业现代化。大数据将会改变人类生活生产方式,可以为新四化提供转变发展方式的新动力。1.大数据可以强力启动内需;2.大数据可以推动城镇化以智慧城市的新方式发展;3.大数据有利于改进政府管理方式;4.大数据产业将会形成新的增长点。根据维基(Wikibon)最近发布的报告,大数据市场正处在井喷式增长的前夕,未来五年全球大数据市场的价值将达到500亿美元。维基(维基百科):Wikipedia维基百科是一个新兴的百科全书式的网站,它只是一种模式,是一个开放式的网站,其内容由广大的网民进行填充,然后由大家协作共同完成—其中任何人都可以进行创建、编辑和修改。其随意性很大。之所以命名为“维基”,主要是因为它的发音,在夏威夷群岛土著居民口中的“wiki”,其意思就是“快”。所以为了突显速度之快,便命名为“wiki”。其次,大数据将对微观经济产生重大影响。IBM的CEO罗睿兰说:“数据将是下一个大的自然资源,将会区分每个行业的胜者与输家。”IBM的全球调查显示:表现优秀的企业使用分析技术的数量比表现较差的企业高五倍。1.未来以政府、电信、教育、医疗、金融、石油石化和电力等行业为重点的大数据应用,将直接拉动整个社会的应用规模;2.数据业务将成为各行各业的主营业务,围绕大数据,企业将向分析级服务升级转型,从而改变各行各业的业态;3.广义的分析级服务得到大发展,包含一切以大数据为基础的高附加值的创新型服务。再次,大数据的发展有利于促进新兴职业的发展。在大数据浪潮的冲击下,一门新兴职业即“数据分析师”(数据科学家)正在以势不可挡的气势涌现。大数据使劳动力市场迅速出现了变化,数据分析师成为炙手可热的行业。麦肯锡全球研究所进行过一次调查,根据调查预计,美国需要14万名至19万名以上具备深度分析专长的人员。而对具备数据知识的经理的需求量超过150万名。一个在业界不可言喻的现象出现了,数据分析师已经能够成为最为抢手的热门职业。但是,除了积极影响之外,大数据产生的消极影响也是不容忽视的。消极影响关于大数据所带来的消极影响主要表现为大数据运用和隐私保护之间的矛盾。要在业务中对大数据进行运用,就不可避免的会遇到隐私问题。首先,对web上的用户个人信息、行为记录等进行收集,在未经用户许可的情况下将数据转让给广告商等第三方,这种行为严重侵犯了用户的个人隐私权,而且会对其造成一定程度的危害;其次,网页上的行为记录,如浏览记录和购买记录等,如果进行了相当数量的积累,则有可能据此推断出个人的兴趣、爱好、思想倾向等。而对于用户来说,他们很不希望这些信息被别人知道,所以在心理上会感觉到自己的隐私受到了侵犯。在今天,关于隐私是一个很大的问题,而且以后这个问题还会越来越严重,会被人们高度关注。所以,对于企业来说,不仅要遵守正式法律的限制,而且不能逾越顾客所能接受的最低底线。必须时刻把用户的地位放在首位,尽可能的多为顾客提供便利,尽最大努力赢得用户的理解和支持。四、大数据面临的挑战和趋势从大数据带来的影响可知,大数据浪潮既是一种机遇也是一种挑战,必须权衡利弊。趋势随着大数据浪潮的加速到来,未来五年将成为大数据的全面发展期,将出现产业链的整体繁荣。如何在大数据浪潮的洗礼中确保技术架构、人才、政府和企业战略以及商业模式能够“逐浪潮头”,将更需要积极主动的选择合适的技术、方法论、解决方案和发展策略等。环顾整个市场,我们在某些领域已经取得了突破性进展,但是,仍然面临着大量挑战。例如:研发分析各种多元结构化数据的高效技术,提高大数据分析的易用性,让大数据分析技术实现“开箱即用”,使得数据分析成为政府和企业建立核心竞争力的关键途径。另外,具备高端数据分析技能,能够从堆积如山的大量数据中找到金矿,并能够将数据的价值以易懂的方式传达给决策者,最终得以在业务上实现的人才即数据科学家是千金难求的。挑战五、思考面对大数据的挑战,我们该以何种态度来对待大数据?是一如既往的坚持,还是有所顾忌的考虑,更或是斩钉截铁的放弃?对此,仁者见仁智者见智,无法统一而论。但是,不论我们的态度如何,都需要我们全面的权衡利弊,谨慎行动。