乐山师范学院文学与新闻学院2012级新闻班徐瑜梅李培谦黄冰冰张亚庆胡雪梅周凯頔蒋敏焦倩茹2015年5月8日维克托.迈尔.舍恩伯格引言1、大数据变革公共卫生2、大数据变革商业3、大数据变革思维4、大数据开启时代转型5、预测是大数据的核心6、大数据是大挑战1、大数据变革公共卫生2009年的甲型h1n1流感,在短短几周之内迅速传播。互联网巨头谷歌公司的工程师们设立一个系统关注特定检索词条的频繁使用与流感在时间和空间上的传播之间的联系。软件发现了45条检索词条的组合,一旦将它们用于一个数学模型,他们的预测与官方数据的相关性高达97%。和疾控中心一样,他们由此判断出流感是从哪里传播出来的,而且他们的判断非常及时。这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。基于这样的技术理念和数据储备,下一次流感来袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。2、大数据变革商业购买飞机票就是一个很好的例子。哈佛大学首届计算机科学专业的毕业生奥伦·埃齐奥尼在一次飞机票价不等的打击下开发一个系统,这个系统用来推测当前网页上的机票价格是否合理。这个系统需要分析所有特定航线机票的销售价格并确定票价与提前购买天数的关系。这个预测系统,它帮助虚拟的乘客节省了很多钱。之后这个项目变为风险投资基金支持的科技创业公司,名为farecast。如今,farecast已经拥有惊人的约2000亿条飞行数据记录。3、大数据变革思维半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。人们不再认为数据是静止和陈旧的。信息总量的变化还导致了信息形态的变化——量变引发了质变。最先经历信息爆炸的学科,如天文学和基因学,创造出了“大数据”这个概念。如今,这个概念几乎应用到了所有人类致力于发展的领域中。4、大数据开启时代转型2003年,人类第一次破译人体基因密码的时候,辛苦工作了十年才完成了三十亿对碱基对的排序。大约十年之后,世界范围内的基因仪每15分钟就可以完成同样的工作。在金融领域,美国股市每天的成交量高达70亿股。而其中三分之二的交易都是由建立在算法公式上的计算机程序完成的。这些程序运用海量数据来预测利益和降低风险。5、预测是大数据的核心大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。6、大数据是大挑战数据化意味着我们把一切都透明化,甚至包括很多我们以前认为和“信息”根本搭不上边的事情。大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。内容简介大数据时代的思维变革第一部分第二部分大数据时代的商业变革大数据时代的管理变革第三部分反思201主要观点更多——不是随机样本,而是全体数据更杂——不是精确性,而是混杂性更好——不是因果关系,而是相关关系数百年来我们都是以抽样调查的方式作为统计的基础,而在大数据时代,这种状况会发生重大改变。由于这些年存储技术的发展以及互联网在全世界的普及,既有了存储巨大数据量的技术基础,也有了数据来源,再加上云计算的快速分析技术,大数据时代是以全体数据作为样本进行分析,而非从前那样在随机抽取一定样本数量的基础之上进行分析。当数据处理技术得到了较大的发展之后,数据分析就采取了全数据模式,样本=总体,比如淘宝进行用户行为分析时会就一个用户在淘宝里的所有行为进行技术分析,而谷歌对流感的预测则是对所有相关词汇搜索行为进行技术分析。更多数据的来源很广阔,数据的数量很庞大,在此基础之上带来的必然是各种数据的混杂,但混杂性并不会影响到大数据的分析结果的可用性,因为数据量的庞大远远抵消了混杂的错误数据对于分析结果的影响。数据量的显著增大必然会让我们付出一些代价——一些不准确的数据会混入数据库,结果也可能不准确。对“小数据”而言,最重要的要求就是减少错误;在大数据的采集里,在技术尚未达到完美无缺之前,混乱是无可避的。虽然我们得到的信息不再那么准确,但是收集到的数量庞大的信息让我们放弃严格精确的选择变的更为划算。更杂不是因果关系,而是相关关系。知道“是什么”就够了,没必要知道“为什么”。更好尤其对于社会经济的参与者来说,及时的知道相关关系并且拿出合适的策略比搞明白“为什么”更重要。无疑大数据将使许多企业的效率得到质的提升。淘宝数据有一个视频内容是各个省份的人购物情况的分析统计,比如在见不到大海的新疆,购买比基尼却是最多的,那么淘宝并不需要知道新疆人为什么喜欢买比基尼,是因为气候还是生活习惯并不重要,重要的是淘宝要多为新疆用户推荐比基尼,可以获得更高的转化率。(推荐视频《淘宝数据盛典——你所不知道的城市秘密》大数据时代的商业变革02内容数据化、数据价值实现、数据公司类型三部分大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。03互联网时代,我们的隐私受到了威胁,大数据时代一定是有过之而无不及。大数据还会带来更多的威胁,因为大数据的核心就是用规模剧增来改变现状。很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途,也是一个未知的挑战。在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。同时,我们将面对另一个挑战,即运用大数据预测来判断和惩罚人类的潜在行为,这是对公平公正以及自由意志的一种亵渎同时还轻视了决策过程中深思熟虑的重要性。人们不是因为所做而受到惩罚,而是因为将做,即使他们事实上并没有犯罪。大数据时代很容易让我们陷入数据独裁的困境中。大数据时代,对原有的规范的修修补补已经满足不了需要,也不足以抑制大数据带来的风险。我们需要全新的制度规范,而不是修改原有规范的适用范围。大数据时代的管理变革背景14020304012个人动因VS预测分析,大数据时代,关于公正的概念需要重新定义以维护个人动因的想法:人们选择自我行为的自由意志。简单地说,就是个人可以并应该为他们的行为而非倾向负责。3击碎黑盒子,大数据算法师的崛起,外部算法师扮演公正的审计员的角色,内部算法师在机构内部工作,监督其大数据活动,不仅要考虑公司的利益,也要顾及受到公司大数据分析影响的其他人的利益;管理变革4反数据垄断大亨,为了促进大数据平台上的良性竞争,政府必须运用反垄断条例1保护个人隐私,从个人许可到让数据使用者承担责任;管理变革管理变革内容8风险:让数据主宰一切的隐忧事物都有两面性,大数据也不例外。大数据时代我们几乎没有真正的隐私可言,因此这也就给监管层提出了更严格的要求。就像枪一样,可以用来保卫家园,也可以用来滥杀无辜,如果将大数据用于歪道,那威力也会比从前提升不少8掌握:责任与自由并举的信息管理大数据是必然趋势,并且在全世界的铺开以及应用会远快于我们多数人的反应速度,不像数百年前的印刷术,给了人类近三百年的适应期,大数据,可能也就几年时间。数据使用者担责,以行为为依据而非预测,防止大数据变成黑匣子,防止数据垄断者的出现,这些可能都是以后应被注意的甚至是写进法律里的。案例:大数据也是一把双刃剑,在带来巨大便利的同时,其背后也隐藏着一些隐患,我们的隐私也可能会被二次利用。联想到近期好莱坞爆出的艳照事件,有外国黑客疑利用苹果公司的iCloud云盘系统的漏洞,非法盗取了众多全球当红女星的裸照,继而在网络论坛发布。通过这样的一个实例,就要求我们不要盲目崇拜大数据,而应该让数据为我们所用,让大数据的发展不超出我们的可控范围。404上海锐普广告有限公司大数据时代显然给我们带来不少便利之处,但是在盲目的欢呼和一时的激动之后,我们更需要认真反思如何正确挖掘出大数据的最大效用,以便我们在大数据的海洋里游刃有余,而不是被大数据洪流冲击得迷失了方向。谢谢