《时事报告大学生版》高校形势与政策课专用大数据:变革世界的关键资源Contents目录1234什么是大数据大数据可以做什么中国:从“数据大国”走向“数据强国”大数据是如何产生的引言第一次信息革命第二次信息革命第三次信息革命第四次信息革命第五次信息革命第六次信息革命语言的创造猿→人信息得以交流和传递文字的出现信息可以被储存在文字中进行传播,解决了语言的时间和空间的局限性印刷术的发明扩大了信息的交流、传递的容量和范围无线电的发明电磁波传播信息,速度增长几十亿倍电视的出现声音、图片影像、文字实现同时远距离实时传播(摘自人民出版社《大数据领导干部读本》)计算机与互联网的使用突破了人类大脑及感觉器官加工利用信息的能力,人类进入信息社会时代引言第七次信息革命?现在我们正经历着一场信息革命。这不是在技术上、机器设备上、软件上或速度上的一场革命,而是一场“概念”上的革命。以往50年信息技术的重点在“技术”上,目的在于提升信息传播范围、传播能力和传播效率。而新的信息革命的重点将会在“信息”上。——彼得·德鲁克《21世纪的管理挑战》一、什么是大数据本章概要0102什么是大数据大数据的五个特点1.什么是大数据它什么都知道会员卡号是:342623我想要一个海鲜披萨。**披萨店为您服务。您的会员卡号是?为什么?海鲜披萨不适合您。根据您的医疗记录,你的血压和胆固醇都偏高。您可以试试我们的低脂健康比萨。那你们有什么推荐?您上星期一在国家图书馆借了一本《低脂健康食谱》。你怎么知道我会喜欢吃这种的?好。那要一个家庭特大号,多少钱?99元,它足够您一家六口吃。但您母亲应该少吃。你们直接把比萨送我家吧,你们多久会送到?大约30分钟。如果您不想等,可以自己骑车来。根据我们CRM全球定位系统的车辆行驶自动跟踪系统记录,您登记有一辆车号为SV-568的摩托车,而您目前正在铁山路右侧骑着这辆摩托车……她上月刚做了心脏手术,还在恢复期。1.什么是大数据大数据——挖掘和整合一切有用的信息,为人类社会提供更好的服务。•21世纪前10年……社交媒体的产生,数据开始呈现爆炸式的增长,大数据的提法开始进入大众的视野并获得了越来越多的关注。2.大数据的五个特点类型多75%•网络日志、音频、视频、图片、地理位置信息•社交媒体中产生的数据25%“1、2、3、4”等传统数字以及符号非结构化数据结构化数据2.大数据的五个特点容量大•美国的国会图书馆5000•百度每天处理数据量根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍,相当于我们地球上所有海滩沙粒总数的57倍。(摘自涂子沛《数据之巅》《大数据》)截至2010年,人类拥有的信息总量大概是1.2Z存储数据量最大的图书馆之一。2011年4月,拥有235TB的数据一首歌4M×1024×1024一部电影1G×1024一图书馆藏书1T×1024谷歌每小时处理1P13亿中国人人手1本500页书的信息量总和=1E吉(G)兆(M)太(T)拍(P)艾(E)泽(Z)约为5000个美国图书馆总和2.大数据的五个特点•数据产生得快一台大型粒子对撞机里共有1.5亿个传感器每秒钟发生粒子对撞6亿次仅仅使用十万分之一一年积累25PB的数据1TB的硬盘×25000个剔除99.999%•数据处理速度快大数据通过云计算,以上数据储存仅需20分钟共计1PB,速度1G/s,还剩144小时已完成50%存取速度快2.大数据的五个特点应用价值大大数据之“大”,其实并不在于其表面的“大容量”,而在于其潜在的“大价值”。如果不能把拥有的数据转化为价值,那么拥有再多的数据也是毫无意义的。个人位置大数据服务8000亿美元的市场规模——麦肯锡研究院对美国的测算零售业大数据帮助企业增加60%的利润制造业大数据降低50%的产品开发制造装配成本2.大数据的五个特点具备大智能更加智能的社会传感器、可穿戴式设备等微小的计算设备将进一步普及“万物皆互联、无处不计算”实时收集数据确保安全行驶谷歌无人驾驶汽车二、大数据是如何产生的123保存数据的能力在增强处理数据的能力在增强生产数据的能力在增强大数据的背后推手1.随着存储器硬件能力的提升,人类保存数据的能力在增强摩尔定律英特尔的创始人之一戈登·摩尔半个世纪来,硬件技术的发展基本符合摩尔定律:同一面积芯片上可容纳的晶体管数量,约每隔18—24个月便增加一倍。今天,一根头发尖大小的地方,就能放上万个晶体管。1.随着存储器硬件能力的提升,人类保存数据的能力在增强世界上第一款硬盘——IBM商用硬盘存储器一兆字节的存储量需要6000多美元1955年2010年一兆字节的存储量仅需要0.005美分2020年1T硬盘=一杯咖啡的钱=一个图书馆的全部信息2.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强传感器感知和运输不断生产的数据移动设备收集了大量的用户数据2.随着物联网技术与互联网经济的发展,人类生产数据的能力在增强社交媒体及互联网经济的发展移动设备收集了大量的用户数据记录各自的活动和行为留下支付行为、空间位置、兴趣爱好、信用历史等每个网民都是数据的生产者3.随着云计算的诞生与发展,人类处理数据的能力在增强爱迪生发明电灯泡自己用电信息时代的“云计算”发电机和电线持续供电个人和企业独立发电私人电厂遍地开中央电厂公共电网付费用电3.随着云计算的诞生与发展,人类处理数据的能力在增强•云计算一般由数量惊人的计算机群构成,谷歌云计算拥有的服务器超过100万台;•云计算系统是一个极其庞大的资源池子,用户可以随时、随地、按需灵活地购买,就像购买煤气和自来水一样便利;•云计算让普通人体验每秒10万亿次的运算能力。而如此强大的计算能力,可以模拟核爆炸、预测气候变化和市场发展趋势。三、大数据可以做什么1234大数据让政府治理更精准透明大数据让公共服务更智慧大数据让商业创新更迅猛大数据让经济治理更有效大数据可以做什么1.大数据让政府治理更精准透明1.大数据让政府治理更精准透明百度地图1用户去目的地前,用百度地图搜索地点和规划路线3提前1—2小时对即将到来的风险进行预警2百度地图通过分析大量数据,预测相关地点的人流量避免如上海外滩踩踏事件一类悲剧再度发生1.大数据让政府治理更精准透明设计人员编入流感关键词,如温度计、流感症状、肌肉疼痛、胸闷等只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图预测出世界上不同国家和地区的流感传播情况2009年,甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并非常及时,令公共卫生官员备感震惊。而传统上,美国疾病控制中心要在流感暴发一两周之后才可以做到这些。谷歌流感趋势谷歌工程师认为,搜索流感信息的人数与实际患病人数之间存在密切关联。谷歌一周疫情报告1.大数据让政府治理更精准透明大数据“第三只眼”使政府治理更加透明化,打造阳光政府反腐倡廉反应各地区的腐败轻重程度、廉洁指数、市民抱怨度、市民对政府的满意度等网民搜索反腐关键词2.大数据让经济治理更有效经济治理领域是大数据创新应用的沃土大数据是提高经济治理质量的有效手段2.大数据让经济治理更有效支付宝“芝麻信用”——“芝麻信用分”,授权开通后,每个支付宝用户都可以看到自己的芝麻信用分。分数越高代表信用程度越好,违约可能性越低。天猫淘宝淘宝电影水费电费工商学历学籍公安内部数据外部数据……支付宝网购相关行为数据政府已经开放的外部数据…芝麻信用分高芝麻信用分低租车、住酒店无押金签证无需财产证明…找不到工作租不到房子贷不到款…2.大数据让经济治理更有效12342012年7月,通用电器公司投资1.7亿美元在纽约州斯克内克塔迪市开设了一家电池工厂。3.大数据让公共服务更智慧3.大数据让公共服务更智慧高德导航高德公司基于位置服务大数据的能力,与乌镇、古北水镇两家旅游公司合作,上线了全国首个“智慧景区”服务,解决游客在景区容易遇到的迷路、拥堵、排队等问题。地图渲染分类筛选导游语音智慧景区3.大数据让公共服务更智慧基于大数据技术,有朝一日,机器的诊疗准确率甚至可能超过人类历史上最有名的名医。4.大数据让商业创新更迅猛未来,无论是在中国,还是在世界其他国家,数据密集型产业将成为发展最快的产业。拥有数据最多的公司将迅速崛起为这个时代的领军公司。商业领域变革4.大数据让商业创新更迅猛北美最大的付费订阅视频网站——Netflix2012年,Netflix准备推出自制剧。不过在决定拍什么、怎么拍上,Netflix推出了自己的秘密武器——大数据。收集预测拍摄四、中国:从“数据大国”走向“数据强国”1234“数据驱动”已成为全球大趋势中国成为数据强国依然面临严峻的挑战面对机遇与挑战,中国的大思路、大举措中国具备成为数据强国的优势条件本章概要1.“数据驱动”已成为全球大趋势•“大数据研发计划”,2亿美元启动资金,开放多门类政府数据确保商业创新•开设课程,为大数据时代储备“数据科学家”美国•《数据价值链战略计划》•预计到2020年大数据技术将为欧盟创造GDP9570亿欧元,增加就业人数380万欧盟•“面向2020年的ICT综合战略”•《创建最尖端IT国家宣言》日本联合国·“全球脉动”项目:用大数据对互联网世界进行“情绪分析”提前指导援助项目大数据时代的到来,让“数据驱动”成为新的全球大趋势。世界各国纷纷利用大数据提升国家治理能力,“得数据者得天下”已经成为全球的普遍共识。2.中国具备成为数据强国的优势条件未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。中国的优势条件A13.68亿(2014年)6.49亿中国移动互联网用户中国人口中国互联网用户IDC预计到2020年中国的数据总量将达到8.4ZB,占全球数据量的24%,中国将成为世界上第一数据大国和“世界数据中心”。北京公交一卡通日均刷卡4000万次9.5亿数据分别来自国家统计局2014,中国互联网中心(CNNIC)《第35次中国互联网络发展状况统计报告》,工信部《2015年10月份通信业经济运行情况》等。电商广告搜索金融医疗百科教育电信城市化创新创业大数据正在得到越来越深入的应用123456791082.中国具备成为数据强国的优势条件中国的优势条件B未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。2.中国具备成为数据强国的优势条件中国的优势条件C•2014年互联网趋势报告:全球10大网站中有四家来自中国;•在网络基础设施方面,截至2015年6月底,中国固定宽带接入用户超过2亿,8M以上带宽占比超过了53%,全国经营性互联网数据中心超过了1000个;•在数据处理分析、语音识别、视频识别、商业智能软件、数据中心建设和维护、IT咨询等领域都已有代表性企业——形成获取、存储、处理、应用的大数据产业链。未来,国家竞争的焦点将从资本、土地、人口、资源转向数据空间,全球竞争版图将分为数据强国与数据弱国两大阵营。值得振奋的是,中国具备成为数据强国的优势条件。3.中国成为数据强国依然面临严峻的挑战政府数据开放共享不够,潜在价值大量淹没A海量的数据分散在各个部门、各个层级,彼此分割,形成一个个“信息孤岛”,且对社会、公众开放严重不够。B个人隐私法律缺位,信息滥用引发焦虑缺少个人隐私和商业机密的专门法律法规和政策制度,对公民隐私权和知情权范围有待厘清。C数据控制力尚未引起足够重视,数据话语权堪忧发展形态较为单一,核心的数据“基础设施”大量依赖进口,数据主权极易受到侵蚀。D人才培育机制薄弱,数据分析型、复合型人才短缺人才缺口已经超过100万人。目前我国每年培养的大数据深度学习方面的博士生大概只有50人左右。4.面对机遇与挑战,中国的大思路、大举措大数据是