1《网络与新媒体应用模式》——创新设计及运营战略视角2第一章网络与新媒体概述“网络与新媒体”的概念辨析和层次模型1网络与新媒体的应用载体——万维网2网络与新媒体的基础设施3网络与新媒体应用的计算模式——云计算4网络与新媒体应用的数据环境——大数据目录534谢谢!THEEND!5Chapter4第四节网络与新媒体应用的计算模式——云计算6如何实现资源和计算能力的分布式共享,是目前互联网界亟待解决的问题,云计算在这样的背景下应运而生。云计算(CloudComputing)作为一种新型的计算模式,是信息技术发展历程中最具革命性的重大进展,将对网络应用模式的发展产生重要影响。7一、云计算的基本原理云计算是一个根本性转变,应用可利用、可管理的、优化的分布式计算资源,以及基于业务优先级实时驱动的存储资源,能构建全球服务协作网络。8其基本原理可从以下几个方面把握:1、云计算具有强大的功能。2、云计算具有明显的优势。3、云计算的服务类型。4、云计算的部署类型。5、云计算平台的逻辑层次。9二、云计算的变革性改变首先,云计算将赋予互联网更大的内涵并改变互联网企业的运营模式。其次,云计算模式将给移动应用带来前所未有的变革。最后,云计算将改变信息化的模式。10Chapter4第五节网络与新媒体应用的数据环境——大数据11目前,信息海洋已经将我们团团围住,单一数据集容量超过几十TB甚至数PB已不罕见,其规模大到无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理,人类已经从小数据时代进入大数据时代。12一、大数据概述所谓大数据是指那些大小已经超出传统意义上的尺度,已有的一般软件难以捕捉、存储、管理和分析的数据。一般意义上,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。但不同的研究机构和学者对大数据的定义不尽相同。13归纳起来,大数据的概念和内涵可以从广义和狭义两个方面进行诠释:广义的大数据概念,除了大数据技术及其应用之外,还包括大数据工程和大数据科学。狭义的大数据概念,主要是指大数据技术及其应用,是指从各种各样类型的数据中,快速获得有价值信息的能力。14大数据的特点可以总结为4个“V”,即体量浩大(Volume)、模态繁多(Variety)、生成快速(Velocity)、密度很低(Value)。15二、大数据的关键技术具体来说,大数据的关键技术主要包括两个方面:非关系数据管理技术和云计算技术。关系数据库技术(RDBMS)经过了将近40年的发展,成为一门成熟的、同时仍在不断演进的主流数据管理和分析技术。16但是,关系数据管理技术在大数据时代丧失了互联网搜索这个机会,其主要原因是关系数据管理系统(并行据库)的扩展性遇到了前所未有的障碍,不能胜任大数据分析的要求。在这种情况下,非关系数据管理技术应运而生。代表性的技术主要包括“映射归约”(MapReduce)技术、“海杜普”(Hadoop)技术、华为“SmartVision”技术和非关系型数据库(NoSQL)技术。17据统计,云计算与大数据的深度融合位列2013年大数据发展趋势的第三名,大数据能为云计算大规模和分布式的计算能力提供广阔的应用空间,云计算正在进入以“分析即服务(AaaS)”为主要标志的Cloud2.0时代。18一是云计算基础设施可以作为有效平台来处理大数据分析应用的计算和数据存储需求。二是开发人员和研究人员可以采用软件即服务(SaaS)、平台即服务(PaaS)和基础设施即服务(IaaS)的架构模型来实现在云中的大数据分析解决方案。19三、大数据带来的主要挑战总之,收集、保存、维护、管理、分析和共享正在呈指数级增长的数据是人类必须共同面临的挑战。具体来说,主要包括三个方面。首先,大数据中劣质数据带来的挑战。随着大数据的爆炸性增长,劣质数据也随之而来,导致数据质量低劣,能极大地降低数据的可用性。20二是大数据对信息安全的挑战。大数据对信息安全的挑战主要包括两个方面。(1)如何防止数据被窃取或篡改。(2)如何防止个人信息泄漏。三是大数据的复杂性、不确定性和涌现性所带来的挑战。(1)复杂性造成网络大数据存储、分析、挖掘等多个环节的困难。(2)网络大数据的不确定性不确定性使得网络数据难以被建模和学习,从而难以有效利用其价值。(3)网络大数据的涌现性是网络数据有别于其它数据的关键特性。21总之,为了有效应对上述挑战,大数据的挖掘与利用应当有法可依,应当既鼓励面向群体、服务社会的数据挖掘,又要防止侵犯个体隐私;既提倡数据共享,又要防止数据被滥用;需要界定数据挖掘、利用的权限和范围;大数据系统本身的安全性也是值得特别关注的,要注意技术安全性和管理制度安全性并重,防止信息被损坏、篡改、泄露或被窃,保护公民和国家的信息安全。22四、发展现状大数据在美国的研究和应用起步较早。2011年,Facebook首次公开新数据处理分析平台(PUMA),相比之前单纯采用“海杜普”(Hadoop)和“Hive”进行处理的技术,效率提高数万倍。近几年大数据的研究和应用在中国蓬勃发展。2012年6月9日,中国计算机学会常务理事会决定成立大数据专家委员会。