云计算技术概论北京大学软件与微电子学院主要内容云计算的成功案例云计算的定义与特征云计算技术的分类与部署模型云计算体系结构典型云计算服务提供商案例云计算的成功案例【案例一】2008年3月19日上午10点,美国国家档案馆公开了希拉里·克林顿在1993—2001年作为第一夫人期间的白宫日程档案。由于这些档案是新闻记者团体和独立调查机构依据“信息自由法案”向国会多次请愿才得以公开的,因此具有极高的社会关注度与新闻时效性。但是,这些档案是不可检索的低质量PDF文件,若想将其转换为可以检索并便于浏览的文件格式,需要进行再处理。华盛顿邮报希望将这些档案在第一时间上传到互联网,以便公众查询,但是据估算仅每一页的操作,以报社现有的计算能力就需要30分钟。因此,华盛顿邮报将这个档案的转换工程交给AmazonEC2(ElasticComputeCloud)。AmazonEC2同时使用200个虚拟服务器案例,每个服务器的单页平均处理时间都缩短为一分钟,并在9小时内将所有的档案转换完毕,以最快的速度将这些第一手资料呈现给读者。案例一分析如果没有AmazonEC2提供的计算能力,华盛顿邮报需要超过一年的时间来完成全部档案的格式转换工作。显然,这样的效率不能满足新闻的时效性和公众对于信息的期盼。Amazon公司通过其EC2平台,将计算资源打包提供给客户,使报社在9小时内就得到了1407小时的虚拟服务器机时,在第一时间完成了档案的转换。华盛顿邮报仅需向Amazon公司支付144.62美元的费用。【案例二】Giftag是一款Web2.0应用,它能被以插件的形式安装在Firefox和IE浏览器上。互联网用户在浏览网页,尤其是在浏览购物网站的时候,可以利用这个插件将心仪的商品加入到由Giftag维护的商品清单中,并将这个清单与好友分享。这个应用一经推出便广泛流行起来,注册用户数量激增,每天Giftag的服务器都要响应数以百万计的请求,并存储用户提交的海量信息,没过多久服务器就不堪重负。Giftag将应用迁移到GoogleAppEngine(GAE)平台,基于GAE的开放API,Giftag可以利用Google具有可伸缩性的计算处理性能来响应高峰期的用户请求,利用Google的分布式数据库来存储用户数据,甚至可以使用Gmail邮箱和Google的搜索功能来增强用户体验。Giftag实现了从一个初创的Web2.0应用向一个稳定的、持续增长的网络服务的平稳过渡。案例二分析Giftag公司和其他初创型Web2.0公司一样,面临着高昂的基础设施投入费用,如:购置服务器、租用带宽等。而基础设施的投入往往是不易估量的,如果一次投入过大而应用并没有达到预期的流行度,就会造成投资的浪费;反之,如果应用获得了超预期的反响,用户数量激增,那么就会给服务器、带宽带来巨大的压力,从而造成应用服务质量下降和客户的流失。此外,Web应用需要复杂的软件配置,包括数据库、中间件、Web服务器等要素,如果其中一项配置得不合理,就会产生连锁反应,影响整个应用的表现。这些潜在问题都给创业公司提出了巨大的挑战。在GoogleAppEngine(GAE)上,Giftag可以将自己的精力集中于业务本身,而将诸如服务器动态扩展、数据库访问、负载均衡等各个层次的问题交给GAE平台来解决。正是由于GAE将Web应用所需的基础功能作为服务提供给了Giftag,才使得其可以专注于应用的开发和优化。【案例三】哈根达斯是著名的冰激凌供应商,其加盟店遍布世界各地。因此,公司需要一个CRM(客户关系管理)系统对所有的加盟店进行管理。当时哈根达斯用Excel表单来管理和跟踪主要的加盟店,用Access数据库来存储协议加盟店的数据,但是使用虚拟专用网(VPN)来访问该数据库的效果总是不太好。因此,公司急需一个能够让分布在各地的员工沟通协作的解决方案,并且该方案应该能够根据不同的需求进行灵活配置。哈根达斯公司选择了SalesforceCRM企业版,应用系统在不到6个月的时间就上线了。除此之外,该系统将MicrosoftOutlook和SalesforceCRM集成了起来,从而使员工能够轻松地访问Outlook中的联系人列表、日程和商业信息。Salesforce.com还为哈根达斯的解决方案提供了员工培训模块、加盟店跟踪模块,以及新店选址模块。哈根达斯公司用更少的成本获得了超预期的效果。案例三分析哈根达斯公司要搭建自己的CRM平台,传统的做法是先聘请一支专业的顾问团队研究公司的业务流程,建模分析并提出咨询报告。然后再雇用一家IT外包公司,进驻自己的公司对平台进行开发,可能会多次出现需求→设计→实施→需求变更→再设计→再实施的循环。同时,哈根达斯作为一家冰淇淋制作厂商,还需要投资IT设备,如购买服务器、交换机、防火墙、各种各样的软件,以及租用带宽等,为系统上线做准备。经历了这令人精疲力竭的过程后系统终于上线了,但它是不是真的满足了哈根达斯公司最初的愿望呢?可能永远不会有人知道和提起了。幸运的是,哈根达斯公司没有重复这条被别的公司走过无数次的老路。Salesforce.com作为CRM系统的专业提供商,对这个领域有着精深的理解。同时,它能够将已经完成的CRM应用模块打包,供用户选择。用户只需要如同在超市选购商品一样选择自己需要的功能模块,让Salesforce.com进行定制集成,一个属于自己的CRM系统就完成了,系统的上线和维护也将由Salesforce.com的专业团队负责。这样,非IT公司就可以专注于它的主营业务,使IT真正成为公司的支撑而不是拖累。【案例四】国际商业机器公司(IBM)作为全球整合的大型跨国企业,在全球共拥有9所研究院,汇聚了3000多位顶尖的科学家和研究员。在他们之中共有6位诺贝尔奖获得者和6位图灵奖获得者。在2009年,共有4914项美国专利在IBM诞生。在这里,每天都有不计其数的科学实验在进行着,其中有些实验需要有海量的计算和存储资源作为支撑。虽然每所研究院都配备了先进的IT设备,但仍然满足不了某些实验的需求。除此之外,由于这些研究院分布在世界各地,处于不同的时区,给合作科研提出了挑战。为了给研究部门的创新提供源源不断的支持,也为提高各研究院间的沟通协作效率,IBM公司构建了IBMResearchComputeCloud(RC2)将分散在各个研究院的资源系统(如服务器、存储)整合,为公司内部所使用。该系统为科研人员提供了共享计算和存储资源的平台,通过任务调度和安排,为每一项科学实验提供了有保障的动态资源供给,而且不需要科学实验人员来管理这些资源。不仅如此,不论是实验的中间流程还是最终结果,都是在该系统中完成和保存的,所以有效地保证了数据的安全,并使得身处世界各地的研究人员随时可以对它们进行查询和交换。这一切大大提高了协同科研的效率,为IBM公司不断深入的创新提供了强大的推动力。IBM公司分布在世界各地的9所研究院虽然各自拥有强大的IT基础设施,但有时单个科学实验对资源的需求超出了其所在研究院具有的资源规模,而且以往各自分割独立的组织方式很难让各个机构间协作完成一项工作。实际上,蓝色巨人IBM一直在努力整合自己的IT资源,以降低运营成本。早在2007年,IBM公司就开始着手将运行在3900台服务器上的业务迁移到30台大型机上,从而减少了80%的电力消耗,同时也促进了公司业务的整合。IBMResearchComputeCloud(RC2)的建立把分散于各地的资源从物理和逻辑上整合在一起,为研究院的科研提供了一个近乎取之不尽的资源池。此外,计算资源的整合带动了业务的整合,研究员们可以在IBMRC2上共享实验所需的工具、平台甚至是结果,大大加速了科研的进程。值得注意的是,与前三个案例不同,IBMRC2是供IBM公司内部使用的私有系统,而不是一个为公司以外的用户提供服务的第三方公用平台。案例四分析主要内容云计算的成功案例云计算的定义与特征云计算技术的分类与部署模型云计算体系结构典型云计算服务提供商案例因特网的变化MySpaceFacebook开心网校内网……用户的需求•随时随地访问能力(Accessibility)–可以随时随地使用任意设备访问•共享能力(Shareability)–要使得共享操作与建立、保存一样容易•自由获取(Freedom)–用户并不希望它们的数据无法获得•简单易用(Simplicity)–容易学会,容易使用•安全放心(Security)–相信数据不会被丢失或被不期望的第三方看到什么是云计算?就像用电不需要在家中装备发电机,只需直接从电力公司购买一样。“云计算”带来的就是这样一种变革。由谷歌、IBM这样的专业网络公司来搭建计算机存储、运算中心,用户通过一根网线借助浏览器就可以很方便的访问,把“云”做为资料存储以及应用服务的中心。云计算是一种计算模型,在这种模型中,应用、数据和IT资源以服务的方式通过网络提供给用户使用。15传统计算云计算云计算的演进云计算价值:资源利用率最大化云计算的本质就是通过整合、共享和动态的提供资源来实现IT投资利用率的最大化,它包括了新投资的资源和已投资的资源。因此,实施云计算不需要舍弃原有的IT基础设施资源。云计算的实施不仅可以利用已有的IT基础设施资源,而且云计算可以高效地监控管理IT基础设施资源。因此,实施云计算将使资源更容易被充分利用。云计算的定义维基百科:云计算是一种能够将动态伸缩的虚拟资源通过互联网以服务的方式提供给用户的计算模式,用户不需要知道如何管理那些支持云计算的基础设施。Whatis.com:云计算是一种通过网络连接来获取软件和服务的计算模式,云计算使得用户可以获得使用超级计算机的体验,用户可以通过电脑或手机上的瘦客户端接入云中获取需要的资源。TheNISTDefinitionofCloudComputing:Cloudcomputingisamodelforenablingubiquitous,convenient,on-demandnetworkaccesstoasharedpoolofconfigurablecomputingresources(e.g.,networks,servers,storage,applications,andservices)thatcanberapidlyprovisionedandreleasedwithminimalmanagementeffortorserviceproviderinteraction.云计算是一个模型,该模型使用户能通过随需应变的网络,无处不在地、方便地访问可配置的计算资源(例如:网络、服务器、存储器和服务等)的共享池,而这些资源以最少的管理工作或通过与服务提供者的交互实现快速地供给和释放。五个基本特征按需自助服务On-demandself-serviceAconsumercanunilaterallyprovisioncomputingcapabilities,suchasservertimeandnetworkstorage,asneededautomaticallywithoutrequiringhumaninteractionwitheachserviceprovider.客户不需要与每一个服务的供应商直接交互,就可以独自地获得自动按需配置的计算资源,如服务器使用时间、网络存储空间等。多样化网络接入BroadnetworkaccessCapabilitiesareavailableoverthenetworkandaccessedthroughstandardmechanismsthatpromoteusebyheterogeneousthinorthickclientplatforms(e.g.,mobilephones,tablets,laptops,andworkstations).可以通过网络获得各种计算资源,可以通过各种各样的痩型或厚型客户端(例如,移动电话、笔记本电脑、掌上电脑等)