google云计算体系架构

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Google云计算原理2ReachedOurGoal认识云计算(理解)理解Google云计算实现原理(难点)可独立在GAE上开发云服务应用了解TMF?以及云未来的发展(了解)3初识云计算1Google云计算原理2GAE平台部署云服务3提纲TMForum对云态度44Wehaveadream……愿景:计算机的服务能力可以作为一种商品进行流通。就像水、电、气一样取之方便,费用低廉5云计算定义图:云计算概念模型云计算:是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够按需获取计算力、存储空间和信息服务。6云计算服务的部署形式IaaS基础设施云(代表:亚马逊的S3)SaaS应用云(代表:salesforce的CRM)PaaS平台云(代表:GoogleAppEngine)私有云(数据中心–内部网)公共云(服务提供商–互连网)混合云(公共和私有)Xasaservice7Amazon云计算1GB数据存放1个月为0.15美元每个服务器租用1小时为0.1美元1.Amazon的IaaS云计算思路弹性计算云EC2为企业提供计算服务简单存储服务S3为企业提供存储服务2.Amazon的IaaS运用实例亚马逊IaaS应用案例:纽约时报使用亚马逊云计算服务效果:在不到24个小时的时间里处理了1100万篇文章费用:累计花费240美元利用自己服务器时间:数月时间费用:多得多的费用89Google云计算1.Google的云计算思路应用向互联网迁移数据向互联网迁移计算能力向互联网迁移存储空间向互联网迁移“浏览器=操作系统”102.隶属PaaS的Google云计算Google云计算PaaS属于部署在云端的应用执行环境支持Python和Java两种语言通过SDK调用Google的各种服务。如GoogleMap、Mail等用户可快速、廉价(可免费使用限定的流量和存储)地部署自己开发的应用(如创新的网站、游戏等)在下一章将具体介绍GAE具体的应用11Google云计算SaaS3.隶属SaaS的Google云计算提供在线“Word、Excel、PPT”提供在线MAP提供在线日历管理……Google云计算平台技术架构分布式文件系统GoogleDistributedFileSystem并行数据处理MapReduce分布式锁Chubby结构化数据表BigTable12Google如何实现云?Google云计算应用MapReduceBigTableGFSChubby将在第二章详细介绍13云计算概念入门14初识云计算1Google云计算原理2GAE平台部署云服务3提纲TMForum对云态度415Google云计算原理分布式文件系统GFS并行数据处理模型MapReduce分布式锁服务Chubby分布式数据库BigTableGoogle云计算应用MapReduceBigTableGFSChubby1617Google设计GFS的动机•Google需要支持海量数据存储的文件系统–购置昂贵的分布式文件系统与硬件?是否可以在一堆廉价且不可靠的硬件上构建可靠的分布式文件系统?1.GFS设计原则:机器失效不能视为异常现象能应付对大型/超大型文件处理支持大量用户同时访问2.GFS组成GFS集群:一个的Master和多个ChunkServer(块服务器)组成,并可以多客户端Client访问3.GFS设计要点每个文件拆成若干个64M文件块Chunk组成每个Chunk都由Master根据其创建时间指定ChunkHandle(64)文件块被保存在ChunkServer本地磁盘中缺省情况下3处热备份Chunk块文件18GFS的设计思路4.Client职责包含文件系统的API负责和ChunkServer和Master通信代表应用程序进行读写操作Client和Master进行元数据操作Client和ChunkServer进行文件数据操作5.Master职责负责管理所有文件系统的元数据元数据包括:命名空间,访问控制信息,文件到Chunk的映射信息等6.ChunkServer职责负责存储chunk文件块Linux文件系统19GFS的设计思路20GFS的系统架构应用程序GFS客户端GFS数据块服务器Linux文件系统GFS主服务器文件命名空间Chunk2EEE/foo/barGFS数据块服务器Linux文件系统………………标注:数据信息控制信息文件名,chunk索引向数据块服务器发指令返回数据块服务器状态Chunk句柄和位置Chunk句柄,查找数据返回数据信息21Question文件为什么要被化分为64M?Answer:1、可以减少Client和Master的之间的交互,减少Master的负载2、客户端可以在一个Chunk中完成许多操作3、可以减少TCP三次握手时间。另外这些信息都要被Master管理的缺点:有冗余采用中心服务器模式Master可以方便地增加ChunkServerMaster掌握系统内所有ChunkServer的情况,方便进行负载均衡不存在元数据的一致性问题不缓存数据必要性:Client流式读取,非重复读写可行性:Master本身管理多个Server,很复杂22GFS架构的特点ChunkServer容错每个Chunk有多个存储副本(默认是3个),分别存储于不通的服务器上每个Chunk又划分为若干Block(64KB),每个Block对应一个32bit的校验码,保证数据正确(若某个Block错误,则转移至其他Chunk副本)Master容错三类元数据:命名空间(目录结构)、Chunk与文件名的映射以及Chunk副本的位置信息前两类通过日志提供容错,Chunk副本信息存储于其它ChunkServer。这样Master出现故障时可恢复23GFS容错机制24GFS实验效果图ChunkServer1ChunkServer2ChunkServer16……MasterClient1Client2Client16路由器1路由器2Master25Google云计算原理分布式文件系统GFS并行数据处理模型MapReduce分布式锁服务Chubby分布式数据库BigTableGoogle云计算应用MapReduceBigTableGFSChubby摩尔定律正在走向终结…单芯片容纳晶体管的增加,对制造工艺提出要求CPU制造18nm技术,电子泄漏问题CPU主频已达3GHz时代,难以继续提高散热问题(发热太大,且难以驱散)功耗太高26并行计算基础未来的发展:多核27什么样的问题适合并行计算?斐波那契序列(Fibonacci)X计算URL访问频率YMap函数处理日志中web页面请求的记录,然后输出(URL,1)。Reduce函数把相同URL的value值都累加起来,产生(URL,记录总数)结果。Google拥有海量数据,并且需要快速处理什么是MapReduce?28Google为什么需要MapReduce?GoogleMapReduce架构设计师JeffreyDeanJefferyDean设计一个新的抽象模型,使我们只要执行的简单计算,而将并行化、容错、数据分布、负载均衡的等杂乱细节放在一个库里,使并行编程时不必关心它们这就是MapReduce29Google并行运算编程模型MapMapMap……原始数据1原始数据2原始数据MReduceReduce结果1结果R……1、在编程的时候,开发者需要编写两个函数:Map:(in_key,in_value)Reduce:(key,[value1,value2…])2、Map操作产生结果是key,value对3、在Map,Reduce之间系统把同一Key归类到Reduce3、Reduce操作对相同的Key进行归类处理30MapReduce实现机制用户程序(1)分割(1)分割(1)分割Master工作机M工作机M工作机M工作机R工作机R(2)指派Map(2)指派Reduce片段1片段4片段3片段2输入文件(3)Read(4)本地存储输出文件0输出文件1Map状态本地存储Reduce状态输出文件(5)远程读取(6)写入文件31单词计数体现M/R算法HelloWorldByeWorldHelloChinaByeChinaHelloSi-techByeSi-tech输入数据:MapReduceHello:3Bye:3China:2World:2Si-tech:2Map(Key,Value){for(eachworld‘world’invalue)collect(‘world’,1);}Reduce(Key,Value[]){intcount=0;for(eachwinvalue)count++;collect(Key,count);}1)32HelloWorldByeWorldHelloChinaByeChinaHelloSi-techByeSi-tech2)分割分割分割HelloWorldByeWorldHelloChinaByeChinaHelloSi-techByeSi-techKEYVALUEKEYVALUEKEYVALUE3)HelloWorldByeWorldHelloChinaByeChinaHelloSi-techByeSi-techMAPMAPMAPHello1World1Bye1World1Hello1China1Bye1China1Hello1Si-tech1Bye1Si-tech133Hello1World1Bye1World1Hello1China1Bye1China1Hello1Si-tech1Bye1Si-tech14)Map输出FoldHello1World1Bye1World1Hello1China1Bye1China1Hello1Si-tech1Bye1Si-tech1Fold输出34Hello3Bye3China2World2Si-tech2Hello1World1Bye1World1Hello1China1Bye1China1Hello1Si-tech1Bye1Si-tech1Fold输出5)Reduce输出Reduce背景MapReduce设计初衷:由普通PC组成的集群来处理超大规模的数据,所以有效的错误保障机制是必不可少Worker容错Master周期性的ping每个workerMaster容错Master周期性的将Master的数据结构的写入磁盘,即检查点(checkpoint)Master数据结构包括:Map和Reduce任务的状态(空闲、工作中或完成),以及Worker机器(非空闲任务的机器)的标识。35MapReduce容错机制36Google云计算原理分布式文件系统GFS并行数据处理模型MapReduce分布式锁服务Chubby分布式数据库BigTableGoogle云计算应用MapReduceBigTableGFSChubby37初识云计算1Google云计算原理2GAE平台部署云服务3提纲TMForum对云态度438GAE部署云应用39初识云计算1Google云计算原理2GAE平台部署云服务3提纲TMForum对云态度440TMFSeeSunnyFutureInTeleManagementWorldAmericanTMF简介1、电信管理论坛,非盈利联盟组织2、会员遍布全球195个国家,700+会员公司3、我们公司也是会员,享受会员权利4、业界广泛使用的eTOM,SID,TAM,NGOSSTMF最新框架技术1.云计算的出现并快速发展,一方面是虚拟化技术、分布式计算等技术发展的结果,另一方面也是互联网应用不断丰富趋势的体现。目前,虽然有Amazon、Google、IBM、Mi

1 / 95
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功