材料清单一、毕业论文二、毕业设计任务书三、毕业设计开题申请表四、毕业设计开题报告正文五、专业译文声明本人XXX,学号06717005,系襄樊学院数学与计算机科学学院计算机科学与技术专业0611班学生(成教)。所做论文内容主体均为原创,无任何抄袭、剽窃他人劳动成果的行为。如有发现此类行为,本人愿意为此承担一切道义及法律责任,特此声明。学生签名:年月日ILinux集群的研究及应用摘要:随着计算机技术的发展和越来越广泛的应用,人们对计算机的依赖程度也越来越高。计算机的可靠性和可用性也变得越来越重要了。尽管单台计算机的性能和可靠性越来越好,但还是有许多现实的要求是单台计算机难以达到的。计算机集群技术就是将多台计算机组织起来进行协同工作来模拟一台功能更强大的计算机的技术。本文首先对现有服务器集群系统的技术进行了分析,介绍了几个典型的集群系统,重点讨论了负载均衡集群(LVS)和高可用集群(HighAvailability)的工作原理和实现技术。然后根据现有的集群技术的缺点进行了改进,将负载均衡集群和高可用集群整合在一起,结合Linux软件RAID5技术实现了三层构架的服务器集群,以较低的价格达到了昂贵的商业硬件存储解决方案所实现的效果。关键字:Linux;集群;LVS;HighAvailability;共享存储IILinuxclusterresearchandapplicationAbstract:Withthedevelopmentofcomputertechnologyanditswideapplication,ourdependencyonthecomputertechnologybecomesmoreandmorehigh.Computer’sreliabilityandavailabilityarebecomingmoreandmoreimportant.Thoughasinglecomputer’scapabilityandreliabilityisbecomingbetterandbetter,Butasinglecomputercan’tcompletesomerequeststill.Atthistime,it’snecessarytoorganizeseveralcomputerstoworktogether.Thistechnologyiscalledcluster.Thispaperfirstlyexistingserverclustertechnologyareanalyzed,andtheintroductionofseveraltypicalclustersystemwerediscussed,andtheloadbalancingcluster(LVS)andHighAvailabilitycluster(HighAvailability)Highworkingprincipleandrealizationtechnology.Thenaccordingtotheshortcomingsofexistingclustertechnologyimprovement,willloadbalancingclusterandhighavailabilityclustertogetherwithLinuxRAID5software,thethree-layerstructureoftheWEBservercluster,withlowpricereachedexpensivehardwarestorebusinesssolutionswhichrealizetheeffect.Keywords:Linux;Cluster;LVS;HighAvailability;Sharedmemory目录1引言............................................................11.1选题背景和意义...............................................11.2国内外的研究现状.............................................12集群技术........................................................32.1集群的定义...................................................32.2集群的分类...................................................32.3集群的优点..................................................43所采用的关键技术及实验平台......................................53.1双机热备技术................................................53.2IP负载调度均衡技术..........................................53.3共享存储.....................................................53.4VMwareWorkstation.........................................54高可用(HighAvailability)集群...................................74.1高可用集群...................................................74.2HA集群的工作过程............................................84.3High-AvailabilityLinux项目和HeartBeat....................84.4高可用(HA)集群的设计及实现.................................85Linux虚拟服务器与集群系统......................................135.1LVS集群的特点..............................................135.2IPVS几种常用的负载均衡调度算法.............................145.3LVS三种工作方式的具体原理.................................145.4LVS集群系统的设计及实现....................................175.5三种工作模式的比较..........................................265.6设计三层架构的选题背景和意义当今计算机技术已进入以网络为中心的计算时代。由于客户/服务器模型的简单性、易管理性和易维护性,客户/服务器计算模式在网上被大量采用。在九十年代中期,万维网(WorldWideWeb)的出现以其简单操作方式将图文并茂的网上信息带给普通大众,Web也正在从一种内容发送机制成为一种服务平台,大量的服务和应用(如新闻服务、网上银行、电子商务等)都是围绕着Web进行。这促进Internet用户剧烈增长和Internet流量爆炸式地增长。现在Web服务中越来越多地使用CGI、动态主页等CPU密集型应用,这对服务器的性能有较高要求。未来的网络服务会提供更丰富的内容、更好的交互性、更高的安全性等,需要服务器具有更强的CPU和I/O处理能力。例如,通过HTTPS(SecureHTTP)取一个静态页面需要的处理性能比通过HTTP的高一个数量级,HTTPS正在被电子商务站点广为使用。所以,网络流量并不能说明全部问题,要考虑到应用本身的发展也需要越来越强的处理性能。大部分网站都需要提供每天24小时、每星期7天的服务,对电子商务等网站尤为突出,任何服务中断和关键性的数据丢失都会造成直接的商业损失。例如,根据Dell的新闻发布,Dell现在每天在网站上的交易收入为一千四百万美元,一个小时的服务中断都会造成平均五十八万美元的损失。所以,这对网络服务的可靠性提出了越来越高的要求。1.2国内外的研究现状九十年代末期,Linux操作系统不断走向成熟,它的健壮性不断增强,并且提供了GNU软件和标准化的PVM、MPI消息传递机制,最重要的是Linux在普通PC机上提供了对高性能网络的支持,这样就大大推动了基于Linux的集群系统的发展。在国内,包括中国科学院在内的许多大学与研究机构早在20世纪90年代就开始了基于Linux集群研究,联想、浪潮等国内许多公司都有Linux集群产品和解决方案。Google、Baidu和腾讯后台均采用Linux集群,其中Google在2005年就达到了200万台,不仅如此,Linux集群大量在金融、证券、电信以及IT行业使用。名为High-AvailabilityLinux的开源项目的目标是,通过社区开发努力提供一个提升Linux可靠性(reliability)、可用性(availability)和可服2务性(serviceability)(RAS)的群集解决方案。Linux-HA项目得到了广泛的应用,是很多有趣的高可用性解决方案的重要组成部分。LVS是中国章文嵩博士发起和领导的优秀的集群解决方案,许多商业的集群产品,比如RedHat的Piranha等,都是基于LVS的核心代码的。HA和LVS的不足主要有:HA集群一般都是以两个节点的形式出现的,单机处理能力有限,所以当服务器压力较大时,想扩容服务器的处理能力往往得把以前的服务器淘汰掉,浪费了以前的投资;LVS集群的真实服务器都是靠前端IP负载器进行调度分配的,所以存在单点故障,如果IP负载器Down机,整个集群系统就会瘫痪。所以必须把HA和LVS整合在一起。真实服务器的数据源所涉及的共享存储一般都是利用商业的硬件解决方案,如SAN网络区域存储,对于小型集群系统来说,投入非常高昂,完全可以利用Linux的软件RAID5技术和NFS网络文件系统来实现。32集群技术2.1集群的定义集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,工作站或超级计算机性能价格比要高得多。[1]2.2集群的分类集群分为同构与异构两种,它们的区别在于:组成集群系统的计算机之间的体系结构是否相同。集群计算机按功能和结构的不同可以分成:高可用性集群(High-availabilityclusters,简称HA)、负载均衡集群(Loadbalancingclusters)、高性能计算集群(High-performanceclus