服务器集群负载均衡方案建议书国际商业机器(中国)有限公司目录目录第1章服务器集群负载均衡方案介绍.............................................................................4一.大量数据处理所面临的问题..................................................................................41.目前存在隐患.........................................................................................................................52.应用系统问题综述.................................................................................................................51)“峰值”问题.........................................................................................................................52)多米诺”现象.......................................................................................................................63)“N+1”方式..........................................................................................................................64)“扩展”不便.........................................................................................................................65)“免疫力”差.........................................................................................................................66)“容灾”.................................................................................................................................77)应用与网络脱节................................................................................................................7二.IBM服务器集群负载均衡F5解决方案...............................................................72.1网络结构.................................................................................................................................72.2方案优势.................................................................................................................................82.2.1避免“不平衡”现象..............................................................................................82.2.2解决因“峰值堵塞”带来的性能调整“不平衡”..............................................92.2.3避免“多米诺”现象..............................................................................................92.2.4更好的提供系统容错,提高系统可靠性..............................................................92.2.5“扩展”灵活.........................................................................................................102.2.6“免疫力”强.........................................................................................................10服务器集群负载均衡方案建议书国际商业机器(中国)有限公司目录2.2.7“容灾”.................................................................................................................112.2.8网络感知应用,应用控制网络............................................................................12第2章IBM公司介绍.......................................................................................................15动漫渲染平台方案建议书国际商业机器(中国)有限公司第4页第1章服务器集群负载均衡方案介绍一.大量数据处理所面临的问题如今的单位和企业中,无论是否提供关键性任务的服务,都需要一个持续不断运行的高可用性服务器和网络计算环境以提供不间断的高品质服务。如果想要提供一个高可用性的服务,信息管理人员所必须考虑以下四件事情:1.使数据有一个安全的存储和运行方式,即使在设备故障时仍能保持数据的完整一致。2.使服务器系统持续运行,即使发生故障仍然让服务持续下去。3.使整个计算环境能更容易更加简单得的管理,如何容错、容灾、集群和共享。4.如何使投资有最好的效益,使系统有最佳的扩充能力,保持最好的整体拥有成本,也就是在任何情况之下均能确保数据的完整,系统持续运行,服务不间断,同时有最好的投资回报率。高可用性是衡量计算系统连续运行的一个重要技术指标。要想实现一个应用系统的高可用性,整个系统中所涉及到的所有组件(包括应用服务器和数据库服务器、存储设备以及端到端网络)都需要对外提供连续的服务。企业和机构对网络化应用及Internet的日益依赖,加上语音,视频流和数据的集成,企业网络和计算机系统以及存储系统的高可用性提出了更高的要求。任何类型的系统故障停机都可能意味着收入、信誉和客户满意度的巨大损失。做到企业整体IT服务系统的高可用性,能够保证:防止财务损失防止生产力损失改进用户满意度改进客户满意/信任降低IT服务支持成本,提高IT生产力快速并且不停机的部署关键任务应用支持新业务快速上线典型的业务要求为了实现高度的网络可用性,需要部署下列组件:可靠的网络设备H/W和S/W冗余及软件可靠性弹性网络技术确保任何设备或链路故障快速恢复的功能性动漫渲染平台方案建议书国际商业机器(中国)有限公司第5页网络设计定义良好的网络拓扑和配置,旨在以一种优化和计划良好的方式利用网络弹性功能。最佳实践定义良好的网络部署和维护过程,以及简化这些政策实施所必需的事件和变化管理工具全球性支持全球性积极的支持和纠错支持,可以实现抢先的快速反应维护支持行业伙伴关系确保端到端应用可用性的技术、支持服务及最佳实践的集成1.目前存在隐患1.1由于采用双机备份方式成本太高,如果不能建立有效的冗余技术,服务器不能保障得到24*7持续服务质量.1.2在广泛开展业务时,在流量的非线性变化或不平衡动态中,有可能需要根据具体情况增加或删除业务服务器,而增加与减少业务服务器材必须更改系统的IP地址指向,造成业务服务器的扩展达不到新业务的需求.1.3大量开展业务使服务器数量急剧增加,而如何管理监控服务器的流量,以便随时掌握服务器的负载情况和趋势是一个较大的难题.1.4服务器需要与许多异种架构系统配合,联网环境复杂,黑客攻击与病毒,蠕虫等侵入的可能性相对核心网络系统大,因为服务器的IP地址裸露在网络中使得服务器的安全性得不到保障2.应用系统问题综述1)“峰值”问题前置服务器的业务一般多为联机业务。联机业务的处理多存在“波峰”和“波谷”的变化。而且“波峰”时,业务量大小的变化又不规律,这就使前置服务器不得不面对“峰值堵塞”问题。如果是使用传统的解决方法,通过增加前置服务器或主机数量,提高处理能力,仍然动漫渲染平台方案建议书国际商业机器(中国)有限公司第6页会存在性能不平衡问题,且这样做,投资成本大。2)多米诺”现象如果使用单台服务器,不可避免会出现“单点故障”,需要进行服务器“容错”。为实现容错,往往在主服务器旁安置一台或多台备份服务器。但这样做,平时只有一台服务器工作,其它服务器处于空闲状态,无法完全利用所有服务器的处理资源,投资得不到充分利用。且当出现“峰值堵塞”时,所得到的往往是“多米诺”效应,即所有服务器连续被“堵”至“死”。并且,当所有服务器都损坏时,无法动态地、合理地利用其它资源提供服务或备份。3)“N+1”方式这种方式也是在应对服务器“容错”时,提出的应用方式。“N”,即业务处理集群,“1”,即一台备份机。我们注意到,虽然存在一台备份机,随时准备对业务处理集群中的任意一台服务器进行备份,但是,如果又有服务器或更多服务器(软硬件)出现故障呢?所以“N+1”也不能很好地完成系统“容错”。4)“扩展”不便随着物理和应用的集中,前置服务器上所要处理的数据量(traffic)增大,客户交易产生的同时连接(concurrentconnection)数量会越来越多。若处理资源不够,在未超出系统容量时,往往是客户的请求回应越来越慢,可容纳的同时连接数量逐渐减小,系统性能严重下降。当超出系统容量后,系统“死机”,业务中断。为应对日益增多的业务量,系统的扩展性尤为重要。当前所采用的扩展方式多为利用CLUSTER的方式。但这时,需要配置CLUSTER卡和CLUSTER集线器。·这些硬件设备成本高,投资大。·CLUSTER对硬件系统存在限制。·CLUSTER的容量有限。所有这些都会使系统“扩展”不便。5)“免疫力”差由于系统服务器“裸露”于网络连接中,而防火墙的安置又多在网络总入口处,所以服务器很容易受到来自各方面的“恶意性”或“无意”地攻击。为每台或每组服务器单独设置防火墙,又会使系统投资加大,维护量大幅提高。动漫渲染平台方案建议书国际商业机器(中国)有限公司第7页6)“容灾”随着数据中心的集中,数据中心的冗余或容错显得尤为重要。当建立备份中心或数据中心间形成备份后,在它们之间提供动态的、灵活的容错机制显得