数据大集中高可用性平台F5解决方案目录一.数据大集中面临的问题.............................................................................3二.数据中心高可用性平台.............................................................................4三.F5应用交付(ADN)解决方案.....................................................................51高可用性实现原理..................................................................................52F5Bigip负载均衡设备的功能..............................................................62.1丰富的负载均衡算法...................................................................62.2高级的健康检查方法...................................................................72.3强大的应用会话保持功能...........................................................82.4内置多种会话保持方式...............................................................82.5支持复杂的,可定制的会话保持功能.......................................93高可用性平台的安全特性......................................................................94高可用性平台实现系统的快速访问....................................................11四.高可用性平台的部署方式.......................................................................13五.F5BIGIP系统的其它优势.......................................................................131设备的高可用性....................................................................................131.1双机采用专用的心跳线,支持毫秒级切换.............................141.2支持双机连接状态镜像(connectionmirroring)....................141.3专用的双机“HA”进程表实现对系统状态的全面监控........142七层带宽管理........................................................................................143连接服用(oneconnect)...........................................................................14一.数据大集中面临的问题随着业务管理的统一,为了提高业务的管理水平和处理能力,政府各职能部门都在省一级机构上进行了业务的整合,并在信息化的过程中实现数据集中,省内各地市的相关业务都统一到省的数据中心进行处理,这样既减轻了各地市的数据中心的运维压力,同时也利于业务标准的统一处理。但在整个数据大集中的过程中,随着数据中心的地位越来越高,面临的问题也相应增多,特别是在应用和服务方面,不在象以前的单一应用或服务,应用的多样性和复杂性的服务内容给数据中心带来很多新的问题,讨论如下:“不平衡”现象当系统完成“物理集中”后,大量的数据等待集中的服务器处理。现有的方式多为采取单台或处于备份状态的双机系统提供服务,存在一半的资源浪费的情况,而在压力不断上升的情况下,往往以增加服务器的方式增加系统资源,但仍无法利用空闲的系统资源,不能有效的解决“不平衡”现象“峰值”问题服务器的处理多存在“波峰”和“波谷”的变化。而且“波峰”时,业务量大小的变化又不规律,这就使服务器不得不面对“峰值堵塞”问题。原有解决方法为增加服务器或主机数量,提高处理能力。但仍存在性能不平衡问题,且这样做,投资成本大。多米诺”现象单台服务器的设置,不可避免会出现“单点故障”,需要进行服务器“容错”。为实现容错,往往在主服务器旁安置一台或多台备份服务器。但这样做,平时只有一台服务器工作,其它服务器处于空闲状态,无法完全利用所有服务器的处理资源,投资得不到充分利用。且当出现“峰值堵塞”时,所得到的往往是“多米诺”效应,即所有服务器连续被“堵”至“死”。并且,当所有服务器都损坏时,无法动态地、合理地利用其它资源提供服务或备份。“N+1”方式这种方式也是在应对服务器“容错”时,提出的应用方式。“N”,即业务处理集群,“1”,即一台备份机。我们注意到,虽然存在一台备份机,随时准备对业务处理集群中的任意一台服务器进行备份,但是,如果又有服务器或更多服务器(软硬件)出现故障呢?所以“N+1”也不能很好地完成系统“容错”。“扩展”不便随着物理和应用的集中,服务器上所要处理的数据量(traffic)增大,客户交易产生的同时连接(concurrentconnection)数量会越来越多。若处理资源不够,在未超出系统容量时,往往是客户的请求回应越来越慢,可容纳的同时连接数量逐渐减小,系统性能严重下降。当超出系统容量后,系统“死机”,业务中断。为应对日益增多的业务量,系统的扩展性尤为重要。当前所采用的扩展方式多为利用CLUSTER的方式。但这时,需要配置CLUSTER卡和CLUSTER集线器。这些硬件设备成本高,投资大。CLUSTER对硬件系统存在限制。CLUSTER的容量有限。所有这些都会使系统“扩展”不便。应用与网络脱节系统的变化随时随地都会发生,完全靠人工的方式去调整网络与之适应,已经显出了其“非时时地”、“不灵活的”缺陷。如何使应用的变化动态地反映到网络的调整,已经成为现代化应用系统的一个新的课题。二.数据中心高可用性平台为了确保数据大集中的顺利进行,建议在数据中心的建设中建立高可用性的平台,此平台主要提供如下功能:业务系统的高可用性:实现业务应用系统的7×24小时的高可用性访问,保障业务的稳定运行。减少因为业务特性所引起的突发流量对系统的影响。实现安全的访问:在实现数据集中以后,省内地级市的访问流量都是经过广域网来进行访问,为了确保系统的安全性,不但需要对传输的数据进行加密,同时,应用系统也需要对发起访问请求的客户端进行认证和授权。实现业务系统的快速访问:在实现数据集中以后,各个地市的数据都需要经过省数据中心进行处理,负载均衡平台需要实现对数据进行压缩,以实现对数据包的快速传递,减少广域网的带宽消耗。同时,可以采用缓存等优化的手段减轻后台服务器的压力,加快用户访问的速度。三.F5应用交付(ADN)解决方案F5作为业界领先的应用交付技术领域的领先厂家,其解决方案很好的解决了在数据大集中以后所带来的各类问题,确保数据中心内的业务系统能够:安全,快速以及高可用的交付到客户端。真正解决了应用在网络上交付的问题。F5解决方案的原理如下:1高可用性实现原理服务器高可用性,就是利用定义在其上面的虚拟IP(virtualIP)地址来为用户的一个或多个应用服务器提供服务。因此,它能够为大量的基于TCP/IP的网络应用提供服务器负载均衡服务。负载均衡设备连续地对目标服务器进行L4到L7合理性检查,当用户通过VIP地址请求目标服务器服务时,BIG/IP根椐目标服务器之间性能和网络健康情况,选择性能最佳的服务器响应用户的请求。下图描述了一个负载均衡发生的流程:当然,F5BIGIP负载均衡设备并不是单纯意义上的对后台服务器分配流量,它能所实现的是为最终客户带来高可用性的应用信息服务。如何体现应用信息系统的高可用性,主要是由F5BIGIP产品的以下主要功能来实现的:2F5Bigip负载均衡设备的功能2.1丰富的负载均衡算法如上图,我们可以清晰看到负载均衡的整个业务流程,F5bigip负载均衡设备的最大特点就是提供了多种的负载均衡算法,充分满足各种应用信息系统的特色以及用户使用的要求,下面简单扼要的介绍这12种负载均衡算法。轮询(RoundRobin):顺序循环将请求一次顺序循环地连接每个服务器。当其中某个服务器发生第二到第7层的故障,BIG/IP就把其从顺序循环队列中拿出,不参加下一次的轮询,直到其恢复正常。比率(Ratio):给每个服务器分配一个加权值为比例,根椐这个比例,把用户的请求分配到每个服务器。当其中某个服务器发生第二到第7层的故障,BIG/IP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。优先权(Priority):给所有服务器分组,给每个组定义优先权,BIG/IP用户的请求,分配给优先级最高的服务器组(在同一组内,采用轮询或比率算法,分配用户的请求);当最高优先级中所有服务器出现故障,BIG/IP才将请求送给次优先级的服务器组。这种方式,实际为用户提供一种热备份的方式。最少的连接方式(LeastConnection):传递新的连接给那些进行最少连接处理的服务器。当其中某个服务器发生第二到第7层的故障,BIG/IP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。最快模式(Fastest):传递连接给那些响应最快的服务器。当其中某个服务器发生第二到第7层的故障,BIG/IP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。观察模式(Observed):连接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。当其中某个服务器发生第二到第7层的故障,BIG/IP就把其从服务器队列中拿出,不参加下一次的用户请求的分配,直到其恢复正常。预测模式(Predictive):BIG/IP利用收集到的服务器当前的性能指标,进行预测分析,选择一台服务器在下一个时间片内,其性能将达到最佳的服务器相应用户的请求。(被bigip进行检测)动态性能分配(DynamicRatio-APM):BIG/IP收集到的应用程序和应用服务器的各项性能参数,动态调整流量分配。动态服务器补充(DynamicServerAct.):当主服务器群中因故障导致数量减少时,动态地将备份服务器补充至主服务器群。服务质量(QoS):按不同的优先级对数据流进行分配。服务类型(ToS):按不同的服务类型(在TypeofField中标识)对数据流进行分配。规则模式:针对不同的数据流设置导向规则,用户可自行编辑流量分配规则,BIG/IP利用这些规则对通过的数据流实施导向控制。2.2高级的健康检查方法当负载均衡设备对服务器作负载均衡时,负载均衡设备对服务器上应用的运行状况的监控能力十分重要。只有及时发现有故障的服务器或应用,才能保证用户的访问请求会分发到可以正常工作的服务器上,从而实现应用系统的高可用性。在F5Bigip设备上具有三种不同层次的健康检查方式:1.服务器(node)——ICMP,Bigip会对后台服务器发送ping包,如果得到服务器ICMP相应,则认为该服务器能够提供服务。2.服务(port)——co