中标普华高可用解决方案支持服务中心目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍集群基础介绍•集群的定义路由器/防火墙外部用户Internet磁盘阵列任务调度......应用服务器集群高可用部署应用服务器应用服务器应用服务器数据库服务器一个集群内包含多台(至少二台)拥有共享数据存储空间的服务器任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管集群基础介绍•集群系统特点性能价格比高可靠性高可扩展性好易用性好集群系统采用高品质的商品化部件,其超强的处理能力可以取代价格昂贵的中大型机只要有一个结点可用,该系统就可以提供持续的服务系统的可视化人机交互集成开发环境功能齐全、界面友好、使用灵便结点的配置和结点机的数目可根据用户的需求来确定,原有的资源还可得到充分利用集群基础介绍•集群系统分类高可用性集群主要功能就是提供不间断的服务。有许多应用程序都必须一天二十四小时地不停运转,如所有的web服务器、工业控制器、ATM、远程通讯转接器、医学与军事监测仪以及股票处理机等。对这些应用程序而言,暂时的停机都会导致数据的丢失和灾难性的后果集群超级计算集群企业利用若干台PC机就可以完成通常只有超级计算机才能完成的计算任务高性能集群通过将多台机器连接起来同时处理复杂的计算问题。模拟星球附近的磁场、预测龙卷风的出现、定位石油资源的储藏地等情况都需要对大量的数据进行处理。传统的处理方法是使用超级计算机来完成计算工作,但是超级计算机的价格比较昂贵,而且可用性和可扩展性不够强,因此集群成为了高性能计算领域瞩目的焦点高可用集群运行于两个或多个节点上,目的是在系统出现某些故障的情况下,仍能继续对外提供服务。高可用性集群的设计思想就是要最大限度地减少服务中断时间负载均衡集群目的是提供和节点个数成正比的负载能力,这种集群很适合提供大访问量的web服务。通常情况下负载均衡集群往往也具有一定的高可用性特点集群基础介绍•集群系统分类路由器/防火墙外部用户Internet磁盘阵列SAN/NAS任务调度Oracle数据库集群应用服务器集群高可用部署应用服务器应用服务器应用服务器数据库服务器数据库服务器数据备份服务器集群基础介绍•集群系统分类比较A高可用集群既适用于提供静态数据的服务,又适用于提供动态数据的服务B负载均衡集群适用于提供静态数据的服务C高可用集群之所以能适用于提供动态数据的服务,是由于节点共享同一存储介质D负载均衡集群的各节点间通常没有共用的存储介质,用户数据被复制成多份,存放于每一个提供该项服务的节点上目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍高可用技术的发展历程及发展方向•高可用技术的发展历程90年代中期IT应用不断增多为实现应用的高可用,用户一般都采用双机热备的方式高可用技术的发展历程及发展方向•高可用技术的发展方向–应用系统多样化高可用集群的应用系统正朝多样化趋势发展,不仅局限于一般业务,还表现出一些特殊的应用模式。例如在制造业生产线系统中,通过将生产线计算机系统进行集群构筑,来提高系统整体的高可用性;又如在银行等需要保障关键业务运行的行业,为实现系统宕机时间的最小化,甚至有采用容错服务器为平台,配合使用高可用软件来构筑集群系统的案例,这种硬件+软件的“超强阵容”,将系统可用性大大提高。–用途多样化除通常意义上对业务应用的保护外,集群软件还将被用于越来越多的领域中。这里重点谈谈在远程容灾方面的应用。企业为了业务的持续发展,必须规避在各种灾难发生时的损失,因此,在远程容灾方面的需求不断增加。通过集群技术实现的远程容灾方案,其最大的优势是即使不具备特别的知识,只要对集群的配置有所了解,就能实现灾备。此外,有些用户还会有在较近距离内(如4、5公里左右)兼做大容量数据备份的需求;甚至如果网络链路容许,还可将备份系统建立在异地数据中心进行托管。高可用技术的发展历程及发展方向•高可用技术的发展方向–运行形态多样化随着CPU多核技术的发展,在处理能力提高的同时,利用虚拟化技术进行服务器整合的需求急增。据统计,在一些发达国家,目前VM市场正在以每年50%的速度增长。但是服务器虚拟化后,必须解决作为虚拟机载体的物理服务器发生单点故障的问题,而且由于虚拟服务器的故障往往与重大故障的发生紧密相关,就更要求系统必须具备高于一般服务器之上的可用性,使得高可用性对虚拟平台的支持成为一种趋势。–配置及可操作性方面的要求提高随着高可用集群技术的发展,高可用集群软件的功能变得越来越多,带给客户更多实惠的同时,也带来了配置及可操作性方面的复杂性。因此,简便的配置及可操作性成为一种必然的需求。目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍用户对高可用集群软件的选择•用户经常遇到的问题软件缺陷/失败–计划中的管理维护–错误操作硬件损耗/维护建筑物/站点范围的灾难(如火灾)城市范围的灾难(如暴风雪、洪水)用户对高可用集群软件的选择•高可用软件的选择对于任何一款高可用集群产品,故障监视都是最核心的功能。监视资源种类的多少和监视层次的深浅,都成为评价一款集群软件高可用性的重要指标。此外,在集群系统中,服务器之间还需要定期进行相互间的健康状态检查,称之为心跳探测。心跳探测主要通过网络来进行,包括私网心跳和作为备份方式的公网心跳探测。一款优秀的集群软件应具有完备的心跳探测机制来避免在高负荷状态下心跳超时所导致的误切换。从产品的适用平台范围和易用性上来说,拥有雄厚实力的集群软件厂家往往能够应对操作系统和硬件平台快速发展的现状,生产出适应更加广泛多样的软硬件平台或特殊环境的产品,还应让用户感到操作维护简单易行。这都是用户在采购时需要充分考虑的。此外根据用户的不同需求,还可以选择支持远程容灾、虚拟服务器环境的高可用集群产品。目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍高可用产品介绍•SteelEye公司LifeKeeper高可用产品介绍•SteelEye公司LifeKeeper–彻底的易用性•集中式管理•Wizard操作方式•自动的可靠性策略•直观的JavaGUI和SDK高可用产品介绍•SteelEye公司LifeKeeper–前瞻性保护某个硬件部件或应用的失效可用过多个错误检测机制被提前检测出来,而不会等到系统完全失效。使用智能的进程和多条LAN心跳线连接监控集群。高可用产品介绍•SteelEye公司LifeKeeper–伸缩性允许通过简单的往集群中增加节点而使应用支持更多的用户。为了确信提供失效保护,还在应用级支持伸缩性。高可用产品介绍•SteelEye公司LifeKeeper–数据存取与完整性当运行于共享存储环境下,数据储存是与集群中的服务分开的。所有数据保存在一个共享的磁盘阵列中。这种独立性允许在存储数据时不必考虑是通过哪台主机上的应用。而且,共享存储锁定机制通过对驱动器的锁定使得在任何时刻只允许一个应用存取,维护了数据的完整性。–多种恢复操作方式高可用产品介绍•SteelEye公司LifeKeeper–数据存取与完整性当运行于共享存储环境下,数据储存是与集群中的服务分开的。所有数据保存在一个共享的磁盘阵列中。这种独立性允许在存储数据时不必考虑是通过哪台主机上的应用。而且,共享存储锁定机制通过对驱动器的锁定使得在任何时刻只允许一个应用存取,维护了数据的完整性。–多种恢复操作方式高可用产品介绍•RoseDataSystem公司RoseHA高可用产品介绍•RoseDataSystem公司RoseHA–优势特点•接近零系统资源的占用;•GUI与Server分离,可随时中断GUI而不影响Server的运行;•安装时不需要更改操作系统的核心,变更应用软件和特殊的硬件;•提供基于GUI的监控中心,管理员能查看PowerHA的状态、检查错误信息和警告、修改系统参数及从远程工作站控制PowerHA系统;•不需要复杂的设定与操作,维护方便。高可用产品介绍•NEC公司ExpressCluster高可用产品介绍•NEC公司ExpressCluster–ExpressCluster特性:*EXPRESSCLUSTER最大可构筑拥有16台服务器的集群系统。因此,与2台服务器的集群相比,能够确保更高的可用性和扩展性。*EXPRESSCLUSTER提供了2种结构用来共享在服务器间应继承的数据。*在集群间共享1台存储装置的磁盘共享型。主要定位是大规模的集群系统。*在服务器间镜像磁盘的数据镜像型。可以构筑2台服务器的集群系统,故定位是较小规模的集群系统。*通过GUI实现简单操作–ExpressCluster特点与优势:*支持最多16台服务器的集群,可以充分利用服务器资源。并且,多点集群能力体现出了产品的技术实力。*基于Web的远程监视能力,能够方便地对服务器集群进行管理。高可用产品介绍•开源产品heartbeatHA高可用产品介绍•开源产品heartbeatHA–ExpressCluster特性:*可配置两个以上节点故障恢复,最多支持16个节点*故障检测时间低于一秒*资源移至另一节点前执行I/O数据完整性检查*故障节点恢复“自动”或“手动”动作设置*通过GUI实现简单操作目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍高可用产品对比LifeKeeperNECRoseHAVeritas硬件平台支持各种硬件平台Intel,AMD—支持各种硬件平台软件平台Linux,Windows,UnixLinux,WindowsLinux,Windows,Solaris,SCOLinux,Windows,HP-UX,IBM-AIX单个集群最大节点数3216232集群存储支持SCSI,FC,NASSCSI,FCSCSI,FCSCSI,FC,SAN支持磁盘镜像是是否否心跳方式以太网,串口,共享磁盘以太网,串口以太网,串口以太网代理高可用产品对比LifeKeeperNECRoseHAVeritas工作方式Active/ActiveActive/StandbyN+1(Active/Standby)Active/ActiveActive/StandbyActive/ActiveActive/StandbyActive/ActiveActive/Standby支持节点优先级是是否是支持STONITH是否否否配置界面命令行,字符界面,图形界面,远程管理命令行,web图形界面,远程管理命令行,图形界面,远程管理命令行,web图形界面,远程管理提供给用的开发接口是(SDK)是(脚本)否否代理高可用产品对比LifeKeeperNECRoseHAVeritas服务Agent支持是(比较完善)是是(脚本)是服务故障处理策略恢复/切换切换恢复/切换恢复/切换添加删除节点而不需停止集群是否否否支持灾难恢复否否否是目录集群基础介绍高可用技术的发展历程及发展方向用户对高可用集群软件的选择高可用产品介绍代理高可用产品对比应用实例介绍应用的行业领域➢金融➢证券➢政府➢医疗➢运输➢流通零售业➢制造行业等成功应用案例Router省级分行生产机生产机营业网点光纤存储备份服务器建行综合前端项目HA集群环境●应用系统包括:●档案系统●政务信息系统●会议系统●公文系统●信息上报与检索系统等●应用的软件产品包括–TRS信息检索系统–ORACLE9i–ORACLE9iAs–中标普华Linux数据库服务器–中标普华高可用解决方案–中标普华安全邮件服务器●应用的硬件包括:–IBM336、346服务器–HPDL380、570服务器–DELL2850、6850服务器–浪潮NF-2