双机热备解决方案1.1双机备份方案描述现代IT技术认为,一个成功系统中数据及作业的重要性已远超过硬件设备本身,在一套完善的系统中对数据的安全及保障有着极高的要求。双机容错系统是由IBM公司提出的全套集群解决方案,结合IBM服务器产品的安全可靠性和集群技术的优点,为用户提供一个完善的系统。1.1.1双机备份方案的原理两台服务器通过磁盘阵列或纯软件模式,连接成为互为备份的双机系统,当主服务器停机后,备份服务器能继续工作,防止用户的工作被中断。1.1.2双机备份方案的适用范围用户对系统的连续工作性和实时性要求较高,系统停机对系统的影响很大,造成很大的损失。1.1.3双机备份的方式及优缺点磁盘阵列备份方式——两台服务器通过磁盘阵列连接起来,形成备份系统,此方法硬件投资大,价格较贵,但系统易于安装,也相对稳定。磁盘阵列备份模式示意图1.2双机备份方案由IBM系列产品组成硬盘备份模式主机:采用IBMX255主机网卡:采用IBM10/100/1000MM网卡磁盘阵列:采用EXP300磁盘阵列,配制RAID5具体实现方法参见后面章节附图和说明IBMX255结合EXP300磁盘阵列的双机方案系统简述:整个系统由两台IBM高端服务器X255和EXP300磁盘阵列构成双机备份模式,双台服务器互为备份,当一台服务器出现问题停机时,另一台服务器能实时接管中断的工作,保证业务系统的正常运行。EXP300磁盘柜磁盘具有热插拔功能,具可以灵活组成RAID模式,当一块硬盘损坏,数据可以恢复,保证数据不丢失。1.3IBMPC服务器双机容错系统解决方案由于采用了双机容错的集群结构,系统具有极高的可靠性。两台服务器可以作为一个整体对网络提供服务,且相互间互为监控。集群具有一定的负载平衡功能,可将一个任务的多个进程分摊到两台服务上运行,提高系统的整体性能。当一台服务器发生故障时,其上所运行的进程及服务可以自动地由另一台服务器接管,保证网络用户的工作不受影响。同时,如果系统采用RAID技术对数据进行保护,可确保重要数据不因系统故障而造成损失。特点:高可靠性支持冗余磁盘阵列冗余电源和风扇设计所有部件均支持热插拔主机可各自运行自己的应用,互为备份,共享磁盘数据高性能单块IBMServeRAID卡数据传输带宽可达160MB/s数据传输I/O可达3000次/s主机与磁盘间的距离可达20米高可用性可扩展性强/性能价格比高/高容错性,系统安全高效产品介绍(略,有兴趣的朋友可以去IBM网站看看详细的介绍)2.1磁盘阵列备份模式介绍概述在双机热备的架构中,除了要考虑切换时间外,要根据每个系统的作业环境,包括网路系统是单网或是双网,数据库的安装和作业内容及用户端的设备是经由广域网路、区域网路接入不同用户有不同的需求,而要求有不同的切换模式,所以选择不同的切换模式,可以使用户端的改变达到最少的程度。EDI-HA根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组合及选择。模式---双机双网络适配器(DualEthernetAdopter)•双主机各自通过一条SCSI电缆线与RAID相联•双主机各自运行不同的作业•每一主机定义第一网口和第二网口•主机A上等一网0在故障时由第二网口接管•主机B上等一网0在故障时由第二网口接管•主机A故障后,主机B自动接管主机A的作业和数据•主机B同时接管A的主机名(Host)及网络地址(IP)•主机A的作业将在主机B上自动运行•主机A的客户(client)可继续运行,无需重新登录•主机A同样可作B的备份机•可进行数机双工备份和网卡的备份软件配置在方案中,我们采用美国ROSE公司的NTCluster软件,作为双机热备份软件;采用台湾DFT磁盘阵列作为双机系统公用数据的存储设备。其构成如图1所示。如果其中一台服务器由于硬件或软件原因(最近国际调查显示70%的服务器故障来自软件错误)发生故障失效,另外一台服务器可在保证提供自己原有服务的同时,启动失效服务器的应用程序、文件系统、IP地址和打印机等网络资源服务从而取代其服务器功能。美国Rose数据公司RoseHAforNT双机热备软件。WindowsNT平台下的双机热备份软件,广泛用于金融、电信、政府等部门的核心业务。备受业界推崇的优秀产品。RoseHA产品经过了许多大型项目的考验,诸如福建、重庆等地的邮电97,外经贸部、宝钢等等,是一套成熟、稳定、可靠的产品。目前RoseNTCluster及其OEM产品占有中国市场NT平台HA软件的大部分市场份额。通过GUI,可以实时地观测到系统的状态,进行failover、takeOver等操作。美国Rose公司在中国设有办事处,对广大的中国用户提供强有力的技术支持双机备份安装完毕之后配置群集服务群集服务指南在运行着Windows2000AdvancedServer和Windows2000DataCenterServer操作系统的服务器上,安装群集服务的说明。该指南描述了在群集节点上,安装群集服务的过程。它的作用不是解释如何安装群集应用程序。而是指导如何安装典型的、两节点的群集本身。内容:介绍群集服务安装的核对表群集安装安装群集服务软件检验安装附录:SCSI驱动器的安装1.介绍群集服务器是一组独立的服务器,运行群集服务,并象单个系统一样运作。通过将运行着Windows2000AdvancedServer或Windows2000DataCenterServer的服务器编组,可组成群集服务器,从而对资源和应用程序提供了高可靠性的、可扩展性和可管理性。群集服务器的目的是,在出故障或断电的情况下,保证客户对应用程序和资源的访问。如果群集里的某服务器由于故障或维护的缘故,不可用,资源和应用程序将移到其它可用的群集节点上。对于群集系统,常使用高可用性,而不是容错性,这是由于容错技术提供了高度的恢复能力。容错服务器通常使用高度的硬件冗余,加上特定的软件,对任意单个的硬件或软件故障,提供了近于即时的恢复功能。这些解决方案的成本大大高于群集解决方案。这是因为前者要提供多余的硬件,并处于空闲状态,等待故障的出现。容错服务器主要用于支持高品质、高速处理的场合,如票据交换所、自动柜员机(ATM)或股票交易。群集服务不保证不停顿的操作,它为大多数执行关键任务应用程序提供了足够的可靠性。群集服务可监视应用程序和资源,并自动将多数故障状态识别和恢复出来。使用群集,可以为管理工作负荷提供更大的柔性,并提高整个系统的可用性。群集服务的好处有:高可用性:使用群集服务,资源的所有权,如磁盘驱动器和IP地址将自动地从有故障的服务器上,转到可用的服务器上。当群集中的系统或应用程序出现故障时,群集软件将在可用的服务器上,重启失效的应用程序,或将失效节点上的工作,分配到剩余的节点上。结果是,用户只是觉得服务暂时停顿了一下。修复返回:当失效的服务器连回来时,群集服务将自动在群集中平衡负荷。易管理性:可以使用群集管理器来管理群集,(如同在同一个群集中),并管理应用程序(就象它们运行在同一个服务器上)。可以通过拖放群集对象,在群集里的不同服务器移动应用程序。也可以通过同样的方式移动数据。可以通过这种方式来手工地平衡服务器负荷,卸载服务器,从而方便地进行维护。可以从网络的任意地方的节点和资源处,监视群集的状态。可扩展性:群集服务可进行调整,以满足不断增长的需求。当群集的整体负荷超过群集的实际能力时,可以添加额外的节点。针对在运行着Windows2000AdvancedServer,和Windows2000DataCenterServer的服务器的情况,本文提供了安装群集服务的说明。该指南描述了在群集节点上,安装群集服务的过程。它的作用不是解释如何安装群集应用程序。而是指导如何安装典型的、两节点的群集本身。2.群集服务器安装核对表该核对表帮助你做好安装的准备。在核对表之后是渐进指南。软件要求在群集里的所有计算机上,都安装了MicrosoftWindows2000AdvancedServer或Windows2000DataCenterServer。有某种名称解析手段,如域名系统(DNS),Windows互连网命名系统(WINS),HOSTS,等。建议安装允许进行远程的群集管理的终端服务器。硬件要求群集服务节点的硬件,必须满足Windows2000AdvancedServer或Windows2000DataCenterServer的硬件要求。这些要求可在产品兼容性查找页面找到。群集硬件必须是在群集服务硬件兼容性列表里的(HCL)。到Windows硬件兼容性列表中,查询群集,就可以找到最新的群集服务HCL。两台满足HCL的计算机,分别具有如下配置:有所安装的Windows2000AdvancedServer或Windows2000DataCenterServer的启动盘。该启动盘不能位于下面所描述的共享存储总线上。共享的磁盘有独立的PCI存储适配器(SCSI或光纤)。启动盘适配器除外。群集里的每台计算机有两块PCI网络适配器。有HCL兼容的外部存储单元,它跟所有的计算机相连。它被作为群集磁盘使用。建议使用独立磁盘冗余阵列(RAID)。用存储线缆,将共享设备连接到所有的计算机。可参考制造商的指南,配置存储设备。如果使用了SCSI总线,参见附录,查看额外的信息。对于所有节点的所有硬件,每个插槽,每个卡,都应该是一样的。这将简化配置,消除潜在的兼容性问题。网络要求唯一的NetBIOS群集名。五个独立的、静态的IP地址:两个用于内部网的网络适配器,两个用于外接公众网的网络适配器,一个用于群集本身。一个群集服务的域名用户帐号(所有节点必须是同一个域的成员)。每个节点应该有两个网络适配器,一个用于外接公众网,另一个用于点对点的群集内部网。如果只使用一块网络适配器完成这两种连接,这种配置是不被支持的。任何独立的内部网适配器都要求是HCL兼容的。共享磁盘要求:所有的共享磁盘,包括定额磁盘,都必须跟共享总线保持物理连接。可以从所有的节点上,检查磁盘是否接到了共享总线上。可在主机适配器安装层次上,对此进行检测。请参考制造商的文档,了解具体适配器的用法。必须对SCSI设备指定独立的SISC识别号,并按照相应的制造商的使用说明,完成相应的步骤。参见附录,了解关于安装和配置SCSI设备的信息。将所有的共享磁盘都设置为基本(不是动态的)。将所有的磁盘分区都格式化为NTFS。建议对所有的磁盘,都使用容错的RAID配置(这不是强制要求)。这里的关键是容错RAID配置-不能是无奇偶校验的阵列集。3.安装群集安装概要在安装过程中,一些节点将要关机,而另一些节点将会重启。这些步骤是必要的,保证连接到共享总线上的磁盘里的数据,不会丢失或被破坏。这样,可以保证在某个磁盘没有被群集软件所保护时,不会同时有多个节点对它进行写操作。使用下面的表一,确定每步应该对哪个节点或存储设备授权。该指南中的步骤是针对两节点的群集的。然而,如果要安装超过两个节点的群集,使用节点2所在列里的信息,确定其它节点的必要的状态。表1.群集安装的上电顺序在安装群集服务软件前,必须采取一些步骤。这些步骤是:在每个节点上安装Windows2000AdvancedServer或Windows2000DataCenterServer。设置网络。设置磁盘。在对首节点安装群集服务前,在每个群集节点上进行这些步骤。为在基于Windows2000的服务器上配置群集服务,你的帐号在每个节点上,都必须具有管理员权限。所有节点都必须是成员服务器,或者所有的节点是同一个域里的域控制器。在群集中,不允许一部分是域成员,一部分是域控制器。安装Windows2000操作系统请参考Windows2000操作系统包里附带的文档,在群集里的每个节点上安装操作系统。该渐进指南使用了特定的命名结构,它源于serversteps.asp中的Windows2000服务器的通用基础结构配置的渐进指南。当然,读者可以使用任意命名。在安装群集服务之前,必须以管理员身份登录。安装网络注:在这一部分,要对所有共享存储设备断电,然