1/13双机双柜高可用高安全存储及异地灾备设计方案昆山高科信息系统工程有限公司2013年5月2/13目录第一章需求分析....................................................................................................31.1项目背景介绍.............................................31.2目前系统现状及问题分析...................................3第二章双机双柜....................................................................................................42.1传统的基于共享盘阵的双机集群系统....................................................42.2双机双柜高可用解决方案........................................................................52.3双机双柜高可用方案特点........................................................................8第三章异地容灾....................................................................................................93.1D2D2R异地容灾方案...............................................................................93.1.1方案简介.....................................................................................................93.1.2方案应用.....................................................................................................93.1.3方案特点...................................................................................................103.1.4可适用产品...............................................................................................103.1.5与D2D2T方案的比较.............................................................................103.2方案部署..................................................................................................113.2.1部署一——基于自建远程节点的D2D2R方案.................................113.2.1.1方案概述....................................................................................................113.2.1.2方案特点....................................................................................................113.2.1.3方案成本分析............................................................................................123.2.2部署二——基于爱数在线备份服务的D2D2R方案...........................123.2.2.1方案概述....................................................................................................123.2.2.2方案特点....................................................................................................123.2.2.3方案成本分析............................................................................................133/13第一章需求分析1.1项目背景介绍为了满足信息系统不断扩大的需求,需要建设信息系统核心数据库的存储系统、备份恢复系统,确保系统高可用性、可靠性、安全性和高性能。通过前期对项目的初步了解,我们根据存储备份发展的一些基本情况,设计出一套数据存储、备份以及异地数据容灾的解决方案,一方面主要完成数据备份保护方案部分设计,另一方对生产系统的异地数据级容灾进行考虑,满足稳定、可靠、减少备份窗口的特殊需求。1.2目前系统现状及问题分析异地灾备及备份保护系统建设目标包括:1.目前主要系统包括各类应用数据服务器,随着业务的发展,数据量的增大,需要进行数据本地备份和异地容灾;2.数据集中存储之后,我们在获得较高的处理性能和扩展性的同时,还将面对存储集中带来的数据风险,需要我们建设一套完善的备份系统对其进行保驾护航。3.由于系统保存了大量重要数据,这些数据非常重要,需要在异地另保存一份以防止灾难的发生。4.要求这个存储备份的兼容性一定要好,能够兼容各个厂家主机和存储系统,能够真正实现设备跨平台。涉及到多地进行的异地数据容灾。4/13第二章双机双柜随着信息化建设的不断推进,各个企事业单位的活动越来越多的依赖于其关键的业务信息系统,这些业务信息系统对整个机构的运营和发展起着至关重要的作用,一旦发生宕机故障或应用停机,将给机构带来巨大的经济损失。传统的基于共享磁盘阵列模式的双机集群系统,通过在两台服务器上运行高可用性软件和共用磁盘阵列来实现。但其有一个明显的缺点,在于存在单点数据故障的可能,即一旦其共享磁盘(磁盘阵列)出现问题,数据安全就得不到保障,整个群集或双机都不可能继续提供核心业务。因而对于核心业务高可用性比较高,并希望随时有数据备份的客户,希望提供双机双柜的解决方案,即:接上2个磁盘阵列,这两个磁盘阵列数据实时一致,一旦其中一个磁盘出现问题,另外的磁盘阵列的数据继续可用,从而保证业务继续可用。2.1传统的基于共享盘阵的双机集群系统基于共享磁盘阵列模式的双机集群系统,通过在两台服务器上运行高可用性软件(双机软件或集群软件)和共用存储来实现。它使用存储作为两台服务器的共用存储设备,通过双机软件对存储进行管理,同时对受保护的服务进行监控和管理。任何一台服务器运行一个应用时,应用数据存储在共享的数据空间内,每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。5/132.1.1共享磁盘阵列集群特点优点:实现真正意义上的数据与系统分离,系统整体效率高,存储系统升级扩容方便。缺点:存在单点数据故障,一旦磁盘阵列出现逻辑或物理故障,数据安全就得不到保障。2.2双机双柜高可用解决方案为了解决共享磁盘模式的单点数据故障问题,本着以客户为中心,为客户负责;以可靠性稳定性为第一标准;以性能价格比最优为选型标准;以可扩展性为导向,我们给客户推出了双机双柜高可用高安全存储解决方案。在方案开始以前,我们首先了解双机双柜。所谓双机方案就是一台主机为工作机(PrimaryServer),另一台主机为备份机(StandbyServer),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机也同时监视备份机是6/13否正常,有时备份机因某种原因出现异常,工作机可尽早通知系统管理工作人员解决,确保下一次切换的可靠性)。当工作机出现异常,不能支持信息系统运营时,备份机主动接管(TakeOver)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断地运行(Non-Stop)。当工作机经过维修恢复正常后,它会将其先前的工作自动抓回,恢复以前正常时的工作状态。(双机双工没写进去)对于本系统,ActiveServer作为工作服务器,BackupServer作为备份服务器。在正常情况下,ActiveServer为网络信息系统提供支持,负责整个网络的正常运行,同时,通过心跳线来检测监视BackupServer的运行情况,但发现BackupServer出现异常时,将及时通知管理员解决,确保切换的可靠性。BackupServer也同样通过心跳监视ActiveServer的运行情况,当侦测ActiveServer出现异常,不能支持信息系统运营时,通过切换,将主动接管ActiveServer的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行。当出现异常的ActiveServer经过维修恢复正常后,它会自动抓回先前的工作,恢复以前正常时的工作状态。双柜方案就是每台服务器联接2个磁盘阵列,这2个磁盘阵列的数据彼此镜像,服务器系统的任何写数据操作都同时写入这2个磁盘阵列,从而保证2个磁盘阵列数据的一致性,这样即使任何一个磁盘阵列出现问题,因数据在另外一个磁盘阵列中保留备份,从而不影响数据的完整性,并且还能不间断的向系统提供数据,保证系统提供的服务不会出现中断的情况。(多路径工作原理要写进去)如此可见双机对企业的影响如下图:Node1做为工作机,在其出现问题后,Node2便可以轻松接替业务。保证企业业务不间断在线,把企业损失降低到最小程度。7/132.2.1系统结构图:(方案图上如果有应用服务器呢,应用及数据库服务器负载均衡)采用加入两台HPDL580G7服务器和两台HP24口(8口激活)SAN光纤交换机以及两台HPStorageWorksP2000G3存储设备通过双机HA高可用软件(去看一下ROSEHA的网站写的方案原理)备份管理不仅仅是备份?软件来实现此方案。上述系统,降低了系统架构的复杂程度,也降低了整个系统的造价,是一种经济实惠的应用及存储高可用的解决方案。小结:基于以上架构,我们可以分别从应用数据服务器和存储设备二个部分分别描述该方案。2.2.2存储设备部分(先讲HA原理,后讲数据镜像同步,最后讲容灾)通过保持两台存储设备之间的数据镜像同步。工作原理为主存储设备将数据以字节对字节的方式镜像到另一台存储设备上,以实时确保数据的可用性和最大程度的安全保护。生产系统的数据写入主存储设备后,立即将写I/O信息通过FCP协议写入到另一个存储设备内,另一个存储设备响应后,主存储设备才会响应生产主机写完成。这种同步实时复制的方式保证了业务数据的最高级可用性保8/13护。任何时候主存储设备发生系统故障,都能保证有另一份完全相同的业务数据供用户重启业务之用。2.2.3应用数据服务器部分(对应用多机集群与数据库服务器的双机集群论述)由于做了存储高可用,所以应用数据的整个存储过程都运行于存储设备系统之中,因此对应用服务器不会有影响,也不会占用应用服务器的宝贵CPU及内存资源。对于服务器端,后端存储系统就是共享存储的双机或者集群架构,这样,我们就