1数据中心灾备系统的分类根据数据中心的安全要求,应对灾难恢复系统采用的技术路线做出全面的考虑。1.数据级容灾和应用级容灾按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统能够提供不间断的应用服务,让服务请求能够透明(在灾难发生时毫无觉察)地继续运行,保证数据中心提供的服务完整、可靠、安全。因此对服务中断不太敏感的部分可以选择数据级容灾,以便节省成本,在数据级容灾的基础上构建应用级容灾系统,保证实时服务不间断运行,为用户提供更好的服务。(1)数据级容灾。通过在异地建立一份数据复制的方式保证数据的安全性,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据。数据级容灾是容灾的基础形式,由于只需要考虑数据的复制和存放,不需要考虑备用系统,实现起来相对简单,投资也较少。数据级容灾需要考虑三方面问题:在线模式与离线模式问题;远程数据复制技术问题;同步与异步容灾问题。(2)应用级容灾。应用级容灾能保证业务的连续性。在数据级容灾的基础上,建立备份的应用系统环境,当本地工作系统出现不可恢复的物理故障时,容灾系统提供可用的数据和应用系统。应用级容灾系统是建立在数据级容灾系统基础上的,同时能完成数据和应用系统环境的复制存放和管理。为实现发生灾难时的应用切换,容灾中心需要配置与工作系统同构和相同功能的业务网络、应用服务器、应用软件等。应用级容灾还需要考虑数据复制的完全性、数据的一致性、数据的完整性、网络的通畅性、容灾切换的性能影响、应用软件的适应性改造等问题,以及为保证业务运行的所需设备、环境、人员及其相应的管理。2.灾难恢复系统的在线/离线模式(l)在线模式。在线灾难恢复系统要求工作系统与灾难备份系统通过网络线路连接,数据通过网络实时或定时从工作系统传输到灾难备份系统。对数据保护的实时性高,对业务连续性要求高,就需要采用在线模式。(2)离线模式。离线灾难备份系统的数据通过存储介质(磁带、光盘等,搬运到异地保存起来实现数据的保护。离线模式适合于对数据保护的实时性要求不高的场合,离线模式设备比较简单,投资较少。3.数据备份技术正常情况下系统的各种应用在数据中心运行,数据存放在数据中心和灾难备份中心两地保存。当灾难发生时,使用备份数据对工作系统进行恢复或将应用切换到备份中心。灾难备份系统中数据备份技术的选择应符合数据恢复时间或系统切换时间满足业务连续性的要求。目前数据备份技术主要有如下几种:(1)磁带备份。(2)基于应用程序的备份。通过应用程序或者中间件产品,将数据中心的数据复制到灾难备份中心。在正常情况下,数据中心的应用程序在将数据写入本地存储系统的同时将数据发送到灾难备份中心,灾难备份中心只在后台处理数据,当数据中心瘫痪时,由于灾难备份中心也存有生产数据,所以可以迅速接管业务。这种备份方式往往需要应用程序的修改,工作量比较大。另外,由应用程序本身来处理数据的复制任务,对应用系统的性能影响较大。(3)数据库的远程数据复制。基本原理是将数据中心的数据库日志传送到远程灾难备份中心的数据库中,通过日志同步两端的数据库。这种方式需要数据库软件的支持。由于数据库方式只是传送数据库日志,与应用没有直接关系,因此无须对应用程序做大量修改。这种灾难备份方式比较适合于只对数据库有远程灾难备份需求,传输距离较长且网络传输带宽不大的用户环境。(4)服务器逻辑卷的远程数据复制。这种方式在服务器操作系统逻辑卷管理软件基础上实现,通过IP网络将逻辑卷操作传输到异地主机,在异地主机执行同样的逻辑卷操作,保证本地和远端逻辑卷的一致性。这种灾难备份方式适合文件、数据库等多种数据的远程复制要求,并且对应用系统和数据库是透明的,但需要数据中心和灾难备份中心主机同构。(5)基于存储备份软件实现的远程数据复制。数据的复制和同步通过存储备份软件实现,系统的灵活性很强,完全不依赖主机系统和存储系统,也不影响本地应用的响应速度,数据可以从任何存储设备上镜像到任何地点的任何存储设备上。(6)基于智能存储设备的远程数据复制。由智能存储设备自身管理软件实现数据的远程复制,即智能存储设备将系统中的存储操作指令发送到远端的智能存储设备上,在远端智能存储设备中重做存储操作指令,实现数据远程复制。这种灾难备份方式要求数据中心和灾2难备份中心配置同构的智能存储设备。4.同步/异步方式数据复制技术是灾难备份系统的核心技术。数据复制技术主要是将数据中心的生产数据复制成灾难备份数据,灾难备份数据与生产数据应保持一致。在线模式下,数据复制的主要方式有同步数据复制和异步数据复制两种。(1)同步数据复制。同步数据复制指的是备份中心的数据在任何时间与数据中心的数据均保持一致。复制环境中的任何一个结点的复制数据发生了更新操作,这种变化会立刻反映到其他所有的复制结点,同步数据复制方式在主机向本地磁盘写数据的同时,将数据传到备份中心的磁盘系统,在确认远程备份系统的数据同步更新后,完成写数据的操作。只有当备份数据的写操作完成后,主机程序继续进行,否则主机程序将等待备份数据的写操作的完成。同步数据复制方式的数据实时性强,灾难发生时备份数据能够与生产数据保持一致,几乎没有数据丢失,恢复时间短。同步数据复制技术可以保证数据的一致性和完整性,实现起来较为简单,但是增加了网络和应用系统的负担,由于需要等待远程站点的确认,数据更新操作时间长,影响应用的性能。同时,由于数据在两个中心间传输要消耗时间,使得数据读/写操作时间受到两个中心之间距离的影响,两个中心间的距离限制很难突破60km。由于受到传输技术的限制,该方式对数据中心和备份中心之间的距离和通信质量有严格要求。一般适用于同城异地的备份。(2)异步数据复制。异步数据复制方式是在主机系统问本地磁盘写数据后,将本地生产数据以后台的方式复制到异地。异步数据复制方式对数据的更新操作不必等本地卷和备份卷的数据都更新完毕后才算是更新完成,因此减少了更新操作的时间,对生产主机性能的影响较小。异步数据复制方式的所有复制结点的数据在一定时间内是不一致的。复制环境中的其中一个结点的复制数据发生了更新操作,这种改变将在一段时间后反映到其他复制结点以最终保证所有复制结点间的数据一致。异步复制技术可以保证数据的一致性,实现起来较为复杂,但是减少了网络和应用系统的负担。但由于数据不能时时同步,灾难发生时可能出现少量数据的丢失。5.存储子系统存储子系统是容灾系统的重要组成部分。保存大量数据的灾难备份中心存储子系统适合采用SAN架构,由磁盘阵列和SAN交换设备组成数据存储池。存储系统中存储设备是最重要的部分,其性能的好坏直接决定了整个SAN存储系统,存储设备特别是磁盘阵列必须考虑以下重要技术特性:(1)存储子系统的性能。对磁盘阵列产品来说,性能指数主要有两个,即带宽和IOps(每秒10次数)。带宽决定于整个阵列系统,与所配置的磁盘个数也有一定关系,而IOps则基本由阵列控制器决定。在Web、E-mail数据库等小文件频繁读/写的环境下,性能主要由IOps决定。在视频、测绘等大文件连续读/写的环境下,性能主要由带宽决定。(2)存储子系统的数据保护能力。数据保护能力是指在存储设备的设计方面,对各种偶然性错误和意外情况的预测,以及采取的预防或补救措施。存储系统是一个从软到硬的复杂系统,所以对数据保护能力的评价应当考虑到整个系统。一些低端磁盘阵列厂商宣称他们的产品由于采用了RAID、热交换磁盘、双电源等技术,数据将永不丢失。对一些中小型用户,这些数据保护技术基本可以满足要求,对重要的应用系统,还需要考虑对数据完整性的保护,对主机连接的保护及对远程容灾的支持等方面。(3)存储子系统的容量。存储容量是存储系统最基本的参数,用户不仅要关心产品的最大容量,还要关心实际可使用容量及扩容成本等问题。(4)存储子系统的连接性。在SAN环境中,以光纤连接设备(光纤通道交换机等)为中心,连接主机、磁盘阵列、磁带库等多种设备,环境比较复杂。因此在产品选型时,要充分考虑设备间的连接性。选择具有良好的开放性和连接性的产品,不仅是当前系统正常连接和运行的要求,也为系统将来扩展提供更大的空间和灵活性。(5)存储子系统的可管理性。可管理性是存储产品的重要性能。首先,用户应考虑产品所提供的管理功能或方式是否实用可靠。其次,要考虑管理的方便性,是否支持中心化管理和远程管理,是否支持故障自动通知机制,在配置改变或系统扩容时,不需宕机或尽可能缩短宕机时间,也是企业级产品的重要特征。(6)存储子系统的其他功能的考虑,如数据快照功能、LUNMasking功能、异地数据复制功能等。6.服务器系统容灾系统中服务器平台的性能和可靠性对容灾系统的整体性能有重要影响。在选择容灾服务器时应注意以下问题:(1)随着计算机软、硬件技术的飞速发展,传统的RISC服务器/UNIX在性能、可靠性方面越来越高,而在性价比和易用性等方面也较以前有很大的提高。而基于MicrosoftWindows操作系统的PCServer在性能方面也有非常大的提高,价格相对小型机来说低廉,比较适合做中小型系统的容灾服务器。(2)在需要采用应用级容灾的情况下,往往要求容灾中心服务器与用户数据中心服务器同构,实现应用系统的兼容。特别应当注意容灾中心服务器中软件环境的配置,容灾中心的软件环境必须能够保证应用服务的正常运行。3(3)在需要采用服务器逻辑卷数据复制技术实现容灾功能的情况下,容灾中心服务器与用户数据中心服务器同构。(4)为了节省容灾系统的建设成本,在性能满足的条件下,几种应用可以共享一台服器。容灾系统服务器的性能应满足容灾方案的要求如CPU处理能力、数据缓存能力、良好的I/O吞吐能力、服务器的性能稳定等。服务器应具有一定的高可用性(如冗余网卡,使用RAID磁盘等),保证在灾难恢复期间的可靠运行。①CPU性能。可以用服务器的TPC-C(TransactionProcessingPerformanceCouncil,事务处理性能委员会C类指标)值作为相对选型参考值。厂家公布的TPC-C值,一般是采用该服务器最大的硬件配置,接近100%使用率得到的TPC-C值,而实际购买的配置往往小得多,实际系统性能的TPC-C值不会有公布值那么高,在设计服务器处理能力时,需要将一些实际经验值和TIC-C值一起综合考虑,留有一定余量。②内存大小。内存是所有程序运行的环境,一般来说内存空间越大服务器的事务处理性能越好,但不同的应用对内存的要求不同,所以在数据处理系统服务器内存设计中,需要从应用的角度来考虑,寻找最佳的配置。③I/O性能。服务器的I/O性能包括内置磁盘性能、网卡性能、HBA卡性能等。服务器的I/O性能应达到灾难备份系统的要求并与容灾系统的网络环境相适应。④应用系统的负载均衡。在由多台服务器提供服务的情况下使用负载均衡技术,以防止服务器结点过载或未被充分利用的情况发生。7.灾难备份设备的共事以实现高度整合和共享为方向,如多个系统共享一套容灾设备,在不影响容灾性能时要考虑所提供的功能或方式是否实用可靠。其次,要考虑管理的方便性,是否支持中心化管理和远程管理,是否支持故障自动通知机制,在配置改变或系统扩容时,不需右机或尽可能缩短右机时间,这些也是产品的重要特征。8.同城灾难备份与异地灾难备份按照容灾距离的远近可以分为同城灾难备份与异地灾难备份(1)同城灾难备份。同城灾难备份方案是在同城或相近区域内建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步镜像,保证高度的数据完整性和数据零丢失。同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。(2)异地灾难备份。异地灾难备份主备中心之间的距离较远(一般在100km以上)因此一般采用异步镜像,会有少量的数据丢失。异地灾难备份不仅可以防范火