1.1××学院学院数据容灾解决方案1.1.1数据容灾需求随着××学院学院的建设以及应用软件的快速发展,业务系统产品及规模不断扩大,业务系统交易量和数据量快速增长,其业务的连续性和数据安全已越发重要。而教育因为其行业特点,从业务需求到国家的指导性要求,需要建设完善容灾系统,实现关键业务系统异地灾备中心,以满足××学院业务发展需要并保障业务系统安全稳定运行,同时符合监管要求。数据容灾系统是指在相隔较远的异地,建立两套数据存储或者备份系统,可以从生产中心定期或者实时的向灾备中心写入数据,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统的数据在异地仍然有一份,在一段时间内可以恢复业务系统的正常运行。数据容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。××学院学院现已明确建设目标:◆覆盖所有业务应用系统,包括:教务系统、学工系统、门户网站群系统等。◆同城实现RPO=0,RTO60分钟的数据同步保护,达到6级灾难恢复能力。◆在新旧校区建立异地数据灾备中心,实现RPO60分钟的数据灾备能力。◆优化设计,节约成本。◆集中管理,方便使用,降低管理维护工作的成本与工作量。在该项目完成后,能够保护现有数据中心,抵御各种灾难和停机风险。1.1.2数据容灾系统的综合分析容灾系统工程的综合分析包括:业务系统的风险分析(RiskAnalysis),容灾系统对业务系统的影响分析(BusinessImpactAnalysis)和容灾系统的投入和产出分析(Cost-BenefitAnalysis)。业务系统的风险分析:建立容灾工程的最终目的是保证在灾难造成对业务数据破坏后,业务数据的可恢复性,所以,首先要分析本地区影响业务数据安全性的灾难有哪些种类。灾难可以分为自然灾难,社会灾难和人为灾难。自然灾难包括火灾、水灾、地震等突发自然灾害造成的业务系统的灾难,而不同地区的自然灾害的发生有一定的统计概率,而且自然灾害的影响范围是有一定区域的,对自然灾害的风险分析相对比较容易。在实施容灾工程时,特别要注意容灾备份中心的选择,建立在自然灾害较少的地方,在美国,一些州通过立法,规定容灾备份中心可选择的地区。社会灾难包括区域性电力系统故障,恐怖分子制造的爆炸、战争引起定点破坏等灾难,国内外社会不安定因素的存在,必须引起足够的忧患意识。美国“911”事件就是一个很好的例子,一些没有采取任何容灾措施的企业由于核心业务数据的破坏而最终破产,而一些采用了容灾措施的企业得以生存,有的建立了备用业务系统的企业的业务能够很快恢复。人为灾难包括IT系统管理人员的误操作、来自网络的恶意攻击、计算机病毒发作造成的数据灾难。近几年,人为灾难更为突出,特别是计算机病毒造成的数据损失触目惊心。最近,迅速泛滥的“冲击波”(WormBlaster)病毒,致使全球上百万台计算机中毒,部分网络服务器瘫痪,迄今已给全球商业界造成了几十亿美元的直接损失,尽管有关公司发布了软件补丁,但余波未静,“冲击波”变种仍然伺机而动。研究结果表明,下一代电脑病毒传播的速度将更快。一种名为Flash的病毒将在极短时间内感染所有的网络,而另一种名为Warhol的病毒将在15分钟之内传遍全球。采用后发制人策略的防计算机病毒系统难以保证数据的安全,有必要建立数据的备份机制。容灾系统对业务系统的影响分析:数据复制操作的发起来自业务系统,不论来自系统的计算层、网络层,还是存储层,肯定会影响到业务系统的性能,对于那些要求高性能的业务系统或者已经是高负荷运行的业务系统,必须分析建立容灾系统对业务系统性能的影响。不同容灾技术对业务系统的影响不同,比如,一个采用同步数据复制技术的容灾解决方案,如果容灾备份中心与业务中心距离超过100公里以上,需要考虑数据传输的时延对业务系统IO性能造成的影响,距离越远,业务系统IO性能下降的速度越快。容灾系统备份系统运行平稳后,需要对备份数据(数据库)的可用性进行检查,一些容灾解决方案采用的是主/备工作方式,正常情况下,备份中心的数据是不能够打开使用的,只有在业务系统工作中断,或者切断容灾进程的情况下,才能够对备份数据(数据库)的可用性进行检查,这样做,势必对业务系统正常运行产生影响。容灾系统包括传输数据的网络,由于网络传输拥堵或者中断等原因,数据复制同样会造成业务系统性能的下降甚至业务运行的中断,当等待传输的数据溢出数据复制发起端的缓冲区时,有可能造成数据的丢失,或者数据传输次序的混乱,破坏备份数据库的一致性,使得数据库不可恢复。容灾系统的投入和产出分析(CBA):众所周知,TCO(总体拥有成本)和ROI(投资回报率)是衡量容灾系统投入和回报的主要指标,CBA强调的是投资产出的分析,从业务系统发展的角度考虑容灾系统投资的合理性。首先,要考虑准备建设的容灾系统与正在运行的业务系统的延续性,保护前期投资,为了建立新容灾系统而对原有业务系统进行大规模改造的情况,应该尽量避免。其次,要考虑业务系统扩展对容灾系统的影响,特别是存储容量增加的影响和通信线路负荷的影响,由于单业务容灾系统使用概率很低,CBA的结果倾向于选择专业的数据容灾中心服务方式。1.1.3容灾技术分类在讨论容灾技术分类前,先了解一些有关容灾的技术术语。同步复制与异步复制同步复制是指向业务系统存储数据和向备份系统存储数据同时进行,只有在两地数据存储操作完成后,才能够进行下一个数据存储操作,因此,同步复制的IO操作时间以最长的IO用时为衡量尺度。异步复制是指对业务系统的数据存储操作独立进行,对备份系统的数据存储操作按照排队方式进行,业务系统的IO操作不受异地备份系统的IO操作影响。为了保证数据传输排队的次序,异步复制需要一些特殊技术的支持。源数据与目标数据业务系统的数据是源数据,备份中心的数据是目标数据。在双工模式下,A业务系统可以存储B业务系统的目标数据,反之亦然。在多向复制模式下,源数据可以有多个目标数据作为备份。在集中模式下,容灾备份中心可以存储多个业务系统复制来的目标数据。冷容灾中心与热容灾中心冷容灾中心的目标数据只能在数据恢复时使用。热容灾中心的目标数据在一定条件下可以离线使用。对于数据库来说,热容灾中心的数据库时刻处于打开状态。应用于容灾工程的技术统称为容灾技术。对于各单位不同的IT业务系统,应该选择不同的容灾技术。每种容灾技术都有自身的技术特点和某些应用局限性。通过对容灾技术的分类,可以帮助用户在容灾工程设计中选择最适用的容灾解决方案。1.备份/恢复技术最简单和投资最少的容灾解决方案是基于数据备份与恢复技术的解决方案。只要对业务系统每日备份的数据制作一个相同的拷贝,通过交通工具或网络传送到容灾备份中心保存起来,这样不需要购买大量的设备和软件,只需要对备份数据的介质进行有效管理。如果在容灾中心建立备用业务系统,当业务系统遇到灾难破坏后,备用中心能够很快投入工作,不难想象,这种容灾技术的RPO是最差的,但对特定的业务系统不失为一个高性价比的容灾解决方案。2.快照有两种常见的快照技术:COW(Copy-on-Write)和快照克隆。COW比快照克隆效率更高,因为它不要创建数据副本,而只需创建一个指向数据的指针集合,创建指针集合只是瞬间的过程,对系统影响不大,可以创建多个时间点的快照数据副本,就算间隔时间很近也不会危及系统的效率。当一个新的数据块写到被COW保护的数据上时,COW技术会在写入之前把原来的数据复制一份保护起来,COW功能对磁盘很有效,因为它仅对变化的数据进行复制,而不是对整个数据进行复制,也许生产系统中80%的数据是不需要变化的。然而,从COW恢复数据所花的时间比从快照克隆中恢复要长,因为COW恢复时需要通过读入指针所指的数据和变化的数据来重建原始数据集合。快照克隆重新创建了整个数据副本,其过程花的时间比COW要长,但比传统的备份仍要快很多,由于快照克隆的数据映像是在线的,可立即使用,能很有效的缩短恢复时间。快照技术可以利用存储设备和安装在主机中的软件来实现。3.连续复制连续俘获复制(Continuous-CaptureReplication)技术对改进RPO是一个很好的选项,能使RPO连续,当变化的数据被写到生产数据的磁盘,连续俘获复制技术会复制I/O流,然后通过网络传送到另一目标系统,I/O流会在目标系统被回放,产生第二份数据副本。复制技术可以同步或异步,可保持复制的生产数据副本持续有效。就像镜像快照一样,复制的生产数据副本是在线的,当出现错误时能立即使它有效,可极大缩短恢复时间。然而,了解复制技术的弱点很重要,由于是复制生产数据的任何变化到第二个数据副本,也包括病毒攻击或其他事件造成的数据破坏。因此,把连续复制和快照结合起来保护在线数据将是非常有益的,确保有另一个数据副本恢复到病毒攻击前的一个时间点,这意味连续复制不能提供连续的RPO来避免所有类型的错误。复制技术有不同的实现方法,常用的有以下几种方法:存储系统级别的复制这种复制是在存储系统上完成的,一般使用安装在存储子系统上的数据复制软件,保持业务系统的存储数据逻辑卷与备份系统存储数据逻辑卷的一致性;存储子系统的容灾技术可以选择同步复制或者异步复制方式。主机软件复制基于对主机卷进行管理的软件容灾技术与存储子系统的类型无关,与业务系统的服务器平台有关。主机卷管理软件的容灾技术同样可以选择同步或者异步复制方式,通过卷管理软件的远程数据复制的扩展功能,可以把业务系统的源数据复制到备份中心指定的逻辑卷上。部分数据库软件厂商和数据库的优化软件供应商提供了基于数据库的容灾技术,基于数据库的容灾技术与上述三种基于存储逻辑卷的数据复制容灾技术有较大的差别,基于数据库的容灾技术传输的是SQL指令或者重作日志文件,在新数据没有被业务系统写入存储子系统前,就被指定发送到异地备份中心的数据库进行相关处理。数据库容灾技术采用异步传输方式,通过IP网络传输,支持一个业务中心向多个备份中心的数据库进行复制的要求,或者多个业务中心向一个备份中心复制的要求。在容灾过程中,业务中心和备份中心的数据库都处于打开状态,所以,数据库容灾技术属于热容灾方式。数据库容灾技术与存储子系统的类型、业务系统服务器的平台无关,与数据库的版本有一定关系,数据库容灾解决方案具有较好的使用灵活性。数据库容灾技术只能作为数据库应用的容灾解决方案,如果需要其他非结构数据的容灾,还需要其他容灾技术作为补充。基于策略的复制一种介于逻辑卷时间点复制和数据库数据复制的软件容灾技术,通过提取操作系统的IO指令形成日志文件,传输到容灾中心的应用系统,可以使用前滚的方式在容灾中心重建任意一个时间点的业务数据或者数据库,这种容灾技术为灾难后数据恢复提供了多种选择。1.1.4灾难备份等级划分一个完整的灾难备份方案的设计基于灾难备份需求分析所得出的各业务系统灾难恢复目标,它可能涉及多个级别的应用,并且需要考虑技术手段、投资成本、管理方式等多方面因素。参照国际灾难备份行业的通行灾难备份等级划分原则,灾难备份系统从低到高可划分为如下七个等级:等级零:无异地备份。没有在异地保存备份数据,未制定灾难恢复计划,不具备灾难恢复能力。等级一:备份介质异地存放。对关键数据进行备份并存放至异地,没有可用的备份中心及备份数据处理系统、备份网络通信系统,未制定灾难恢复计划。等级二:备份介质异地存放及备用场地。对关键数据进行备份并存放至异地,并制定相应的灾难恢复计划。具备备用的办公及计算机场地,一旦灾难发生,需要重新调配数据处理系统及网络通信系统资源,利用异地备份数据恢复关键业务系统运行。等级三:备份介质异地存放及备份中心。对关键数据进行备份并存放至异地,并制定相应的灾难恢复计划。具备可用的备份中心并配备部分数据处理系统及网络通信系统。一旦灾难发生,利用备份中心已有资源及异地备份数据恢复关键业务系统运行。等级四:定时数据备份及备份中心。在备份介质异地存放的基础上,利用通信网络将部分关键数据定时批量传送至异地,并制定相应的灾难恢复计划。具备可用的备份中心并配