两地三中心--灾备解决方案两地三中心,两地是指同城、异地,三中心是指生产中心、同城容灾中心、异地容灾中心。结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。备端在线的两地三中心灾备解决方案浪擎设计的备端在线两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。本地机房的容灾主要是用于防范生产服务器发生的故障,异地灾备中心用于防范大规模区域性灾难。本地机房的容灾由于其与生产中心处于同一个机房,可通过局域网进行连接,因此数据复制和应用切换比较容易实现,可实现生产与灾备服务器之间数据的实时复制和应用的快速切换。异地灾备中心由于其与生产中心不在同一机房,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,应用系统的切换也需要一定的时间,因此异地灾备中心可以实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。1.“双活”+异地容错的技术方案1.1备端在线两地三中心灾备方案网络设计本地容灾是指在本地机房建立容灾系统,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,本地双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点;异地灾备中心是指在异地建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。针对两地三中心灾备建设的需求,我们结合我们自主研发的软件的优势,设计了典型的建设方案。本地机房安装我们镜像系统,主备端同时在线,真正实现“双活”,是可见,可验证,可靠的容灾;异地机房安装实时备份,既能实现数据的实时复制,确保数据不丢失,又能任意时间点手动恢复,实现容错,而且无需主备硬件配置一致,还能降低成本。网络拓扑和部署如下:2.2备端在线容灾系统设计在生产服务器上部署A镜像系统代理软件,在容灾服务器上安装A镜像系统服务器端软件,设置A镜像代理的检测路径为主存储路径,设置A镜像服务器路径为备用存储路径。通过Web管理界面配置镜像对象、全量和增量策略等。1)当生产服务器处于正常工作状态时,把生产服务器的浪擎代理软件连接至服务器。当代理检测到主存储数据变化后,将捕获变化的数据实时的复制到备用存储上,实现了实时的复制。具体部署如下图:2)当生产服务器故障,或者存储故障导致生产系统无法正常提供业务支持时,本地容灾服务器可直接接替生产服务器工作保障业务系统的持续运行;当本地机房发生灾难时,异地机房的容灾服务器可直接接替生产服务器工作保障业务系统的持续运行。具体部署如下图:3)当生产系统恢复工作后,浪擎软件会继续其生产服务器的复制工作,并且在这之前会通过回切工具保障主备系统数据一致,具体部署如下图:2.3异地容错的容灾系统设计如果本地机房发生故障,将异地容灾服务器中备份的数据进行手动恢复,可以直接恢复到原生产服务器(也可恢复到新服务器)。备份存储系统保存了应用系统任意时刻的数据,恢复时可恢复到任意时间点,实现容错,具体部署如下图:通过以上4点保证了备用存储上的数据和主存储上的数据完全一致。避免了主存储的单点故障。管理端可部署在备用服务器上或系统管理员主机上。与一般的cluster不同,浪擎灾备系统不采用共享存储模式,首先避免了硬件方面的巨量投资;其次避免了由于共享存储硬件或者连接共享存储硬件链路的故障引起的业务系统中断,避免了单点故障.2.4备端在线的两地三中心容灾优势1)备端在线的容灾优势:●所见即所得的容灾,备用系统直接处于在线运行的状态,是直接可见、可验证的。不像其他容灾系统,一定要恢复后才能知道备用系统的好坏;●应用级的复制技术,即镜像系统复制的数据是数据库事务,是属于应用层的,从而可以保证数据库数据的完整性;●实施无需停顿业务系统,适合7X24小时连续运行的业务系统;●不需要主备系统硬件保证一致性,极大的降低系统改造及投入的硬件成本,只需备份存储空间大一点就行;●对网络带宽消耗非常小,不需专用的光纤传输网络,采用实时增量复制技术大大减少了资源的开销,对业务系统性能影响很小;●一旦主系统发生故障,由于备用系统的数据库直接处于运行状态,无需数据恢复阶段,仅需恢复业务系统即可,所以整个备用系统替换主系统的过程非常快;●采用实时增量复制技术,将数据复制到备用系统上,当主系统发生故障时,备用系统丢失数量极小,由于数据量小使得备份窗口趋于零,对主系统的性能影响很小;●应用方式多样化,支持多对一、一对多等镜像方式,为后期提供扩展平台;●基于WEB的统一管理平台,负责对服务器、数据库等进行配置,设置镜像策略,并监控复制链运行情况,方便管理。WEB监控界面可监控全网的备份任务及运行状态。每条监控记录就是一条完整的复制链路,包含镜像代理、镜像服务器、运行状态。镜像系统监控Web可监控全网所有镜像代理、镜像服务器的工作状态以及所有复制任务。复制任务监控信息包括:编号:根据任务复制的顺序来排序的。类型:模块类型,有文件,SQLSERVER和ORACLE三种。服务器:镜像服务器所在服务器IP。目标数据库:镜像服务器端备份数据库的名称。执行内容:具体复制的内容,数据库监控的是SQL语句,文件监控的是复制的文件名。开始时间:任务开始执行的时间。结束时间:任务执行结束的时间。状态:任务执行完成后的状态,如果复制成功显示为成功,失败显示的是失败。2)实时备份浪擎•服务器备份系统的客户端模块实时捕获数据变化,并进行实时增量传输,不间断的保护客户端数据,保障生产服务器的业务数据不丢失。并且可以恢复到任意时间点和任意版本,无时无刻保护业务系统的数据安全。3)任意时间点还原实时备份,保留所有的变化的数据块,可以根据用户的需求,恢复到任意的时间点的版本。增量和差异版本的实时复制、传输技术,以及全量加增量合成存储技术实现了数据完整性和任意时间点还原的功能。4)裸机还原通常情况下,裸机要想进行信息处理需要进行硬盘分区和格式化、安装操作系统、安装驱动程序、安装应用程序等繁琐的步骤,需要花费大量的时间才能构造一个可用的系统环境。但是浪擎•服务器备份系统可以轻松地将备份好的系统恢复至裸机上,实现一步到位。可以快速的恢复业务系统的运行环境,极大的降低业务系统的最大恢复时间(RTO)指标。达到高性能的容灾。5)容灾与容错相结合采用CDP技术,系统能根据数据库事务日志的变化分析出数据库完整性点,在复制此数据到备用服务器的同时还将保存历史记录,保证系统可以以I/O数据块为单位恢复至任意时间点,并且每个数据版本都满足数据库级的一致性,即每个版本等都是正确可用的,而不需要尝试回退I/O。从而真正防止因数据库误操作对企事业单位带来的损失。6)异机还原支持异机还原,避免单机故障导致的数据无法还原、使用的风险。即时在不同硬件上,也可以恢复出故障的系统。克隆与部署操作系统,不受硬件限制。在物理计算机之间以及物理计算机与虚拟机之间进行迁移。7)对系统影响小安装过程无需停机,采用定时全量和实时增量的技术,对网络和系统资源占用极低,不会影响生产系统的运行。所有的操作在用户端完成,用户通过访问一个WEB浏览器来设定备份计划和策略,浪擎•服务器备份系统将变化的数据从生产服务器捕获到,并传输到备份服务里,从而减少了对生产服务器的负担。全量加增量合成存储备份技术,保证系统只需做一次全量备份即可,大大降轻系统负担。8)基于WEB的作业、管理、监控平台支持Web-Manage平台,即所有的作业操作都可以在Web平台上完成。支持远程WEB进行备份策略设置、作业监控、存储配置、空间管理等,无需进行现场维护。通过设置备份计划与存储管理策略,让系统自动运行,极大地减少系统维护和管理工作量。支持基于WEB的查询备份对象、图表的存储空间显示、备份策略管理、计划管理。支持基于WEB的备份作业监控,可显示从触发、排队、启动、传输、存储整个过程。