历康备份和容灾一体化解决方案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

概述:备份和容灾一体化解决方案备份与容灾一体化的意义1.可防范所有灾难,是各类灾备体系中唯一的全部灾难防御技术历康推荐的备份和容灾一体化解决方案可以帮助客户防范所有灾难,没有任何死角。该备份和容灾方案是业界唯一可以防范所有灾难的解决方案,而常规的各类灾备技术只能防御部分灾难(被称为局部防御体系,例如数据丢失一般不在防御范围之内),不具备灾难防范的全面性,往往会造成有了灾备系统长时间无法恢复,甚至无法恢复数据的局面2.可以瞬时恢复到任意历史轨迹历康推荐的备份和容灾一体化解决方案可以将数据恢复到任意历史轨迹(秒级和I/O级),并且恢复的过程可在瞬间完成(instantrecovery),完全不同于传统体系的restore回存恢复机制,在恢复的速度上以及恢复到任何时间点的能力上均产生了不可比拟的飞跃。该备份和容灾方案备份的数据立即可用,无需各类备份技术冗长的数据回滚过程(restore);该备份和容灾方案这种瞬时恢复任意历史轨迹的技术在业界是绝无仅有的3.可实现分层次恢复,大部分灾难在本地即刻恢复,无需启动异地灾备系统历康推荐的备份和容灾一体化解决方案可以实现本地恢复和异地恢复的分层恢复体系,而大部分灾难在本地即刻恢复(如数据丢失或磁盘阵列损坏等),不用“惊动”异地灾备系统,这种体系的恢复效率和减少灾难造成的影响的能力令各类传统的灾备技术黯然失色。该备份和容灾方案这种分层次恢复的能力可以准确定位应对灾难的解决方案,做到快速有效的恢复4.精简复制功能--带有独特的带宽优化技术,在窄带环境下实现异地灾备该方案的精简复制功能带有独特的带宽优化技术(Microscan),是存储设备级灾备技术占用带宽的1/50,是常规灾备技术占用带宽的1/6,在窄带环境下轻松实现异地灾备,可为客户节约大量带宽方面的投资5.磁盘故障,无需停机,瞬时接管当客户生产存储发生故障时,该备份和容灾系统可以自动瞬时接管业务,数据库和应用不停顿照常提供服务;这个功能可以充分保证客户的业务连续性,实现存储层面的冗余,大幅提高系统可靠性第1章方案实施实例1.1系统原状和需求客户的系统原状为:SAP数据库服务器:AIX系统双机,Oracle数据库和应用,主机为IBMP590和IBMP570,外挂DS6800/DS4800阵列,容量为5T,两存储阵列用操作系统LVM做的Mirror。客户生产系统的主机配置为双机模式,针对以上描述的系统现状,客户对连续数据保护和容灾的需求可概括为以下几点:1.总的原则是:无论发生任何灾难都要在最短的时间内恢复业务,并且实现最小的数据丢失;2.采用的数据保护和容灾系统要经过严格的市场检验,在市场上要有多个长时间运行稳定的成功案例;3.为了防止各种逻辑灾难(如人为误删除等),需要有多个历史版本作为备份,并且历史版本要与生产系统的数据格式相同,这样才能做到瞬时恢复;为了提高恢复的可靠性,历史版本要提前验证,不能直接覆盖生产卷。4.对于站点级别的灾难,数据丢失量(RPO)和恢复业务时间(RTO)是重要考核指标,根据客户业务系统的重要性,RPO和RTO都应该不高于10分钟;5.考虑到客户生产系统的重要性,实施容灾系统的停机时间越短越好,所以该容灾技术必须是在数据库或应用打开的情况下做初始数据同步,这样可以大大缩短停机时间;6.要求容灾解决方案必须具备带宽优化技术,这样才能在窄带环境下进行数据传输,实现异地灾备;7.从生产端到灾备端的数据复制,必须要有一致性保证机制,使得灾备端的数据可用,接管业务时可以瞬间打开数据库或应用系统;8.Internet上的波动是常见现象,所以异地容灾技术必须要有断点续传的功能,保证网络在较长时间中断的情况下不溢出,恢复网络后是增量传输;9.为了规避实施风险,数据保护和容灾系统不应该对原有生产系统做任何改动,包括结构和底层卷管理等。10.为了节约管理成本,数据保护和容灾系统应该集成在一个管理界面中,并且可以实时监控状态。11.为了满足系统的扩展性,该数据保护和容灾系统必须具备开放性,兼容所有第三方主流存储以及前端应用主机的操作系统;1.2历康推荐的备份和容灾一体化解决方案历康推荐备份和容灾方案的框架是:1.在客户的生产系统中部署备份和容灾方案服务器,用于实现生产数据的实时镜像和多点快照(快照用于历史数据的瞬间恢复);2.部署在客户生产中心的备份和容灾方案配置255份历史快照,保留255份生产数据的历史版本。利用多达255个快照实现各种逻辑错误的瞬间恢复;3.生产中心的备份容灾保护系统将数据复制到灾备中心备份容灾保护系统,实现备份容灾保护系统的异地复制,从而将本地保护的范围扩大到各类自然灾害级别的异地保护。该备份和容灾方案的复制技术有独特的优势:如优化带宽,压缩,加密和数据一致性保证等;1.3该方案技术实现的灾备目标本次数据保护和容灾系统要实现的目标有:实时镜像备份,无备份窗口这一特征使得该备份和容灾方案方案彻底不同于传统的备份技术,备份技术所困扰人们的长备份窗口和按天进行备份的弱点将不再存在。备份数据立即可用由于该备份和容灾方案实时镜像备份技术所获取的数据影像不是专用的备份格式,而是直接的数据原型,因此数据的恢复将是立即可用,无需任何恢复窗口,这在恢复技术上已经产生了一个大的飞跃。多点快照,无需1分钟历史数据轻松获取该备份和容灾方案保护技术既是一种灾难发生时保护最新数据的灾难备份技术,也是一种历史数据丢失时恢复原有数据的备份技术,由于自动产生数据的多个时间点保存,因此即使丢失的数据已经过了几天,你仍然可以轻松实现1分钟获取正确的历史数据的能力。任何IO的历史轨迹恢复在系统发生逻辑灾难(例如数据丢失时),该备份和容灾方案技术能够提供颗粒度达到IO的历史轨迹恢复能力,追溯历史随心所欲,使灾难防御能力达到空前的高度。一致性保证该备份和容灾方案在本地连续数据保护和异地容灾两个层面都提供数据一致性机制,保证复制到灾备端系统的数据立即可用(如瞬时打开数据库等)。先进的精简带宽复制技术保证异地容灾的实现该备份和容灾方案的复制技术可以在窄带环境下实现连续的数据传输,独特的基于扇区的检测和传输可以大大的节省带宽;复制过程中保证数据的一致性,灾备端可以瞬时打开数据库或启动应用。实现系统故障后的分层次快速恢复能力在本地生产端建立一套完整的自动化数据实时备份机制,每时每刻随时完成本地端及异地端数据备份。避免因发生天灾人祸后的数据丢失,导致营运系统停止运行,严重影响到企业的服务质量。实现灵活和方便的实时备份机制,管理简单能够对实时备份系统进行灵活的集中管理,需要提供良好的操作使用界面、事件告警、与工作流程的管理等,将复杂的企业数据保护工作化繁为简,避免人为的疏忽,降低维护人员的工作量。总之,该备份和容灾方案技术的设计思想是彻底摆脱传统备份方式的弱点,实现系统数据的实时和超高速恢复能力,使得信息系统获得前所未有的健壮性。第2章详细设计在本章中先介绍本次方案的整体架构,根据架构介绍连续数据保护的原理,最后详细说明各种灾难下的恢复方法。2.1数据保护和容灾系统总体架构本次客户该备份和容灾方案总体架构如下图所示:历康公司本次所推荐给客户的连续数据保护和容灾方案,是专为客户设计的一套行之有效的,集磁盘镜像、数据连续保护和备份、远程容灾于一体的综合容灾解决方案。其基本架构为:在客户生产中心和灾备中心各部署1台该备份和容灾方案服务器,接入到以太网和SAN网络中,通过FC协议进行数据保护,通过以太网进行管理。保护数据的方法是将生产数据镜像到备份容灾系统服务器中。在生产中心,将该备份和容灾方案服务器采用旁路的方式接入到SAN网络中,不会对现有网络拓扑有任何的更改和影响,而且,数据以镜像的方式备份到备份容灾系统服务器中(图中A-B的过程),不影响正常的生产数据。生产中心的备份容灾系统和灾备中心的备份容灾系统的存储都来自于磁盘阵列或内置硬盘,该备份和容灾方案可以与任何磁盘阵列完美结合。生产主机共5TB数据需要保护,按照高速增长要求,并且考虑到备份容灾系统的历史快照空间,存储空间为不小于10TB比较合适,通过同步镜像工具实现数据向备份容灾系统的实时抽取。该备份和容灾方案中配置Safecache的写加速技术,使得写入访问呈现高速特征生产中心的备份容灾系统配置255份历史快照(TimeMark),实现多历史点保护。生产中心的备份容灾系统将镜像过来的数据复制到异地灾备中心的备份容灾系统中(图中B-C的过程)。灾备中心的备份容灾系统服务器同样配置255份快照(TimeMark),实现灾备中心多历史点的保护。这样在生产中心和灾备中心各有255份历史快照,使历史数据得到了双重保护。远程复制采用TCP/IP协议,复制策略根据实际的数据增量和传输带宽灵活制定。那么利用该备份和容灾方案精简复制技术,可以实现连续传输的模式,将数据丢失量降到最低(有可能实现零丢失)。除了连续模式,该方案的复制策略还包括间隔复制,可以基于时间,也可以基于数据增量。2.2灾难发生时的接管和恢复本节将详细说明各种灾难发生时,该备份和容灾方案如何对客户环境中的主机(包括数据库和应用系统集群)进行接管和恢复。2.2.1数据库表级别的丢失或损坏由于误操作或病毒入侵等原因,数据库会出现表的记录丢失或损坏情况。面对这种灾难,需要在主机上挂载该备份和容灾方案提供的历史快照,该快照包含完整的记录条目。然后再使用数据库命令将丢失或损坏的记录导入到生产数据库中即可。2.2.2数据库和应用系统的文件丢失或损坏若是数据库文件丢失或损坏这类逻辑错误,可以采用提取历史快照的方法找回历史数据。找到没有丢失的时间点提取快照,并分配给Aix主机,然后在Aix主机上运行扫描新增磁盘,完成后启动数据库将需要的表或数据库导出,再导入到原来的数据库即可。如果情况十分紧急,该备份和容灾方案的快照是可读可写的,可以直接使用该备份和容灾方案快照磁盘接管业务。2.2.3数据库和应用系统无法正常启动当数据库或应用系统出现问题无法启动时,可以先使用备份容灾系统中的快照进行接管。方法是将历史快照提取出来,然后分配给Aix主机,Aix主机上运行扫描新增磁盘,然后启动数据库或应用即可。2.2.4生产存储发生故障当生产盘出现故障时,备份容灾系统镜像盘会自动接管业务,数据库系统根本感知不到中断和设备灾难,实现了RPO=0和RTO=0的理想。当硬盘恢复时数据会在阵列中自动同步。2.2.5站点级别的灾难当发生站点级别的灾难时,需要启动灾备中心的业务来接管,方案中将会在容灾中心采用一台IBMP590作为Aix灾备主机。对于Aix系统来说,如果要实现应用级别的灾备备份,需要在灾备中心部署Aix灾备主机,数据来自于灾备中心的该备份和容灾方案。整个应用在灾备中心启动的过程非常简单,大幅降低RTO指标。当生产中心修复后,灾备中心的备份容灾系统能以增量的方式将数据同步回生产中心,轻松实现Failback。2.3关键技术和优势该备份和容灾方案技术是一种数据的连续时间点的保护技术,其根本作用是能在故障瞬间完成任何时间点的故障恢复,达到业务的快速连续的作用,从根本上解决传统备份中低恢复能力和非精细时间策略的先天弱点。这种技术的诞生造成了备份领域和灾难恢复领域的一次革命,采用的关键技术包括:2.3.1精简复制技术(Microscan)在实际灾备系统中,往往异地备份受到带宽的限制。一般而言,2-4M的传输带宽必须采用适合窄带的容灾技术(一个典型的2M网络,每小时传输的最大字节数仅为720MB,这还不指实际数据量),否则,容灾系统会出现数据的阻塞和溢出,根本无法正常工作。该方案的容灾技术就提供了窄带传输的优化技术。一般的基于磁盘阵列等传统灾备技术中,传输单元以块block传输为基准,往往小的数据更新,远程传输需要最小4KB左右的传输数据(Block定义)。该方案的容灾技术replication模块中,提供了Microscan的微单元传输技术,将传输的最小数据单元缩小到512字节(一般的软件级别技术在1个block4096字节,硬件级别技术在block16000

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功