HDS容灾解决方案培训日立数据系统有限公司2安排容灾的问题与方法论容灾实现的各种方式容灾方式的经济分析容灾技术讨论HDS能为你做什么容灾成功案例分享容灾的问题与方法论4业务连续管理•业务连续管理:businesscontinuitymanagement(BCM)–为保护组织(企业)的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反应恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。–From:GB《信息系统灾难恢复规范》5自然灾害火灾后的央视大楼火灾时的央视大楼6法律法规要求法规要求•《关于加强银行数据集中安全工作的指导意见》中国人民银行[2002]260号•《国家信息化领导小组关于加强信息安全保障工作的意见》中办发[2003]27号•《关于做好重要信息系统灾难备份工作的通知》信安通[2004]11号•《关于进一步加强保险系统信息安全保障工作的通知》保监发〔2004〕62号•《重要信息系统灾难恢复指南》国信办[2005]8号•《关于进一步加强银行业金融机构信息安全保障工作的指导意见》中国人民银行[2006]123号•《2006━2020年国家信息化发展战略》【工信部】2006年05月08日•《银行业信息系统灾难恢复管理规范》(征求意见稿)(中国人民银行)•《银行业金融机构信息系统风险管理指引》银监会2006年11月•《GB信息系统灾难恢复规范》国家标准2007年11月1日•《关于进一步开展电信网络安全防护工作的实施意见》【工信部】2007年10月16日•《银行业信息系统灾难恢复管理规范》【中国人民银行】2008年2月4日•《商业银行信息科技风险管理指引》【银监会】2009年3月5日7HDSBCM方法论HDS业务连续性管理(BCM)项目管理启动阶段实施开发设计阶段运行维护灾难切换分析阶段项目规划风险分析业务影响分析DR策略规划DR方案设计DR方案实施DRP开发DR系统监控培训/演练DRP维护更新灾难切换生产回退可研/立项系统调查目前阶段重要部分容灾实现的各种方式9-DR解决方案的选择服务器存储技能与服务支撑软件与自动化网络Ontime,Onbudget,ONdemand10-远程实时容灾技术一览1.基于应用的交易复制解决方案–应用程序在本地、远端双写I/O2.基于数据库复制的解决方案–数据库本身的远程复制3.基于主机的远程数据复制软件解决方案–卷管理器层面截获I/O,远程复制4.基于SAN网络虚拟器数据快照解决方案–交换机虚拟化设备担任复制引擎5.基于存储的远程数据复制容灾解决方案–智能存储远程数据复制存储系统存储系统1235应用系统数据库卷管理器生产中心灾备中心应用系统数据库卷管理器SAN网络SAN网络411容灾TCP/IP网络应用系统备用主机备用SAN交换机备用存储-1-交易复制的容灾解决方案应用系统前台主机系统SAN交换机生产TCP/IP网络存储容灾TCP/IP网络应用系统备用主机备用SAN交换机备用存储应用系统前台主机系统SAN交换机生产TCP/IP网络存储•优点:不需要特殊的硬件、软件支持;数据传输量最少,节约网络资源;对磁盘子系统透明•缺点:需对应用程序作大量修改;实施维护难度较大,需定期进行一致性检查;备份中心的备份数据较难回切主中心方式一方式二12-2-基于数据库复制的容灾技术•OracleDataGuard数据库远程复制技术,异构存储解决方案•限制与弱点:–只能针对Oracle管理的数据,应用关联性保证?–不能跨主机平台,Oracle版本对等,“N-1”?–占用主机CPU资源,实施周期长,维护复杂,隐性成本过高–备份中心的备份数据较难回切主中心,不支持数据级容灾–有待证实应用普遍性网络Broker生产数据库逻辑备用数据库可用于报表操作SQL应用将重做转换成SQL额外的索引和物化视图物理备用数据库DIGITALDATASTORAGEDIGITALDATASTORAGE备份重做应用同步或异步重做传输13-3-基于卷管理器的容灾技术存储其他存储服务器服务器同步或异步方式•主机层面基于逻辑卷复制的DR软件(VeritasVVR)–异构存储DR解决方案–同步、异步方式•弱点:–10-20%主机资源损耗?–同构主机平台–不支持数据级容灾–不支持RAW设备的数据复制–卷管理系统替换复杂度?成本?–实施、维护复杂性?–技术成熟性?企业级案例?VeritasVVR示意图卷管理器应用程序文件系统VVR数据库I/O卷管理器VVRI/O生产中心灾备中心应用程序文件系统数据库14-4-基于SAN网络的远程快照技术•IPStor,DataCore等远程快照方案–快照复制,异构存储解决方案•弱点:案例、容灾能力(容量、性能)、技术成熟性、可靠性?同步、异步复制15-5-基于存储复制的容灾技术•逻辑卷实时数据镜像–不占用主机资源–覆盖所有数据对象–数据级、应用级容灾–高效复制性能–低实施和维护成本–双向复制,切换与回切–成熟技术,丰富案例•限制:–同构存储同步或异步方式I/OS-VOLP-VOL远程数据复制服务器数据库文件系统卷管理器应用程序切换与回切服务器数据库文件系统卷管理器应用程序容灾方式的经济分析17-远程数据复制技术总结A-征询B-筛选子集方案1方案2方案3方案1a方案3aC-精选D-评估容灾解决方案选择方法论企业级容灾解决方案首选应用层复制技术数据库复制技术卷管理器复制技术基于网络复制技术存储复制技术应用复杂度04555数据保护范围53355数据一致性55505数据丢失53505复制距离55555主机开销00055主机异构50000存储异构55550性能影响05405实施复杂度01115维护复杂度01115复制效率03335成功案例02205303739305518远程数据复制经济分析总结应用层复制技术数据库复制技术卷管理器复制技术基于网络复制技术存储复制技术产品成本34321实现技术成本24455维护成本12224恢复时间成本32435人员成本22335性能影响成本34435实施复杂度成本11115复制效率成本13335成功案例可靠性成本22225总评分1824262440容灾技术讨论20HDS主要的容灾解决方案•ShadowImage-本地数据镜像复制•TrueCopySynchronous(同步,异步)-近距离数据保护•UniversalReplicator-远程异步数据复制•HDS3DC技术-抵御“RollingDisater”容灾技术方案21ShadowImage本地数据镜像复制•高速的、基于存储系统的复制技术•“实时”异步方式数据镜像保护•双重数据保护=数据镜像+磁盘Raid保护•分离后的PIT数据拷贝立即可用•支持OS390、开放系统•FlashCopy特征完全兼容OS390•ConsistencyGroup,磁盘组的数据一致性,简化操作•镜像后基于时间点的数据可以通备份的方式拷备到磁带上,实现对主机无影响的serverless备份。恢复时对整个镜像进行恢复,加快恢复时,同时避免了恢复数据库的繁琐操作。S-VOL5:00PMS-VOL2:00PMS-VOLP-VOLShadowImageAsynchronousCopyCCI开放系统主机OS/390PPRC并行处理快速恢复镜像保护分离22HitachiTrueCopySynchronous(同步)-近距离数据保护•基于存储的远程数据复制技术•同步方式,远程拷贝实时镜像,数据完整、一致•快速的数据恢复,没有数据丢失•I/O响应时间惩罚•距离限制,距离越长,时延越大,理论极限值100km•支持开放系统与OS390•ESCON、FC、DWDM1-Writetoprimarylogicaldisk2-Writetosecondarylogicaldisk3-Writecompleteonsecondarylogicaldisk4-I/OCompletion1生产中心容灾中心PrimaryHostPrimarylogicalVolumeSecondarylogicalVolumeOptionalsecondaryHost234100公里SameasPPRCTrueCopySynchronous23TrueCopySync同步远程拷贝模式本地远端1432主机应用切换传送数据到远程磁盘阵列cache接收本地主机一个写I/O123接收远程磁盘阵列确认4通知主机IO完成本地主机远端主机24同步数据复制的优点,缺点•实时镜像,最少数据丢失•各厂商成熟的、基本的复制技术•距离限制(100km以内)•高带宽需求(I/O峰值计算)•对生产端性能冲击大25远端远端主机1本地主机TrueCopyAsync异步远程拷贝模式本地3主机应用切换124ConsistencyGroup接收本地主机一个写I/O传送数据到远程磁盘阵列3接收远程磁盘阵列确认4通知主机IO完成使用SMS时间标记和consistencygroup来保证数据完整性2ATMT1/T3E1/E3OC326异步数据复制的优点,缺点•异步镜像,发生灾难时可能有数据丢失•无距离限制(100km-几万公里以内)•对带宽要求相对低•对生产端性能冲击小27UniversalReplicator-远程异步数据复制•远端存储采用“吸”的方式拷贝jounal,按照时间戳、顺序号更新备份卷•最小的对生产系统的性能冲击•解决链路故障、cache容量、链路带宽对复制的影响•异构存储平台通过USPV进行复制Journal以异步方式传输生产中心备份中心写I/O按顺序记入jounal卷远端存储“吸入”jounal卷Journal数据按顺序写入相应的应用卷应用卷写IOUSPUSPJNLJNL应用卷减少的缓存平均峰值时间减少的带宽成本写I/O29异步数据复制带宽需求数据流量根据客户的实际情况确定DataInflowWriteI/OTime其他厂商HURTypicalInflow峰值30HDSBC解决方案业务级生产中心异地灾备中心高可用性,稳固的容灾体系生产中心灾难时恢复时间较长数据级/应用级异地灾备中心生产中心同城热备中心最稳固的容灾体系全方位的容灾切换应用级/业务级数据级/应用级100公里300公里生产中心同城灾备中心抵御生产中心物理破坏应用级容灾成本低高可靠性生产中心异地灾备中心抵御地域性灾难恢复时间较长数据级/应用级31HDS3DCData-Resync容灾方案•HDS3DCData-Resync是目前业界最先进的灾备技术;•当生产中心切换到同城灾备中心后,同城灾备中心可以很快按增量建立新的数据复制;•能够抵御RollingDisater灾难的发生;S-VOLJNLHURS-VOL同城灾备中心异地灾备中心TakeoverJNL生产中心JNLP-VOL32三中心级联容灾架构比较SRDFSRDF/adaptiveBCV,需断SRDFBCV,需断SRDFadaptivePPRCGlobalCopyFlashcopy,需断GlobalCopyABCTruecopyHURJNLJNL•RTO大于30分钟•消耗磁盘5份•RTO大于15分钟•消耗磁盘4份•RTO分钟级•消耗磁盘3份33三中心星型架构比较SRDFSRDF/APPRCTruecopyHURJNLJNLJNLHUR•Resync过程远程容灾数据不一致•开放系统不支持•需要SDM主机资源•不是闭环架构•闭环架构•Resync过程远程容灾数据保持一致SRDF/ASRDF/StarGDPS/PPRCXRC3DCData-Resync34HDS容灾解决方案-“任意到任意”异构存储容灾架构容灾平台统一化、容灾技术标准化、容灾管理一体化SANSANWindowsMainframeUnix/LinuxWindowsMainframeUnix/Linux灾备中心生产中心USPVUSPV虚拟存储池(HDS、IBM、EMC、HP、SUN……)虚拟存储池(HDS、IBM、EMC、HP、