11专业存储领域领导品牌远程灾备解决方案2目录3误操作黑客入侵病毒感染地震/水灾/火灾/冰灾等设备故障意外断电如何保障信息系统安全自然灾难硬故障软故障如何保障信息系统安全4灾难是计划外的故障在所有停机中断中,87%为计划停机,只有13%信息不可用是由真正的故障造成的。----FIND/SVPSurvey备份/恢复测试升级修订维护数据提取/上载数据中心移动/整合灾难测试用户和操作员培训扩展/增长分布数据工作负荷分担工作负荷平衡报告生成批处理硬件故障软件故障程序错误人为错误电源故障空调故障通信故障设备丢失火灾、洪灾、暴风雨、地震病毒、恶意行为威胁、恐怖活动计划内停机计划外停机灾难是小概率事件,影响巨大,因此要提高投资回报率5灾备-当前信息化建设热点1979年.Sungard.费城全球第一个灾备中心2001年.911事件.美国数以千计的企业破产2004年.海啸.印度洋生命财产毁灭性的打击2地震/水灾/火灾/冰灾等自然灾难时有发生6灾难:小概率事件,影响巨大软件故障,32%硬件故障,44%人为错误,14%病毒影响,3%自然灾难,7%灾难分类示意图数据保护方式应对7%自然灾难远程灾备保护44%硬件故障49%软件\人为\病毒故障本地数据中心保护灾难分类及应对原则7灾备系统的特点和挑战主要特征•灾难事件概率小,风险高•容灾事业投入大,效率低•灾难系统建设易、维护强关键挑战•解决技术、成本、融合、发展的问题•技术上考虑先进性、成熟性、可靠性和安全性、性能价格平衡以及维护与可扩展的问题•成本上解决投入大效率低的问题•融合上解决技术和管理的问题•发展上考虑灾备中心的运营模式、投资管理模式和业务发展模式8容灾的分类数据级容灾•保证数据的安全性,通过异地建立一份数据拷贝,当本地系统出现不可恢复的物理故障时,容灾系统提供可用的数据应用级容灾•保证业务的连续性,在数据级容灾的基础上,建立完备的应用系统环境,当本地生产系统出现不可恢复的故障时,容灾系统提供可用的数据和应用系统970年代90年代▲数据存进保险箱,业务按需可恢复。RTO—灾备的第二目标灾难恢复,需要确保BC业务连续性,即确保RTO目标的实现,灾难发生后,能迅速恢复业务。RPO—灾备的第一目标灾备的基础职能,源于对信息系统的备份,即确保RPO的目标实现,将数据丢失量控制在可接受范围内。灾备系统的建设目标10灾备国际标准SHARE78将灾备系统定义为七个层次:0级:无异地备份1级:实现异地备份2级:异地备份+热备份中心3级:在线数据恢复4级:活动状态的备份中心5级:实时数据备份6级:零数据丢失Tier7-接近零或是零数据丢失,远程数据镜像,并且业务环境可进行高自动化的业务接管Tier6-接近零或是零数据丢失,远程数据镜像保证数据的完整性和一致性Tier5-软件级的,两地点-两阶段提交(交易完整性)Tier4-批量/在线的数据库镜像或日志的传输,或重复的时间点拷贝Tier3-电子链接传输Tier2-PTAM卡车运送+热备份站点Tier1-PTAM开车运送访问专门的远程灾备中心《24小时重建数据24-48小时数据重建15分钟1-4小时4-8小时8-12小时12-16小时24小时几天恢复时间目标费用分钟-小时重建数据11灾备级别的国家标准等级一:基本支持等级二:备用场地支持等级三:电子传输和设备支持等级四:电子传输及完整设备支持等级五:实时数据传输及完整设备支持等级六:数据零丢失和远程集群支持24hrs.72hrs.Minutes12hrs.恢复时间目标费用2007年7月,《重要信息系统灾难恢复指南》升级成为国家标准《信息系统灾难恢复规范》(GB/T20988-2007)12灾备级别的考量指标《信息系统灾难恢复规范》中提出的灾备级别的行业参考标准举例灾备等级RTORPO第1级2天以上1天至7天第2级24小时以上1天至7天第3级12小时以上数小时至1天第4级数小时至2天数小时至1天第5级数分钟至2天0至30分钟第6级数分钟013灾备系统建设的七要素序号要素要素的考虑要点1备用基础设施•灾难备份中心选址与建设•备用的机房及工作辅助设施和生活设施2数据备份系统•数据备份范围与RPO•数据备份技术•数据备份线路3备用数据处理系统•数据处理能力;与生产系统的兼容性要求•平时的状态(处于就绪还是运行)4备用网络系统•备用网络通信设备系统与备用通信线路的选择•备用通信线路的使用状况5灾难恢复预案明确灾难恢复预案的:•A)整体要求•B)制订过程的要求•C)教育、培训和演练要求•D)管理要求6运行维护管理能力•运行维护管理组织架构•人员的数量和素质•运行维护管理制度•其他要求7技术支持能力•软件、硬件和网络等方面的技术支持要求•技术支持的组织架构•各类技术支持人员的数量和素质等来源:《信息系统灾难恢复规范》2007.1114灾备系统建设的考量要素灾难备份的核心是:建立一份或多份可用数据副本。RPORTORR(容灾半径)成本运维管理灾备链路要求数据一致性组网能力现有系统影响恢复演练业务考虑事项技术考虑事项15来源:《信息系统灾难恢复规范》2007.11备用网络技术支持备用数据处理系统灾难恢复预案数据备份系统备用基础设施2.两个数据中心同步3.运维体系及决策1.新建物理灾备中心灾备建设三步曲运行维护管理灾备关键灾备系统建设的三步曲16主中心节点磁盘阵列服务器操作系统数据库和应用系统存储网络系统磁盘阵列服务器操作系统数据库和应用系统存储网络系统灾备中心节点复制、镜像卷复制、卷镜像存储虚拟化数据库同步不合理的灾备技术选择不仅大大消耗投资,而且带来了新的不稳定因素!选择合理的数据同步技术数据复制技术实现层次基于文件/数据库的数据复制文件/数据库层基于服务器逻辑卷的数据复制服务器层基于SAN的数据复制SAN网络层基于存储设备的数据复制存储层17基于存储阵列的灾备技术概述–采用磁盘阵列之间的镜像/复制功能实现生产中心与灾备中心的数据同步。等级–国家标准3-5级–RPO10min,可达秒级–RTO为小时级优势–功能完善,策略丰富–管理维护简单–不占用主机资源,成本低限制–只能适用于同品牌同系列的产品之间–灾备数据不可实时读取适用于关键/非关键业务应用主数据中心灾备数据中心复制/镜像交换机交换机18基于存储虚拟化的灾备技术(一)概述–采用虚拟化引擎将异构磁盘阵列进行资源整合–采用虚拟化引擎的镜像/复制功能实现数据同步。等级–国家标准3-5级–RPO10min,可达秒级–RTO为小时级优势–实现异构磁盘阵列的灾备–不占用主机资源,成本低限制–虚拟化引擎成为性能瓶颈和最大的故障点–虚拟化引擎的接口、功能、兼容性限制–灾备数据不可实时读取适用于非关键业务虚拟化引擎在主、备中心成对部署生产卷虚拟化网关交换机交换机镜像/复制镜像卷虚拟化网关交换机交换机主数据中心灾备数据中心19基于存储虚拟化的灾备技术(二)适用于非关键业务虚拟化引擎只部署在主、备中心其中之一概述–采用虚拟化引擎将异构磁盘阵列进行资源整合–采用虚拟化引擎的镜像/复制功能实现数据同步。等级–国家标准3-5级–RPO10min,可达秒级–RTO为小时级优势–实现异构磁盘阵列的灾备–不占用主机资源,成本低限制–虚拟化引擎成为性能瓶颈和最大的故障点–虚拟化引擎的接口、功能、兼容性限制–灾备数据不可实时读取生产卷虚拟化网关交换机交换机镜像/复制镜像卷虚拟网关和灾备存储同一品牌交换机主数据中心灾备数据中心20基于主机卷管理的灾备技术概述–在主机的卷管理层进行虚拟化,在基于卷的镜像/复制功能实现数据同步,比如VeritasVVR。等级–国家标准4-5级–RPO10min,可达秒级–RTO为小时级优势–实现异构磁盘阵列的灾备限制–主备中心都需要同型号的服务器,每台主机都需要安装特定软件–占用主机资源–存在兼容性问题–管理维护复杂–灾备数据不可实时读取适用于少数非关键业务需要对主机现有环境进行较大调整交换机交换机VVRVVRVVRVVR卷复制WAN主数据中心灾备数据中心21基于应用的灾备技术概述–采用应用层/数据库复制软件,实现数据同步,比如OracleDataGuard、DSG等。等级–国家标准4-5级–RPO秒级–RTO为分钟级优势–实现异构磁盘阵列/服务器/操作系统的灾备–灾备中心数据可实时读取限制–主备中心都需要服务器–受应用类型的限制–占用主机资源–管理维护复杂–成本较高适用于实时性要求较高的少数关键业务只针对特定应用类型主数据中心灾备数据中心数据库复制交换机交换机22不同灾备技术对比序号名称优点缺点成本适用场景1基于磁盘阵列•复制策略丰富•不占用主机资源•仅限于同一品牌同一系列产品•灾备数据不可实时读取较低所有业务2基于虚拟化存储•不受存储品牌限制•不占用主机资源•虚拟化引擎成为瓶颈和最大故障点•灾备数据不可实时读取初次投入成本高非关键业务3基于主机卷管理•不受存储品牌限制•主备中心都需要同型号的服务器和特定软件•占用主机资源,管理维护复杂•灾备数据不可实时读取较高少量关键业务4基于应用层面•异构系统的灾备•灾备数据可实时读取,恢复速度快•受应用类型的限制•占用主机资源•管理维护复杂高少量关键业务23三大要素的权衡容灾的效果投资成本对原有系统的影响RPO和RTO对原有系统影响实施了容灾系统之后,造成原有业务系统的性能下降该指标可用系统性能下降百分比、交易处理时间延迟数据表示投资成本设备成本所有与项目相关的设备投入基建成本为容灾项目投入的基建项目运维成本运行整套容灾项目所需的长期投入24数据量与链路的矛盾网络带宽2Mbps10Mbps50Mbps100Mbps1000Mbps数据传输速率(MB/s)0.251.256.2512.580同步量(GB/小时)0.8794.39521.9743.95281.2同步量(GB/天)21.094105.5527.31,0556,750表:典型链路带宽下数据同步速率(理论值)链路类型租用费用裸光纤800元/月/公里/2芯2MbpsSDH2000元/月10MbpsVPN800元/月100MbpsVPN1500元/月4Mbps个人宽带用户980元/年表:典型的链路租用参考资费20天!在10Mbps的网络链路上同步2TB数据所需的时间数据量租用费用链路带宽矛盾25两台磁盘阵列之间的同步镜像–数据被同步写入到主存储和灾备存储,灾备存储的镜像卷是生产卷精确的、完整的数据副本应用场合–在距离较近或同城范围内(低延时链路),实现存储数据零丢失的远程灾难备份和恢复同步镜像技术LAN/WAN主机生产卷副本卷数据块写入到主存储14主存储向主机返回成功写入的确认信号2数据块写入到灾备的副本卷3写入成功后向主存储返回确认信号2526LAN/WAN主机生产卷副本卷新增数据块策略名称触发条件数据差量链路要求定时复制固定时刻,比如每天12点小时级低周期性复制固定周期,比如每隔30分钟分钟级较低连续性复制单个写IO触发,实时复制IO级较高按需选择数据同步策略远程复制技术27块增量–基于块增量的复制技术,只需一次初始同步,后续只复制数据块增量,减少网络带宽占用差量比对–初始数据同步可进行差量比对,大幅减少需要传输的数据量WAN数据卷复制卷数据块复制基于IP网络–基于IP网络,无需协议转换,IP可达,灾备可达文件复制断点续传–支持断点续传,降低链路故障的影响传输优化技术289am10am11am自动连续数据快照–按策略为数据卷自动创建的时间点标记–当发生数据丢失或错误时,可数秒内快速恢复512个数据影像–每个卷可拥有512个时间点标记–基于增量的时间点记录,占用1.2-2倍空间快照资源池动态扩展–快照资源池自动增长,可灵活设定策略和位置147102581136912写入新数据块10:00-10:591471025811369129:00-9:59147102581136912写入新数据块267910267910267源资源自动创建快照快照资源数据存储块初始(不包含任何数据)001002003…255快照技术29快照回滚–