灾难恢复和业务连续性管理中国信息安全测评中心CISP-20-灾难恢复和业务连续性管理目录一.历史和背景二.业务持续性和灾难恢复基本概念三.灾难恢复流程与管理四.灾难恢复技术五.灾难恢复的级别划分一、历史和背景背景:信息安全管理技术信息安全管理风险管理基本概念信息安全管理技术风险评估业务持续性和灾难恢复定量/定性风险评估风险评估工具和方法知识类知识体知识域知识子域BCP&DRP概念和背景业务持续性计划编制和内容业务持续性计划的技术和管理应急响应背景和组织应急响应流程应急响应灾难备份和恢复的历史1970年代中期起源于美国中西部地区1979年在美国宾西法尼亚州的费城(Philadelphia)建立了专业的商业化的灾备中心并对外提供服务是历史性标志。从1982年到1998年的约15年间,由单纯的灾难恢复向业务连续性方向发展。2000年之后,扩展至全面的业务连续性管理概念。1982~2006年,美国灾难恢复行业共恢复了约1500宗灾难平均每年约60宗排头四位的原因是:恐怖袭击、停电、硬件损坏和火灾灾难备份和恢复的历史灾难备份和恢复的重要性事实:根据IDC的一项关于1990-2000年10年间公司遭遇灾难情况的统计,灾难发生后,由于数据丢失或者企业没有业务连续性计划,55%的公司当时即宣告倒闭,剩下的45%中,有29%的公司在两年内倒闭。事实:“9.11”事件中,受影响的1200家公司中有400家迅速启动业务连续性计划(BCP)。结论:对于企业来说,通过灾难备份来实现业务连续性管理,已经成为企业提高风险防范能力,有效应对非计划的业务破坏,并降低不良影响的重要举措。我国国内灾难恢复的发展概况20世纪90年代末期,一些单位在信息化建设的同时,开始关注对数据安全的保护,进行数据的备份,但当时,不论从灾难恢复理论水平,重视程度,从业人员数量质量,还是技术水平方面都还很不成熟。2000年,“千年虫”事件引发了国内对于信息系统灾难的第一次集体性关注,但“9.11”事件所引起的震动真正地引起了大家对灾难恢复的关注。我国国内灾难恢复的发展概况各行业用户对信息安全的建设越来越重视投入呈现稳定增长的态势,但,•大部分单位还没有有效的灾难恢复策略•没有建立统一的业务连续管理机制。随着国内信息化建设的不断完善、数据大集中的开展和国家对灾难恢复工作的高度重视,越来越多的单位和部门认识到灾难恢复的重要性和必要性,开展灾难恢复建设的时机已基本成熟。我国国内灾难恢复的发展概况2003年,《国家信息化领导小组关于加强信息安全保障工作的意见》,要求:各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。2004年,国信办《关于做好重要信息系统灾难备份工作的通知》,强调了“统筹规划、资源共享、平战结合”的灾备工作原则。2005年,国信办公室《重要信息系统灾难恢复指南》2007年,《信息安全技术信息系统灾难恢复规范》(GB/T20988—2007)我国国内灾难恢复的发展概况北京市、上海市、深圳市、广州市、成都市等地都已出台或正在研究电子政务信息系统灾难恢复工作的意见和规划;人民银行、银监会、保监会出台了有关行业政策国税总局、海关总署、人民银行、商务部等部委均已完成或正在建设灾备中心;北京、上海、深圳、广州、杭州等各地政府已建设或启动灾备中心建设。其他信息化程度较高的行业如保险、证券、电力、民航、电信、石化、钢铁等企业正在开展和规划灾难恢复系统的建设我国灾难恢复工作存在的主要问题存在侥幸心理,缺乏开展灾难恢复工作的积极性;在没有统筹规划,各行业及地方自行建设灾难备份中心,造成社会经济资源的分散和浪费;从事灾难恢复建设和服务的企业良莠不齐,部分企业缺乏专业化能力,不能满足灾难恢复的要求;已建成的灾备中心普遍缺乏严格的演练,灾备中心的运营缺乏有效的监管和审计,导致大量的灾备中心无法在灾难来临时有效发挥作用;灾难备份恢复有关人员意识欠缺、专业人才缺乏二、灾难恢复和业务连续性管理基本概念什么是灾难灾难disaster•《信息安全技术信息系统灾难恢复规范》(GB/T20988—2007)由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。*典型的灾难事件包括:•自然灾害,如火灾、洪水、地震、飓风、龙卷风、台风等,还有技术风险和提供给业务运营所需服务的中断,如设备故障、软件错误、通讯网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、植入有害代码和恐怖袭击。人员误操作恢复与备份灾难恢复disasterrecovery•为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。灾难备份backupfordisasterrecovery•为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、专业技术支持能力和运行管理能力进行备份的过程。规划和预案灾难恢复规划disasterrecoveryplanning•为了减少灾难带来的损失和保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作所做的事前计划和安排。灾难恢复预案disasterrecoveryplan•定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。BCP和BCM业务连续规划(BusinessContinuityPlanning,简称“BCP”)•是灾难事件的预防和反应机制,是一系列事先制定的策略和规划,确保单位在面临突发的灾难事件时,关键业务功能能持续运作、有效的发挥作用,以保证业务的正常和连续。业务连续规划不仅仅包括对信息系统的恢复,而且包括关键业务运作、人员及其它重要资源等的恢复和持续。业务连续管理(BusinessContinuityManagement,简称“BCM”)•为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反应恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续计划或灾难恢复预案的有效性的培训、演练和检查的全部过程。BCM、BCP、DRP•对于信息化依赖程度高的单位,信息系统灾难恢复是其业务连续规划的重要组成部分。信息系统灾难恢复的目的是保证信息系统所支持业务的连续,业务连续规划面向信息系统及业务恢复。物理场地、环境、设施、水、电等计算机、路由器,交换机。。。操作系统中间件、数据库、服务软件变化配置管理应用战略规划,系架构定义,规划与控制BCP设施硬件系统软件支撑系统业务应用管理只有保证每一层都是安全的,才能保证BCPBCP/DRP层次结构BCP/DRP的指标恢复点目标-RPO/恢复时间目标-RTO秒分小时日周秒分小时日周恢复点恢复点恢复时间恢复时间RPO-RecoveryPointObjective,恢复点目标•定义:灾难发生后,系统合数据必须恢复到的时间点要求•代表了当灾难发生时允许丢失的数据量RTO-RecoveryTimeObjective,恢复时间目标•定义:灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。•代表了系统恢复的时间主中心与灾难备份中心主中心也称主站点或生产中心,是指主系统所在的数据中心。灾难备份中心也称备用站点。是指用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的基础设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。主系统与灾难备份系统主系统也称生产系统,是指正常情况下支持组织日常运作的信息系统。包括主数据、主数据处理系统和主网络。灾难备份系统,是指用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。灾难恢复过程灾难恢复规划流程三、灾难恢复流程与管理灾难恢复工作范围信息系统的灾难恢复工作•灾难恢复规划确定灾难恢复需求制定恢复策略实现恢复策略灾难恢复预案的制定、落实和管理•灾难备份中心日常运行•灾难后的应急响应•关键业务系统在灾难恢复中心的恢复和重续运行•生产系统的灾后重建和回退工作业务连续:它是谁的责任?高层管理人员的责任•–对以下事件的后果负责:业务中断业务关键信息的丢失对数据保护的法律要求负相关责任的管理层所有参与业务连续规划的员工灾难恢复组织机构灾难恢复组织机构是对灾难事件做出相应反应的核心力量。灾难恢复的组织机构应强调信息畅通,协调合作,高效决策,有效执行。•信息畅通:信息畅通是第一要务。•协调合作:包含了内部协作和外部协作。•高效决策:应当根据需要设置扁平化的、有专家参与的决策支持体系。为保证决策的高效性,决策人员应当被授予较高的权限。•有效执行:任何决策的执行效力,应该在组织机构上进行关注。对于关键的岗位和职位都应该设置替代人员。灾难恢复的组织机构和职责管理部门管理部门新闻媒体新闻媒体供应商供应商电信部门电信部门电力部门电力部门。。。。。。系统评估系统评估系统审计系统审计系统检查系统检查。。。。。。外部外部协作协作沟通沟通外部外部协作协作沟通沟通灾难恢复灾难恢复领导小组领导小组外部专家外部专家内部管理组织机构内部管理组织机构外部协作沟通环境外部协作沟通环境灾难恢复灾难恢复实施组实施组灾难恢复灾难恢复日常运行组日常运行组灾难恢复的组织机构和职责灾难恢复规划领导小组•审核并批准经费预算;•审核并批准灾难恢复策略;•审核并批准灾难恢复预案;•组织灾难恢复预案的测试和演练;•批准灾难恢复预案的执行灾难恢复的组织机构和职责灾难恢复规划实施组•灾难恢复的需求分析•提出灾难恢复策略和等级•灾难恢复策略的实现•制订灾难恢复预案灾难恢复的组织机构和职责灾难恢复规划日常运行组•灾难备份中心日常管理•灾难备份系统的运行和维护;•灾难恢复的技术支持;•灾难恢复预案的教育、培训和演练;•维护和管理灾难恢复预案;•突发事件发生时的损失控制和损害评估;•灾难发生后信息系统和业务功能的恢复;•灾难发生后的外部协作。灾难恢复的外部协助1.同业机构间合作•加强与业务密切相关的同业机构的协调联系,相互合作,分享经验,共同评估可能面临的风险因素,共同制定灾难恢复策略,提高行业整体风险防范和灾难恢复能力。2.厂商与客户合作•与设备及服务提供商、通讯和电力部门等保持联络和协作,以确保在灾难发生时能及时通报准确情况并获得适当支持,确保灾难恢复的顺利进行。3.主管机构协调•与相关管理部门保持联络和良好关系,以确保在灾难发生时能及时通报准确情况并获得适当支持。4.新闻媒体交流•制定、协调、评价和演练在危机情况下与媒体交流的计划,以确保在灾难发生时能及时通报准确情况。灾难恢复规划的过程阶段1、灾难恢复需求分析•1.1风险分析(RA)•1.2业务影响分析(BIA)•1.3确定灾难恢复目标2、灾难恢复策略制定•2.1灾难恢复要素分析•2.2成本风险分析和策略制定2.2.1灾难恢复资源的获取方式2.2.2灾难恢复等级各要素的具体要求3、灾难恢复策略的实现•3.1灾难备份中心的选择和建设•3.2灾难备份系统技术方案的实现•3.3技术支持能力的实现•3.4运行维护管理能力的实现•3.5灾难恢复预案的实现4、灾难恢复预案的制订、落实和管理•4.1灾难恢复预案的制订•4.2灾难恢复预案的教育、培训和演练•4.3灾难恢复预案的管理灾难恢复规划的过程阶段业务影响分析制定恢复策略灾难恢复策略的实现灾难恢复预案的制定、落实和管理•分析业务功能和相关资源配置•评估中断影响•确定灾难恢复资源获取方式•确定灾难恢复等级的要素要求•正式文档化•灾难备份中心的选择和建设•灾难备份系统技术方案的实现•技术支持能力的实现•运行维护能力的实现•灾难恢复预案的制订•灾难恢复预案的教育、培训和