金税工程(三期)容灾方案建设思路根据金税工程(三期)的项目建设要求,各信息系统的数据将逐步集中到省级处理平台,其核心应用也将逐步上收到省级处理平台和总局处理平台。目前,国家税务总局以及各省国、地税务部门现有业务严重依赖信息系统,其新业务的开展也离不开信息系统的支持,大量重要的税务数据通过信息系统的网络和主机应用进行传输和处理。一旦这些机房因为电力、水灾、火灾等因素而无法正常运作,如果没有异地灾备中心提供服务,则将会直接影响到业务系统的正常运行,其影响面也将直接波及到全省乃至全国。作为金税工程(三期)的一个重要组成部分,灾备系统的建设本身是一个大的系统工程,它的建设必须要考虑业务需求、组织架构、流程分析、技术手段、外部环境等诸多因素。而且由于税务系统数据与应用的灾备需求的复杂性和难度,这就需要制定出一套完善的方案。在灾备项目设计、实施过程中各相关机构和人员严格遵循该方案执行,才能最大程度规避风险,保证灾备项目的成功实施。一、灾难恢复等级划分根据国务院信息化工作办公室于2005年4月下发的《重要信息系统灾难恢复指南》中的定义,灾难恢复等级可以划分为6个不同的等级,根据不同的灾难恢复需求确定灾难恢复等级,不同的灾难恢复等级,其解决方案可根据灾难恢复登记以下主要方面所达到的程度分为七级,即从低到高有七种不同层次的灾难恢复解决方案。可以根据金税工程(三期)各业务的系统及数据的重要性以及恢复策略,来设计选择灾难恢复方案和计划。根据《重要信息系统灾难恢复指南》的定义,灾难恢复级别的选择,主要决定以下七个要素:数据备份系统备用数据处理系统备用网络系统备用基础设施技术支持运营维护管理灾难恢复预案国信办在《重要信息系统灾难恢复指南》中定义的灾难恢复等级划分标准,具体内容如下:A.1第1级基本支持第一级灾难恢复应具有技术和管理支持如表A.1所示。表A.1第1级灾难恢复的技术和管理支持要素要求A.1.1数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。A.1.2备用数据处理系统—A.1.3备用网络系统—A.1.4备用基础设施a)有符合介质存放条件的场地。A.1.5技术支持—A.1.6运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证。A.1.7灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案A.2第2级备用场地支持第二级灾难恢复应具有技术和管理支持如表A.2所示。表A.2第2级灾难恢复的技术和管理支持要素要求A.2.1数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。A.2.2备用数据处理系统a)灾难发生时能在预定时间内调配所需的数据处理设备到场。A.2.3备用网络系统a)灾难发生时能在预定时间内调配所需的通信线路和网络设备到位。A.2.4备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的备用场地。A.2.5技术支持—A.2.6运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用场地管理制度;d)与相关厂商有符合灾难恢复时间要求的紧急供货协议;e)与相关运营商有符合灾难恢复时间要求的备用通信线路协议。A.2.7灾难恢复预案a)有相应的经过完整测试和演练的灾难恢复预案。A.3第3级电子传输和部分设备支持第三级灾难恢复应具有技术和管理支持如表A.3所示。表A.3第3级灾难恢复的技术和管理支持要素要求A.3.1数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。A.3.2备用数据处理系统a)配备灾难恢复所需的部分数据处理设备。A.3.3备用网络系统a)配备部分通信线路和相应的网络设备。A.3.4备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的场地。A.3.5技术支持a)在备用场地有专职的计算机机房运行管理人员。A.3.6运行维护支持a)按介质特性对备份数据进行定期的有效性验证;b)有介质存取、验证和转储管理制度;c)有备用计算机机房管理制度;d)有备用数据处理设备硬件维护管理制度;e)有电子传输数据备份系统运行管理制度。A.3.7灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。A.4第4级电子传输及完整设备支持第四级灾难恢复应具有技术和管理支持如表A.4所示。表A.4第4级灾难恢复的技术和管理支持要素要求A.4.1数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。A.4.2备用数据处理系统a)配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态。A.4.3备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态。A.4.4备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持7x24运作。A.4.5技术支持在备用场地有:a)7x24专职计算机机房管理人员;b)专职数据备份技术支持人员;c)专职硬件、网络技术支持人员。A.4.6运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有电子传输数据备份系统运行管理制度。A.4.7灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。A.5第5级实时数据传输及完整设备支持第五级灾难恢复应具有技术和管理支持如表A.5所示。表A.5第5级灾难恢复的技术和管理支持要素要求A.5.1数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)采用远程数据复制技术,并利用通信网络将关键数据实时复制到备份场地。A.5.2备用数据处理系统a)配备灾难恢复所需的全部数据处理设备,并处于就绪或运行状态。A.5.3备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态;c)具备通信网络自动或集中切换能力。A.5.4备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;a)以上场地应保持7x24运作。A.5.5技术支持在备用场地有:a)7x24专职计算机机房管理人员;b)7x24专职数据备份技术支持人员;c)7x24专职硬件、网络技术支持人员。A.5.6运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有实时数据备份系统运行管理制度。A.5.7灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。A.6第6级数据零丢失和远程集群支持第六级灾难恢复应具有技术和管理支持如表A.6所示。表A.6第6级灾难恢复的技术和管理支持要素要求A.6.1数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)远程实时备份,实现数据零丢失。A.6.2备用数据处理系统a)备用数据处理系统具备与生产数据处理系统一致的处理能力并完全兼容;b)应用软件是“集群的”,可实时无缝切换;c)具备远程集群系统的实时监控和自动切换能力。A.6.3备用网络系统a)配备与生产系统相同等级的通信线路和网络设备;b)备用网络处于运行状态;c)最终用户可通过网络同时接入主、备中心。A.6.4备用基础设施a)有符合介质存放条件的备用场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持7x24运作。A.6.5技术支持在备用场地有:a)7x24专职计算机机房管理人员;b)7x24专职数据备份技术支持人员;c)7x24专职硬件、网络技术支持人员;d)7x24专职操作系统、数据库和应用软件技术支持人员。A.6.6运行维护支持a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有实时数据备份系统运行管理制度;f)有操作系统、数据库和应用软件运行管理制度。A.6.7灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。A.7灾难恢复等级评定原则如要达到某个灾难恢复等级,应同时满足该等级中7个要素的要求。A.8容灾中心的等级容灾中心的等级等于其可以支持的灾难恢复最高等级。示例:可支持1至5级的灾难备份中心的级别为5级。二、灾备项目建设流程随着信息化技术的发展,灾备项目建设目标已经从对灾难的预防向保证业务连续性转变,如何能保证各项业务在灾难发生后连续运行成为灾备项目建设围绕的核心。参照业务连续性的十个最佳实践,一个完整的灾备项目建设应包括以下几个阶段1、项目启动和管理确定业务持续计划(BCP)实施过程的相关需求,包括获得管理支持、以及组织和管理项目使其符合时间和预算的限制要求。2、风险评估和控制确定可能造成机构及其设施中断的灾难、具有负面影响的事件和周边环境因素,以及事件可能造成的损失、防止或减少潜在损失影响的控制措施,提供成本效益分析以调整控制措施方面的投资,达到消减风险的目的。同时,由于风险会随着系统的发展而变化,所以风险管理过程也必须是动态的。3、业务影响分析确定由于中断和预期灾难可能对机构造成的影响,以及用来定量和定性分析这种影响的技术。确定关键功能、恢复优先顺序和相关性以便确定恢复时间。4、制定业务连续性策略确定和指导备用业务恢复运行策略的选择,以便在恢复时间目标范围内恢复业务和信息技术,并维持机构的关键功能。5、应急响应和运作制定和实施用于事件响应以及对事件所引起状况进行稳定的规程,包括建立和管理紧急事件运作中心,该中心用于在紧急事件中发布命令。6、设计、制定和实施业务连续性计划设计、制定和实施业务连续性计划,以便在恢复时间目标范围内完成恢复。7、知识培养和培训项目准备建立对机构人员进行意识培养和技能培训的项目,以便业务连续性计划能够得到制定、实施、维护和执行。8、维护和演练业务连续性计划对预先计划和计划间的协调性进行演练、并评估和记录计划演练的结果。制定维持连续性能力和BCP文档更新状态的方法,使其与机构的策略方向保持一致。通过与适当标准的比较来验证BCP的效率,并使用简明的语言报告验证的结果。9、公共关系和危机通信制定、协调、评价和演练在危机情况下与媒体交流的计划;制定、协调、评价和演练与员工及其家庭、主要客户、关键供应商、业主/股东以及机构管理层进行沟通和在必要情况下提供心理辅导的计划,确保所有利益群体能够得到所需的信息。10、与监管和公共当局的协调建立适用的规程和策略,用于同监管部门和公共部门协调与沟通,以确保符合现行的法令和法规。以上是一个通用型流程,在实际应用中,根据金税工程(三期)税务应用的需求和特点,结合金税工程(三期)业务连续性建设的实际需求,我们可以简化并适当改变上述标准流程。可以依据下列容灾规划步骤:1.灾难类型分析(风险分析)2.业务影响分析3.容灾策略制订4.容灾方案设计5.容灾设施资源及容灾IT系统建设6.业务连续性计划&灾难恢复计划制定与维护7.容灾系统运营管理维护8.演练及测试每一个步骤的相关职责一般会落在“计划协调人”或“应急计划制订人”的身上,他们通常是相关部门领导。协调人在其他相关系统或业务处理部门的协助下制定应急策略;应急计划协调人通常管理应急计划的制定和执行。其过程如下图所示,是一个周而复始的过程,随着内部环境的变化随时灵活变化:图1:灾难备份项目实施过程以下将针对这几个阶段作一些详细的介绍。阶段一、灾难类型分析(风险分析)风险分析(RiskAnalysis)是针对国家税务总局总局数据中心和各省国、地税局数据中心进行。根据国际灾难备份行业规范,任何准备建设灾难备份系统的机构,首先应该对自身的工作现状