ITSS《信息技术服务运行维护第3部分应急响应规范》

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《信息技术服务运行维护第3部分:应急响应规范》标准提纲一、目的、意义及定位四、标准验证与应用三、编制思路和标准内容二、编制过程1.1编制背景各行业、领域信息化体系逐步建立,重要信息系统普遍进入运维阶段运维重点是保障系统安全、可靠、高效运行,支撑业务工作的开展但随着运维内容的增多,信息系统出现应急事件的频率也大幅提高行业缺乏应急响应服务规范1.1编制背景信息技术服务标准由工信部提出由全国信息技术标准化技术委员会归口在标准工作组指导下,成立各专业组,专业组主要由企业、科研院所等单位组成国家标准化委员会发布的“2009年第二批国家标准制修订计划”,标准计划编号为“20091400-T-469”1.2编制目的规范运维服务当中的应急响应过程,提升应急响应能力,提前发现和解决问题,降低应急事件可能带来的不良影响编制目的1.3信息技术服务标准的组成…1.4运维标准的组成运维标准的组成1.4运维标准的组成运维服务各标准之间的关系通用要求从人员、资源、技术和过程四个方面提出能力要求和关键指标交付规范、应急响应规范从服务实施过程上作专业深化数据中心规范、桌面及外围设备规范、信息系统规范从领域上作专业延伸服务能力信息技术服务运行维护第1部分:通用要求服务过程信息技术服务运行维护第3部分:应急响应规范服务对象信息技术服务运行维护第2部分:交付规范信息技术服务运行维护第4部分:数据中心服务规范信息技术服务运行维护第5部分:桌面及外围设备服务规范信息技术服务运行维护第6部分:应用系统服务规范……提纲一、目的、意义及定位四、标准验证与应用三、编制思路和标准内容二、编制过程标准编制路线图工作组成立标准起草征求意见标准修正标准送审2.1标准工作组成立信息技术服务标准工作组成立-2009年4月23日运维专业组成立-2009年4月30日2.2标准调研举办IT运维服务论坛时间:2009年4月地点:万寿宾馆参与单位:30余家单位参与(包括工作组成员单位、政府部门、行业企业及外企)调研成果:根据“急用先行、成熟先上”的原则确定信息技术服务运行维护第1部分:通用要求、第3部分:应急响应规范做为优先建设的标准2.2标准调研五省市调研时间:-2009年5月~6月地点:武汉、广州、山东、上海、北京调研单位:上海宝信、山东浪潮、广州南天、武汉太阳花、太极、神州数码调研成果:1、调研不同行业(政府、金融、税务、电信、制造业、钢铁、烟草、电力、冶金、石油等)从事运维服务的龙头企业,并确定标准编制核心成员单位(神州数码、宝信、太极、浪潮、广州南天、武汉太阳花等20家)。2、太极公司作为专业组副组长单位,主持应急响应规范的编制,参与单位包括浪潮、东软、神码等单位。2.3标准起草时间地点主要工作参与单位组内征求意见2009年6月15日—6月19日北京亦庄整体运维标准体系;应急响应规范的框架确立。7家33条2009年7月6日—7月10日云南昆明各标准之间逻辑梳理,边界的界定;应急响应规范草稿基本完成;IT运维体系(架构)讨论。12家41条2009年8月9日—8月14日山东泰安应急响应规范征求意见稿形成;组内第一次审核。20家19条2.4意见征求第一次意见征求时间:2009年8月26日范围:中科院计算所、长风联盟等5家单位第二次意见征求时间:2010年3月29日—4月2日范围:运维专业组征求稿发出份数反馈份数反馈意见总数采纳意见数551210征求稿发出份数反馈份数反馈意见总数采纳意见数101076452.4意见征求第三次意见征求时间:2010年9月15日范围:邀请北京市应急办、北京市经信委、国家证监会、农业部、中编办等单位参会第四次意见征求时间:2010年11月26日范围:参会单位包括中科院计算所、中科院软件所、总参三部、北京市无线电管理局、TRS公司等单位征求稿发出份数反馈份数反馈意见总数采纳意见数665546征求稿发出份数反馈份数反馈意见总数采纳意见数66752.4意见征求第五次意见征求时间:2011年1月7日范围:全国信息技术标准化委员会、中编办、农业部、北京市应急办、中国移动研究院单位专家以及原国办秘书局局长、原国家质监局副司长等专家参会第六次意见征求(标准验证)时间:2011年1月—10月范围:国家质检总局和北京市等9个省地市接受标准验证征求稿发出份数反馈份数反馈意见总数采纳意见数772622征求稿发出份数反馈份数反馈意见总数采纳意见数1414103422.5标准修正2010年至2011年,编写组在北京、四川都江堰多次召开应急响应规范修正会议,标准编制单位参加。会议对历次组内和对外征求意见进行了回顾,对应急响应规范进行了重新梳理和深化,完成了7次标准修正。形成送审稿。2.6标准送审2012年1月17日,工业和信息化部软件服务业司在北京组织召开了国家标准送审稿专家审定会。与会专家一致同意标准送审稿通过审定。2012年1月19日至2月2日,标准编制组对标准内容再次进行检查与核对,根据专家意见进行修改,专家意见共4条,采纳意见4条,形成报批稿。提纲一、目的、意义及定位四、标准验证与应用三、编制思路和标准内容二、编制过程3.1编制依据《中华人民共和国突发事件应对法》《国家突发公共事件总体应急预案》GB/T22240-2008信息安全技术信息系统安全等级保护定级指南……3.2编制思路应急响应基本过程(以流程为主线)预防与应急准备监测与预警应急处置与救援事后恢复与重建突发事件应对法针对的是四类突发公共事件应急准备监测与预警应急处置总结改进应急响应规范针对的是运维服务对象3.3适用范围适用范围指导在经济建设、社会管理、社会生活、生产经营等领域重要信息系统运行维护服务中的应急响应实施和管理3.4主要内容术语应急响应:组织为预防、监控、处置和管理应急事件所采取的措施和活动3应急事件:导致或即将导致运行维护服务对象运行中断、运行质量降低,以及需要实施重点时段保障的事件2运行中断:故障运行质量降低:达到或超过容量阈值,如内存、CPU、存储等重点时段保障:提升服务等级以确保某一时间段内重要活动或重点业务的开展所采取的措施和行为13.4主要内容概述应急准备监测与预警应急处置总结改进应急响应规范3.4主要内容(一)应急准备建立应急响应组织制定应急响应方针风险评估与改进预案制定培训与演练应急准备划分应急事件级别3.4主要内容(一)应急准备建立应急响应组织1连续性:一体化:职责清:可管理:运维组织应急响应组织含供、需等多方角色权限明确关键角色备份有记录可评审制定应急响应方针23.4主要内容(一)应急准备风险评估与改进3风险规避风险转移风险降低风险接受3.4主要内容(一)应急准备划分应急事件级别4参考要素主要应考虑应急事件发生时系统提供服务的状态主要应考虑信息系统内信息资产的重要性和信息系统服务的重要性主要应考虑应急事件发生时信息系统功能和性能等方面的影响程度重要程度服务时段受损程度3.4主要内容(一)应急准备划分应急事件级别4级别划分——资料性附录A赋值描述1非系统服务时段(不含系统服务时段即将开始)2系统服务时段或系统服务时段即将开始3系统处于重点时段保障或处于服务高峰时段(2)服务时段划分为3级(1)重要程度划分为4级(参考等保)(3)受损程度划分为3级功能性能功能无损部分损失全部损失小于阈值—13大于或等于阈值123赋值3.4主要内容(一)应急准备划分应急事件级别4级别划分信息系统服务时段信息系统受损程度1.赋值应急事件分值2计算应急事件分值信息系统重要性2.计算应急事件分值∏3.定义应急事件等级三级:1≤∏≤6;二级:8≤∏≤18;一级:26≤∏≤36赋值相乘3.4主要内容(一)应急准备预案制定5根据应急事件级别制定应急预案可以分为总体预案和针对某个核心系统的专项预案应明确,易执行,使用检查列表和详细规程给出预案内容建议评审、发布、版本控制3.4主要内容(一)应急准备培训与演练6(1)培训(2)演练预先制定演练计划、演练脚本演练的整个过程应有详细的记录演练不能影响业务的正常运行必要时,组织可根据演练的效果,对预案进行完善3.4主要内容(二)监测与预警监测与预警预案启动日常监测与预警核实与评估3.4主要内容(二)监测与预警日常监测与预警1运维服务对象应用系统系统软件、工具软件网络及网络设备安全设备主机、存储、外设、终端等设备电力、空调、消防等基础环境……业务数据以跟踪和判别业务数据是否超出了预警条件(1)范围3.4主要内容(二)监测与预警日常监测与预警1(2)手段与工具采用运行维护工具与人工相结合的方式开展日常监测与预警活动设立服务台并保持运营建立知识库并保持更新确定监测项、监测时间间隔与阈值确定活动中的人员、角色和职责(3)记录与报告发现应急事件时,应提交报告开展应急事件的先期处置根据授权,负责人统筹开展后续工作对应急事件保持持续性跟踪3.4主要内容(二)监测与预警核实与评估2将事件级别置于动态调整控制中核实确认后的应急事件报告,应作为事件级别评估的输入重点时段保障需求,也应作为事件级别评估的输入针对报告内容逐项核实级别评估初步确认级别3.4主要内容(二)监测与预警预案启动3对可能造成的影响进行评估就启动何种类型预案达成一致预案启动通报调整监测与预警状态可进行预案的自动启动重点时段保障应启动的预案可参考同级别预案确定3.4主要内容(三)应急处置应急调度排查与诊断处理与恢复持续服务事件关闭应急处置事件升级3.4主要内容(三)应急处置应急调度1按照预案,开展统一的应急调度,包括物资、人员、经费等获取现场信息组织必要人员进行勘察、分析下达调度命令并保持跟踪保护可追查的相关线索基本流程问题沟通与确认排查与诊断2不应延误处理与恢复工作的开展3.4主要内容(三)应急处置处理与恢复3原则:满足事件级别处置时间要求的前提下,尽快恢复服务;采用的方法、手段不应造成次生、衍生事件的发生。基于预案、配置管理数据库、知识库必要时可启用备品备件、灾备系统对过程和结果信息记录,并及时告知3.4主要内容(三)应急处置事件升级4当实际处置时间超过事件级别处置时间要求时,应作为事件升级的参考要素。持续服务5有可能是临时性恢复需要跟踪,以确保问题“真正”解决重点时段保障要求3.4主要内容(三)应急处置事件关闭6关闭通报调查取证核实申请就单一事件响应来说,事件结束3.4主要内容(四)总结改进应急工作总结应急工作审核应急工作改进总结改进总结改进应急准备提纲一、目的、意义及定位四、标准验证与应用三、编制思路和标准内容二、编制过程4.1标准验证范围验证范围•政府行业中央部委(质检)地方政府(北京,上海和成都等)•典型甲方客户需方•运行维护服务组织自我评估和验证供方•第三方监理(电子四所)运行维护服务监理规范•行业管理(工信部软件服务业司)资质评定监管方标准科学性标准可行性标准合理性符合度评估验证内容4.2标准应用1.使用范围:重要信息系统2.使用主体:供、需等多方参与3.流程作参考,可裁剪;规范中提出多个报告,对内容提出建议,模板可自定义4.如何区分“平-战”活动,故障-重点时段保障活动:见资料性附录B5.与日常运维中“故障”之间的关系:在低级别应急事件中相同6.是否需要单独工具:不需要。结合监控工具、交付工具等运维系统使用标准化的标准化的ITIT服务服务可信赖的可信赖的ITIT服务服务

1 / 48
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功