IT服务管理体系问题管理流程文件编号:ITSS-15-04版本/版次:V1.0生效日期:2019.6.1制订审核批准版本历史记录版本生效日期修订内容制订者审核人批准人目录1.目的...........................................................................................................................42.范围...........................................................................................................................43.名词术语....................................................................................................................44.问题状态定义.............................................................................................................45.问题来源....................................................................................................................56.问题的分类.................................................................................................................57.问题分级....................................................................................................................58.问题处理原则.............................................................................................................79.问题升级处理.............................................................................................................810.流程角色.................................................................................................................911.流程......................................................................................................................1011.1问题管理流程............................................................................................................................1011.2问题导入知识库机制................................................................................................................1212.审核......................................................................................................................1213.关键绩效指标(KPI)...........................................................................................1214.问题管理和其它流程关系.......................................................................................1215.参照文件...............................................................................................................131.目的本规范的目的是消除或减少运维过程中事件发生的数量和严重程度,防止相同事件的再次发生,从而为客户建立一个稳定的IT环境,提高IT服务的可用性。问题管理包括主动性问题管理和被动问题管理两类活动。前者的目标是通过找出基础设施中的薄弱环节来阻止事件再次发生,以及提出消除这些薄弱环节的建议;后者的目标是找出导致以前发生事件的根本原因,以及提出解决措施或纠正建议。2.范围应用于公司所有ITSS运维服务与问题相关的活动。3.名词术语问题:造成一个或多个事件的根本原因。注:问题的根本原因在问题创建通常是未知的,问题管理过程就是负责探寻这些未知。4.问题状态定义为方便问题状态的跟踪和查询,对问题状态定义如下。编号状态描述1处理中问题正在处理2待签收问题等待处理人签收3已关闭问题流程已经结束4待确认问题处理完成,等待结果确认5已撤销问题已经被撤销6搁置中问题进入搁置状态7搁置请求审批中问题处理人申请搁置等待审批5.问题来源问题的来源主要有:事件没有得到解决,需要升级为问题进行进一步分析处理时,应创建问题;事件虽然得到解决,但还可能存在未知错误时,应创建问题;重大事件,无论是否得到解决,为防止再次出现,应创建问题;在事件分析报告中提出的存在趋势或潜在隐患的可能问题,例如事件类型或数量的趋势分析存在问题;对基础设施和服务的主动性问题检查;供应商提供的已知产品缺陷、已知错误;与信息安全有关的安全事件或安全风险也应作为问题来管理。6.问题的分类问题分类公司应根据实际情况对问题进行分类,本公司目前依据运维对象依据事件类型进行分类,问题的分类参照事件的分类方法进行,包括:故障类问题、信息安全类问题和询问性的问题三大类,问题涉及到的运维服务范围包括:1、040201网络运维服务;2、040202主机运维服务;3、040203存储运维服务;4、040301基础软件运维服务。运维问题分类代码要和来源事件的编码进行关联,以便跟踪问题产生的根本原因,从而获得有价值的信息。7.问题分级问题级别优先级是问题管理的一个关键要素,优先级决定处理问题的顺序及所需的资源。在运维服务中,问题优先级可分为五级:S1(紧急,即:最高)、S2(高)、S3(中)、S4(低)。为方便服务支持对于问题优先级的判断,建议从问题影响程度和问题紧急程度两维来进行优先级定位。问题的影响程度主要是对事件发生的关键程度以及问题发生后的影响范围综合考虑得出。在运维业务中,要考虑以下几个方面:受影响用户数量和范围紧急程度业务重要性相关用户部门相关用户职位表1问题影响程度类别级别备注影响程度高中低从影响客户的数量方面进行分类信息系统中发生的已经影响或者即将影响24小时的业务运行信息系统中发生的已经影响或者即将影响8小时的业务运行信息系统中发生的已经影响或者即将影响4小时的业务运行问题的紧急程度主要由问题本身是否涉及关键业务系统来进行判定,如问题涉及关键业务系统,则认为紧急程度较高,需要尽快恢复;如问题不涉及关键业务系统,则认为紧急程度较低,可优先处理紧急程度较高的问题。在运维业务中,问题紧急程度定义具体如下:表2问题紧急程度类别级别备注紧急程度紧急高中低从业务影响程度进行分类客户关键核心业务无法使用;信息安全事件客户关键核心业务受影响客户普通业务受影响客户业务可能有潜在影响结合问题发生时的影响程度和紧急程度,可以通过下表确定问题的优先级:表3问题优先级矩阵问题优先级影响度高中低紧急度1-紧急S1S2S32-高S2S3S43-中S3S4S44-低S3S4S5服务台在创建工单时可结合其他因素确定实际优先级别。8.问题处理原则处理问题的原则是尽可能消除对业务的影响;问题管理流程必须包括管理服务事件影响的步骤,比如评估影响、沟通、提供变通方案等,使消除问题对客户业务活动的影响,并按问题目标解决要求进行外理问题。问题目标解决时间问题目标时间问题被分派并得到接受问题找到根本原因问题找到解决方案问题单关闭S11工作日2工作日4工作日N/AS21工作日3工作日6工作日N/AS31工作日5工作日10工作日N/AS42工作日10工作日20工作日N/A9.问题升级处理当问题未能或预计未能按照服务等级协议(SLA)的要求,得以修复时,将按照预定的时间表自动(或由服务台)发起问题升级。另当,用户或支持队伍认为有必要时,可以要求发起问题升级。表5问题升级时间表问题升级机制问题专家问题经理技术总监S1N/A2工作日4工作日S2N/A3工作日6工作日S3N/A5工作日10工作日S4N/A10工作日20工作日10.流程角色角色职责职能岗位运维服务经理开发和维护问题管理流程提供管理信息并运用这些信息主动预防问题的发生确保和外部供应商等其他角色的有效合作获取问题管理流程各项活动所需的资源进行事后检查或组织重大问题审查分析和评价主动问题管理活动的有效性识别问题管理过程中存在的问题并提出改进措施定期编写问题报告技术部经理问题提交人负责问题确认、记录、分级及跟踪确保所有相关问题信息都被正确登记对登记的问题进行分类负责根据问题解决方案实施运维项目经理问题分析员(二线、三线)接收由问题经理派发的问题。确认问题的分类和关联配置项。通过详细分析确认问题根源。提出问题的解决方案。识别问题发展趋势。防止问题扩散到其他系统。必要时提交变更请求。参与问题解决。各部门参与问题分析与解决的人员二线:技术专家团队三线:供应商和研发团队11.流程11.1问题管理流程问题管理流程问题分析员问题经理问题提交人开始1确认问题2记录问题信息3问题分类/分级4分析、确认问题根源,提出解决方案,参与问题解决6跟踪问题7问题关闭及后续处理结束5解决问题活动描述责任人输入输出1问题确认用户事件产生的问题;运行工程师巡检发现的问题;现场工程师事件记录巡检报告提出问题2记录问题信息服务台记录问题及用户基本信息。服务台提出的问题问题记录3问题分类/分派服务台人员参考目前问题分类、分级标准对该问题进行分类/分级;服务台人员将问题派发给问题分析员;服务台问题记录已分类及分派的问题活动描述责任人输入输出4解决问题分析记录的问题信息;确认问题的根源;提出问题的解决方案;根据方案解决问题。问题分析员运维工程师/技术支持工程师含有分类及准确信息的问题记录问题解决方案5跟踪/关闭问题跟踪问题的解决情况;服务台在用户认可后关闭问题记录。服务台已解决的问题记录已关闭的事件记录6问题后续处理流程经理在问题关闭后检查;生成问题报告并根据需要转向其他流程。问题经理关闭问题后,根据解决方案判断是否需要更新知识库运维服务经理已关闭的记录定期事件报告相关知识定期事件报告需要提交其他流程处理的问题记录总结的知识更新的知识库11.2问题导入知识库机制问题经理关闭问题后,根据解决方案判断是否