《开发区海外学人信息管理系统升级改造项目》系统运行维护方案北京北内制造业高新技术孵化基地有限公司2015年7月第2页目录1服务内容........................................................................................................................................31.1信息资产统计服务...............................................................................................................31.2网络、安全系统运维服务...................................................................................................31.3存储系统运维服务...............................................................................................................41.4数据库系统运维服务...........................................................................................................52运维服务流程................................................................................................................................53服务管理制度规范........................................................................................................................63.1服务时间...............................................................................................................................63.2服务支持规范.......................................................................................................................63.3问题记录规范.......................................................................................................................74应急服务响应措施........................................................................................................................84.1应急基本流程.......................................................................................................................84.2预防措施...............................................................................................................................84.3突发事件应急策略...............................................................................................................9第3页1服务内容1.1信息资产统计服务此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。服务内容包括:硬件设备型号、数量、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络结构、网络路由、网络IP地址统计记录其它附属设备的统计记录1.2网络、安全系统运维服务系统运行环境、系统安全基本服务内容:序号服务模块内容描述提供方1备件安装按备件到达现场时间工程师到达现场设备厂商2软件升级首先分析软件升级的必要性和风险,配合用户进行软件升级开发方3故障诊断根据用户提出故障描述提出解决方案开发方4电话远程技术支持7×24小时开发方5问题管理系统对遇到的问题进行汇总和发布开发方(1)远程技术支持为保证系统的正常运行,开发方提供可实时连通的远程技术支持。保障系统的正常运转。对于操作中出现的技术问题予以远程解答和指导。对安全事件的产生原因进行判断和解决。第4页同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:配置数据性能数据故障数据系统运行问题调查系统维护情况调查系统历史故障调查(2)网络运行分析与管理服务网络运行分析与管理服务是指公司工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务。1.3存储系统运维服务公司提供的存储系统的运维服务包括:存储设备操作系统维护,补丁升级等内容。存储系统基本服务内容:序号服务模块内容描述提供方1现场备件安装按备件到达现场时间工程师到达现场设备厂商2补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。开发方3升级服务对系统进行软件升级,以改进、完善现有系统或消除现有系统的漏洞。开发方4故障诊断对用户提出的故障反馈及时判断。开发方5远程技术支持7×24小时电话开发方6问题管理系统对遇到的问题进行汇总和发布开发方7系统优化对客户操作系统、提供优化服务。开发方8进程管理系统进程管理开发方9存储管理服务进程,备份情况的故障提示和报警开发方第5页1.4数据库系统运维服务提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。提供的数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。2运维服务流程主要服务方式为远程技术支持方式。流程如下图所示:技术人员诊断故障原因用户操作不当或硬件故障系统软件问题用户发生故障指导用户正确操作,建议维修硬件等设备技术人员提出解决方案,记录到维护数据库库库提交用户信息,系统运行维护报告第6页3服务管理制度规范3.1服务时间(1)接收服务请求和咨询:在5*8小时工作时间内设置热线电话,接听服务请求,并记录服务事件处理结果。(2)在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决操作的技术问题。技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。行为规范(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。(4)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。3.2服务支持规范运维服务人员要做到耐心、细心、热心的服务。工作要做到有记录、有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。(1)支持服务人员应言行礼貌大方,技术专业,操作熟练、严谨、规范;(2)支持工程师在进行支持工作时必须在保证数据和系统安全的前提下开展工作。(3)支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。(4)故障解决后,支持工程师要详细记录问题的发生时间、地点、提出人和第7页问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。3.3问题记录规范根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:(1)问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。(2)问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。(3)问题确认、解决。技术人员收到系统缺陷类问题后,对提交的问题进行归类汇总和分析、确认。可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施。服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员。(4)问题上报。收到经技术人员确认的系统缺陷类问题提交后,上报技术总监。(5)问题回复。根据提交问题的分析,制定解决方案并进行实施的解决,同时做好变更记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出回复,并将分析过程和问题产生原因一并提交。第8页4应急服务响应措施针对本项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。4.1应急基本流程出现突发情况报项目经理项目经理协调、处理结束问题报告单采取措施避免类似事件发生处理记录情况通报单维护服务应急处理流程4.2预防措施针对服务过程中一些可能出现的情况,制定了一系列预防处理措施,举例如下:类型事件预防措施处理应用软件无法启动软件可执行文件提前准备好各类需维护软件安装程序将应用软件数据文件备份后,重新安装软件打开过程中或运行中异常错误关闭准备好安装程序,操作系统优化和修补软件,查杀病毒软件判断出错原因,备份数据,采取相关修复措施第9页4.3突发事件应急策略系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,开发方设计了完善的突发事件应急策略。根据长期以来的运行维护的服务工作经验,建立了常用知识库,其中包括多种常见技术故障和突发事件的应急策略