1提纲ITIL对企业的价值ITIL十大流程简介2部分行业调查结果:IT运行维护管理困难与挑战3•最终客户的满意度低–IT以技术而不是以服务为中心–满意度评测不科学,对IT服务工作帮助小•以被动为主而不是以主动为主–靠“英雄”而不是靠“流程”来解决问题–尽力而为vsSLAIT运行维护管理困难与挑战思考:•如何让IT部门的维护力量得到支撑和加强•如何提高最终客户对IT运营管理服务的满意度•如何降低在IT基础设施方面的运营成本•服务的特点:–无形–感知–不可存储–强调过程–互动–成本–质量管控难440%流程失误40%人员疏失20%平台故障从IT运维的现状来分析Source:GartnerSecurityConferencepresentation“OperationZeroDowntime”,D.Scott,May2002未测试的变更高负荷问题管理弱硬件、软件、网络、电力失常及天灾训练不足备份错误安全疏忽IT运行维护管理困难与挑战5IT部门面向最终客户的服务演变历程FireFightHelpDeskService-CentricSupportSelf-ManagingInfrastructure时间(Time)效率(Efficiencies)集成化运营中心主动/自动服务管理救火队热线服务全球IT运行管理发展趋势IT系统生命周期6全球IT服务发展趋势分别采购路由器、交换机、桌面PC、办公软件、ERP/CRM/SCM应用系统。。。整体采购、一揽子服务IT部门-直接提供服务IT部门负责IT系统的运行维护,直接响应最终客户的服务请求IT部门-IT服务管控者IT部门负责整合内外部资源,对各个服务提供商的质量进行管控可预测的成本带来可预测的质量“黑箱子”——服务过程不透明最终客户不知道IT部门的工作状态和进展情况服务透明化最终客户知道IT部门或者外包服务工程师的工作状态和进展情况透明展示工具:Web、Email、短信、电话等多种方式7ITIL对企业的价值•ITIL/ITSM是一套公开的、基于业界最佳实践制定,用于规范IT服务管理的流程和方法论。•ITIL(ITInfrastructureLibrary)以流程为导向,以客户为中心,通过整合IT服务与企业业务,提高了企业IT服务提供与运营管理的水平。•1989年最初由英国商务部OGC(OfficeofGovernmentCommerce)组织开发、出版——十大流程(1.0版本)。2001年,整合、增加为6个模块,构成了ITIL2.0版本。•目前已经成为一套事实上标准,全球有至少20,000多家在各自行业领先的组织都依据ITIL的框架来提升IT服务的效率及改善IT部门内部的以及IT部门与业务部门沟通。提高IT服务质量降低IT服务成本IT与业务的整合IT服务管理目标ITIL能对解决企业解决信息化发展中遇到的问题提供帮助8参考模型–ITIL2.0服务管理规划与实施服务管理服务支持ServiceSupport服务提供ServiceDelivery业务业务视角应用管理ICT基础设施管理技术安全管理9ITIL核心—服务支持、服务提供ITCustomerRelationshipManagement发布管理变更管理配置管理服务水平管理事件(故障)管理问题管理服务提供ServiceDelivery服务支持ServiceSupportServiceDesk服务台容量(能力)管理IT服务连续性管理可用性管理安全管理IT服务财务管理10ITIL和业务的关系IT-Services问题发布配置变更事故IT持续容量可用性服务服务提供服务支持管理层关注战略层面运维层面——正确地做事战术层面——做正确的事业务服务台财务11ITIL帮助企业建立的流程举例•一个用户打电话到SERVICEDESK•INCIDENTMANAGEMENT处理涉及到的故障•PROBLEMMANAGEMENT调查深层的原因•CHANGEMANAGEMENT提交RFC处理变更•FINANCIALMANAGEMENT帮助衡量其中的费用•ITSERVICECONTINUITY考虑对恢复计划的影响•RELEASEMANAGEMENT监督软件的分发•AVAILABILITYMANAGEMENT评估性能/操作•CAPACITYMANAGEMENT确保所需资源可用•CONFIGURATIONMANAGEMENT在CMDB中记录所有的事件•SERVICELEVELMANAGEMENT确保用户的需求已经满足12ITSM的PPT原则•业务是核心业务技术流程人员•流程是关键•技术是重要因素•人员接受流程管理•建设ITSM–规范流程–选择和使用先进技术–完善人员管理13人员•ITIL帮助企业建立:–为客户服务的文化–共同的沟通语言–IT服务的‘端到端’视图–改进沟通–打破井架式组织的障碍–提供服务展现的完整视图–对个人的有效绩效评估体系People14流程•ITIL是:–基于流程–公正的,通用的建议–与采用何种技术无关–开放的架构–可升级、可扩展–经常更新–和标准一致(BS15000)ProcessITIL15技术和工具•ITIL推荐:–工具可以很好地支持流程–对事件管理和变更管理有通用的支撑工具–工具可以使得工作流和升级自动化–可以更好地参考配置数据–可以与系统/网络管理工具集成–可以更好地实现各种统计和考核–工具可以大大提高有效性Tools16ITSM的预期效果17改善服务管理的效果举例•用户理解并使用IT支持机制•当用户需要时,IT就在他身边•服务可以迅速恢复•消除问题的反复发生•用户可以知道在真正变更之前了解变更何时发生18作为IT的使用者,你可以看到(举例):•IT服务水平得到提高•IT的变更在发生前经过积极、完善的准备•IT部门提供的所有服务均有明确的责任定义•可以测量的服务响应和恢复时间19作为IT服务的提供者,你可以看到(举例):•确定了一套成熟的故障管理流程及其工具•开发了一套变更管理流程,以控制变更带来的影响•一个集中的CMDB管理库•基于ITSM的流程和工具•使用ITSM的框架评估和奖励员工20你不会看到•故障上报后石沉大海•已经感到痛苦时,才发现有意外的变更•难于找到标准;不能找到成文的标准•对技术支持感到困惑;不知道谁支持什么•为解决一个问题来回踢皮球•对其他人已经收集的信息再次努力去收集•没有任何绩效评估来告诉我们做得如何•缺乏一个集中的存储库来存放知识和已知错误的修复方法21提纲ITIL对企业的价值ITIL十大流程简介22服务支持流程之间的关系CMDB事件问题已知错误变更发布管理工具事件事件变更管理发布管理发布定时访问权限测试标准配置管理问题管理事件管理CustomerSurveyreports沟通、更新发布事件请求、需求CMDB报告CMDB统计策略标准审计报告变更评估变更授权变更跟踪问题跟踪趋势分析问题回顾深入挖掘审计报告服务报告事件统计审计报告变更配置项关系服务台客户调查报告业务、客户和用户23服务提供流程之间的关系最终客户查询服务水平管理可用性管理容量管理IT服务财务管理IT服务连续性管理沟通更新报告需求目标成果SLAs,SLRsOLAs服务报告服务目录意外报告审计报告应急计划风险分析需求定义控制中心容灾计划审计报告财务计划类型和模型花费和预算审计报告容量计划目标和门限容量规划进度表审计报告可用性计划资产数据库设计原则目标和门限审计报告告警和意外变更管理工具24服务台ServiceDesk工作目标:•提供与客户的单点联系•促进日常服务的恢复(作为突发时间的跟踪者)•生成报告,沟通和推广服务•为组织增加价值活动:•为IT客户提供建议和指导•为IT客户快速恢复日常服务•从被动支持到更多主动服务•监控并支持SLA服务目标的完成•沟通和推广服务•产生和报告IT管理信息思考:服务台如何支持SLA目标的完成?举例:向最终客户承诺了每月网络LinkDown3小时以内,如果突发一个LinkDown故障,服务台如何定义该故障级别?可能1:当月未发生过LinkDown可能2:当月已发生LinkDown2.5小时25服务台ServiceDesk服务台的职责:•接听客户呼叫电话,提供一线支持•记录,设定优先级并跟踪突发事件•使客户了解服务请求处理进展状态•升级服务请求•协调二线/三线支持团队•向客户确认并终止事件•生成报告——重点:–发生的主要事件、问题、变更,已经与之相关的应急措施–客户不满意事件–运行不良的IT设施–下周计划的变更思考:1、呼叫中心、帮助台(HELPDESK)和服务台的关系2、服务台跟踪突发事件处理过程的作用和意义3、如何通过电子化手段与最终客户建立个性化的联系,建立个性化档案(特别适用于桌面PC服务)4、如果网管监控人员发现故障,应该首先做什么?26如何评估服务台的工作PlanDoCheckActProjectPlanImplementitAuditNewAction/ImproveOrganisationMeasuresWBS,Scheduling...衡量(Measures)让我们衡量ServiceDesk...定量:•首次呼叫解决率[%]•所有问题解决率[%]•客户满意度[ratingrange]•升级到二线的问题[%]•…定性:•完备的审计功能使责任到人,摒弃了工作中的推诿•问题自动升级上报机制大大提高整体服务水平等级•知识共享减少了大量的重复工作服务台服务质量参数(举例)27如何评估服务台的工作(举例)•每天–需要升级的事件–可能违背SLA的地方–所有显著/特别的事件•每周–一周内经常发生的,占用员工最多处理时间的事件–需生成问题记录的事件–已知错误与变更请求–违背SLA的地方–客户满意度–影响业务的趋势–员工工作量•每月–服务可用性–整体绩效、成绩与趋势分析–客户感受与满意度级别–最终客户培训与教育需求–员工绩效–技术性能–回顾评审报告的内容–提供服务的成本28事件管理IncidentManagement定义任务目标•尽快将服务恢复到正常状态•最小化突发事件对业务运作的负面影响•确保服务质量和可用性满足SLA指标•突发事件(Incident)–会引起或可能引起服务中断、服务质量下降的任何事件–硬件故障、软件故障、服务请求•探测和记录•分类和在线支持•确认优先级(影响和紧急度)•调查和诊断•解决和恢复•结束•职责、监控、跟踪和交流29事件管理IncidentManagement•变通方案-应急方案–举例:计算机重启;打印机故障,将打印任务分配到其他打印机上;•服务请求:除了IT基础设施(硬件、软家)故障外的事件都是服务请求•思考:•举例:邮件收得慢,是否算突发事件?•答:要根据事先约定的阀值来判断–事先约定,能收下来即可,不算突发事件–事先约定,10M邮件3秒钟下载完成,有可能算30突发事件生命周期突发事件突发事件探测和记录分类和在线支持服务请求调查和诊断解决和恢复结束突发事件服务请求流程是否思考:事件发生并得到处理后,由谁来结束事件?为什么?——强调责任、避免客户请求丢失31事件管理IncidentManagement32事件管理IncidentManagement并非所有的事件都能由服务台和一线支持加以解决。在不能解决的情况下,事件必须转交给后续支持组。为了及时获得后续支持组的协助,我们需要建立事件升级机制•思考:以什么标准决定是否需要升级?•时间-自动触发•分工-事先确定•举例:有一天一线人员很忙,有一些应该由一线处理的到时仍未处理,应否升级?•-从客户视角看33突发事件流程的输入和输出该流程的输入为:•来源于服务台、网络和计算机等事件的详细信息•相关操作•来自配置管理数据库(CMDB)的详细配置信息•事件与问题或已知错误是否匹配的反馈•以往相关解决方案的详情•相关事件变更请求(RFC)的反馈该流程的输出是以某种方式尽快恢复服务,例如:•事件解决方案的变更请求•更新的事件记录(包括解决方案和/或临时解决措施)•已解决和结束的事件•与客户交流的相关信息•管理信息(报告)•思考:如何提高记录的效率?•——不