第11章服务等级管理了解你为何付费第11章服务等级管理网络提供商和网络服务受益方彼此会维持之间的商业关系,网络提供商提供了一种产品给客户,产品的一种网络服务——但是缺乏普遍性,在此我们只考虑网络服务。客户需要为服务提供商提供服务的付费。这和其他的商业事务并没有不同,客户为产品付费,它希望获得高质量而且符合它们要求的产品。第11章服务等级管理和许多产品不同的是,网络服务通常是可以自定义的,从而满足不同客户的需求。除了它的功能之外,服务的一个固定部分涉及它的技术属性,这些属性统称为等级服务,预期为某个服务提供的服务等级规范协议的形式出现,SLA定义了要提供服务的技术条款——预期的服务等级。因此SLA构成了网络服务提供商和用户之间的业务核心关系。第11章服务等级管理学习目标:1.了解服务等级协议的组成部分以及如何定义业务问题2.了解服务等级参数示例3.了解在定义服务等级协议时需要考虑业务问题4.学习如何规划和管理网络来获得指定等级服务5.了解如何应用网络管理技术来监控和验证服务第11章服务等级管理11.1服务等级协议的动机通常把网络服务提供商称为服务提供商,包括企业的IT部门或者是运营数据中心的组织。服务提供商运营网络或数据中心不仅仅为了装点门面,而是为了能够从运行于网络之上的服务中获得收益。对于企业IT部门的这种情况,服务的受益方是企业中的各个部门和员工,他们需要使用数据和语音服务来作为其技术基础设施的一部分。第11章服务等级管理这意味着服务提供商和网络服务受益方之间的关系通常是带有一定商业安排的商业关系。网络提供商提供一种产品,并期望客户为此付费种形式。产品通常不仅根据它们的功能来定义,而且还根据其他的特性来定义。产品的特性很大程度上决定了能够从该产品所获取的价值和你愿意为它所付出的价钱,甚至决定了是否将它作为首要的购买对象。第11章服务等级管理产品的特性在很大程度上决定了能够从该产品所获取的价值和你愿意为它所付出的价钱,甚至决定了是否希望将它作为首要购买对象。对于通信服务也是如此。这些参数可以定义所提供的服务等级考虑一种虚拟专用网络服务,服务提供商通过提供这种服务来互联企业网络的各个站点和远程办公分支机构。第11章服务等级管理不仅相同的服务功能可以按照各种方式来实现,而且在提供服务时涉及的服务特性是千差万别的。服务等级协议是通信服务提供商和用户之间签订合同来规定服务的预期等级。预期的服务等级是通过一系列服务等级目标来定义的。网络服务提供商向客户保证将满足服务等级目标,为了使该保证能够切实可靠,SLA还包含非技术性的内容。第11章服务等级管理11.2确定服务等级参数有关SLA的一个重要问题涉及使用什么参数来定义服务等级目标。在SLA中的参数必须满足一下的三个准则:1.重要性:该参数必须对于要定义的服务而言具有重要的意义2.相关性:该参数必须和服务的使用环境相关3.可测性:该参数必须可测定而且客观上可检验第11章服务等级管理11.2.1重要性在SLA中要纳入哪些服务等级参数在很大程度上取决于服务的类型。这些参数必须对于服务而言有意义。许多认为服务等级参数主要是包括一些传统的网络性能和容量参数。仅仅包括网络性能和容量参数并不完整。下层的服务等级参数会影响到上层的服务参数。了解这些相关性对于服务提供商很重要,但是它对于SLA的表述并不重要。第11章服务等级管理服务等级的其他方面可能和下层的服务并不相关。这些方面会严重影响到用户的使用体验,但可能与通信栈的下层服务并没有关系。导致这方面的原因可能是用于在一端对于语音进行数字化处理,然后在另一端将网络上连续发送的语音数据包有效载荷组装到一起的编解码器出现了问题。第11章服务等级管理不管服务如何实现以及如何使用底层的技术,在SLA中要使用的最重要参数是那些与实际服务本身有关的参数。在语音服务本身所在的层次,具有一些参数诸如语音质量、呼叫接通率以及语音延迟等。它们所关心的是整体的语音延迟,而不是组成语音延迟中延迟的某一部分。第11章服务等级管理示例:语音服务等级参数对于语音服务而言很重要的服务等级参数示例,这些示例说明了在定义这些参数时需要考虑一些问题,以及如何将用户关心的内容转换为服务的等级目标。端到端的语音延迟,基于该参数的服务等级目标应当指定最大端到端的语音延迟。第11章服务等级管理呼叫接通率——也就是实际被另一端应答的呼叫尝试占总数的百分比。忙时呼叫尝试(BHCA),在一天最忙的时候呼叫尝试的次数。第11章服务等级管理这个数字会受到呼叫模式的影响:语音服务实际是如何使用的。呼叫的持续时间是决定占用多少网络资源的一个因素,它影响到所能够服务的呼叫数量。1.从开始拨号一直到接收到振铃声这期间所花费的时间长度2.平均意见值(MOS)3.在峰值时段和空闲时段内服务可用性4.供应一个新用户的时间5.每天的供应操作数量第11章服务等级管理11.2.2相关性在SLA中作为某个服务等级目标一部分而加入的服务等级参数必须符合三个准则。重要性是一个准则,相关性是第二个准则。作为一个服务等级参数来说,仅仅在定义服务特征时是一个很重要的方面是不够的,服务等级参数还必须与服务具有相关性,应当足够重要才能作为SLA中某个服务等级目标的一部分。当某个参数未成为一个足以产生影响的因素时,也可以认为它是不相关的。第11章服务等级管理11.2.3可测性建立在服务等级参数基础上的服务等级目标还需要具有可测性,必须能够按照一种现实可行的方式来确定某个服务等级目标是否满足或者违背。SLA的整个意图就是按照一种明确、可测量的方式来定义什么是一种可接受的服务等级。一种方法是针对采样结果进行统计,另一种方法是使用分析呼叫的软件来进行自动测量。第11章服务等级管理11.3定义服务等级协议SLA需要回答的问题:1.服务提供商将提供什么内容2.如何根据并核实服务等级目标3.如果服务提供商未提供符合要求服务怎么办?第11章服务等级管理11.3.1服务等级目标的定义在定义要包括哪些等级目标时,需要进行以下考虑:1.确定哪些服务等级参数以及服务等级目标对于你的需求来说最重要2.在定义服务等级目标时尽可能具体3.作为服务提供商,应当考虑只在SLA中加入那些自己预期能够完全满足的服务等级目标第11章服务等级管理11.3.2跟踪服务等级目标在定义服务目标时,需要核实这些目标,如何进行其中的服务等级参数,这一点很重要,不仅仅可以避免以后的纠纷,还可以有助于澄清有关于服务等级参数的任何误解。1.明确需要测量参数的地方2.明确如何测量参数3.确保测量结果具有统计相关性4.应当明确谁负责以及如何核实测量结果第11章服务等级管理11.3.3处理违背服务等级目标的情况尽管服务提供商和客户最初都抱有良好的意愿,但仍然可能存在违背等级目标的可能性,为了应对这种情况,良好的SLA需要明确指出在这种情况下如何处理。你可以将SLA看作是网络提供商和客户之间的一个“婚前协议”在出现违背服务等级目标的情况下应当如何处理涉及多个方面,在SLA应当顾及到每个方面。第11章服务等级管理1.恢复所协定的服务等级,这当然是首先需要做的,可以将它看作是一个紧急响应计划.(1)当检测到违背服务等级目标时将通知客户(2)按照指定的时间间隔定期告知客户最新的问题解决情况(3)在一定的时间内采取足够的措施来应对服务等级违背情况(4)在一定时间内恢复服务等级第11章服务等级管理2.为未满足的服务等级作出补偿。(1)违背服务等级目标的次数(2)违背服务等级目标的严重性(3)违背的特定服务等级目标3.重新考虑未来的商业关系以及放弃业务的可能性,如果服务等级目标一直达不到或者严重被违背,可能无法表明提供商遵从SLA的条款。第11章服务等级管理11.4管理服务等级在定义一个SLA之后我们没有结束,接下来需要去实现SLA,这涉及以下一些方面。1.需要建立服务——网络必须进行扩建并分配资源来支持服务等级目标。2.当服务处于运营期时,必须持续监控服务来确保所承诺的服务等级目标得到满足。3.必须收集统计性数据来作为所协定的服务等级已经被交付的证据第11章服务等级管理如何管理网络和服务来满足服务等级目标在很大程度上涉及该服务的提供商。客户至少也会对服务等级监控感兴趣。服务客户进行服务等级监控的目的和网络服务提供商执行服务等级监控目标的目的有所不同,用户需要需要确保自己得到的服务等级货真价实而没有偷工减料,并且需要收集必要的证据来支持他们的申诉。第11章服务等级管理11.4.1分解服务等级参数在很多情况下,服务是通过多个部分的组合来实现的,在提供这种服务时涉及多个部分:网络连接部分用于提供从数据中心边缘到主机的连接,并且数据流可能还需要经过一个在多个主机之间执行负载均衡的内容交换机。服务等级参数会受到实现服务的不同的影响,服务等级参数可以相应地分解为构成整体参数的每一部分。第11章服务等级管理作为服务提供商,了解组成服务的不同部分,以及组成某个服务等级参数的各种因素很重要。这样做带来的一些潜在好处是有助于服务等级的管理。1.这有助于对出现服务等级目标未满足的情况以及观察到的某个服务等级参数降级的情况来诊断其根源。2.更容易评估网络中的某个故障对服务的影响,并且确定哪些服务和SLA可能会受到影响。第11章服务等级管理3.这为规划和设计一个可实现指定服务等级的网络提供了指导。服务提供商可以确定整体的服务登记目标将能够被满足。4.了解组成服务等级参数的不同方面有助于设计一种监控该参数的策略。但是监控组成服务等级参数的要素,并且将各自的结果聚合成最终的结果也可以作为一种合理的替代。第11章服务等级管理11.4.2针对指定的服务等级来规划网络满足服务等级目标的第一步需要正确设置服务,使得服务等级目标能够被满足,涉及确定服务将要对应的设备和网络资源,并相应地设置它们。用户和服务提供商所参与的SLA是相当标准的,从理想角度看,服务提供商具有一些可以快速应用。第11章服务等级管理1.配备网络来满足服务等级目标在配备网络来满足等级目标时,将服务分解为单独的组成部分会很有帮助。如何进行配备就是针对某个指定的服务实例要分配哪些资源以及具体数量。用户通常并不会是一直使用服务,或者不会使用到所订购服务的全部容量。当某个服务不太可能一直按照最大容量来使用时,而且如果服务等级并没有涉及一种绝对的保证。第11章服务等级管理2.管理超额认购的风险超额认证网络资源可能会有风险,因为有时候可能每个用户会同时访问服务,在这种情况下,必须做出一定的妥协。根据服务的不同,服务提供商可以使用各种技术来降低这些风险:1.重新供应:在监控当前服务等级和服务消费的过程中,通常可以检测到与资源过度使用有关的问题。第11章服务等级管理2.施加接入控制:服务提供商有可能施加一种方案,使得当服务使用情况超过一定的级别、而且若准许更多的用户接入将会导致每个人的服务等级都会恶化时便不再允许新用户访问服务。第11章服务等级管理3.网络维护考虑如何执行维护操作是完全受网络提供商控制的,在进行网络维护时,应当谨慎处理,因为由未计划或非预期的维护工作所引起的服务中断很难为免责的理由。在制定SLA时应当预计到执行维护工作的需求,这可能需要在SLA中明确指出一定的“中断”期限,在这期间会因为网络维护而导致服务不可用。第11章服务等级管理11.4.3服务等级监控——建立早期预警系统在服务启用并运行时,需要对它进行监控来确保它按照规范的要求运行——不要违反任何服务等级目标,通过监控可以提前检测到即将发生的问题,并且可以有足够的时间来采取对策。服务等级监控可以大致分为两个方面:1.监控服务等级参数2.检测问题何时可能发生第11章服务等级管理1.监控服务等级参数针对服务等级目标领域存在不同的技术来监控服务等级参数的性能和质量。(1)分析管理信息:Netflow和IPFIX记录SNMPMIB包括许多对象syslog信息第11章服务等级管理了解如何将服务等级参数分解为不同的组成部分以及涉及哪些统计