第6章数据中心专业化运维

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第6章数据中心专业化运维数据中心作为信息与信息系统的物理载体,目前主要用于与IT相关的主机、网络、存储等设备和资源的存放、管理。只有运维好一个数据中心,才能发挥数据中心的作用,使之能更好地为业务部门提供强大的支持能力。本章从IT服务商的角度对数据中心运维管理进行系统的介绍,其出发点在于运维的精确控制、管理水平和服务质量的持续提高,对于其他类型的数据中心建设模式也有较高的参考价值。6.1数据中心运维管理概述6.1.1.运维目标从数据中心角度来看,数据中心运维管理就是:为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维是数据中心生命周期中最后一个、也是历时最长的一个阶段。所谓生产运维期指的是从数据中心项目交付使用,直到项目废除的全过程,也就是项目进行生产运维活动,收回投资,以实现预期投资目标的周期。在此阶段的运维管理,将依托于数据中心已交付的基础设施,通过科学的管理,最终使数据中心得以实现服务与经济上的目标。简单地说,运维管理就是用好、管好已建设交付的数据中心。因此,在数据中心生命周期中,运维管理主要肩负起以下重要目标:合规性、可用性、经济性、服务性四大目标。1.合规性合规性,要求数据中心在运维管理过程中能避免违反任何法律、法规、标准与合约文件等规定。这里要求数据中心在运维管理的管理框架设计与执行全过程(包括人员使用、流程设计、产品部署与厂商管理等),能充分考虑有关文件的要求,并在运维管理过程中留下相应的记录,建立起相应的管理评估机制,以向利益相关方证明其能达到合规性的目标。2.可用性可用性,要求数据中心在运维管理过程中能保证数据中心各功能组件保持支持既定功能的能力。这里要求数据中心在运维管理过程中能准确识别相关功能组件,了解该组件的设计能力,定义与该组件技术特点相匹配的监控指标,并通过主动与被动的管理,最大限度地保证数据中心各管理组件的可用性。3.经济性经济性,要求数据中心在整个运维管理周期中实现数据中心预先要求的财务目标。这里要求数据中心在运维管理过程中,要建立IT财务机制,一方面通过合理的财务预算、会计、成本分析等手段准确、及时地分析、记录运维管理过程中的各项支出;另一方面要制定相应的计价模式,将数据中心运维过程中的成本合理地分摊。此外,要通过财务管理,使数据中心在运维管理上实现成本与其他管理目标的相对平衡。4.服务性服务性,指数据中心应建立服务导向型的运维管理框架。要从服务的角度出发,分析客户与数据中心的各种交互界面,以此为源头构建各种管理流程,最终形成整体管理框架。比如,数据中心在管理体系的设计上可以参考ITSM(IT服务管理体系)的要求,建立服务台、服务水平管理、业务关系管理等流程,以此来驱动后台运维管理工作。6.1.2.运维对象如前所述,数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。因此,在探索数据中心运维管理方式之前,必须要理清数据中心的运维对象,才能针对数据中心特定的运维对象建立相应的管理模式。数据中心运维对象共分成5类,如图6-1所示。图6-1数据中心运维对象第一类运维对象是基础设施部分。这里主要指为保障数据中心所管理IT设备正常运行所必需的网络通信、电力资源、环境资源等。这部分设备对于客户来说几乎是透明的,因为大多数客户基本上只关注业务,并不会关注到数据中心的风火水电。但是,这类设备如发生意外,对依托于该基础设施的IT应用来说,却是致命的。基础设施部分的主要内容如图6-2所示。图6-2数据中心基础设施第二类运维对象是在提供IT服务过程中所应用的各种IT设备,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体。第三类运维对象是系统与数据,包括操作系统、数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见、摸得着”,但却是IT服务的逻辑载体。第四类运维对象是管理工具,包括了基础设施监控软件、IT监控软件、工作流管理平台、报表平台、短信平台等。这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证到数据中心如何管理好与其IT直接相关的资源,从而间接地提升IT的可用性与可靠性。第五类运维对象是人员,包括了数据中心的技术人员、IT运维人员、管理人员以及提供服务的厂商人员。人员一方面作为管理的主体负责管理数据中心运维对象,另一方面也作为管理对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。所以,下文将有专门章节探讨对人员的管理。6.1.3.运维要求由于数据中心运维对象涉及种类比较多,从供配电设施到IT设备、到应用系统、到各类人员,这无疑要求数据中心的运维管理应能适应上述所有的管理对象。另外,作为IT服务的物理载体,客户对IT服务实时性、安全性、可靠性等的要求最终将内化为对数据中心运维管理的要求。最后,如果该数据中心要通过一些专业认证,或为一些特殊行业提供IT服务,其运维管理必须符合相关标准与行业规范。以下列举了部分运维管理方面的要求。1.信息安全的要求随着技术的广泛应用与信息的转型,信息对机构来说,已经变得与土地、人力与资金等传统资源同等重要。另外,随着信息面临的威胁逐年增加,如病毒、钓鱼网站、间谍软件、错误操作、越权使用、人员安全等,作为承载客户信息系统运行的数据中心而言,信息安全绝对是其运维管理的重要要求。2.运维管理服务化的要求随着客户对IT系统依赖程度的增加,数据中心的工作质量将直接影响到客户的业务、市场甚至是公司形象等。由于信息系统宕机导致企业一天遭受数千万元的损失,甚至被监管机构处罚的例子屡见不鲜。这个变化使得数据中心的运维管理逐渐浮出水面,数据中心运维管理团队已从原来的机房管理者演变成了IT服务的提供者。如何定义数据中心工作与服务的关系,如何建立与客户之间的服务水平协议,如何快速地支持客户业务的IT服务需求,如何规划好IT系统建设更好地为业务部门提供发展的动力等,均成为数据中心运维管理规划过程中不可或缺的一部分。3.全面质量管理的要求数据中心运维管理的目标之一就是要保障用户IT服务的按质提供,该目标又可细分成基础设施的可用性、IT设备的可用性、配置管理的有效性、人员对设备操作的熟练程度、服务商管理的到位程度等多个方面。由于数据中心与制造企业不同,上述服务性的工作毕竟无法像工业产品那样容易衡量质量,而且就算是在检查的时候服务质量是合格的,也无法确保在需要该服务时服务质量也是合格的。因此,如何做好全面的质量管理是数据中心运维管理的主要内容。4.管理制度体系化的要求数据中心作为一个新生事物,对其运维管理也是近年才兴起的一门学科。因此数据中心的运维管理制度主要靠运维人员利用以往的经验,并总结数据中心管理过程中的经验教训而逐渐建立起来的。这样的管理制度能满足一定的管理要求,但由于没有一个标准的指导,而且在搭建初期主要遵循从下而上的方式,从而导致整个制度的体系化不足。这种体系化不足的缺陷会导致企业管理出现零散化,也就是当组织面临一个新的工作或管理要求时就会产生一个新的制度,而该制度与原有制度之间的关系则难以进行整合,最终会使管理者无所适从。5.管理制度测量的要求随着IT技术应用的广泛和深入,以及精细化管理的提出,量化管理已成为许多成熟企业努力的方向。作为直接支撑IT服务的数据中心来说,也需要导入这种量化的管理方式,用数字来说话。这就要求数据中心在构建运维管理体系时,要考虑将来的测量需求,并在流程中预留这些测量点,最后通过报表、记录的输出,达到对该制度进行测量的要求。6.2数据中心运维管理框架6.2.1.运维管理框架4Ps概述所谓数据中心运维管理框架是指管理一个数据中心所使用的方法与手段的总称。那么,应该用什么样的方法与手段来管理数据中心呢?在此,信息技术基础架构库(InformationTechnologyInfrastructureLibrary,ITIL)给出了一个比较好的管理框架,即所谓的4Ps。数据中心运维管理框架如图6-3所示。图6-3数据中心运维管理框架1.人员人员是数据中心运维管理的基础,也是数据中心运维管理的核心。一个好的数据中心运维管理框架,少不了合适的技术和管理人员。从前面数据中心运维管理概述中,可以看到数据中心所需要管理的对象,包括基础设施、IT设备、系统与数据、管理工具和人员等。只有具备相应知识背景与管理经验的人,才能有效地整合上述资源,为客户提供符合质量与合同要求的IT服务。因此,在考虑建设数据中心运维管理框架时,必须要考虑到:如何建立起一套科学合理的包括选、用、培养、考核及解聘的人员管理生命周期;如何通过合理的组织架构设计与人员分工,最大限度地发挥个人的主观能动性,为组织目标贡献力量等。2.流程流程是数据中心运维管理质量的保证。作为客户IT服务的物理载体,数据中心存在的目的就是保证服务可以按质、按量地提供。服务与产品有着许多的不同,其中最核心的不同在于服务本身是看不见、摸不着的,但又是能通过服务商与客户的互动为客户所感受到的。为确保最终提供给客户的服务是符合服务合同的要求,数据中心需要把现在的管理工作抽象成不同的管理流程,并把流程之间的关系、流程的角色、流程的触发点、流程的输入与输出等进行详细定义。通过这种流程的建立,一方面可以使数据中心的人员能够对工作有一个统一的认识,更重要的是通过这些服务工作的流程化使得整个服务提供过程可被监控、管理,形成真正意义上的“IT服务车间”。3.产品产品是数据中心运维管理的加速器。数据中心运维管理涉及的对象庞杂,且重复性工作较多。若完全依靠人工去完成这些工作,一方面对人员的技能与数量有较高的要求,另一方面在工作质量的保证方面也存在风险。为此,越来越多的数据中心在开展运维管理工作时使用大量工具,目的是通过这些工具的部署取代一些监控、操作、配置文件、工作流管理等大量重复性工作,最终实现提升运维水平、降低运维风险、减少运维成本的目的。4.服务商服务商是数据中心运维管理的支持者。作为专业化的数据中心运维管理,有效地整合数据中心管理对象,并最终为用户提供专业化的服务才是数据中心服务提供者的核心价值所在。而且,数据中心运维管理中涉及了太多不同种类的设备,数据中心也不可能把所有的技术与管理工作独自承担。聘用一批既懂变压器、发电机、UPS,又了解空调、消防、防火设备,同时还精通IT相关软硬件的人员,对于任何一个企业或机构均是极大的成本支出。所以,数据中心需要与许多设备供应和服务提供商建立良好的战略合作关系。6.2.2.运维管理的人员要求如前所述,人员既是数据中心运维管理的基础,也是数据中心运维管理的核心。一个数据中心组建团队时应注意什么呢?以下重点就人员技能、人员分工与人员管理三个方面谈一下数据中心运维管理方面的人员要求。1.人员技能现在回到数据中心的运维对象来分析数据中心需要配备怎样的人员。数据中心人员技能构成如图6-4所示。图6-4数据中心人员技能构成基础设施操作和技术人员。这类人员的主要职责是保障与数据中心服务相关的基础设施的稳定运行。他们应掌握数据中心各类基础设施的原理、使用方式、维护方式,并具备简单故障诊断的能力。而且还能协助开展数据中心场地、设备性能的能力管理与可用性管理。由于数据中心业务的特殊性,这类人员需能支持7×24小时服务。IT设备与IT系统的操作或技术人员。这两类人员的主要职责是保障客户IT服务相关的设备与系统的稳定运行,同时根据客户的要求完成IT系统的检查、后台操作、批作业处理、备份、恢复等相关工作。如果数据中心规模较大,将会按技能的不同将IT人员分成硬件类与系统类的两组人员。如果数据中心规模较小,通常会将这两组人员合并,统一负责数据中心所有IT设备与系统的操作与维护。系统工具管理人

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功