浅析云数据中心的构建与实现随着云计算的出现和传统大中型数据中心建设高耗能问题的到来,我们如何借助云计算技术,建设低耗能、高效率的数据中心,实现传统数据中心的云化,这是本文的主要研究问题,也是对前期研究成果的重新整理和进一步的研究。1数据中心的分类数据中心是数据计算、网络传输、数据存储等各种IT应用业务的提供中心,依据数据中心商业运作模式,可以将其主要分为四个类别:(1)企业数据中心;(2)托管数据中心;(3)因特网数据中心;(4)网络数据中心。按机房的规模,又可以分为小型数据中心、中型数据中心、大型数据中心和超大型数据中心等。本文主要讨论中型规模云数据中心的建设,即占地面积:200~1000m、机柜数量:50~200个的数据中心建设。这种规模的云数据中心对企业来说,是最为普遍的。在中型数据中心的建设中,企业内部的实施主要是建设基础设施云(IaaS),而IaaS虽然是企业内部的私有云,但也是建设PaaS和SaaS基础平台,是组成混合云和公众云的基本构件单元,从这个意义上说,企业私有云的建设具备重要的基础性意义,企业级的私有云数据中心建设,也有着一套特定的方法步骤。2数据中心的建设传统数据中心基于所谓烟囱式的构建部署方式,业务系统独立规划、独立建设,各个业务系统形成一个个的信息孤岛,横向信息沟通复杂,导致其效率低、运行复杂,且不利于管理维护,资源利用率低下,通常只有10%~20%左右。随着业务量的超速增长,资源配置量不能动态变化,导致过早耗竭,而改建扩建的周期漫长,无法满足业务需求的快速变动。为改变传统数据中心的不利局面,构建高起点、大规模、低成本、节能的数据中心,解决大规模多样性业务的资源需求的中型数据中心。我们可以通过云数据中心的构建达成基础架构共享、资源共享、集中管理的IT系统,满足企业业务策略、业务发展的需要,进而提供优化企业IT资源的竞争优势。实现低成本高效运营,提升企业核心竞争力。3云数据中心的构建企业级私有云数据中心的建设途径,从传统数据中心进化到云数据中心,需经过三个主要步骤:虚拟化、资源池化、自动化。3.1虚拟化虚拟化技术,通过软件或硬件管理程序把物理资源映射为虚拟资源。依据对数据中心中稀缺IT资源的分类,可被虚拟化的资源包括服务器虚拟化、存储虚拟化、网络虚拟化三个类型。服务器虚拟化,分为Unix服务器虚拟化和x86服务器虚拟化。Unix服务器又称小型机,市场主流的小型机厂商各自提供配套的虚拟化程序,各厂家的产品互不兼容。x86服务器虚拟化,主流虚拟化产品包括VMwareESX/ESXi、微软的Hyper-V、开源的KVM等。除此之外,Oracle和华为等厂商提供了基于开源XEN内核的虚拟化平台。服务器虚拟化屏蔽了各种类型服务器的硬件差异,为用户提供统一逻辑形式的计算资源。为计算资源的标准化提供了基础。存储虚拟化,主要是在物理存储系统之上添加一个虚拟层,将物理存储虚拟化成逻辑存储单元。把分散的、不同级别或不同品牌的存储产品统一到大的逻辑存储空间。再从这些大的存储空间,划分空间提供给用户使用。对于网络资源来说,有各种网络设备及安全设备和网络本身。网络设备及安全设备包括路由器、交换机、网卡、HBA卡、防火墙、IDS/IPS、负载均衡设备等。网络包括FC存储网络和IP网络。IP网络根据用途又可分为生产网络、IP存储网络等。网络的需求及其实现越来越复杂,随着IT预算紧缩,网络的整合不可避免,虚拟化技术将会在整合和简化网络资源中得到很好的应用。同时,虚拟化在网络环境下可将各组用户彼此逻辑隔离,在多层应用环境中也可将其彼此隔离。网络虚拟化不但提高了数据的安全性,也很好的简化了数据和网络管理的复杂性。实现数据中心三类资源的虚拟化,是构建云数据中心的基础。虚拟化实现了数据中心IT资源的集中共享和统一调度,能够有效提高IT资源的利用率,将传统数据中心的资源利用率从10%~20%提升至50%~60%,相当于增加了3~5倍的资源量。3.2资源池化资源池化的过程,也是资源标准化的过程,在隐匿了各种异构IT设备纷繁复杂的品牌及规格的差异,以统一的逻辑形式提供客户的过程中,对资源进行逻辑分类和分组。三个资源池,服务器资源池,存储资源池、网络资源池均可以依据其硬件的特性,划分成不同服务等级(SLA)的资源池组,提供给不同业务需求的用户。IT硬件设备在虚拟化之后,标记上特定性能标签,进入不同的资源组,完成池化的过程。服务器资源池主要是基于x86服务器的资源池。构建服务器资源池,x86服务器的选型要从投资成本、机架建设(机房空间和供电、耗电、管理)等方面来考虑。从投资成本上说,由于服务器处理能力按摩尔定律发展,因此不建议采购最新、性能最强的处理器,因为其性价比最低。从机架建设上说,由于机房机架建设成本较高,在满足处理能力需求的同时,需尽量考虑节省机架空间。x86服务器主要分为刀片式服务器和机架式服务器两种技术阵营。无论是那种服务器,在处理器性能、内存容量、I/O、磁盘读写速度四个方面,虚拟化应用对其都有很大的影响。这四个因素在影响虚拟化业务应用中,刀片服务器在处理器和内存容量方面,性能配置稍低于机架式服务器。在磁盘读写速度方面,两者基本相当。在I/O瓶颈方面,针对虚拟化引发的I/O瓶颈,机架式服务器的应对方法就是利用PCI-E插槽进行I/O行扩展,而刀片服务器由于是高集成度设计,使得其I/O扩展受限制,需要采用专用的网卡以及各种HBA,但都要占用扩展插槽。所以,刀片服务器又提供了支持PCIE/PCIX的PCI扩展模块,它占用刀片模块的相邻槽位,为刀片模块提供扩展,实际占用了刀片服务器机框的槽位,降低了刀片服务器的密度。但刀片服务器具有节省机架空间、节省接入交换机和光纤交换机端口的优势。具体选择刀片服务器,还是机架式服务器,需结合机房的具体情况进行选择。存储资源池的构建,除了考虑存储容量,还需要考虑是FCSAN网络所需的HBA卡的端口数量和IP网络所需的网卡的端口数量是否满足业务的需求。网络资源池的构建,则是要考虑进口链路的带宽和出口链路的带宽是否够用,HBA卡及端口数量,IP网卡及端口数量,安全设备的端口数量及带宽是否足够。3.3自动化逻辑化和标准化之后,所有的IT资源都可以按照预定的程序进行处理。数据中心的所有任务,无论是业务任务还是IT任务,均可以使用基于SOA的流程管理工具,进行统一IT编排。可编程的工作流程工具将工作流程、流程的执行逻辑从资产解耦/抽象出来。利用IT编排工具,允许系统设计师修改工作流程(包括调用和管理并行任务)、插入新的工作流程步骤,或者通过可重用的适配器修改资产,一切无需从头开始,服务自动化变成更加经济、更加可行的选择。IT资源的虚拟化和池化使企业某个应用所拥有的计算能力、存储空间、网络带宽及链路选择不再是一成不变,而是一个动态的基础设施。为更好地发挥动态基础架构的优势,在虚拟化平台之上企业还需要一套灵活动态的基础设施管理工具。从虚拟化到资源池化,再到自动化,实现了传统数据中心的云化的完整过程。4云数据中心安全防护在数据中心云化的过程中,我们结合云计算技术特点对云数据中心安全防护建设的给出几点建议。1)时刻注重对虚拟化的支持。由于适用于网络环境下的多租户,并可将其隔离。所以,不论是为满足不同用户的需求,还是为保证数据安全,虚拟化都不错的选择。为此,对虚拟化的支持,在云数据中心的安全防护体系建设过程中是十分重要的。2)建设统一安全威胁防护系统。由于云数据中心的资源高度整合,实际上的安全边界已难以区分,用户也不可能单独部署独立的安全防御体系。为此,我们要基于整个系统,建设统一安全威胁防护系统,保护数据资源的安全。3)建立快速的安全风险反应机制。在云数据中心的安全建设中,我们要充分利用云计算强大的运算能力和资源共享能力,建立快速的安全风险反应和处置机制,及时对安全威胁进行解析并提供处置措施,提升数据中心安全性。5云数据中心管理平台为达到更好的发挥动态基础架构的优势,云数据中心要具有灵活动态的基础实施管理工具云管理平台,实现动态的基础设施资源监控、资产管理、流程自动化管理、基于ITIL的运维管理、安全管理等。云管理平台是一个综合性的对云数据中心进行管理的工具,有各种商业化的产品,比如IBM的ISDM、VMware的vCenter、BMC的CLM、DELL的VIS等等。开源的云管理平台,有Openstack、Eucalyptus等成熟的平台可供企业用户依据自身的需求进行选择。但任何一家商业化的产品也不可能涵盖各类客户的所有的管理内容。所以,一种低成本高效率,并且灵活性高的工具利用方式,可以考虑采纳一种开源云管理平台(比如OpenStack)为基础,集成多种开源产品,构建云数据中心的完整集成管理平台的做法。比如可利用开源Cacti结合开源监测工具RRDtool,提供云数据中心健康状况的实时图形与视觉提示;利用开源Nagios提供基础架构和容量规划工具;利用Cfengine进行配置管理;利用OpenNMS监控网络性能等等。动态监控模块主要是用来有效地检测瓶颈和潜在故障、主动监控关键系统资源以及自动响应事件,帮助管理关键的业务应用。通过监控和识别问题,可以在用户体验到明显的性能影响之前迅速纠正问题,提供解决基础架构问题的最佳做法。动态IT基础架构使IT资源在逻辑上动态共享,IT资源部署会随着应用系统的负载情况动态调整,进而提高资产利用率,同时增加应用系统的可用性。为了更好地发挥IT资源的作用,支撑业务应用系统,功能完善的IT资产配置管理数据库作为统一的IT资产配置信息管理平台,负责存放标准化配置信息和资产间关系信息,通过发现IT资源、配置信息、以及不同种类资产间的相互关系,支撑管理流程的实施,并对资产配置信息及关系信息合理分类和建模,以帮助数据中心建立规范化流程来控制配置变更。面向业务的IT运维管理,首先通过对业务数据进行分析,得到各个业务服务的结构及其相互关系。然后对服务依赖关系进行建模,得到服务模型。通过对关键运维指标进行量化,制定出详细的考核指标体系,包括影响考核指标的不同业务规则。对业务模型和运维指标进行虚拟化,实现对服务状态的可视化管理。最后,通过集成广泛的事件,实时的更新业务状态,从而及时的追踪关键业务服务和关键运维指标。云数据中心比传统数据中心大得多的规模复杂程度高。必须通过全新的管理架构和方式来掌控云数据中心的运营。同时,需要提供完整全面的数据保护和提供快速的恢复能力。6云数据中心的运维三分技术,七分管理。如果说,云数据中心的建设主要是个技术实现的过程,那么云数据中心的运维则主要是一个管理实现的过程。云数据中心的建设仅仅是开端,使得数据中心成为云数据中心的根本其实是高效的运维管理。运维对象是云数据中心运维管理的目标对象,主要包括机房环境基础设施、提供IT服务过程中所应用的各种设备、系统软件与数据、管理工具和数据中心所有相关人员。相对于传统数据中心,云数据中心的运维管理的效率、灵活性、复杂程度和管理规模都同以往大大不同。数据中心的云计算服务要求更高的效率和灵活性,传统基于人工的工作和过程无法有效的统一管理数据中心的资源,而实现资源池的快速分配和无用资源的回收则更是无法实现。针对云数据中心不同于传统数据中心的新需求,我们依据信息技术基础架构库(informationtechnologyinfrastructurelibrary,ITIL)给出了一个比较好的管理框架,即所谓的4PS来管理云数据中心。依据及借鉴ITIL运维管理框架,除了4P,增加SLA/合同和持续改进两项,明确服务的度量指标,建立符合PDCA原则的持续改进管理体系。运维管理的持续改进可以不断螺旋式上升地提高管理水平,同时也可以提高满足客户需求的能力,向客户提供更好的服务。相对于传统数据中心1∶40的人员服务器比率,云数据中心可达到1∶1500的人员服务器比率。相对于服务器的数量,运维人员大幅减少,自动化程度大幅提高。7小结云数据中心的构建与实施,将大大改善企业的信息系统基础设施运行和管理现状,为企业信息化的发展提供巨大的助力。私有云IaaS是P