1/12EnterpriseCloudPlatform企业级云计算平台技术白皮书成都科诺德信息技术有限公司2011年7月01日2/121、适用场景随着企业信息化建设的深人,大部分企业都或多或少面临以下困惑:拥有大量的物理计算设备,但本身资源利用率较低,而新的信息系统又需要新的资源;一些信息所在物理设备老化无法满足业务需要,而迁移到新的设备上困难,既耗时又耗钱;设备管理分散,无法统一监控以及调配。EnterpriseCloudPlatform(简称ECP)采用开发式软件架构OSGI,它在云计算平台之上实现企业现有IT和服务提供商基础架构。其通过主机虚拟化,降低信息系统与硬件的耦合性;通过弹性效用计算架构以及智能调度优化并提升了资源利用率;并且对资源进行了统一监控以及调配。ECP对企业数据中心和没有特殊硬件要求的需求,ECP适合共有云和私有云的部署。ECP兼容多个Linux发行版,而且正在发展管理程序和虚拟化的各种技术。通过ECP,可以为企业按照自身所需构架IT基础设施提供了成本效率和可扩展性。2、产品定位目前,学术界和产业界对云计算技术的体系结构的认知逐步趋同,普遍认可云计算基础架构即服务(InfrastructureasaService,IaaS)、平台即服务(PlatformasaService,PaaS)、软件即服务(SoftwareasaService,SaaS)三层体系结构。基础架构即服务可以看作是硬件/操作系统层面的服务封装,平台即服务可以看作组件和中间件层面的服务封装,软件即服务可看作应用软件层面的服务封装。EnterpriseCloudPlatform(简称ECP)采用java技术以及OSGI架构,在云计算平台之上实现企业现有IT和服务提供商基础架构。ECP在当今的IT基础架构之上,利用Linux和REST技术,允许客户快速、轻松的创建适合他们特定应用需要的计算云。作为一个高度可用的云平台,企业ECP提供了许多高级功能,包括用户定制、自助服务供应、遗留应用程序支持、定制的“服务水平协议”(SLA)、监测、计量,以及自动缩放支持等。3产品介绍ECP云平台总体上分为三层体系架构,包括上层的云管理门户和底层的云资源控制服务,以及云主机。ECP采用先进OSGi的模块化设计开发,平台总体架构如图1所示。3/12ECP云计算管理门户虚拟机全生命周期管理物理机全生命管理多种创建方式支撑虚拟机个性化创建资源管理SLA在线资源动态调整弹性扩展智能调度基于REST的接口服务基于目录的实体认证与权限控制云安全服务基于数字证书的可信资源管理安全远程访问控制管理全面的安全审计管理基于REST的接口服务Ip资源管理虚拟机模板管理在线安装管理资源性能监控虚拟存储管理资源池管理VNC接入管理系统管理多数据中心管理基于VLAN的网络隔离保护……ECP云资源控制器规则引擎资源性能监控分布式解析引擎HA的实现支持省电策略调度网格资源管理智能调度资源均衡调度分布式事件机制多渠道通知机制资源控制适配机制预警模块ECP云资源控制器云主机云操作系统虚拟化技术AgentWindowsLinux其他应用云主机云操作系统虚拟化技术AgentWindowsLinux其他应用……分布式解析引擎云主机Agent虚拟化适配器服务性能监控存储——应用镜像需要存在存储上应用1应用2应用3资源池图1ECP云平台总体逻辑架构3.1ECP云计算管理门户云计算管理门户采用B/S架构,通过REST接口与云资源控制服务集成,实现对云平台管理的各种计算资源的全生命周期监控管理,主要功能包括虚拟机管理、物理机管理、服务等级协议(SLA)、系统管理、智能调度、资源池管理等,功能架构如图2所示。云管理门户物理机全生命周期管理系统管理虚拟机全生命周期管理根据定制资源创建虚拟机根据定制资源变更虚拟机虚拟机启动/停止虚拟机备份/恢复个性化定制创建用户管理资源角色权限管理日志管理SLA虚拟机挂起/激活VNC远程控制物理机启动/停止物理机性能监控资源ACL控制智能调度资源均衡模式省电模式弹性扩充资源池管理物理资源管理存储资源管理虚拟机模板管理模板在线安装安全组控制虚拟机性能监控HA管理物理机镜像服务IP与分组管理图2ECP云管理门户功能结构服务等级协议(SLA):为用户提供不同需求的资源服务。云用户根据自身业务需求定制相关的虚拟资源配置,如CPU数量、内存容量、磁盘容量、网卡数量等。也可以直接按资源需求定制和发布应用服务。定制申请提交后由云管理员来创建虚拟资源或发布应用服务。同时用户可按不同的服务等级定制额外的应用监控及弹性扩4/12展服务,以提高应用运行的可靠性。虚拟机管理:用于维护整个云平台中的虚拟机服务器资源。这些操作包括对虚拟机服务器的个性化定制创建,对虚拟机服务器的启停,对虚拟机服务器的挂起与激活、对虚拟机服务器的备份和恢复、对虚拟机服务器的迁移,对虚拟机服务器的VNC远程控制以及对虚拟机服务器的性能监控。物理机管理:用于维护整个云平台中的物理服务器资源。模块包括物理服务器资源的启停,物理服务器资源的性能监控,物理服务器的智能化发现与加入以及对物理服务器的移除。智能调度管理:通过该模块对整个云计算平台会根据资源及应用监控数据通过分析及自定制策略自动地对虚拟资源及应用进行迁移或计算能力的扩充。资源管理:该模块包括了物力资源管理、存储管理、虚拟机模板管理、安全组和IP与分组管理、资源池管理,是实现整个云平台的高可用性的重点。系统管理:对平台本身的管理,模块包括用户管理、角色权限管理、日志管理、资源ACL控制等功能。用户管理和角色权限管理共同承担了云平台的用户权限管理。日志管理用于记录平台的各类日志信息。资源ACL控制用于根据实际情况配置管理控制节点应用中的页面资源。3.2ECP云资源控制服务ECP云资源控制服务是基于Agent技术对云平台物理层各种资源(物理服务器、存储、网络)进行调度控制管理,ECP云资源控制服务将不同应用场景的资源组合成不同特殊的资源池进行控制,这个系统将采用OSGI组件式架构,其Agent可根据场景的需要进行热插拔部署,是ECP云平台系统的核心关键组件,其技术特色如下:采用libvirt标准接口,可接入KVM,XEN等虚拟化技术,不同于其他商业或者开源的云计算解决方案,SkyController支持preload以及thinprovision多种虚拟机运行模式,虚拟机可存于本地或者存储上,并采用LVM进行存储管理,比传统的文件系统方式在效率上提高很多。采用OSGI组件式架构,其运行的组件可实现真正意义上的热插拔部署。采用多种缓存技术例如内存数据库等,可支持1000台物理机的管理以及调度。提供全开发式分布式脚本开发环境,其内嵌了Python解析引擎,并构建了Job——Joblet方式的分布计算模式,结合web方式编辑界面,调试跟踪界面,可实现资源调度控制在线定制。内嵌了基于策略的调度引擎,可根据各种动态需求:内存需求,cpu需求,IO需求等,将虚拟资源均衡的调度运行在合适的物理资源上,确保了资源可靠运行。管理员可根据实际需求定制各种不同的策略文件(police文件),策略引擎动态载入策略文件,从而实现调度的优化。提供弹性扩展接口,根据在管理门户中用户定制的策略需求,全方位协调资源调度,实现了真正意义上的资源按需分配。提供省电策略调度:结合弹性扩展策略,在虚拟资源需求较多的时候,启动相应的物理资源支撑运行,当虚拟资源需求较少的时候,停止相应的物理资源,确保资源的浪费,从而节省了能耗。5/12实现独特的HA机制:快速恢复,物理机宕机后,1分钟内在其他物理机上恢复虚拟机运行;超大规模,可支持几百台同时构成HA群;支持“全恢复模式”(实时记录了各个资源运行状态,即使所用物理机因异常情况全部宕机,在依次重启后,可自动恢复到宕机前状态)。3.3系统安全架构ECP企业级云计算平台的云安全服务贯穿云计算管理门户和云资源控制服务,提供对云平台的4A安全管理,主要功能包括基于LDAP目录的实体认证与权限控制、基于数字证书的可信资源管理、安全远程访问控制管理、全面的安全审计管理、基于VLAN的网络隔离保护机制。基于目录的资源认证:整个云计算平台将建立基于目录的认证中心。无论是管理平台还是调度服务,虚拟化资源和物理资源的访问都需要通过目录进行身份认证以及授权。基于目录的身份认证:系统中的用户直接关联到目录用户,用户通过登录界面进行登录,系统自动关联目录进行验证,并且根据目录自身访问控制权限(ACL)来管理系统用户权限。通过目录系统的高安全性,实现系统的高安全性管理。全方面的审计机制:整个云计算平台将建立云计算的包括管理,调度,以及虚拟资源等日志审计体制,做到在云计算下的任何动作都留下痕迹。基于数字证书的可信资源管理:任何物理服务器加入到云计算,必须先到调度服务用所颁发的电子证书进行认证。安全远程访问机制:其远程访问是采用目录集成进行身份论证,并结合防火墙技术对远程访问进行集中管理。基于VLAN的网络隔离保护机制:系统采用安全组方式对业务应用进行网段式隔离,通过基于VLAN的安全组策略,有效防止网络攻击。3.4系统物理部署架构ECP云平台总体部署架构及其与其它云平台产品的部署关系如图3所示。6/12存储1存储2云存储服务器群其他(VCenter,PSO,RHC2)云资源控制服务云资源控制服务数据中心1云计算管理门户数据中心2数据中心3VmWareKVMVmWareVmWareKVMKVM通讯VtoVXENXENXEN通讯VtoV存储1存储2云存储存储1存储2云存储用户门户(申请,使用,监控,统计)云交互管理云交互云交互图3ECP云平台总体部署架构及与其它云平台的部署关系ECP云平台采用应用网、管理网、存储网三网结构,均为千兆以太网,为了确保各处对云平台的访问性能,中心核心交换机的带宽应为千兆,每个对外提供服务的云主机都需要一个静态IP地址,基于ECP云平台构建的云计算环境如图4所示。图4ECP云平台典型物理架构4、产品功能演示4.1云管理门户演示首页门户7/12物理机管理物理机监控8/12虚拟机管理虚拟机远程访问9/12在线安装4.2云资源控制服务资源池以及物理机10/12分布式解析引擎——job编辑——Job运行监控11/12——规则配置——软件库管理下午13:00—17:00度。全体员工都必须自觉遵守工作时间,实行不定时工作制的员工不必打卡。3.1.2.2打卡次数:一日两次,即早上上班打卡一次,下午下班打卡一次。3.1.2.3打卡时间:打卡时间为上班到岗时间和下班离岗时间;3.1.2.4因公外出不能打卡:因公外出不能打卡应填写《外勤登记表》,注明外出日期、事由、外勤起止时间。因公外出需事先申请,如因特殊情况不能事先申请,应在事毕到岗当日完成申请、审批手续,否则按旷工处理。因停电、卡钟(工卡)故障未打卡的员工,上班前、下班后要及时到部门考勤员处填写《未打卡补签申请表》,由直接主管签字证明当日的出勤状况,报部门经理、人力资源部批准后,月底由部门考勤员据此上报考勤。上述情况考勤由各部门或分公司和项目文员协助人力资源部进行管理。3.1.2.5手工考勤制度3.1.2.6手工考勤制申请:由于工作性质,员工无法正常打卡(如外围人员、出差),可由各部门提出人员名单,经主管副总批准后,报人力资源部审批备案。3.1.2.7参与手工考勤的员工,需由其主管部门的部门考勤员(文员)或部门指定人员进行考勤管理,并于每月26日前向人力资源部递交考勤报表。3.1.2.8参与手工考勤的员工如有请假情况发生,应遵守相关请、休假制度,如实填报相关表单。3.1.2.9外派员工在外派工作期间的考勤,需在外派公司打卡记录;如遇中途出差,持出差证明,出差期间的考勤在出差地所在公司打卡记录;3.2加班管理3.2.1定义加班是指员工在节假日或公司规定的休息日仍照常工作的情况。A.现场管理人员和劳务人员的加班应严格控制,各部门应按月工时标准,合理安排工作班次。部门经理要严格审批员