采油三厂云中心建设及应用完成单位:技术指导人:姚伟明项目负责人:宁莹项目组成员:宁莹李化斌李录兵张晓莉周维琴审核:中国石油天然气股份有限公司长庆油田分公司2017年12月12日成果简介一、成果背景银川生产指挥中心现有中心机房和备用机房2座,服务于生产、办公服务器74台,在用业务应用系统38个。原有中心已经使用很长时间,随着设备的老旧,机房运维成本越来越高,隐患也越来越多;同时IT设备面临服务器数量多、品牌杂,运行超年限,性能下降,脱保率高等问题,导致厂内每年在IT上面的固定投资及运维成本也很高。随着集团对数据安全、机房动力设备实施监控和油田开发的要求越来越高,数据积累又呈几何级增长,传统机房愈来愈不能满足现实的需求。通过创新性手段引入最先进的技术解决实际问题,是解决问题的有效手段。以云计算为核心的新型数据中心作为信息行业的创新应用模式,是新一代技术变革的核心。通过引入新型监控系统,搭建以云计算为核心的云中心,可以有效解决上述问题。基于以上背景,搭建以“中心机房动环监控系统”为依托的云计算虚拟平台,形成采油三厂云中心,在保证稳定性,降低成本的同时提高了效率。二、成果创新点以云计算为基础,通过虚拟化技术虚拟化技术进行整合,组建统一的服务器硬件虚拟化资源池,在实现资源复用提升。1.机房内安装18套高清视频监控设备,通过IP协议传输至NVR硬盘录像机,终端利用web访问将视频图像实时上传至管理员办公室,实现机房全天候实时监控。2.机房动力环境监控系统将空调、供配电、门禁、温湿度、漏水检测等重要指标参数进行整合。通过设定基础数值,实现高低限报警,以给管理员发送短信、管理员办公室声光报警两种形式告警,并通过实时数据分析、统计,监控系统将自动生成日报、月报功能。3.建立监控平台,直观显示空调、漏水、配电系统、UPS等动力、环境设备运行参数,实现机房运行状态在线监控。4.从云计算管理平台中可直观显示虚拟主机承载业务系统情况,以及每项业务系统运行状态,并可进行业务系统迁移或更改数据存储。三、应用效果有效提升运维效率,实现人员优化:通过现代化自动监测和科学管理以及机房环监控系统,达到7×24×365的全面集中监控和管理,在保障机房环境及设备安全高效运行的同时实现机房无人值守。2.大幅度提升了系统稳定性和数据安全性,提高了资源利用率:通过利用云计算虚拟化技术、网络技术、数据共享存储技术,建成系统稳定、安全可靠、集中统一的云计算虚拟平台,达到降低业务中断频次,缩短系统部署周期,提升了数据存储的安全性。3.大幅度降低了CPEX(投资成本)和OPEX(运营成本):建成的云计算平台将扩展出较目前5倍以上的虚拟服务器,保障未来业务系统对服务器资源的使用需求;在经济效益上未来5年将节约服务器购置费30.4万,节约服务器维护成本费113万,年节约电费20余万元。4.标准化的产品和技术,可复制性强,可在集团各单位快速推广。目录一、机房建设及应用现状................................................................5二、云中心项目建设........................................................................7三、项目价值...................................................................................28采油三厂云中心项目建设及应用一、机房建设及应用现状1.1新型数据中心建设及应用现状随着社会的进步,目前传统的数据中心面临着两大问题,一是对于数据中心的监控系统来说,随着服务器数量的增加,运维人员成本的提升,传统的监控运维系统已经愈来愈不能满足现实的需求。二是服务器效率低下形成了计算资源的巨大浪费,存储的数据共享效率低,形成了存储资源的巨大浪费;数据中心扩容需要长时间宕机,影响正常的生产,且随着技术的不断变革,也不能满足企业日益提升的安全性要求。在此背景下,以云计算为核心的云中心应运而出。云中心包含两个方面,一个是运用新的技术和方案监控监测数据中心,可以降低运维成本,在减少人工支出基础之上加强对数据中心安全性的监测,另外依托云计算,另外是利用云计算虚拟化技术、网络技术、数据共享存储技术,建成系统稳定、安全可靠、集中统一的云计算虚拟平台。作为技术革命的核心,以现代监控系统和云计算为要点的云中心目前已经广泛应用到各行各业。而对于石油行业来说,目前美孚、壳牌等全球化的石油企业IT系统均已云化,而云化的IT系统则在方方面面帮助这些体力大力提升效率,降低运营成本。目前全球大部分先进企业均已根据自身的企业搭建新型云中心,不仅提升了效率降低了运维成本,也大大降低了数据安全的风险。1.2采油三厂中心机房建设及应用现状一是机房动力、环境设备作为机房设备运行的基础支撑,其良好的运行是保证机房计算机系统安全可靠运行的前提,一旦出现故障(如机房的温度、湿度过高、电力系统不稳定、机房安全措施不完善致使非核心工作人员进出机房操作等),很可能引发机房事故,导致不必要的经济损失。二是目前服务器维护工作面临品牌杂、脱保率高、硬件资源使用率低、服务器性能下降等问题。并且服务器存在大数据量存储空间、应用数据备份以及未来高扩展性等需求。1.3搭建云中心的必要性随着信息化技术的发展和全面应用,信息数据中心机房已成为第三采油厂正常运营的重要组成部分,计算机系统设备数量与日俱增,规模越来越大,为保证信息数据中心机房安全正常运行,与之配套的机房动力环境设备(如供配电、UPS、精密空调等)等系统必须时时刻刻为计算机系统提供正常的运行动力及运行环境。一旦机房动力环境设备出现故障,便会影响到计算机系统的运行,对数据处理、传输、存储以及整个系统运行的可靠性构成威胁,若机房动力及环境设备出现故障不能及时被发现,从而没有得到及时的处理,不但会影响整个单位业务系统的正常运行,而且会造成计算机和通信设备故障甚至报废,使系统陷入瘫痪,造成严重的后果和无法挽回的损失。尤其需要实时交换数据的单位的机房,一旦系统发生故障,造成的经济损失更是不可估量,因此,机房实时监控管理显得更为重要。目前机房采取管理人员24小时专人值班的方式,定时巡查机房各动力环境设备。但这样不仅加重了管理人员的负担,而且往往不能及时发现机房设备的运行故障(如供电电压异常、UPS或精密空调内部某部件故障)及机房环境的异常(如漏水、机房温度、湿度超标等),对事故发生时间、频率及原因等也无科学的管理与数据分析,从而造成故障得不到及时排查处理,这对机房的安全运行无疑又是一个不利因素。因此对信息数据中心机房的动力设备及环境情况进行实时的监控管理极其必要,特别是随着近年来国家出台了相关信息化建设的规定,数据中心综合管理系统已成为了信息数据中心机房系统中必不可少的一部分。采油三厂因为生产建设的不断高速发展,业务不断扩大,信息系统的复杂程度越来越高,同时业务服务器数量也在不断扩大,当前,采油三厂共有:生产指挥平台实时数据库、生产指挥平台中间数据库、后台数据库、数字化生产管理平台、静态数据系统、生产数据库、网络安全系统、视频转发系统、专项费用管理系统、采油工程报表等多个业务系统,约为40余台服务器。数量众多的服务器由多种品牌共同构成,且型号各异,具体有HP、IBM、Lenovo、CISCO、DELL等,维护起来较为复杂,工作量较大,且根据前期统计,服务器脱保率过高,达到90%左右,后期维护成本较大;服务器硬件资源使用率普遍较低,内存、CPU、硬盘使用率均值在40%左右,在一定程度上浪费了设备性能;由于全厂信息系统建设时间较早,所以现有服务器大多数运行时间过长,有些超过五年之久,致使部分硬件老化,服务器性能下降,为有效的解决上述问题,并在对现有资源的合理利用下,提出虚拟化云计算中心解决方案,加强我厂信息化的综合水平,建设采油三厂的大数据云计算中心。二、云中心项目建设2.1设计依据与原则从实际出发,在有限的预算下,追求最高的性能。监控系统严格按照“严格、合理、可靠、经济、完善”和“无人值班、少人值守”的要求进行设计,保证技术先进性,系统高可靠性,运行管理方便,同时可扩展能力强,模块化结构有利于扩容与扩展。适应监控数字化、网络化发展趋势,不落后,不重复投资;采用内部局域网或广域网通信和管理,更稳定安全。采用TCP/IP方式,被监控机房可以很容易地与监控管理中心及数据库建立起联系,用较低的成本对被监控机房的动力设备、机房环境等信息实施统一平台下的监控。监控主机采用采集、解析、传输和报警一体化设计,报警迅速,数据显示及时,数据记录完整,数据分析直观;系统以模块化设计,具有开放性,能灵活地组建各种规模的监控系统,与企业内部网络系统连接,不管是何种网络传输方式都能有机融合成一个整体,将是十分重要的。机房大小差异较大,要求设计的系统能适合各种实际情况,有较强的可扩性,能随时适应对系统的扩容要求。云计算虚拟平台设计上则需要整合信息化建设资源,充分利用现有设备及环境,对现有平台进行调整、升级和改造,满足我厂应用需要。具体包括:采用云计算技术,结合创新建设模式,搭建标准统一、功能完善、系统稳定、安全可靠、纵横互通、集中统一的云计算平台,为各部门信息资源共享、数据交换和系统办公提供良好的支撑。通过建设云计算平台,方便未来将新增应用快速部署到云计算平台上,大大缩短新IT系统的上线时间,预期将节省设备30%,节约能耗50%。解决“信息孤岛”,实现信息共享,提高信息安全水平,提升监控能力和响应速度,提高工作效率,从而为全厂提供更为高效的信息服务。通过降低成本、提升效率、节能减排,满足我厂要贯彻落实科学发展观,转变发展模式的需要。满足在云计算平台上搭建应用系统的需要,包括以三层架构为主的应用系统,以及大访问量的应用系统、大数据处理量的应用系统以及大计算量的应用系统。2.3项目设计内容2.3.1监控系统设计内容根据生产建设发展需要,对机房进行动力环境集中监控,统一监测,一旦出现异常情况,需要第一时间通知系统管理人员,及时告警,及时排除隐患和故障,保障系统正常,使损失降到最低限度。项目的建设内容为:1.机房温湿度监测:安装温湿度传感器,监控机房温湿度情况。2.消防漏水监测:消防监测包括烟感监测,机房内配置烟感烟感探头;漏水监测通过漏水检测系监视空调漏水和窗户漏水。3.UPS监测:监测机房内UPS关键数据指标。4.电压监测:监测机房内电压。5.空调监测:监测空调运行状况,对普通空调安装来电自启动功能。6.门禁监控:监测机房的进出。7.视频监控:通过视频监控机房内部情况。2.3.2虚拟平台设计内容针对采油三厂信息系统存在的问题以及需求,以充分保护现有投资为核心原则,展开对采油三厂云计算中心的全面建设。通过此次方案的部署,将会对采油三厂信息系统的存储层、网络层、计算层进行全面的融合和升级。解决方案分为四个部分:核心层、汇聚层、计算层、存储区域。核心层:以加强核心交换机的处理能力,提升用户网络访问质量,满足云计算中心对硬件资源的需求,对核心交换机进行升级,新采购一台数据中心级设备;汇聚层:汇聚层为服务器提供与内网的连接,实现了远程管理,及应用服务,此次汇聚层交换机将采用IRF虚拟化技术,将两台物理交换机虚拟为逻辑上的单台交换机,可以提高运行的可靠性以及运行效率;计算层:通过虚拟化技术,将现有十三台性能较好的服务器,通过虚拟化技术进行整合,构建为统一的硬件资源池,根据实际的业务需要,为不同虚拟机分配不同的硬件资源,实现业务的灵活搭建,以及高效的扩展能力,利用虚拟化专有的技术特性,保障平台上业务的安全、稳定、与可靠,消除物理机对应用系统的运行限制;存储区域:本方案将采用两台共享存储,并配备两台存储交换机,分别通过8GBFC接口实现互联,两台存储交换机与两台共享存储设备都采用1+1互为热备的方式。云计算虚拟平台设计图2.4项目系统技术概述2.4.1温(湿)度监测系统在重要的计算机机房中,设备对温(湿)度等