1数据中心监控管理解决方案机房设备监控IT核心业务系统监控智能楼宇综合监控数据中心节能一、共济机房监控系统特征1、功能全面、集中监控:要求能覆盖到机房动力、环境、安全、微环境、IT设施等各种对象的监控系统,必须是集中监控,具备高整合度;2、稳定可靠:整体系统具备分布式结构,各部件功能清晰;现场处理单元采用嵌入式设备,无硬盘、风扇设计,避免机械故障,具有跨平台能力;具备双机热备的高可靠性设计;3、融合管理:具有应对各种层面的管理,有效的帮助机房管理,提高效率;例如:系统需具备排班管理工具、智能报警工具、丰富的数据分析工具、逻辑联动工具、运维快速指引工具、集中监管平台等;4、适应企业的长期发展:采用了通用标准接口,具备有优秀的数据开放性和拓展性,需求变化时可以方便的扩容和更改系统,为日后ITIL的发展充分考虑;系统还应具备有在线扩展的能力,升级、扩容、变更时不需要停止系统,最大程度保障稳定性。二、数据中心监控管理现状2数据中心监控管理新需求要求厂家具有专业的自主软件和硬件开发制造能力要求厂家具有提供标准的、一体化成套设备的能力要求厂家具有快速升级设备的能力要求厂家具有快速定制软件系统的能力要求厂家能提供模块式的软件开发接口,原代码和协议要求集成商和厂家具有丰富的机房设备维护和网络经验要求集成商和厂家快速响应用户变化的需求要求工程商规范、标准、快速的实施项目要求系统的操作简单、明了,工作稳定要求用户充分认识到机房安全的重要性要求用户积极参与到系统的方案设计中来三、数据中心监控管理建设所需新技术嵌入式、纯IP化、免维护网络化、数字化、智能数据分析分布式(分散式)节点设置、集中综合管理平台B/S架构、C/S架构混合集成、大型关系数据库、预警报警管理开放式网络结构、多数据流冗余技术、主从数据服务器.NET、JAVA技术、嵌入式OS技术、SOC应用技术、网络、路由、交换技术、多种数据协议解析技术3四、共济系统架构采用分布式架构,每个嵌入式服务器可以脱网独立运行数据采集,视频录像,数据存储,设备联动,设备报警;4硬件特点稳定的嵌入式服务器,充分保障分布的机房管理可靠性;采用低功耗硬件,适应各种恶劣环境;内置软硬件看门狗,保证系统有完善的自检测和自恢复功能;稳定的管理服务器通过双机热备冗余,保障上级管理平台的稳定运行。软件架构服务器采用嵌入式操作系统,可免除病毒干扰;各系统功能模块均采用插件的形式,各个功能模块相互独立,任何功能模块出现故障不会影响到其他功能的正常运行。五、监控对象及内容5六、系统监控内容1.机房动力监控共济机房监控系统对市电电量参数、配电开关状态、UPS运行状态和参数、蓄电池参数、STS/ATS运行状态、电源防雷器状态等各级供配电质量进行分析及对配套设施进行全面实时监测,保证系统用电连续、稳定。系统还可提供智能照明管理,满足节能及警情照明联动需要。62场地环境监控对于放置了大量精密设备的计算机机房来说,稳定安全的场地环境异常重要。一旦空调等环境保障设备出现故障,将严重影响IT设备的运行。共济机房监控管理系统可监测机房内的温湿度参数、空调(含精密空调与普通空调)运行状态及参数、运行风机状态、漏水状态等,可设置必要的调控逻辑自动或由管理人员远程人工控制设备启停和调整运行方式,确保机房在稳定安全的环境中运行。73机柜微环境监控在机柜狭小的空间内所放置的设备日渐密集,形成机柜微环境与机房大环境之间存在明显差距。如果机柜内温度过高,极容易造成机柜内放置的设备出现故障。同时,对于某些放置重要设备的机柜,也需对其微环境进行监控,确保对其运行过程的全面监测和安全管理,保障最核心设备的稳定运行。共济机房监控系统可监测机柜内的温湿度参数、PDU电源运行状态、机柜门开关状态、附近人员活动情况等,还可实现对重要机柜的独立门禁管理和视频监控,确保核心设备在最优化、最安全的环境中运行。4场地安全监控共济机房监控系统可提供门禁出入管理、防盗监控、音视频监控、消防监控等整体安防解决方案,确保机房的场地安全。门禁出入管理利用行业内最先进的诸如虹膜识别、掌纹识别、指纹识别、ID卡识别等尖端技术,对机房的主要出入口进行严密的权限管理。系统具有双门互锁、远程管理、球机联动自动跟踪、消防联动自动开门、防盗联动自动闭锁、开关门联动灯光开关节能等高端功能,确保机房场地的安全。门禁系统还可扩展用于单位人事考勤。8防盗监控实时监测进入防区的人员活动情况,具有防区划分、自动布撤防、警情准确定位、联动摄像机自动拍摄、门禁自动闭锁等功能。一旦有非法侵入,能准确掌握犯罪分子动态,协助有关人员及时处理。音视频监控利用数字化媒体流技术对机房进行直观的图象和声音监控。管理人员可以采取远程浏览、多画面切换、回放等方式随时掌握音视频信息,了解人员活动情况,实施监控管理。消防监控在机房发生火警时,能实时报警,同时自动联动切断电源,打开所有逃生通道门锁,启动排烟机、摄像机等,配合进行应急处理。95IT核心业务监控系统硬件监控实现对服务器硬件、网络设备(路由器、交换机)、安全设备(防火墙、网闸、IPS、IDS)、存储及负载均衡等IT系统硬件资源的监控。服务器的硬盘、网卡、内存的好坏直接影响到服务器的可用性,通过对硬盘、网卡、内存等部件好坏的性能指标监测,运维人员可实时了解服务器各部件的可用性,当服务器异常后,可以直接定位到出问题的具体部件。实现对网络设备、网络安全设备的在线状态可用性、CPU利用率、内存使用率及设备日志等关键性能指标的监控。10系统监控IT核心业务监控系统对各种类型操作系统、中间件、数据库及业务等系统资源实现全方位监控。操作系统监控支持所有类型操作系统的监控,如Windows系列、Linux系列及UNIX系列等。通过对服务器的CPU使用率、内存大小、磁盘使用情况等性能指标,关键进程的状态、服务器提供服务的状态及服务器的日志信息等指标进行监控且任意灵活组合关注指标,在一个界面中实时全面展现服务器的运行情况。发生异常时及时报警,避免服务器宕机或磁盘空间不足等重大问题的发生。中间件监控支持Tuxedo、MQ、CICS、WebSphere、WebLogic、TongLink等各种中间件的监控。如可监控MQ中间件队列的数量、每个队列消息阻塞的数量;监控CICS中间件客户端的连接数、每个连接的名字及服务端的状态。数据库监控支持Oracle、Sql-server、MySql、Informix、domino、Sybase、DB2等多种数据库的监控。数据库的运行状态,数据库服务主要进程的状态、CPU使用率和内存大小,数据库表空间利用率,日志空间利用率及指定SQL语句的执行情况等性能指标是反映一个数据库整体运行是否健康的重要指标。例如:可监控Oracle数据库的进程有无及关键参数(CPU使用率、内存大小、)、表空间利用率、SGA命中率(CACHE失败率、命中率、重装比率等)、Session状态(系统用户数、系统占用率)、Oracle执行的SQL、Oracle日志、Oracle的SGA大小等指标。业务应用监控通过定制来满足日益个性的业务需求。包括对业务应用系统的配置、状态、性能和安全实施全方位的监控和管理。安全检查对于金融行业及其它安全级别要求较高的企业、政府,需要通过实时监控每一台服务器的运行情况,检查是否存在与自身安全规范不符的操作及配置信息。如果发现存在违规配置信息或违规操作的服务器,通过实时发送报警信息来保障信息的安全性。基于WINDOWS操作系统的服务器检查WINDOWS是否启用系统自身的安全机制,是否关闭了不需要的服务,是否对网络实现了安全控制等。如可以检查操作系统补丁信息、注册表配置信息、关键服务与关键业务应用程序监测。基于AIX操作系统的小型机侵入一个用户帐号通常是一个攻击者获得系统访问权限的最简单方式,帐号安全是AIX系统安全的“外层”之一,因此应对设置帐号及口令的配置文件进行重点检查;如检查11帐号及用户组设置是否合理,帐号是否有密码,密码是否定期修改等。6节能控制测、管、控一体化数据中心(IDC)能耗监测及智能节能控制系统基于集测、管、控一体化的整体考虑、全面节能的模式来实现节能减排。结束机房中各设备“各自为政”的局面,使他们被统一的管理和调度起来。七、产品功能介绍管理工具排班管理:该工具能自动设置、调整值班表、班次,并通过短信、EMAIL提醒值班人员到岗,大幅度地减少了人员工作量,提高排班过程管理的效率。数据分析:定时记录机房设备的进行数据,以多种图形(曲线图、柱状图、扇形图)方式反应出来,并可以日、周、月、季、年报统计数据报表。该工具能清晰地反应各控制点状态,方便机房管理人员及时决策和处理。逻辑联动:将各个独立的子系统相互联动起来,能快速调出、查看故障信息,该工具不需要编程,只需在图形化的界面中进行简单设置即可完成,极大的明高了可操作性。运维指引:该工具提供常见问题应急处理方案,检测故障时能自动调用生成派单进行规范指引,延缓事故发生时间。业务角度对IT系统实施监控根据IT业务应用监控个性化程度高的特点,对业务监控采用按需定制并整合到平台的模式;实现对用户关注的关键性能指标的监控,帮助用户解决棘手的问题。平台化工具支撑快速变化的需求对已实施监控的对象,可根据监控平台自带的智能化匹配工具,用户自行快速匹配监控指标来满足各种新需求。对于新的业务需求,用户可自定义脚本实现与监控平台的无缝对接,来满足新增个性化需求的监控。12而这一切体现出了基于工具化平台的灵活性与实用性,保护了用户的投资。沉淀运维经验,降低运维门槛针对发生问题比较频繁及用户关注的性能指标,可以提前定义出现问题的处理建议,一旦监控指标超过报警阀值而报警,运维人员可以根据处理建议进行处理,解决了运维岗位人员变动导致运维经验流失严重的问题;同时,缓解了专家太少与问题太多之间的矛盾,降低了运维门槛。长期规划与可扩展性标准化集成技术:C语言、OPC、SNMP、DDE、IP网络技术、组态技术、Web技术„„在线式快速扩容能力:预留ITIL、ERP接口,在线式监控对象、网点扩容„„双机冗余热备当机房监控系统应用在大型数据中心和联网机房项目中时,必定要监控管理大量的设备和系统,同时也会具有很多数据分析、报警、联动等管理功能,如果监控系统出现问题,数据中心的管理将回到原始的纯人工管理模式,配备的员短时间内是无法满足管理要求的,如果IT系统出现问题,带来的损失将不可估量,所以,大型数据中心的监控系统必须考虑高可靠性设计,建设具有冗余热备的监控系统,最大程度保障其稳定性。共济科技可提供全系统的冗余热备机房产品,一般是在应用层使用双机热备冗余的设计,可以通过多架设一台管理服务器接入网络,同时增加集中监控软件(配套的报警设备、管理工具都需多配置一套)实现双机冗余热备。考虑到机房内都是一些重要的设备,一旦监控服务器发生故障后无法实时对机房内的设备进行监控,管理人员无法第一时间掌握情况,后果会比较严重。监控系统支持双机冗余热备管理,即为系统架设两台服务器,分为主服务器和备份服务器,当主服务器出现故障13时,可以由备份服务器快速自动接替主服务器任务,从而在不需人工干预的情况下,自动保证系统能持续提供服务,最大程度上保障了系统的稳定性。正常运行情况下主服务器从设备获取监控数据,而备份服务器从主服务器获取所有数据,两机互为备份。故障恢复后备机将故障期间设备的监控数据上传至主服务器,确保备份服务器与主服务器之间数据同步。报警管理1、分级报警根据监控对象的重要等级设置不同的报警级别,并采用不同的报警方式,发送给各个层级的管理人员。2、分区报警可按区域的管理权限分配报警。3、分时间报警可按排班,将不同时间段发生的警情,发送给不同的值班人4、分职能报警可将不同系统的报警发送给不同的管理人员。排班管理共济机房监控系统具有智能化排班功能,可根据预先设置的规则自动调整值班班次、实现自动通知管理人员值班、值班情况考勤管理等功能。如与报警系统进行关联,还可以针对值班顺序作相应的报警发送,避免发生报警骚扰。报表管理共济机房监控系统具有高效的数据记录和分析功能