InspurSSMV6.0R2业务监控中心-产品白皮书2012.6北京浪潮嘉信计算机信息技术有限公司InspurSSMV6.0R2产品白皮书声明本资料著作权属北京浪潮嘉信计算机信息技术有限公司所有。未经本公司书面许可,任何单位或个人不得以任何方式摘录、复制或翻译,并不得以任何形式传播。是北京浪潮嘉信计算机信息技术有限公司的注册商标。在本手册中出现的其他公司的商标、产品标识及商品名称,由各自权利人拥有。本手册仅作为使用指导,本手册中的所有陈述、信息和建议不构成任何明示或暗示的担保。技术支持热线电话:010-82581198邮箱:wangjiaqing@inspur.com公司网址:产品白皮书前言北京浪潮嘉信计算机信息技术有限公司自主研发的业务监控系统(InspurSSM)定位于对网络中的应用服务、网络设备、安全设备以及基础支撑系统的运行状况的监测、性能的管理以及故障的监控。它通过持续对各项资源运行状况的监控,建立性能基线,发现系统中的异常并且及时告警;有效提高了各类资源运行维护的工作效率和服务质量,保障企业的综合信息平台健康有序运行。《InspurSSMV6.0R2产品白皮书》主要针对SSM的产品架构、产品功能与产品特点进行介绍,是公司对外宣传与技术人员了解InspurSSMV6.0R2产品的最佳技术参考资料。内容说明《InspurSSMV6.0R2技术白皮书》全书共分为6章。章节概要第1章市场背景产品推出的市场背景说明。第2章产品介绍产品总体介绍。第3章产品架构产品的系统、技术、部署架构说明。第4章产品功能产品的主要功能、技术优势总结。第5章产品特点产品主要特点第6章运行环境与要求产品的运行要求本书约定介绍符号的约定、键盘操作约定、鼠标操作约定。符号约定带尖括号“<>”表示键名、按钮及操作员从终端输入的信息;带方括号“[]”表示人机界面、菜单项、数据表和字段名等,多级菜单用“→”隔开。如[开始→程序→Word2003]表示[开始]菜单栏下的[程序]子菜单下的[Word2003]菜单项。键盘操作约定格式意义加尖括号的字符表示键名、按钮名。如<Enter>、<Tab>、<a>等分别表示回车、制表、小写字母a。<键1+键2>表示在键盘上同时按下几个键。如<Ctrl+Alt+A>表示同时按下<Ctrl>、<Alt>、<A>这三个键。InspurSSMV6.0R2产品白皮书<键1,键2>表示先按第一键,释放,再按第二键。如<Alt,F>表示先按<Alt>键,释放后,紧接着再按<F>键。鼠标操作约定格式意义单击快速按下并释放鼠标左键。双击连续两次快速按下并释放鼠标左键。右击快速按下并释放鼠标右键。拖动按住鼠标左键不放,移动鼠标。InspurSSMV6.0R2产品白皮书1.市场背景企业IT系统越来越多,网络、设备和产品越来越复杂,企业的各项经营活动越来越依赖于稳定可靠的业务应用系统的支撑。面对着复杂多样的IT网络和业务支撑系统,信息部门面临着诸多挑战:如何最大程度的提前发现和改善IT系统中的不稳定因素?如何满足信息部门复杂的IT资源不同层面的监控和管理需求?如何从业务角度提高质量,保证业务使用部门的满足度?如何实现IT资产和运行情况的统一管理分析,为IT系统建设提供量化的决策依据?......作为北京浪潮嘉信SSM产品系列中的业务管理产品,InspurSSM应运而生。2.产品介绍浪潮嘉信凭借多年的相关软件开发和实施经验,结合国内管理实际情况,并在充分吸收国外先进网络管理理论的基础上,研制开发出了SSMIT运维管理平台。部署该平台将帮助用户及时的发现IT系统运行中所存在的问题,做到异常事件早发现、早解决,既提高了信息系统的运行效率,又增强了企业的故障应急处理能力。面对用户日益复杂的IT环境,SSMIT运维管理平台将以往对网络、服务器与业务应用、安全设备、客户端PC和机房基础环境等的分割管理进行了有效的整合,实现了全面监控与集中统一管理;并融入了基于ITIL理念的IT服务管理,实现了技术、功能、服务三方面的有机结合,从而提高了企业IT系统的运行管理水平和服务能力,为企业生产和日常办公提供高效、贴身的保障。InspurSSM作为SSM产品系列中的业务管理产品,全称应用监管系统,是浪潮嘉信在多年系统管理和服务经验积累之上,推出的第三代业务系统监控解决方案,定位于对应用服务、安全设备、网管系统、基础支撑系统等一系列资源的不间断监控,是一套能够对网络基础平台和业务支撑系统进行统一监控的业务监控管理平台。InspurSSM面向国内客户的业务环境和管理模式,加入了客户和市场迫切要求的重InspurSSMV6.0R2产品白皮书要特性,融合了国内外的监测技术发展趋势,可满足在复杂的IT环境下实施面向业务服务的监控需求。系统为客户提供直观、全面、多角度的视图,动态预测业务应用的发展,对影响正常运转的事件快速响应,帮助信息部门建立主动化管理模式,实现对IT资源和运维资源的高效管理,提升业务服务质量,从而保障IT信息系统的可持续性发展。图1SSM产品概念示意图InspurSSMV6.0R2产品白皮书3.产品架构3.1.产品系统架构图2InspurSSM系统架构图InspurSSM系统架构分为五层:基础资源层包含网络设备、服务器系统、数据库、中间件、基础应用平台、通用服务管理和基础运行环境等被监测资源。数据采集层数据采集层包含监测采集器、采集探针和监测数据接收几部分:监测采集器利用HTTP、SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等标准协议和各种业务系统专有协议实现远程监控和数据采集,同时也支持SSMUniAgent代理式监测采集被管资源的监测数据。InspurSSMV6.0R2产品白皮书监测采集器运行在采集探针(Probe)内,采集探针可以分布式部署,满足多个隔离子网和多级大规模IT环境监测的要求。监测数据接收模块接收各个采集探针上报的数据,并交由数据处理层统一处理。数据处理层性能数据经过整理、归并与挖掘处理,为上层提供可靠参考;同时故障数据经过过滤、压缩、归并与关联分析之后,产生告警信息与事件记录。业务模块层提供全面业务功能支撑,展现监测分析结果。监测配置:各类监测任务配置,监测调度和阈值管理。资源管理:面向资源监测与数据汇总。业务管理:业务应用与业务影响模型建模。业务拓扑:业务拓扑视图管理告警管理:智能告警处理与展现。统计分析:各类数据的统计和分析报表支撑。功能展现层用户接入方式与WEB客户端功能展现。3.2.产品关键技术InspurSSM的产品关键技术有:基于J2EE平台,B/S展现模式,采用先进的业务框架,良好的互操作性和扩展性,轻松实现跨平台部署。默认数据库为Oracle10g。内嵌WEB应用服务器,简化配置、优化性能、加固安全。支持监测配置集中管理,分布式探针(Probe)监测采集部署,满足多个隔离子网和多级大规模IT环境的统一监测管理要求。主机监测提供远程无代理和UniAgent代理两种模式。强大的监测插件体系,确保监测功能和指标的可扩展性。内置智能事件分析引擎,通过业务影响依赖关联模型iBDM自动分析事件关联。InspurSSMV6.0R2产品白皮书遵循各类标准化协议与规范ICMPSNMPJMXCorbaCLI(Telnet、SSH)WBEM/WMIHTTP、HTTPSLDAPDNSFTP/POP3/SMTP…3.3.产品部署模式图3InspurSSM产品部署示意图InspurSSM产品支持分布式监测采集部署与集中配置管理模式,通过在服务端集中配置采集策略下发到采集探针(Probe)执行周期采集任务,完全可以满足在大规模网络环境下的对IT基础设施的监测要求。客户端无需任何安装,直接通过浏览器查看各类ITInspurSSMV6.0R2产品白皮书资源的即时性能指标,方便快捷。SSM系统采集探针(Probe)具有以下几大特性:探针自带监测数据存储功能:在网络临时中断或服务端临时关闭的情况下,Probe端会临时存储监测数据(Probe关闭后也不会丢),待网络和服务端恢复后再向服务端传输数据,保证监测数据的完整性。探针支持自我管理和故障自恢复:当采集探针由于某些原因无法正确运行时,探针会自动重启并迅速执行监测任务,保证监测数据的连续性。探针支持自动升级功能:当探针有新版本发布时,只需要把探针升级程序发布到服务端固定的目录,探针会自行判断并升级到新版本,减少手工升级带来的成本和出错几率。探针提供自动注册功能:采集探针在启动时会自动根据配置信息连接到服务端进行自动注册,增加了管理的方便性。探针支持多种常见平台部署:采集探针可在Windows和常见类Unix操作系统下部署,并能以服务模式运行(默认提供Windows操作系统下的安装程序)。4.产品功能4.1.深度全面的资源监测InspurSSM集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等远程监控手段和SSMUniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7X24不间断监控。强大监测插件体系无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。众多监测器工作独立,互不影响,保证整个监测体系的稳定运行。灵活的监测时间调度机制和智能化的监测阈值模型自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。InspurSSMV6.0R2产品白皮书主机代理Agent监测和远程无代理监测两种监测模式多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。4.1.1.网络安全设备管理全面支持CISCO、华为、中兴、北电、Foundry、Extreme、Avaya、H3C、DLink等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU/MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。InspurSSMV6.0R2产品白皮书图4CISCO路由器监控详细视图InspurSSMV6.0R2产品白皮书网络设备监测项包括:设备CPU利用率:监测网络设备的CPU使用率。设备内存利用率:监测网络设备的内存使用量、内存使用率。端口速率监测:监测网络设备中指定端口的入速率、出速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速。端口上下线监测:监测网络设备指定的端口的上下线状态。自定义SNMP监测:可监测多个SNMP表达式(支持四则运算、时间差值运算等)对应的采集结果。ICMP连通性监测:监测与网络设备的连通性。……4.1.2.服务器系统管理管理和监测Windows、Linux、IBMAIX、AS/400、HP-UX、SUNSolaris、SCOUnix、SGI、Tru64等不同操作系统的服务器或集群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。帮助用户及早发现服务器系统的性能瓶颈与故障隐患。InspurSSMV6.0R2产品白皮书图5.Solaris监控详细视图服务器监测项包括:主机基本信息采集:主机的基本信息,包括:CPU数目、机器型号、系统名称、系统版本、IP地址、内存大小、总线程数目、磁盘名称等。主机CPU使用率:监测主机系统的CPU使用率。主机内存使用率:监测主机系统的内存使用量、内存使用率。主机磁盘使用率:监测主机系统的指定磁盘使用率。主机磁盘IO监测:监测主机系统的磁盘TPS数、磁盘写操作速率等、每秒完成IO读写次数、每秒读写扇区数、每秒读K字节数、平均I/