版本:V1.0曙光Gridviewv2.0,您身边的系统管理得力助手曙光Gridview服务器综合管理系统v2.0版本:V1.0概述曙光Gridview服务器管理系统v2.0系统概述曙光Gridview服务器综合管理系统v2.0是继承曙光DCMM2、DCAS、曙光Gridview管理系统v1.1等监控管理产品的主要功能和技术特色,并增加多项优秀功能开发而成的机群监控管理系统产品。曙光Gridview管理系统提供了统一的集中式监控平台Portal,具备可扩展性、集成性、可靠性和易用性,提供了对各种商用、自己研发的管理工具的集成接口,从而满足同时对各不同厂家大型机的环境、硬件、软件等各方面进行监控管理的需求。曙光Gridview服务器综合管理系统v2.0系统采用模块化设计,该系统提供了机群部署恢复中心、综合监控管理系统、统一告警平台、统计报表系统、作业调度调度中间件、IPMI管理等多种机群管理功能。曙光Gridview服务器管理系统v2.0应用场景曙光Gridview服务器综合管理系统v2.0面向于曙光集群系统的多种人员,可满足管理、维护、使用、研究、分析等多方面、多层次的系统应用需求。曙光Gridview服务器综合管理系统v2.0应用场景曙光Gridview服务器管理系统v2.0面对的挑战曙光Gridviewv2.0服务器管理系统可解决基于分布式环境下的机群统一监控、统一管理、统一存储、统一报警、统一配置等诸多问题,克服分布式环境下数据资源的局部特性,整合信息孤岛,提供给用户应用资源的基于层次结构的统一的多角度视图,具体解决的问题包括:¾用户统一管理问题¾系统统一监控问题¾数据统一存储问题¾系统统一报警问题¾管理统一配置问题根据集群系统在设计、部署、实施、管理、维护、应用、扩展等多方面的复杂性,曙光Gridviewv2.0服务器管理系统所面对的挑战包括如下几方面:曙光Gridview服务器综合管理系统v2.0版本:V1.0Gridview服务器管理系统v2.0所面对的挑战曙光Gridview服务器管理系统v2.0产品目标曙光Gridview服务器综合管理系统v2.0采用分布式、层次化、模块化、可扩展、可定制的设计和架构,提供综合一体化的机群管理系统;产品可应用于单机、机群和机群之上,实现局域网内部及跨广域网环境对大型机进行集中部署、配置、监控、管理、告警、报表、作业调度、IPMI管理等功能;产品可对各种监控资源进行告警管理与运行状态等实时监测,可方便通过本系统进行故障关联分析和处理,提供各种统计报表的功能,并进行机群之间、设备之间的比较分析,并支持与应用的整合扩展接口。曙光Gridviewv2.0服务器综合管理系统产品目标曙光Gridview服务器管理系统v2.0系统架构曙光Gridviewv2.0服务器综合管理系统硬件架构曙光Gridviewv2.0服务器综合管理系统采用分布式、层次化设计方法,可应用于单机、集群、网格基础之上,并提供远程管理方式,及邮件、短信等多种告警方式,硬件层次架构如下图版本:V1.0所示:曙光Gridviewv2.0服务器综合管理系统硬件架构曙光Gridviewv2.0服务器综合管理系统软件架构曙光Gridviewv2.0服务器综合管理系统支持对多种资源(如服务器、交换机、存储设备、机房环境、应用等)的统一监控管理,软件层次包括设备资源层、通信层、数据层、事务处理层、表现层多个层,软件架构如下图所示:曙光Gridviewv2.0服务器综合管理系统软件架构版本:V1.0技术特色(一)曙光Gridview服务器管理系统v2.0部署恢复中心曙光Gridviewv2.0服务器综合管理系统部署恢复中心可实现对集群操作系统快速部署和自动配置,基于镜像的管理,及系统的快速恢复等功能。曙光Gridviewv2.0服务器综合管理系统部署恢复中心曙光Gridviewv2.0服务器综合管理系统部署恢复中心采用基于镜像的部署方法–镜像服务器(ImageServer)从样板机取得其配置信息,文件系统镜像等,并对集群中其他所有节点的安装过程进行监控,为其提供镜像。–镜像样板机(GoldenClient)样板机作为集群中其他所有节点的模版,其硬件配置应尽可能与集群中的待安装节点相同,其操作系统由用户根据实际需要用一般的安装方法手动安装,并对样板机进行充分的配置包括设置网络、配置服务、应用软件等。–被部署节点(InstallNode)采用网络启动协议,自动加载引导内核,并实现了点对点通信协议,网络安装操作系统,可实现待安装的节点越多,安装速度越快的效果。曙光Gridview服务器综合管理系统v2.0版本:V1.0曙光Gridviewv2.0服务器综合管理系统部署恢复中心镜像部署方法曙光Gridviewv2.0服务器综合管理系统部署恢复中心点对点快速部署方式功能特性优势机群系统部署z采用B/S架构,安装后节点信息直接存储在管理系统的数据库中,方便管理配置。z可以同时针对不同的节点分发不同的系统镜像,极大方便系统的安装过程。z安装过程中无需手动干预。z安装前可指定系统最终IP、主机名等z能自动适应大硬盘,自动适应各节点间的软硬件配置不完全相同。z支持多种Linux系统,如RedhatLinux,TurboLinux,DebianGNU/Linux,SUSE等.z同时支持64位和32位的CPU、操作系统(二)曙光Gridview服务器管理系统v2.0综合管理门户曙光Gridviewv2.0服务器综合管理系统综合管理门户可实现对集群统一监控、集群集中管理、多集群综合管理、IPMI带外硬件管理等功能。版本:V1.0曙光Gridviewv2.0服务器综合管理系统综合管理门户曙光Gridview提供全方位的状态监控功能,状态监控功能提供了机群总体运行状态视图、机群总体IO状态视图、机群实际物理拓扑视图以及多项性能视图,用户可直观地监控当前机群系统运行情况。此外,状态监控功能还提供了具体某台服务器节点的运行状态监控,用户在监控机群整体运行状态的同时,也可具体监控各节点的运行状态。功能特性优势机群状态监控管理z直观的机群物理拓扑视图z全方位的机群总体性能视图z一目了然的机群总体IO视图支持以机柜为基础的机群物理拓扑方式,按设备实际位置和尺寸实时显示,使用户对机群系统“一目了然”。从机群总体性能视图中用户可全方位把握当前整个机群的使用情况,包括CPU平均使用率、内存剩余率、磁盘剩余率等等。版本:V1.0z详细直观的机群性能视图z机群各节点的静态、动态信息属性视图曙光Gridviewv2.0服务器管理系统可支持IPMI硬件远程管理,包括传感器管理、电源管理、资产管理、事件管理等功能层次图如下图所示:从机群总体IO视图中用户可以一目了然的查看机群整体IO运行情况,包括总体网络发送速度、网络接收速度、磁盘写入速度、磁盘读出速度等等。从机群性能视图中用户可通过柱状图方式,监控当前机群各部件的CPU平均使用率、内存使用率、磁盘剩余量等等。机群状态监控功能还提供了对机群节点的静态属性信息、动态属性信息及告警属性信息显示。版本:V1.0Gridviewv2.0服务器管理系统IPMI带外远程管理曙光Gridview提供简单灵活的、易用的机群管理功能,机群管理功能采用了人性化的界面和功能设计,方便用户对机群系统的管理、使用。机群管理功能提供了从IP管理、Hosts管理、进程管理、服务管理到并行命令、关机管理等九项机群管理功能,有效解决了大型机群管理的复杂性,保证了机群管理的扩展性、可靠性、自主性。机群管理系统z采用有Browser/Server分布式结构、跨平台管理等特性z提供了一整套对集群系统进行并行操作、性能监控、信息获取的工具,为整体集群计算资源的统一管理构建了一个基础平台z机群管理系统提供了从IP管理、Hosts管理、进程管理、服务管理到并行命令、关机管理等九项机群管理功能版本:V1.0(三)曙光Gridview服务器管理系统v2.0统一告警平台曙光Gridviewv2.0服务器综合管理系统统一告警平台采用BS架构,提供了全方位的告警管理功能,包括告警收集、告警监控与处理、告警通知、告警分析、告警报表等功能。曙光Gridviewv2.0服务器综合管理系统统一告警平台功能图示版本:V1.0曙光Gridviewv2.0服务器综合管理系统统一告警平台产品告警收集功能提供了对告警信息的接收功能,其既能够接收设备类告警,例如服务器、交换机告警,又能够接收应用类告警,例如进程告警、数据库告警,同时也能够接收第三方软件发出的告警信息。曙光Gridviewv2.0服务器综合管理系统统一告警平台产品提供了完善的告警监控与处理功能,依据告警信息与节点之间的关联关系,提供了物理视图、拓扑视图等多种展现方式,并提供了多种告警信息的处理操作。曙光Gridviewv2.0服务器综合管理系统统一告警平台产品提供了告警通知、告警分析、告警报表等多种其他功能。告警通知能够以邮件、短信、声光的方式,快速将产生的告警通知管理人员。告警分析提供了对大量告警信息的分析操作,为故障定位提供有力的支持。告警报表提供了告警信息的统计,便于管理人员了解一段时间内的系统运行情况。曙光Gridviewv2.0服务器综合管理系统统一告警平台系统图示功能特性优势开放的告警收集功能z告警收集的开放式接口系统提供开放式的告警收集接口,既能够收集设备类告警、又能够收集应用类告警,同时也支持第三方软件的告警收集。版本:V1.0完善的告警监控与处理z告警状态实时监控z告警处理操作系统提供对告警信息的多种处理操作,可对告警进行删除、恢复、终止告警发送等操作。系统提供多种告警状态监控视图,由用户任意选择。视图包括物理视图、网络拓扑视图、设备面板视图,同时提供表格方式的告警信息查看功能。版本:V1.0告警通知z邮件、短信通知z声光通知z灵活的通知策略告警关联分析z系统提供对告警信息的关联分析功能¾通过告警之间的关联关系简化告警的显示、提高故障定位能力¾提供对关联分析知识库的管理系统提供Email、短信方式将告警信息快速通知管理人员,使得对故障的响应速度更加快速。系统在显著的地方提供告警的声光显示功能,使得管理人员更加容易的发现问题,避免错过已发生的故障,导致不能及时处理。系统提供灵活、完善的通知策略,管理人员可以设定自己所关心的告警信息,包括类型、等级、原因、关键字等多种角度的限定。版本:V1.0告警报表z系统提供告警信息的多角度统计功能,包括节点、时间、告警等级、告警类型等。z系统提供告警报表的编辑功能,包括自定义新报表、修改已有报表、删除无用报表等。(四)曙光Gridview服务器管理系统v2.0统计报表系统性能报表的主要作用是根据产品提供监测的数据,通过分类组合,输出相应的报表。版本:V1.0性能报表子系统具有如下特点:¾系统预定义报表以及用户自定义报表系统预定义一些常用报表,以方便用户进行常用报表的查看分析。系统支持用户自定义生成报表,用户可以选择关注的指标组合存储下来,方便以后查询。¾报表显示对大型机整体及设备的历史信息,以曲线图显示,可以选择按系统设定的时间段进行统计,也可以由用户自己定义开始时间和结束时间进行统计。对于实时信息,可以以曲线图的方式显示,也可以以柱状图的方式显示。在图形中通过不同颜色来标识不同的指标,对各种颜色代表的指标进行说明。纵坐标可以有多个,根据指标的单位来确定,不同单位的纵坐标不同,也以颜色来区分。可以把多个设备的同一指标显示在同一张图中,也可以把多个设备的多个指标显示在一张图中。¾系统实时信息报表显示。用户可以定义要实时显示的性能指标,通过柱状图或者实时动态曲线的方式显示,便于用户直观掌握系统当前运行状况。功能特性优势机群性能报表z通过机群性能报表系统了解机群系统每小时、每日、每月、每年的总体运行情况。¾支持小时报、日报、月报、年报等多个时间段的报表生成¾关联报表,可以把多个设备的指标在一个报表中生成并进行多设备对比分析;也可以把一个设备的多个指标在一个报表中生成,从而进行多指标之