内部资料注意保密北京神州泰岳软件股份有限公司2009年7月中国联通增值业务综合网管系统培训2目录项目背景及进度说明系统总体设计软硬件架构及部署系统功能介绍使用场景培训3项目整体及进度说明GSM增值业务综合网管系统分为总部和省份两级系统总部系统含电子运维、全网网管和总部网管系统,由神州泰岳公司承建省份网管系统由神州泰岳承建19个省,中盈、天元各承建6个省项目自2008年底开工,至2009年6月已基本完成系统功能的搭建和各被管业务系统的接入,具备上线运行条件建设范围:短信类(短信中心、在信网关、互通网关、SP管理系统、EMP等)语音类(炫铃、语音增值)数据类(WAP、彩信等)支撑类(VAC、终端管理等)44议程内容系统功能介绍213系统总体设计、软硬件架构及部署4使用场景培训项目背景及进度说明55总体设计-系统的定位如何理解并明确什么是综合网管系统:中国联通增值业务综合网管就是增值专业的综合性的运行支持系统综合性运行支持系统的“7种武器”综合监控体系综合维护体系安全管控/防护体系管理考核体系指挥调度体系客服支撑体系合作伙伴考核体系综合性的运行支持系统的建设是需要总体规划、逐步推动的,本期项目的重点是综合监控体系、综合维护体系、综合分析体系的建设66总体方案设计-架构搭建架构搭建:系统架构的生命周期就是整个系统的生命周期,如何设计、搭建稳定、高效且扩展能力强的系统架构,是必须放在首要位置考虑并解决的问题产品组合的选择:主机监控代理、工单流程引擎等模块间横向和纵向接口设计:21种横向接口是保证系统各模块有机联系的基础,省部接口是重要的上传下达通道系统统一的框架设计与实现:基于JEF的框架设计是系统整体性的根本保障,严格规范的研发管理是产品质量和人性化的基础77总体方案设计-功能释放功能释放:如果没有深入细致的需求调研,没有广大维护人员的日常使用,没有最佳实践的积累,就不会形成真正有效的监控策略和维护条目,那么大部分功能就不能充分发挥作用,因此,必须想方设法解决功能释放的问题88总体方案设计-数据消费数据消费:如何有效的利用综合网管的数据,在实际的运维管理活动中发挥作用数据消费是一种习惯,需要帮助相关人员养成良好的数据消费习惯数据消费是有层次的,不同角色的人员对数据消费的需求不同数据消费是一种能力,数据消费的能力越强,数据的价值就越高数据消费是有方向的,对于联通增值业务部来说,数据消费的方向就是上下左右上:是指总部要有效的利用综合网管系统提供的各种数据,指挥调度各省分公司有效的开展各项运维工作,推广各种运行维护的最佳实践,高效的履行各项管理和考核的职能,并且提高自身的主动管理能力,提升项目建设投资的有效性,贯彻执行信产部制定的各种管理规定下:是指省分公司要有效利用综合网管系统提供的各种数据,指导运维人员开展日常工作,提高运维水平,改善业务质量,贯彻执行总部的各项规章制度和管理要求,同时加强对供应商和业务厂商的管控和考核力度左:是指利用综合网管系统提供的各种数据,想法设法提高用户感知,从而达到发展有效用户,增加有效收入的目的右:是指利用综合网管系统提供各种数据,一方面加强对SP等合作伙伴的管控能力,保障增值业务的健康、持续发展,另一方面,有针对性的加强对主要SP等合作伙伴的支持和保障力度,实现双赢的局面,同时,需要对重点发展的新业务进行持续的跟踪,研究新业务的发展特点和用户的使用习惯,从而在业务推广方面提供更有力的支持99总体方案设计-系统推广系统推广:系统推广是增值业务网管项目成败的最关键的因素,网管系统的推广工作需要常抓不懈,形成的最佳实践需要有步骤、有计划地向各省分公司进行持续的推广,只有这样,网管系统才具有长期存在的价值,联通在网管方面的投资回报才能充分体现。我方认为网管系统的建设只是万里长征第一步,真正有意义的是制定切实有效的、长期的系统推广方案,并注重逐项落实,通过各种措施帮助各省分公司改进日常维护工作的各个环节和工作习惯,从而通过网管这种技术手段提升全网的运维水平和管控能力。1010议程内容系统功能介绍213系统总体设计软硬件架构及部署4使用场景培训项目背景及进度说明1111软硬件部署方案设计-总部总部硬件部署方案六台SUNM4000小型机---总部网管、电子运维、全网网管五台应用服务器两台省部接口服务器四台采集服务器磁盘阵列一台光纤交换机两台路由器两台三层交换机两台防火墙(8口)4台拨测设备一套1212软硬件部署方案设计-总部(续)1313软硬件部署方案设计-分公司1414软硬件部署方案设计-分公司(续)1515议程内容系统功能介绍213系统总体设计软硬件架构及部署4使用场景培训项目背景及进度说明16功能模块基本结构综合监控综合维护综合分析监控管理平台UltraNMS数据采集处理UltraProbe主机/数据库监控省部接口自动巡检IP地址管理集中操作维护局数据业务拨测网管平台数据与业务数据分析话单用户与业务量分析1717综合监控重点内容监控管理平台Ultra-NMS:自动发现采集调度状态轮询性能管理配置/资源管理告警管理拓扑展现数据采集模块Ultra-NMSProbe:网络设备性能、告警采集与主机监控代理间数据采集接口与业务系统间业务数据接口主机/数据库监控代理省部接口1818监控管理平台Ultra-NMS监控管理平台Ultra-NMS:自动发现设备厂商型号自动发现三层网络连接自动发现二层网络链路自动发现定期重发现IP/MAC/Port归属关系自动发现拓扑生成与更新采集调度通过定义网元组、指标集和采集调度策略,驱动各个Ultra-Probe采集各种数据状态轮询:定时主动轮询相应对象的状态1919监控管理平台Ultra-NMS监控管理平台Ultra-NMS:性能管理数据指标建模历史性能处理性能门限管理性能工作空间配置/资源管理资源对象建模资源数据维护资源树图及查询统计配置文件上传下载配置变更比对稽核2020监控管理平台Ultra-NMS监控管理平台Ultra-NMS:告警管理事件标准化事件过滤相关性分析告警通知告警升级工单接口告警视图值班告警拓扑展现拓扑编辑拓扑展现拓扑导航21数据采集软件Ultra-NMSProbe数据采集软件Ultra-NMSProbe:接口适配层模块任务管理层模块预处理模块通讯适配层模块系统自管理业务系统接口数据库接口方式:目前华为短信中心的I2000,中兴短信中心、中兴语音增值(部分指标)等SNMPMIB:语音增值、EMP等系统是通过私有SNMPMIB的方式提供性能数据的Ftp+XML:华为目前傲天、斯特奇的在信网关SPMS中兴/华为WAP网关,彩信中心性能数据均通过该方式采集(上传目录为upsendmsg,处理后保存目录为backup)分布式采集支持性能预处理配置预处理阈值预处理通讯适配模块自管理自身日志状态侦听采集机软件自动发现预处理业务预处理告警预处理SNMPTelnetJDBCFTP话单采集SyslogTrapICMPCORBA其它...任务调度局数据管理前端巡检前端日志管理前端缓存文件网管Server网管CORBA服务厂商平台[1][2][bind][lookup][3][return][上传(kbp,kpi)]启动CORBA服务绑定服务对象查找服务对象NamingService远程服务对象上传实时数据bimanapi网管平台2222主机/数据库监控代理BMCBPMBMCBPM产品主要功能:系统资源占用情况进程监控系统错误诊断与定位数据库监控告警管理2323主机/数据库监控代理BMCBPMUltra-NMSProbe与BMCAgent之间的通信协议主要使用了BMCBPM产品内置的NotificationServer、HistoryLoader两个功能组件,同时利用了PemnAPI和SNMP协议2424省部接口省分公司与总部之间的省部接口主要用于实现:定时的历史性数据(汇聚后数据)上传实时的重大告警信息上传定期的资源配置数据上传考核指标上传2525综合维护平台重点内容说明总部和省分公司的综合维护平台在软件构成方面有所差别省分公司的综合维护平台主要由以下五个子系统组成:自动巡检业务拨测IP地址管理集中操作维护局数据管理总部的综合维护平台除了以上五个子系统,同时还有:总部业务运行中心专用的设备维护管理值班管理总部集中建设,全国统一使用的电子运维子系统流程引擎流程设计器13大类工单流程工程管理维护作业计划知识库信息公告资料管理论坛等2626自动巡检根据当前增值业务来说,巡检任务可以归纳为以下几类:设备类巡检任务,包括服务器、网络设备、数据库等、磁盘空间、双机状态、电源/温度/板卡等硬件状态,操作系统中软硬件报错业务类巡检任务,包括进程状态、接口状态、端口响应、文件状态、文件内容、目录状态、数据库表指定字段的变化情况等维护类任务,如备份任务完成情况拨测任务,在数据业务系统中,日常的巡检任务中都会包含对相应业务的手工拨测而自动巡检从业务上,主要需要满足:实现四化:将巡检工作自动化、巡检结果电子化、运维经验固化、巡检工作量化考核等要求融于一体未雨绸缪:自动执行各项日常巡检工作,对巡检的结果形成评价和考核的指标,从而将巡检工作通过技术手段延伸到IT环境的各个方面,切实避免运维工作的死角亡羊补牢:通过分析已经发生的故障,找到监控空白点,把相应的技术手段固化到巡检系统中,从而提前发现甚至避免同样的问题发生有条不紊:让巡检工作在管理制度的规范下进行,严格执行签认制度,匹配运维管理规定的要求昨日重现:将设备和业务系统的历史运行情况保存下来,为后续的查询、统计、分析提供详实的第一手资料27自动巡检(续)2828业务拨测支持对文本短信(点对点/互通/在信等业务)、G网WAP、G网彩信等数据业务、IVR/VAG等语音增值类业务的拨测,支持运营商之间的网络质量比对支持对拨测的成功率和时延的计算,对于WAP/MMS,,将GPRS成功率和时延与后台业务系统成功率和时延分别统计支持对业务逻辑的拨测,如在信类业务订购需要二次确认,点播类业务单次下行不能超过5条等,并能够测试各种业务订购和退订支持对于语音增值类业务的多环节拨测规则定制支持对内容的解析,判断是否存在违规内容提供与局数据管理子系统之间的接口,能够将局数据作为拨测内容,自动形成相应的拨测规则提供完善的自监控功能提供与自动巡检系统之间的接口,提供与监控管理平台之间的告警接口采用拨测ModemPool设备,系统稳定性提升较大29业务拨测(续)3030局数据管理支持标准局数据的导入导出功能支持现网局数据的采集功能支持现网局数据与标准局数据之间的稽核比对提供与综合监控平台、业务拨测、综合分析平台和自管理模块之间的各种横向接口提供直观的局数据拓扑,局数据拓扑根据与业务系统之间的接口自动形成,能够直观的了解现网系统内部以及与周边系统的逻辑连接状况,并作为局数据查询和比对的统一入口,实现简洁方便的数据组织3131IP地址管理准确提供现网各业务系统的IP地址使用情况,一方面帮助维护人员清晰的了解现网IP地址分配和部署情况,另一方面为新建系统或扩容改造系统时的IP地址规划提供有力的技术支撑手段,同时还应该提供一些诸如掩码计算、子网拆分等IP地址分配工具准实时监控网络中是否存在非法接入的设备,通过制定并维护IP地址/MAC地址/交换机端口之间的黑白名单,并及时监控和比对网络中的设备接入情况,在发生违规接入的时候,生成告警3232集中操作维护支持远程Telent/SSH,实现B/S方式的远程Telnet/SSH;对设备的访问过程完整的记录下来,为审计提供原始素材,供Ultra-ESA软件进行统一的分析和展现对目前C/S方式的业务系统维测台,Ultra-GCOS提供了