GSM日常维护及应急流程(BSS)典型案例GSM-BSS故障反馈培训移动事业部用服部2006年1月内容提要前言前台BSC类故障反馈后台OMCR类故障GPRS类故障BTS类故障上级网管类故障故障信息提取指导第一章前言目的取对数据取全数据减少反复及时定位信息反馈要素起止时间现象描述处理步骤系统数据反馈案例分析案例一大海捞针某地单通、掉话严重。现场在故障站点下进行拨打测试,并返回了录制的A口,以及Abis口信令,请求研究所协助分析。测试手机信息?测试站点信息?呼叫起始时间?案例点评:有没有想过,如果你来分析,在茫茫数字流中怎么样才能找到有用的信息?案例二无字天书市中心基站扩容后,无法正常运行,不断反复重启。面对巨大压力,现场维护人员向研究所求助,并在第一时间内发回了Abis口录制的OAM消息。哇,信令发回来了,赶快分析!咦,信令文件怎么是空的?!案例点评:先问问自己,知道如何正确取数据么?取完后检查了么,有没有确认数据内容的完整性?具体故障类型,以及在某一类型中所需数据的确定,请现场人员根据实际情况决定;如果不能确定,请咨询总工组。本文档是故障信息反馈的指导性文档,不是故障处理流程文档。如遇‘重大或者紧急故障’,请按照部门重大故障流程来操作!请现场人员将所需反馈的故障信息,以部门要求的‘现场故障处理单’的方式来返回。‘现场故障处理单’附件如下:第二章前台BSC类故障反馈什么是前台类故障?BSC机框内的单板故障BSC增减硬件时发生的故障由于BSC导致的基站通话异常和MSC之间的A口通讯异常案例分析XX办事处接到运营商投诉,南城区下用户无法呼入呼出。办事处维护工程师赶到机房,发现BSC2下的3号外围模块MPRUN灯长亮,而南城区的基站都挂在该模块下。复位MP后,基站恢复正常。假设你在现场,为了查明故障原因,需要返回哪些数据?o投诉:好多基站不能打电话o用户很生气,后果很严重o故障模块MP打印日志已经发给你们了,赶快分析,马上出故障报告故障发生的起始时间?故障现象,历史告警信息?现场采取的恢复措施?中心模块的MP打印?前台MP下的ERRO.LOG?前台BSC类故障常见数据汇总先知道有那些数据,才能根据现场实际情况,返回有用的数据!BSC类故障需反馈的信息信息用途简述信息获取方法故障发生的时间,持续时间,以及结束时间便于定位数据中的故障信息咨询现场人员详细的故障现象,包括告警(当前告警以及历史已恢复告警),通知消息,相关单板闪灯情况,故障所属的模块等故障特征故障单板的闪灯情况,系统告警信息、通知消息包含了故障的最基本信息咨询现场人员故障现象还应该包括该故障对整个网络的影响,以及最终给用户通话所带来的影响告警信息,通知消息的获取,在告警界面的[历史查询]里,获取告警信息、通知消息,包含故障时段曾经采取过的故障处理描述有助于将人为操作信息分离咨询现场人员前台MP下系统运行打印,考虑到可能主备倒换,主备MP(L,R)打印都要,包含故障时段MP打印文件记录了系统相关的故障信息前台MP打印文件的获取,位于后台/$OMCHOME/tmp/mplog下前台MP的ERROR.LOG&POWERON.LOG以及INT13等打印信息记录MP硬件异常信息位于前台MP的/trace目录下,获取方法:omcftp工具连接前台MP提取数据上级MSC的信息,MSC的厂家,以及最近的数据变更情况上级MSC的信息对判断A口故障很重要咨询现场人员A口时隙状态,以及NO.7信令链路状态确认MSC和BSC之间的连接是否正常,并分析A口信令流程在OMCR动态管理界面里查看时隙状态;A口信令跟踪消息文件信令消息的获取BSC前后台运行版本;和故障有关的单板运行版本,以及单板硬件版本确认是否是版本缺陷引发的故障OMCR后台运行版本通过命令amp–v在OMCR服务器里查询;前台MP以及单板运行版本在OMCR客户端的软件装载里查询,通过物理视图界面,右键点击单板查询当前运行版本返回前台MP下/config/目录下的tcpip.cfg、zxg10.cfg文件检查参数是否设置正确omcftp工具连接前台MP提取数据前台/data/work/下的ZDB文件,以及后台OMCR服务器生成的BSC配置备份文件检查现场的配置关系omcftp工具连接前台MP提取数据;在后台服务器$OMCHOME/tools/dbbak目录下使用cmexp工具倒出配置文件第三章后台OMCR类故障反馈什么是后台类故障?OMCR进程运行异常增减数据配置出错前后台通信故障OMCRserver故障告警,性能数据提取故障案例分析某地联通维护人员投诉在提取忙时性能报表时,系统出错,提取不到数据。假设你被指派处理这个故障,该指导用户返回怎样的数据?o投诉:省公司要求马上上报,赶快解决o要是数据丢了,后果由你们承担o当然,你们需要什么数据,我们可以给你提供故障发生时间?故障现象,故障代码?OMCRclient和server的连接方式?Diffs和imf进程的打印进程的打印级别?后台OMCR类故障常见数据汇总先知道有那些数据,才能根据现场实际情况,返回有用的数据!OMCR类故障需反馈的信息信息用途简述信息获取方法故障发生的时间,持续时间,以及结束时间便于定位数据中的故障信息咨询现场人员详细的故障现象,包括告警(当前告警以及历史已恢复告警),相关操作失败情况,以及服务器OMCR各子进程运行情况系统告警信息、通知消息包含了故障的最基本信息咨询现场人员故障现象还应该包括该故障对整个系统操作带来的影响;反馈各子进程有否重启告警信息,通知消息的获取,在告警界面的[历史查询]里,获取告警信息、通知消息,包含故障时段omcps指令查看各子进程运行情况曾经采取过的故障处理描述有助于将人为操作信息分离咨询现场人员返回AGT,BAF,IMF,LMF,DIF等子进程的打印日志,包含故障时段各子进程打印,有相关失败操作的记录后台子进程打印文件的获取,位于后台/$OMCHOME/tmp/log下注意:要求$OMCHOME/conf/syscfg.ini文件中设置的进程日志打印级别为5!OMCR服务器和BSC之间的链接方式,是本地网管还是远程网管,并确认之间的链路是否通畅确认组网方式现场检查OMCR服务器下$OMCHOME/CONF目录下的SYSCFG.INI、BSCCFG.INI、DBCFG.INI等配置文件确认重要配置文件参数设置利用FTP工具从OMCR服务器下载BSC前后台运行版本确认是否是版本缺陷引发的故障OMCR后台运行版本通过命令amp–v在OMCR服务器里查询;前台MP运行版本在OMCR客户端的软件装载里查询,通过物理视图界面,右键点击MP查询当前运行版本对于可能存在的服务器本身故障,返回服务器运行记录文件查看服务器系统运行情况返回服务器/var/adm目录下以message开头的所有文件前台ZDB文件,以及后台OMCR服务器生成的BSC配置备份文件在出现配置出错的情况下,检查现场的配置关系是否正常omcftp工具连接前台MP提取数据;在后台服务器$OMCHOME/tools/dbbak目录下使用cmexp工具倒出配置文件第四章GPRS类故障反馈什么是Gprs类故障?基站下Gprs业务异常相关Gprs单板故障和SGSN对接故障案例分析用户投诉,在中兴基站下不能使用gprs功能上网了。经过前几个章节的培训,你已经是故障处理的行家了,你来分析一下这个问题。思绪如潮故障发生时间?故障现象,单个站还是都有问题?和SGSN的链路正常么?相关GPRS单板正常?用户做过什么操作?看看单板的打印是否正常GPRS类故障常见数据汇总先知道有那些数据,才能根据现场实际情况,返回有用的数据!GPRS类故障需反馈的信息信息用途简述信息获取方法故障发生的时间,持续时间,以及结束时间便于定位数据中的故障信息咨询现场人员详细的故障现象,包括告警(当前告警以及历史已恢复告警),通知消息,相关单板闪灯情况,故障所属的模块等故障特征故障单板的闪灯情况,系统告警信息、通知消息包含了故障的最基本信息咨询现场人员故障现象还应该包括该故障对整个网络的影响,以及最终给用户带来的上网故障现象告警信息,通知消息的获取,在告警界面的[历史查询]里,获取告警信息、通知消息,包含故障时段曾经采取过的故障处理描述有助于将人为操作信息分离咨询现场人员前台中心模块MP打印,考虑到可能主备倒换,主备MP(L,R)打印都要,包含故障时段MP打印文件记录了相关的故障信息前台MP打印文件的获取,位于后台/$OMCHOME/tmp/mplog下上级SGSN的信息,SGSN的厂家,以及最近的数据变更情况上级SGSN的信息对判断GB口故障很重要咨询现场人员GB口链路状态,相关基站的PS信道状态确认当前GPRS状态在OMCR客户端的动态管理界面里查看BSC前后台运行版本;GPRS运行版本,以及GB口TIC单板硬件版本确认是否是版本缺陷引发的故障OMCR后台运行版本通过命令amp–v在OMCR服务器里查询;前台MP以及单板运行版本在OMCR客户端的软件装载里查询,通过物理视图界面,右键点击单板查询当前运行版本;TIC单板硬件版本需要拔出来查看GB口信令跟踪消息录制分析GB口信令流程信令消息的获取GPRS单板打印文件确认单板运行情况GPRS打印文件的获取MP到GPRS机架的网线连接方式,是利用HMS还是和其它设备共用一个HUB共用HUB对GPRS有影响现场查看前台ZDB文件,以及后台OMCR服务器生成的BSC配置备份文件检查现场的配置关系omcftp工具连接前台MP提取数据在后台服务器$OMCHOME/tools/dbbak目录下使用cmexp工具倒出配置文件第五章BTS类故障反馈什么是BTS类故障?地球人都知道!基站倒了基站单板坏了基站下通话异常基站配置更改故障o。。。。。。。。。。。。怎样做好基站故障数据反馈?基站故障从硬件上来看,关键四点:传输,单板,线缆,拨码开关。在排查故障中,这4部份都没有问题的话,不会起不来。由于基站故障涉及面较广,所以在反馈数据的时候,需要尽可能的详细反馈现场的情况。作为一个优秀的技术支持工程师,我认为需要反馈如下数据:基站基本信息很重要:基站配置信息;拨码开关;基站运行版本;基站和BSC之间的连接方式基站故障现象描述非常重要:单板闪灯;通话异常描述故障基站的系统信息至关重要:告警信息;通知消息;性能报表系统各种打印消息是最后制胜的法宝:Abis口信令消息;MP打印;基站配置备份文件Hey!Watchit!BTS类故障常见数据汇总先知道有那些数据,才能根据现场实际情况,返回有用的数据!BTS类故障需反馈的信息信息用途简述信息获取方法故障发生的时间,持续时间,以及结束时间便于定位数据中的故障信息咨询现场人员详细的故障现象,包括告警(当前告警以及历史已恢复告警),通知消息,基站单板闪灯情况。动态管理中的基站信道状态。故障单板的闪灯情况,系统告警信息、通知消息包含了故障的最基本信息咨询现场人员以及由此导致的手机用户通话故障情况描述描述用户的投诉现象很重要告警信息,通知消息的获取,在告警界面的[历史查询]里,获取告警信息、通知消息,包含故障时段现场测试结果曾经采取过的故障处理描述有助于将人为操作信息分离咨询现场人员基站的硬件型号,配置情况;基站的基本信息通过OMCR客户端软件装载界面查询;基站当前运行版本;咨询维护人员;基站和BSC的链接方式(直连站还是级联站),以及传输方式(E1,光纤,微波,卫星);现场基站检查基站的相关拨码开关情况BSC前后台EDRT硬件型号以及DSP版本。确认是否存在EDRT852+DSPV1.02的组合,导致语音出现断续的情况通过OMCR客户端查询版本;低话务量插拔EDRT,确认EDRT板件所使用的芯片相关小区的ABIS口的OAM,RSL层信令跟踪消息分析ABIS口信令信令消息的获取性能管理中的基本测量15分钟粒度报表;对于开通了跳频,HR等新功能后出现的问题,需要反馈故障前、后两个阶段的基本测量,通过对比来分析在OMCR客户端的【性