2004年5月AlcatelBSS故障分析及解决方案AlcatelBSS故障分析及解决方案—2Allrightsreserved©2003,AlcatelShanghaiBell引言本文根据江苏地区Alcatel无线网络的特点,就BSS方面的几个典型的问题,进行了详尽的分析,并给出了解决方案以及预防措施。衷心希望通过此次技术探讨和交流,能够对提高双方的技术水平,对江苏的网络建设维护起到积极的作用。AlcatelBSS故障分析及解决方案—3Allrightsreserved©2003,AlcatelShanghaiBell目录第一部分BSCX.25和OSI_CPR问题处理第二部分BTS问题引起小区话务异常问题分析第三部分A接口时隙处理AlcatelBSS故障分析及解决方案—4Allrightsreserved©2003,AlcatelShanghaiBell第一部分BSCX.25和OSI_CPR问题处理BTS问题引起小区话务异常问题分析A接口时隙处理AlcatelBSS故障分析及解决方案—5Allrightsreserved©2003,AlcatelShanghaiBell1.1综述自从BSSB6.2版本以来,出现了诸多BSC的OSI_CPR模块的故障。OSI_CPR模块的主要作用是联系BSC与OMC-R,因而若该模块发生故障,必将严重影响OMC-R对BSS系统的操作与维护。现就此问题将现场的故障处理情况予以分析和总结,希望给现场以后处理类似问题以借鉴。AlcatelBSS故障分析及解决方案—6Allrightsreserved©2003,AlcatelShanghaiBell1.2BSCX.25问题的分类问题分类:由OSI_CPR问题引起的X.25故障:OSI_CPRFOS告警为:[OV_RELC],无法通过INIT命令来解决问题。由传输路径上的问题引起的X.25时隙问题:OSI_CPR无告警,但路由器中显示其时隙状态为DOWN。AlcatelBSS故障分析及解决方案—7Allrightsreserved©2003,AlcatelShanghaiBell1.2.1由OSI_CPR问题引起的X.25故障由OSI_CPR问题引起的X.25故障一般表现为:•出现故障的BSC都无硬件问题(能够通过HWTEST)。•BSC的一块或两块OSI_CPR状态FOS,告警为OV_RELC;•对模块INIT后,模块可以到IT状态但不稳定,自动RESET3次后又变为FOS状态;使用VERIFY命令结果相同。AlcatelBSS故障分析及解决方案—8Allrightsreserved©2003,AlcatelShanghaiBell1.2.1由OSI_CPR问题引起的X.25故障通过对各种实例的处理和分析,可将问题分为以下两种情况:•两块OSI_CPR同时FOS,BSC与OMC-R中断连接•一块OSI_CPRFOS状态,常规操作无法解决问题AlcatelBSS故障分析及解决方案—9Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.1由两块OSI_CPR问题引起的X.25故障对于第一种情况,即两块OSI_CPR问题引起的X25故障,可以通过以下的方法来定位故障:断开A-trunk2&6,故障依旧:•原因:一般由于误操作造成。•例如:在信道配置中将CBC设成了CBH(含小区广播中心)(此问题可以通过检查BSC的DLS软件中的R_TRX_MGT的D_TRX_TSCF的值确认,若检查了所有小区的该参数发现有0C值的话,基本可以确认问题所在).由于要开启小区广播中心的功能还必须修改BSC的相关参数,若小区和BSC参数有矛盾,会导致OSI_CPR故障。(B6问题,B7.2已解决)…/...AlcatelBSS故障分析及解决方案—10Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.1由两块OSI_CPR问题引起的X.25故障…/...•由于问题发生后OMC-R已经无法观察BSS的状态,要比较快速的解决问题有两种方法:–若故障原因不明,可以将故障发生前的DLS导入BSC并BOOTBSC,再核查问题;–若可确认有类似CBH问题,则可以先BOOTBSC,由于在BSC启动后OSI_CPR状态可以有一段稳定而较短的时间,可以在这段时间内打开BSS有关参数即可。•为避免此类问题的发生,在日常操作时应严格遵守规范流程,及时手工备份DLS,这样可以为以后处理问题打好基础.AlcatelBSS故障分析及解决方案—11Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.1由两块OSI_CPR问题引起的X.25故障断开A-trunk2&6,OSI_CPR故障解除:•原因:一般由于A接口模块故障造成,包括:ASMC、ATBX、ASMB、及交换模块等•解决方法:其中较多是由交换模块引起,可让交换方更换模块确认故障所在。AlcatelBSS故障分析及解决方案—12Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.2由一块OSI_CPR问题引起的X.25故障对于第二种情况,即一块OSI_CPRFOS,如果通过换模块、INIT等常规操作问题无法解决,那么可以按照于上述类似的方法来处理。断开A-trunk2/6,故障依旧:•表现:INIT模块后CPR可以IT,但之后模块马上自动RESET,三次后CPRFOS;•原因:一般由于BTS_ADAPTOR的状态异常,BSC告警异过多,引起OSI_CPR负荷过重,导致此问题发生。…/...AlcatelBSS故障分析及解决方案—13Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.2由一块OSI_CPR问题引起的X.25故障…/...•解决方法:–通过BSCTERMINAL对BSC进行观察,Lock所有状态不正常的BTS_ADAPTOR,该问题一般能解决;–对于BSC出现频繁告警的模块(如:RA:VSWR等)暂时LOCK,等CPR恢复后再打开,并解决其告警。…/...AlcatelBSS故障分析及解决方案—14Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.2由一块OSI_CPR问题引起的X.25故障…/...•另外值指出的是,若发现BTS_ADAPTOR的状态异常,特别是在OMC-R上显示状态为MSA,在BSCTerminal上显示状态不稳定的模块,还会引起其他多种问题,如:PRC激活时TCUFLT;切换SYS_CPR,BSC不稳定等等.其根本原因由于BTS_ADAPTOR状态FLT,当CPR有动作时,与问题BTS_ADAPTOR相关的TCU,DTC等网元的状态亦会随之刷新,导致大量的内部MSG送往CPR,使其不堪重负。当然对于其他模块如果也有类似现象。因此,防患于未然,及时发现问题并予以解决是网络维护的重中之重。AlcatelBSS故障分析及解决方案—15Allrightsreserved©2003,AlcatelShanghaiBell1.2.1.2由一块OSI_CPR问题引起的X.25故障断开A-trunk2/6,OSI_CPR故障解除:•原因:由于A接口模块造成,包括:ASMC、ATBX、ASMB、及交换模块问题引起,其中较多发生的是由于ATBX的SETTING错误.•解决方法:可以UPLOADATBX的MAPPINGFILE,观察31TS便知。如发现出错,可以通过重新SETTING来解决问题。AlcatelBSS故障分析及解决方案—16Allrightsreserved©2003,AlcatelShanghaiBell1.2.2由传输路径上的故障引起的X.25问题由传输路径上的故障引起的X.25链路问题,表现为:OSI_CPR无告警,但路由器中显示时隙状态为DOWNOSI_CPR的X.25显示X.25不通AlcatelBSS故障分析及解决方案—17Allrightsreserved©2003,AlcatelShanghaiBell原因:一般是由X.25路径上传输模块的相应时隙故障引起的,分下列几种情况:•TC模块问题:在ATR2/6模块上观察到无话务占用的情况,RESETATBX/MT120即可;•ASMB/ASMC的相应时隙异常占用,插拔后即可;•交换的SPC模块问题,对SPC进行重新删创或RESET相应模块即可;1.2.2由传输路径上的问题引起的X.25问题AlcatelBSS故障分析及解决方案—18Allrightsreserved©2003,AlcatelShanghaiBell1.2.2由传输路径上的问题引起的X.25问题现场实际处理实例:•在浙江金华的巡检过程中,发现有10个X.25时隙状态为DOWN,其中8个BSC的OSI_CPR有X.25告警,处理结果如下:–有4个X.25时隙通过在MSC侧对SPC进行重新删创恢复正常;–有3个X.25时隙通过在TC侧对TC模块进行重新SETTING并RESET后恢复正常;–有3个X.25时隙通过在BSC侧对DTC和ASMB进行RESET后恢复正常。AlcatelBSS故障分析及解决方案—19Allrightsreserved©2003,AlcatelShanghaiBell1.3小结现将上述的X.25问题的分析小结如下:第一类问题•原因:操作不当•注意事项:因此操作人员应该严格按操作流程,谨慎对网络进行操作,避免出现故障;AlcatelBSS故障分析及解决方案—20Allrightsreserved©2003,AlcatelShanghaiBell第二类问题•原因:由于传输模块中对应的时隙状态异常引起。•注意事项:–在设备开通之初,必须对各个传输模块作正确的设置(SETTING)–在日常维护中,应通过OMC-R对X.25的时隙状态进行经常性的观察,发现问题及时处理,以避免问题的积累。1.3小结AlcatelBSS故障分析及解决方案—21Allrightsreserved©2003,AlcatelShanghaiBell第二部分BSCX.25和OSI_CPR问题处理BTS问题引起小区话务异常问题分析A接口时隙处理AlcatelBSS故障分析及解决方案—22Allrightsreserved©2003,AlcatelShanghaiBell1.综述南京等一些地区在软件升至B72MR4版本后,有个别小区在运行一段时间后话务占用异常,现场CQT测试发现电话根本无法打通,但在OMC-R上观察BTS的SBL状态为IT,这种问题俗称“基站吊死”。然而,这类问题一般只能通过终端用户投诉及话务分析报告发现,但此时问题已经比较严重。通过对问题小区的话务报告、AbisTrace、告警报告、CQT测试报告分析,发现此类问题主要有四种类型,找到了问题原因及预防措施,并提供了相应的解决方法。AlcatelBSS故障分析及解决方案—23Allrightsreserved©2003,AlcatelShanghaiBell2.BTS问题引起小区话务异常的四种类型经分析,此问题的表现可以分为四种类型,有不同的内部原因和解决方法。现在将问题分析结果归结如下,并给出解决方法和预防措施。AlcatelBSS故障分析及解决方案—24Allrightsreserved©2003,AlcatelShanghaiBell2.1BTS问题引起小区话务异常的四种类型类型一:话务报告分析:•话务报告中显示TCH分配失败率很高,有时甚至达100%。•分配失败集中在MC14b计数器,也就是BSSProblem引起的分配失败。•个别TRX的占用时长超短。AbisTrace分析:在TCH分配时BTS没有向BSC回“channelactivationacknowledge”的消息。CQT测试分析:在现场拨打测试,SDCCH能被正