KPI及性能相关告警KPI的定义:KPI的counter:考虑与KPI及性能相关的告警,如果只关注平时正常运维的情况,不外乎两类:1.硬件类告警,导致基站或小区退服2.传输类告警,导致S1或X2连接中断下面讨论一些比较常见的告警类型。1.RP3告警对于eNB而言,只要cell不是OnAir的状态,那么该小区均无法处理呼叫,而所有导致小区退服的告警都属于这一类,由于基站或小区退服了,所以该类告警会影响所有KPI及性能指标,区别只在市整个基站的指标还是某小区的指标。一般而言,该类告警有两种7650BASESTATIONFAULTY和7653CELLFAULTY这两类告警通常是硬件告警,如BBU,RRU,Antenna,以及他们之间的链路出现硬件故障,最典型的当数RP3告警,FailureinopticalRP3interface,相比较RP3告警,模块的硬件故障从比例上来说要相对少很多所谓RP3即BBU与RRU的接口。这种告警也是最常见的告警,告警内容多为光路告警。目前这类告警常见的fault有0010、4064和2004。其中0010和4064严重时会导致小区退服、基站退服。但是2004一般只是小区性能下降,不会引起小区退服。1.1Fault0010:Noconnectiontounit伴随告警号7650、7651、7652、7653、7654(其中7650会引起基站退服;7653会引起小区退服)问题描述识别不到RRU处理方法1、可以先尝试重启基站观察2、检查光口速率是否匹配(强制8x速率)BBU侧强制8x速率设置:先检查SWCONFIG中0X19000C字段,对于软件版本RL25,0x19000C=1,及代表8x光速率,0代表4x光速率;对于软件版本RL35,0x19000C=0,代表自适应,1代表4x,2代表8x,注意不同软件版本的区别。RRU侧强制8x速率设置:telnet到RRU上,端口号是2323,使用命令rad–r0查看RRU的所有参数配置。找到0xED这个参数,看一下它当前的值是0还是1。0表示自适应,1表示强制8x。命令:rad–pw0xED1-----表示设置0xED=1命令:rad–pw0xED0-----表示设置0xED=0改完之后再次使用rad–r0查看是否修改成功即可。重启基站。3、确认光口速率没问题之后,就要排查是否是光纤、光模块及RRU的问题:检查光纤是否插好,尝试拔插光纤在BBU侧与正常小区对调,对调之后若光纤所连小区仍未识别,可判定BBU侧光模块没问题,而RRU侧光纤、RRU侧光模块或RRU可能有问题检查RRU是否上电通过更换光模块,排除光模块问题通过BTSLOG过滤OptIF查看光纤同步状态,确定光纤问题。如需要,考虑更换光纤(光纤质量问题占比较大)以上都不解决问题时,考虑更换RRU另外注意,对于F频段和E频段的RL35IRP7/P8版本,通常需要先下载配置文件才能找到RRU1.2Fault4064:MissingRP3-01link伴随告警号7653、7654(其中7653会引起小区退服)问题描述RRU可以识别到,但小区不能onair。此告警一般为硬件告警处理方法1、Telnet到有问题的RRU。3个RRU的地址依次为:192.168.253.196;192.168.253.212;192.168.253.220(RRU的地址可能会随着软件版本的不同而变化)。命令为telnet192.168.253.xxx23232、进入RRU之后输入命令:routersh–stat查看此RRU的两条光路状态。9代表主光路,10代表辅光路。如果两条光路的TXstate和RXstate均为Frame,并且PI值为14左右,则表明光路正常。如下图:3、出现4064告警,多数情况是辅光路state为idle或者off,说明辅光路没有同步。尝试拔插光纤,更换光模块或者更换光纤。4、对于RL35P8版本,如果是第三小区有4064告警,很有可能是光口速率匹配问题,可以尝试强制8x速率。但也有可能是硬件问题,如FBBABUS线连接松动,导致FBBA连接光口不正常(可以通过上述步骤和在BBU侧将正常小区和第3小区对调的方法来排查)BBU侧强制8x速率设置:先检查SWCONFIG中0X19000C字段,对于软件版本RL25,0x19000C=1,及代表8x光速率,0代表4x光速率;对于软件版本RL35,0x19000C=0,代表自适应,1代表4x,2代表8x(注意不同软件版本的区别)。RRU侧强制8x速率设置:telnet到RRU上,端口号是2323,使用命令rad–r0查看RRU的所有参数配置。找到0xED这个参数,看一下它当前的值是0还是1。0表示自适应,1表示强制8x。命令:rad–pw0xED1-----表示设置0xED=1命令:rad–pw0xED0-----表示设置0xED=0改完之后再次使用rad–r0查看是否修改成功即可。重启基站5、在RL35P7、P8版本中还发现根据上述步骤2如果两条光路的Rate值为4x,也会触发4064。更换RRU侧光模块,不需要重启基站。一般更换之后就会变成8x。小区随之恢复正常,若仍未恢复,则手动强制更改光口速率。1.3Fault2004:10b8bcodingerrorinOpticalInterfacedeviceoptlink/RP3伴随告警号7654问题描述第三小区告警,一般不影响业务处理方法1、如果是第三小区的2004告警,首先要确认FBBA是否为A103,必须要两块FBBA板都是A103的板子才可以消除,如果第一块FBBA板是102,那么还是会出2004告警。2、如果已经是A103的的板子,可以收集一段时间的BTSLOG,搜索关键字10b80b,查看到底是哪根光纤的问题。查看RP3-01X,后面这个X,0-5分别对应1-6光口。比如下面这个4就代表光口5,需要更换该光口以及对应的RRU侧的光模块。00021014.0213:29:42.88[100.92.206.26]3eFCT-1011-HWRSumS14.0210:23:02.08397423CWRN/HWA/SUM,10b8bbyteerrorcounterhashitthethresholdcount(link:RP3-014,LCV:0,LCVtotal:3058650310)2.FAILUREINOPTICALINTERFACE这类告警也是常见的告警,多为光模块或光纤问题。目前这类告警常见的fault有1944和1967。其中0010和4064严重时会导致小区退服、基站退Fault1944:CPRIopticalportfailure伴随告警号7653(会引起小区退服)问题描述小区退服处理方法1、检查TD-S到RRU的光纤是否连接2、检查RRU是否加电3、重启和TD-SBBU连接的RRU模块4、更换TD-SBBU连接的RRU模块5、更换TD-SBBUFault1967:SevereSFPreceptionpoweraggravationoptIfID伴随告警号7650、7653、7654(其中7653会引起小区退服)问题描述严重时小区退服处理方法1、检查TD-S侧告警,发现TD-S侧对应小区光口出现光口异常告警2、根据TD-S侧告警,更换光模块或者光纤3、多数更换的是TD-SBBU连RRU的光模块或光纤6、如果不解决问题,才考虑更换TD-SBBU连TD-LBBU的光模块3.SYSTEMMODULEFAILURE(3000)伴随告警号7650、7651(其中7650会引起小区退服)问题描述基站检测到一个系统模块内部功能的反常操作或者故障处理方法1.重启系统模块2.替换系统模块相关告警:10Noconnectiontounit16Unitsynchronizationfailed69POSTtestfailed1817Ovenoscillatorheatingfailure1819Ovenoscillatorclockmissing1820OvenoscillatorMissingPulse1806Communicationfailure1875/1876SRAMoperationfailure4025InternalMTUconfigurationfailure4.CONFIGURATIONERROR:NOTENOUGHHWFORLCR(1868)伴随告警号7653(会引起小区退服)问题描述射频模块无法为所配置的小区提供服务,或在基站启动期间发现配置的小区没有足够的FSP资源,或为配置的小区服务的FBBx被移除处理方法射频模块:将单/双功放更换成三功放射频模块。或者可以给基站减少配置的小区FSP:1.闭锁/解锁系统模块或FBBx2.如果没效果,更换系统模块或FBBxFBBx:1.将FBBx的电源断连和重新连接.2.如果不起作用,更换FBBx.当基站在启动过程中失败请确认基站的配置所需要的DSP能满足需求。或者可以减少基站配置的小区数目5.VSWR驻波告警Fault1838:VSWRminoralarmFault1837:VSWRmajoralarm当出现本类告警是,小区有可能退服,会影响该小区的所有KPI指标伴随告警号7652、7653、7654、7655(其中7653会引起小区退服)问题描述基站出现此告警,对应的小区橘黄色。告警明确会指示哪个小区的哪个通道有问题(F频段新建需要特别的方法来查看是哪个通道有问题);出现伴随告警4057:Radioresourcesswitchedoff和4003:TXfailureinMIMO处理方法1、跳线接触不良(多是RRU侧,和产品设计很有关系,但可以通过严格的施工工艺来尽量避免):拔插出现告警的跳线2、跳线对调:在RRU侧把出现告警的跳线与正常的跳线对调,观察告警是否跟随跳线走(注意对调最好间隔一个天线口,比如4口出现告警时,与6口或者2口对调)。如果告警跟随跳线走,则更换跳线。如果告警还在之前的天线口上,尝试用负载或者蘑菇头天线堵上该告警的天线口,看看告警是否能消除。如果告警能消除,说明问题在跳线或者天线侧,如果告警不消除,说明问题在RRU侧。3、跳线或馈线损坏:检查跳线是否进水或者跳线做工有问题,如果是,更换跳线。4、天线连接序列不对5、天线权值问题6、更换RRU7、更换天线8、告警出在1、2通道的多是软件问题(研发在进一步确认)另:如果使用的是京信内置合路器天线和集束电缆,会发现告警经常出现在7、8通道。更换跳线,RRU及天线都无法解决问题,并且更换不同的厂家天线后,会由于各个天线权值的变化,告警的通道也发生变化。这种问题是RRU软件问题。6.射频模块故障告警:RFMODULEFAILURE这类告警多为射频模块故障。目前这类告警常见的fault有1911和6259。对于Fault1911,一般不会引起小区退服。对于RL35IR分支,常见的fault为6259对于RL35mainbranch分支,常见的fault为1911Fault6259:AntennaCarrierconfigurationfailureFault1911:RXoutoforder伴随告警号7652、7653、7654(其中7653会引起小区退服)问题描述TD-L侧看到RRU在线,但小区不能onair,TD-S侧用“制式间光口资源冲突”告警,定位信息是问题小区的光口。或者TD-L侧看到三个RRU在线并均有此告警,3个小区均不能onair,TD-S侧查询所有硬件状态正常,无告警。或者TD-S正常起站后,TD-L侧起站完成某个小区onair之后马上退服,并出现此告警。TD-S侧查询所有硬件状态正常,无告警。处理方法1、对RRU重启,然后对TD-L的BBU重启2、如果不解决问题,在RNC上检查是否TD-S侧小区载频配置过多。如果是,对该小区进行减容。或者1、对RRU重启,然后对TD-L的BBU重启2、在RNC上检查三个小区功率是否均超过47