LTE故障处理手册一.重大故障处理方法1.重大故障实时告警列表告警类别告警设备表述描述可能的原因及影响华为ENODEB网管批量网元断链或小区不可用基站断电,或大批量双模站点TD测GPS故障传输设备网管批量网元断链基站断电,或传输原因中断2.重大故障处理步骤●【批量基站断站或小区不可用】●原因分析基站批量断点或或批量双模站点TD测GPS出现故障及传输设备故障●关注重点批量基站断站或小区不可用●常见处理方法序号处理方法“是”“否”1联系传输人员,看是否为传输设备故障422联系代维人员确定基站是否断电533联系代维人员确定基站是否为双模基站并确定TD测GPS完好54通知传输人员处理65通知代维人员处理66结束二.告警预处理告警分类1.实时告警分类总表告警等级告警号告警名称本机网管紧急网元连接中断ENODEB重要29243小区服务能力下降告警重要19240小区不可用告警重要26205BBU单板维护链路异常告警重要29207基站控制面传输中断告警重要25621直流输出异常告警重要26276制式间站点配置冲突告警重要26238RRU组网拓扑类型与配置不一致告警重要BBP心跳检测失败告警重要26529射频单元驻波告警重要26322BBU测收发光异常重要26503RRU测收发光异常重要26233BBUIR光接口性能恶化告警重要29201S1接口故障告警重要25888SCTP链路故障告警重要26235射频单元维护链路异常告警重要26506RRU测光口性能恶化重要26260系统时钟不可用告警2.主要告警分析和常见的处理手段。1)【网元链接中断】●告警解释:网元与OMC网管之间的链接中断,一般来讲,为断电或传输问题●对系统的影响对该网元无法控制●告警处理序号处理方法“是”“否”1检查同一环路下基站是否全部中断(基站侧检查光路和电源是否OK.)232通知传输中心处理433通知机房巡检处理故障(基站侧更换传输光模块/光纤)44结束2)【29243:小区服务能力下降】●告警解释当基站射频资源或基带资源不能满足当前小区的配置规格时,产生此告警●对系统的影响告警小区提供给客户可用的无线空口资源会减少。●告警处理序号处理方法“是”“否“1DSPBRDMFRINFO查看当前RRU型号(基站侧直接查看RRU型号)272LSTRRU查询RRU配置信息是否与当前RRU相符(基站侧可以直接登录基站侧查看命令相同)343LSTALMAF查询当前的告警信息,看可用通是否相符(基站侧可以直接登录或网管确认)454MODRRU把通道数该为当前RRU通道数,看告警是否恢复(基站侧请联系数据修改组修改数据)95DSPVSWR查看告警小区RRU是否有驻波(基站侧联系网管确认)866DSPSFP查看光模块型号是否满足LTE需求(基站侧可直接查看)光模块大于6.144G。787考虑可能基带板资源不足,需增加基带板LBBP。看是否恢复98通知基站代维人员上站处理RRU通道/驻波/光模块99结束查询RRU配置通道:查询基站当前告警信息:查询驻波:查询光模块型号,速率:3)【19240:小区不可用告警】●告警解释当基站检测到小区不能提供业务时,产生此告警。●对系统的影响告警小区不能提供业务。●告警处理序号处理方法“是““否“1在网管上查看基站是否断开(基站侧联系网管确认)822DSPCELL,发现小区为不可用状态(基站侧可直接登录基站查询或联系网管)3113LSTALMAF查看是否有RRU告警,如硬件,温度,掉电等告警(基站侧可直接检查或登录基站查询)944DSPBRD,看是否有RRU故障(基站侧可直接查看RRU是否掉电)955DSPSFP查询不可用RRU对应的光路是否OK(基站侧可看指示灯是否正常)966DSPCLKSRC查看当前使用的时钟,如是GPS,DSPGPS查看当前收星情况(基站侧直接查看GPS是否开路或登录基站查看)977查看是否有系统无License运行告警、配置数据超出License限制告警108通知传输人员处理故障119通知代维人员处理故障1110联系华为申请1111结束查询小区是否可用:查看RRU是否有告警:查询光路是否OK:查询GPS是否可用:查看是否有License告警:4)【29207:基站控制面传输中断告警】(注:由于网元断链,网管无法对基站控制)●告警解释当基站所有SCTP链路状态都异常时,产生此告警。●对系统的影响基站所有承载S1Interface、X2Interface的SCTP链路(链路个数不少于2条)状态都异常,导致基站所有S1接口、X2接口无法建立成功,小区无法激活,用户无法入网。●告警处理序号处理方法“是““否“1在网管中心的告警台上,检查是否存在根源告警:SCTP链路故障告警,S1接口故障告警242检查并处理SCTP链路闭塞情况并处理,看是否恢复43联系传输网络维护人员处理故障44结束5)【26233:BBUIR光接口性能恶化告警】●告警解释当BBU的IR端口上的光模块的接收或发送性能恶化时,产生此告警。●对系统影响1、光模块的收发性能严重恶化,可能导致IR链路承载的业务质量严重下降,或导致下级射频单元业务中断。2、光模块的收发性能轻微恶化,可能导致射频单元该IR链路承载的业务质量出现轻微恶化。●告警处理序号处理方法“是““否“1在网管中心的告警台上,检查是否存在告警(基站侧可登陆基站或联系网管)252光模块的型号与射频单元测是否匹配,并用DSPSFP命令查询收发光是否过低或过高(基站侧可直接检查BBU到RRU光模块型号是否相同或登陆基站查询)。443联系代维到BBU近端,重新插拔故障IR端口上的光模块和光纤接头并用酒精擦拭以清洁光纤接头,看是否恢复544通知代维人员上站更换光模块55结束查询RRU收发光:6)【26260:系统时钟不可用告警】●告警解释当基站使用本地晶振的时间超过其可保持的时限时,产生此告警。●对系统影响基站业务处理会出现各种异常,如切换失败、掉话等,严重时基站不能提供业务。●告警处理序号处理方法“是”“否”1网管中心告警台上,检查系统是否存在相关告警。(基站侧可直接检查GPS是否开路或登陆基站检查)252在网管室查询TD测(LTE取得时钟为对端及TD测)是否配置时钟参考源和时钟参考源是否存在异常。(基站侧联系网管或登陆基站查询)353查询单板是否故障454通知代维处理55结束查询GPS情况:查询GPS问题是否是有单板故障问题引起:●提示eNodeB大部分取得时钟为对端(及TD测),现网大部分为GPS,当前时钟状态为不可用时,可判断GPS问题,需上站检查GPS。●关于License的下发遵守的规则:TD:LTE:典型案例1、光模块速率问题导致小区服务能力下降告警现象描述:某局站点开通后出现小区服务能力下降告警,查询基站CELL,VSWR等均正常,也无任何告警。现场RRU类型3152-e,基带板LBBPd,且3152-e开单流1*20M小区。可能原因:1、射频单元发射通道故障,比如驻波,现场所接RRU物理通道和数据配置不一致。2、单板硬件故障,软件运行异常等。3、小区CPRI带宽资源不足,光模块速率不匹配。处理过程:1.网管查询CELL建立成功,VSWR均为1.2左右,低于门限值,没有驻波。RRU开单流物理通道和数据配置一致。,排除原因1.2.远程下点复位告警单板,单板运行正常后告警仍然不消除,近端插拔单板也不行,且没有单板硬件故障告警和单板软件运行异常告警,排除原因2.3.通过命令DSPCPRILBR查询每个RRUCHAIN的协商速率均为2.5G,重新协商STRCPRILBRNEG后仍为2.5G,之后通过DSPSFP查询发现BBU侧和RRU侧光模块均为2.5G,到底问题基本定位,联系室分厂家全部更换6.14G光模块后重新协商CPRI速率,均为最大能力4.9G,告警也随之消除。总结建议3152-e开1*20M小区所需CPRI速率为4.9G,而2.5G满足不了此要求,进而就上报了小区服务能力下降告警。2、数据配置问题导致小区服务能力下降现象描述TDS/L双模站点“xxxx”,TDL侧3个小区上报“小区服务能力下降告警”,但是查询RRU驻波、收发光功率都正常,无其它相关告警,需要排查产生该告警的原因。ENODEB版本:DBS3900V100R005C00SPC310NODEB版本:DNB6200V400R007C00SPC500告警信息小区服务能力下降告警,告警ID=29243,定位信息:本地小区标识=1,小区当前使用发射通道数=1,小区当前使用接收通道数=1,具体问题=小区射频资源,小区名称=盛平村FE1原因分析通常小区服务能力下降告警都是由于站点硬件故障导致的,例如RRU驻波告警、RRU到BBU之间收发光异常、光模块速率过低等,但是查询该站点并不存在上述情况,怀疑跟数据配置有关。处理过程1查询RRU驻波、收发光功率、光模块速率都正常,也不存在其它异常告警,初步排除硬件故障原因;2怀疑跟数据配置有关,查询RRU和扇区配置发现该站点为8T8R的宏站配置,而且RRU的8个PATH也都正确关联进去,如下所示(详见附件)——LSTRRU:查询RRU/RFU配置信息-------------------柜号框号槽号管理状态RRU拓扑位置RRU链/环编号RRU在链中的插入位置RRU类型RRU工作制式接收通道个数发射通道个数0600解闭塞主链环10MRRUTDS_TDL88LSTSECTOR:查询扇区配置信息----------------扇区号扇区名称地理坐标数据格式秒格式天线经度(秒)秒格式天线纬度(秒)经度(1e-6度)纬度(1e-6度)天线模式1sector_1度格式NULLNULL114250022273022八发八收3怀疑RRU硬件可能是RRU3152-fa,不支持上述8T8R的配置,查询RRU硬件信息发现确实如此(见下),将相关配置数据修改为RRU3152-fa支持的场景后,告警恢复。//查询单板制造信息DSPBRDMFRINFO:CN=0,SRN=60,SN=0;----------------单板类型=WD1MTRU4FADH条码=210231935610C6000572描述=TD-TECHRRU3152-FADC,WD1MTRU4FADH,TD-SCDMA1880-1910MHz&2010-2025MHz2path思考与总结1、本案例中RRU配置为8发8收,实际物理硬件为RRU3152-fa,只支持2发2收,但没有上报“单板类型和配置不匹配告警”,而是从检测RRU的实际能力出发,上报“小区服务能力不足告警”,这一点需要注意。此外,告警信息中提示“小区当前使用发射通道数=1,小区当前使用接收通道数=1”,而不是2个通道数,应该与小区实际生效时检测到只有1个可用通道有关。问题回溯后发现,现场负责硬件安装的督导与后台负责数据制作的督导之间没有及时有效沟通,后台想当然地根据宏站LTE站点8发8收的模板制作数据,后续项目组在开站流程上予以梳理规避,特别是对于RRU3152使用在宏站、室分的场景,要求必须核实。3、双模站点因TDS载波扩容后超过产品规格导致LTE小区服务能力下降的问题处理现象描述多个双模站点LTE侧上报小区服务能力下降告警,无其它相关告警,需要排查产生该告警的原因。ENODEB版本:DBS3900V100R005C00SPC372NODEB版本:DNB6200V400R007C00SPC700RRU类型:3168-fa告警信息LTE站点只有小区服务能力下降告警TDS侧无任何异常告警原因分析1.驻波告警,光模块速率问题2.LTE数据配置问题3.产品规格问题处理过程1、DSPVSWR查询驻波值均不超过1.3,通过扫频测试驻波值也正常,DSPSFP查询光模块速率均为9.8G,由于当前软件版本不支持9.8G光速率,所以数据配置仍为6.1G,目前局点该场景很多,并无问题,排除原因1。2、仔细检查数据配置的各种关键参数(扇区模式、天线收发模式、RRU链环配置等)均无发现问题,对比其它类似场景站点的数据配置,也未发现问题,