LTE-FZHA(RL25)常见故障总结1.Systemmodulefailure(0010)引起原因:由于天气温度过高或者机房温度过高,导致BBU的热量散发不出去,引起的告警,一般表现是第三小区挂死,严重的可能会整站挂死,甚至会烧坏BBU。抑或是光模块出现问题导致出现此告警。处理方法:1、由于是高温引起,基站要降温并重启BBU.若是BBU长期处于高温状态,会导致BBU内部的芯片烧坏,到最后只能替换BBU2、若是因为光模块导致,则可以更换光模块,则可以解决此问题。2.BTSreferenceclockmissing(1898)引起原因:一般导致此故障有两个原因:1、高温导致比较常见,由于高温时间过长,光模块过热,导致BBU和RRU失去连接,而后会出现此告警。2、时钟盒出现故障。3、时钟线与GPS头的连接线接头(避雷器接口)没有做好,接收不到时钟信号。4、时钟线和时钟盒的连接不好。处理方法:1、高温引起,基站要降温,等待一段时间后并重启BBU.2、时钟盒故障,更换时钟盒;3、GPS线头没有接好,重新做一下从GPS引下来的馈线到避雷器的头子,使其能够正常接触。4、若是时钟线损坏,则更换时钟线;若是时钟线和时钟盒接头没有接好,则接好接头。3.Configurationerror:Unitinitializationfailure(0012)引起原因:1、高温导致小区挂死,软重启后会出现此告警2、高温导致基站自动重启出现此告警处理发法:1、高温引起,基站要降温并重启BBU。2、重新COMISSION基站,即重新把基站的集成文件(SCFC)和传输文件(Config)重新传入BBU内,重启后一般可以恢复正常。4.Configurationerror:NotenoughHWforLCR(1868)引起原因:以3小区基站配置来说明,由于集成文件已经配置好了,若是某一小区丢失或两个、三个小区的RRU都识别不到,则会出现此告警。1、高温导致光模块过热,跟光纤的连接中断2、光纤没有插好3、光纤断了4、RRU坏了5、SCFC文件配置有问题处理方法:1、高温引起,基站要降温并重启BBU。2、将光纤拔下来,重新插好3、更换损坏的光纤4、更换RRU5、重新配置SCFC文件,如果是二小区的基站,不能将SCFC文件做成三小区的配置,否则也会出此告警。5.Configurationerror:Powerlevelnotsupported(4008)引起原因:1、BBU上的FSMF到FBBA之间的电源连接线没有插好,导致供电不足2、BBU自身的问题处理方法:1、重新拔插这些电源线,使之接触正常2、说是BBU自身的问题,则是有些可以不用拔插,直接重启基站就可以解决此问题。6.Cellconfigurationdatadistributionfailed(6253)引起原因:基站运行一段时间由于自身问题导致,在此也说不清楚为什么会出现此问题,最大的可能性就是BBU加载好的文件一般存储在它的FLASH芯片里面,运行一段时间后文件出错,未能成功读取到SCFC文件,导致基站出现此告警处理方法:由于重启基站后此问题即可消失,所以一般处理的方式为重启基站,在重启的过程中,基站会重新读取索引目录Filedirectory,重新加载基站的配置文件,此过程会擦除原先在Flasn里面的数据,这样基站就能正常工作了。7.FailureinopticalRP3interface(4064)引起原因:1、光模块损坏导致辅口读不到光纤消息2、温度过高,导致辅口光模块故障,读取不到光纤消息3、辅口的光纤断了处理方法:1、更换辅口的光模块,问题得到解决2、下电直接重启,或是下电后将光模块拔出,冷却一阵再插入卡槽内,加好光纤,加电起来后此告警消失3、光纤损坏导致此问题,需要更换光纤,此问题最为麻烦,需要工程队配合,一般更换光纤后都能好(前提是把1、2都做过一遍了,告警得不到解决的情况下,更换光纤)。8.FailureinopticalRP3interface(0010)引起原因:1、高温导致小区两光纤传输中断,BBU读不到RRU消息2、高温导致小区两光模块出现问题处理方法:此问题处理的方法一般为下点重启,问题都可以得到解决,但是如果机房或者综合柜的温度还是很高的话,过不了多久,大概10分钟左右,此告警还会出现,所以需要做的是打开综合柜的门,进行散热处理,或是增加空调设备,降低室内温度,如果基站在室外,则没有什么好的办法,只能将BBU拿出来,放在综合柜外面。9.Basebandbusfailure(3020,1906)引起原因:1、BUS线没有插好2、BBU内部主板的问题处理方法:1、重新拔插BUS线,使之连接正常2、BBU内部主板的问题有的可以通过下电重启解决此问题,但是有的只能更换BBU,此问题才能得到解决。10.RFmodulefailure(6259,1911、1711、1712)引起原因:1、光模块损坏导致2、RRU出现故障导致处理方法:1、若是告警号为1711(主)或1712(辅),则分别更换主辅侧的光模块即可解决问题。2、告警号为1911或者是6259的时候,则需要更换RRU,一般都可以解决此类故障。11.Cellpowerfailure(4090)引起原因:1、高温导致供给FBBA的电流减少,导致功率不足2、Vendor文件不匹配处理方法:1、高温引起,基站要降温并重启BBU2、更换跟天线匹配的正确的Vendor文件12.GPSReceiveralarm:ControlInterfacenotavailable(4011)引起原因:GPS时钟盒工作不正常处理方法:1、重启时钟盒2、拔插连接BBU和时钟盒的时钟线13.X2interfacesetupfailure(6304)引起原因:X2链路连接建立失败,需要建立X2链路连接处理方法:1、如果邻基站存在,则邻基站好了以后,此告警自然消失2、如果邻基站不存在,则需要在邻区关系表里面讲此链路的连接配置删除,既可以消除此告警。14.TransportlayerconnectionfailureinX2interface引起原因:邻小区没有Onair,即基站未能正常起来工作处理方法:1、删除邻区关系2、是邻小区正常工作15.Failureinreplaceablebasebandunit引起原因:1、FSMF和FBBA之间连接不好导致2、FBBA硬件问题处理方法:1、重启BBU2、检查FSMF和FBBA之间的连线3、更换FBBA板件16.Temperaturealarm(0002)引起原因:1、机房或者综合柜温度过高2、BBU风扇转速过快或者过慢处理方法:1、检查机房空调是否正常工作,温度是否正常。2、检查综合柜是否散热良好3、检查BBU的风扇转速是否正常,一般可以看到此类告警,若是不正常,则需要更换风扇。17.VSWR(1838)引起原因:1、RRU内部的耦合器脱落,倒是发射端口出现驻波2、天线跟BBU内的Vendor文件不匹配,出现驻波3、馈线头子没有做好,进水了,出现驻波4、馈线有问题,出现驻波5、光模块也会导致驻波(很少见,我没见过,但是听说过)处理方法:1、对于RRU损坏导致的驻波,则更换RRU,只能如此解决2、若是天线和Vendor文件不匹配导致的告警,则更换相对应的Vendor文件3、进水了则需要晾干或者更换馈线4、馈线有问题则直接更换5、光模块有问题,可以通过更换光模块来解决。18.FailureinopticalRP3interface(2004)引起原因:1、软件问题2、硬件问题处理方法:1、更换软件版本,此告警有的基站可以消失2、更换硬件,此告警可以消失对于此告警,实在是难以有一个定论,曾经研发的人为此告警一天打了5个补丁还是解决不了,到现在也不知道怎么办,只有不停的更换软件包,更换硬件,更换光模块来消除此告警。19.GPS时钟盒闪断,时钟信号不正常,无法识别RRU正常情况下,小的时钟盒信号灯为常绿,如果出现绿色指示灯不断闪烁则GPS信号不正常。如果灯闪的情况为一长二短,则为GPS馈线短路,如果灯闪的情况为一长一短,则为GPS馈线开路。20.FailureinopticalRP3interface(2000)引起原因:此告警基本是因为温度过高,但是光模块还能工作,但又受到影响,出现的告警,或者是光模块故障导致解决办法:1、更换光模块2、下电重启,若是基站处于正常温度下,则可以保持正常,不再出此告警。21.光纤交叉连接对于室外型宏基站(FZHA,s111),开通后正常的FZHA的框号为1.1.1、1.3.1、1.4.1(normalFZHArackno.png)。已发现有部分基站开通后的FZHA的框号为1.1.1、1.2.1、1.3.1(abnormalFZHArackno.png)。对于这种情况,基站无告警,但对于第一、二小区的业务测试会造成影响。原因可能是第一小区的辅光纤与第二小区的主光纤交叉错接。1、3、4代表主光口22.基站始终无法建立S1连接,只到configed状态这种情况一般是基站发了S1连接请求,但是核心网侧没有回,在SM里面会有6308的告警(S1interfacesetupfailure),这个时候我们会误认为是核心网侧没有配这个站的数据或没配对,其实核心网侧不需要配置任何数据。所有的information都由ENB上报。下面是MME的输出:MCCMNCENBIDENBIPS1CONNAMOUNT==================================================4600813172.16.2.16346008106172.16.2.137046008108172.16.2.13916S1口通了之后,ENB正常接入网络,MME侧就能看见有关的信息。所以,基站侧开通时,不外乎2个问题:1.传输不通:需要核对传输侧数据是否配对。比如:ENBIP地址,网关,S1-C控制地址,VLANID等。2.传输通了,S1口不通:需要核对ENB侧MCC,MNC,ENBID是否正确。特别是ENBID,不能与其它站冲突。截止到现在,99%的ENBS1口不通,是由于ENBID冲突造成的。SCTP的端口号36412如果都是诺西的设备,就不会出问题。总之,在ENB接入EPC的过程中,MME只是起着等待接入,接入确认的作用。23.GPS时钟盒闪断,时钟信号不正常,无法识别RRU正常情况下,时钟盒信号灯为常绿,如果出现绿色指示灯不断闪烁则GPS信号不正常。如果灯闪的情况为一长二短,则为GPS馈线短路;如果灯闪的情况为一长一短,则为GPS馈线开路。这两种情况一般只需重做GPS头子就行。还有一种情况是灯闪的时间间隔相同,则为时钟盒模式选择错误,只需把时钟盒上的模式开关拨到GNSS就行。24.某一个小区的RRU无法识别现象是:该小区的RRU能ping通,但是在BTSlog里面无法读出RRU的版本,SiteManger里面也无法识别RRU。既然小区光纤同步没问题,而BTSlog和SM却又同时识别不到RRU的版本,按照RL15时的经验只可能是RRU的productCode丢失,所以从RRU里面,通过log–a提取RRU的log(F01_startup.zip和F01_runtime.zip),从该RRU的启动log里面,可以看到如图1-1显示的信息:图1-1该小区RRU启动log而正常RRU启动log里面,应为如图1-2所示的信息:图1-2正常RRU启动log对比可以看出,原因应该是productCode和Serialnumber丢失造成。在RRU里面,使用eeprom命令,手动写入productCode和Serialnumber,重启基站后,小区恢复正常。25.BBU版本无法识别BBU版本无法识别主要表现在SM读到的版本为“?”,这个问题也是在1800之后出现的,主要是因为往BBU里传文件时出错引起系统切换,重启后就识别不到版本了。对此尝试过很多手段,包括重升PS、重传fs1、重灌基站包和重刷fl