中国电信兰州分公司联合优化项目总结2021-8-5第1页,共10页1.1.1CMPT板损坏导致基站失锁【现象描述】基站在操作维护平台中查看未退服,但BBU内HECM、HCPM板件均无法正常使用,不断重启;告警维护平台中查看基站存在“失锁”告警。【原因分析】通过告警维护平台可得知告警涉及“GPS线路”方面,但对于具体障碍,需要对整段线路进行检查。【处理过程】通过障碍现象实际上可以得知该基站已经退服,无法实现其应有的功能。由于已通过网管定位为GPS故障,因而直接检查GPS线路。将CMPT板与GPS蘑菇头相连的小跳线处断开,使用万用表的直流电压档位测试CMPT板输出电压,为0V;再使用万用表欧姆档位测试GPS电阻,在合适范围内(注:蘑菇头电阻几百欧不等,按照品牌略有差异)。由于一般情况下CMPT板应该输出约5V左右的直流电为GPS蘑菇头供电,那么可以判定,为CMPT板件引起的故障。更换CMPT板,恢复小跳线,基站重启后恢复工作,HCPM、HECM板正常工作,基站修复。【建议与总结】1.当在基站不同步的一些情况下,网管不显示基站退服,但需要同步的板件无法正常工作;2.应当了解GPS故障处理的一些常识性知识。1.1.2PPP链路中断【现象描述】接到网管通知,反映所属安宁分局的“费家营”基站UTRP板件存在PPP链路中断告警,影响该基站的正常业务功能。【原因分析】由于涉及的设备为基站电路域设备,因此优先考虑是电路部分的问题。【处理过程】在现场察看发现UTRP板件存在告警,ALM指示灯为红色闪烁状态,初步判断UTRP板件正常。排除传输扩展板件故障后,察看与其相联接的2M线路,将不涉及开销信道中国电信兰州分公司联合优化项目总结2021-8-5第2页,共10页的2M(不会造成断站)在成端处断开,METRO500光端机的2M接口向BSC环回,与UTRP板相连的2M接口向基站环回。询问网管,发现BSC侧链路正常,基站侧无法环回。近一步察看与UTRP板相连的2M头子,可能存在虚焊,重做2M头子后PPP链路恢复正常,障碍恢复。【建议与总结】1.涉及电路域的故障优先考虑电路部分;2.熟悉传输“环回”的故障处理方法1.1.3PPP数据漏配【现象描述】在操作维护系统对日常告警进行查看时,发现榆中分局“蒋家营”基站CMPT板上链路标示为1的PPP链路中断。【原因分析】传输链路出现告警的可能引起原因包括物理上的和逻辑(数据)上的。【处理过程】现场查看CMPT板件存在告警指示。与基站CMPT板件相连的PPP链路,即通俗的2M链路,标示为1,表明为物理连接的第2条2M链路。观察2M接头,发现头子焊点饱满,不存在虚焊问题。在成端处把第2对2M向基站环回,CMPT板上告警消失,排除近端故障原因;在成端处向BSC把第2对2M环回,BSC侧人员发现链路不通。将该情况向网络控制中心上报,最终查明故障原因为传输单条链路数据漏配导致。重新添加数据后基站PPP链路告警消失,障碍修复。【建议与总结】1.单条传输链路告警一般是由物理原因引起的,处理时优先考虑虚焊、短路等问题;2.传输数据单条漏配是容易被忽视的障碍原因,需要引起重视。1.1.4PPP链路自环【现象描述】基站退服后,东岗分局人员表示该基站电源工作正常,外部传输光缆未中断,但基站却无法正常重新启动。【原因分析】中国电信兰州分公司联合优化项目总结2021-8-5第3页,共10页基站退服,如果排除了电力和外部传输原因,那么优先考虑机房内传输和板件因素。【处理过程】赶往故障现场后查看基站电源工作正常;查看光端机,型号为瑞斯康达RC120,光口LOS灯灭,即外部传输光路正常,未中断。仔细查看2M链路所使用的BNC接头,接头良好,无虚焊、短接。但将近端未占用开销信道的BNC接头向基站环回时,BSC侧人员却表示不可见。此时,可判断出BSC至BTS传输链路不通。在光端机侧向BSC侧打环发现,无论物理上是否连接,BSC侧均可见。至此,故障查明,障碍原因是传输侧软件自环引起。通知相关维护人员,对自环链路进行释放后,基站在5分钟后重新启动进入正常工作,障碍修复。【建议与总结】1.传输自环是一种比较隐蔽的障碍现象,需要多部门配合才能处理;2.对基站故障的判定要从大处着眼,从小处着手。1.1.5传输单纤中断导致基站退服【现象描述】基站退服,电源工作正常,基站光端机无告警。【原因分析】在排除电源故障的情况下,出于对设备本身的可靠性考虑,基站退服优先怀疑是传输的问题。【处理过程】查看CMPT板件,存在传输中断告警,查看光端机,无告警。遵循“由近到远”的维护原则,从成端将2M断开,首先向基站侧环回,环回后观察CMPT板件指示灯,告警消失,表明基站2M线路正常;在成端将2M端子向BSC侧环回,询问BSC侧人员,发现链路不通。此时可判定障碍为传输障碍,报相关传输维护单位,发现由BTS至BSC的单条光纤中断,重新融接后基站恢复正常。【建议与总结】1.传输光端机设备仅将自身能否收到对端发光作为判定光路是否正常的依据。由于光端机一收一发两条链路,当发端链路中断时,本端不显示告警;2.谨记上述情况,理解光路中断,但光端机“无告警”的含义。中国电信兰州分公司联合优化项目总结2021-8-5第4页,共10页1.1.6CMPT板件故障导致基站退服【现象描述】基站退服,传输、电源设备正常工作。【原因分析】当基站退服后,在排除所有外部故障可能性的前提下,锁定基站主设备本身【处理过程】现场查看设备机柜,发现BBU框架内的CMPT板件有告警存在,ALM灯常亮而不闪烁。对CMPT板件作下电重启处理后,状态如前,可判断为CMPT板件已坏,需要更换。使用备件替换损坏原件,基站恢复正常。【建议与总结】1.特别注意,由于CMPT板件内部含有存储基站信息的电路,因此更换该板件时不能仅仅更换板件就结束,还需要通知BSC侧人员对基站数据进行灌制;2.如果更换的备件是从未被使用过的新板件,可直接通知BSC侧人员灌制数据。若更换的备件是已经使用过的旧板件,需要BSC侧人员首先删除其内原有的数据,才可重新灌注数据,否则无法正常加载数据,基站是无法启动的。3.现网内使用的华为板件,除去CMPT板件外,其他板件故障,直接进行更换即可。1.1.7光纤中断导致BBU与RRU失去联接【现象描述】查看操作维护系统,发现所属皋兰分局的“109国道3”基站两个小区退服,但基站未退服。【原因分析】由于该基站为分布式基站系统,涉及障碍的板件可能是RRU设备。【处理过程】现场发现该基站的BBU设备在山坡机房内,而RRU设备挂在机房外10M抱杆上。由于故障原因为小区退服,那么应当先查看RRU设备。但由于RRU设备查看不易,因而首先查看与RRU相连的BBU设备。发现与RRU相连的基带单元上的HCPM板件存在告警,告警显示为TX正常,RX收无光,可理解为BBU设备向RRU发送信号正常,但收不到RRU设备所发出的信号。检查RRU设备供电,发现RRU设备供电正常,排除设备供电原因导致的故障。爬上抱杆,发现RRU设备指示灯显示为收无光告警,也证明了中国电信兰州分公司联合优化项目总结2021-8-5第5页,共10页排除电力故障的正确性。对RRU与BBU相连接的两路光纤进行更换,与网管确认,退服小区已可用,障碍恢复。【建议与总结】1.维护人员应熟知基站连线结构;2.维护时应遵循先易后难的原则。1.1.8GPS失锁【现象描述】基站传输与电力已确认正常,但基站有时退服,且无明显规律。【原因分析】在基站传输与电力确认正常的情况下,率先考虑基站同步问题。【处理过程】查看主设备BBU框架内的传输主控板,发现基站存在告警。对传输与电力再次确认,包括光端机、2M、电源电压等,均无故障,故推测为GPS故障。联系BSC侧维护人员,将基站的同步时钟源由GPS改为传输线路时钟。观察发现,基站正常启动,且再无退服现象出现。障碍查明,将基站原GPS蘑菇头进行更换,障碍恢复,未再次出现退服情况【建议与总结】1.GPS失锁是容易被忽视的障碍现象,但确实存在;2.当基站使用传输时钟时,基站与其他基站间无法切换,使用传输时钟仅是一种手段。1.1.9DCDU端子故障【现象描述】RRU设备不断与BBU设备失去联接,间隔约5分钟。【原因分析】由于基站BBU工作正常,因此优先考虑RRU本身以及其连线的问题。【处理过程】至现场查看,该基站RRU采用直流供电(注:华为RRU设备根据不同的型号,可使用交/直流两种电源供电),且给RRU供电的设备为DCDU端子,当时DCDU端子空中国电信兰州分公司联合优化项目总结2021-8-5第6页,共10页开已跳脱。将DCDU跳脱空开进行复位,RRU恢复供电,询问网管,RRU与BBU建立连接,障碍似乎已恢复;观察10分钟,在RRU正常恢复后不久,DCDU端子上的空开再次跳脱。使用万用表对整个基站的引入电源进行较长时间的观察测试,发现电压平稳,排除外部电源的问题。将DCDU为RRU供电的端子改换为另外的一对接口,观察RRU设备,至今再未出现空开跳脱情况,障碍恢复。【建议与总结】1.华为DCDU设备支持1路48V直流输入和10路直流输出,由于工艺、制造等方面的原因(不在本案例讨论范围之内),可能存在某对端子电压、电流不稳的情况;2.基站维护要求我们能够就地取材、灵活应对各种障碍。1.1.10PSU损坏导致基站退服【现象描述】基站退服,传输正常。【原因分析】基站退服,大多数情况下都是由电力和传输故障引起。【处理过程】永登韩家井基站,地处偏远,因而野外露天安装,采用APM30机柜。查看机柜内设备,发现PMU模块存在短路告警,表明PSU模块发生了故障。首先,拔出1号槽位的PSU,告警仍然存在。连接拔出2号槽位的PSU,告警消失,基站开始启动,5分钟后基站工作正常。然后,将1号槽位内拔出的PSU模块恢复,基站仍然正常工作,证明1号槽位内的PSU模块也是正常的。最后,将2号槽位已拔出的PSU模块带走进行返修后,重新装入了机柜内。【建议与总结】1.维护人员除了需要熟知常见板件和故障外,还应了解生僻设备和不常见故障的处理方法;2.现网内目前在用的机柜包括APM30、APM30H、19英寸机柜等,其中APM30机柜中一般安装有1个PMU模块,3个PSU模块。它们不是主/备关系,只要有一个PSU模块短路,机柜就会自动切断本身所有供电,造成所有设备电力中断。1.1.11光模块损坏【现象描述】中国电信兰州分公司联合优化项目总结2021-8-5第7页,共10页基站工作正常,告警管理平台产生“小区退服”的告警,操作维护平台查看发现RRU与BBU失去联接。【原因分析】RRU与BBU失去联接,一般考虑RRU电力中断、RRU与BBU传输链路中断、设备本身故障这三种情况【处理过程】观察BBU机框内的HCPM板,发现与RRU相连光路的指示灯中,TX灯为绿色且常亮,表明HCPM板件发光正常;RX灯不亮,即板件收不到对端RRU设备发出的光。在BBU端将RRU的发光纤使用光功率计测试,发现RRU设备发光正常;再到RRU侧使用光功率计测试HCPM板件发光纤也正常。那么问题的焦点集中于HCPM板件处,故障可能是由HCPM板件本身或者是连接HCPM板件与RRU之间的光模块造成。将光模块拔出后进行更换,HCPM板上的TX/RX灯均常亮,故障恢复,同时也排除了HCPM板件本身故障的可能性。【建议与总结】1.现网基带单元内的HCPM板与射频单元(包括CRFU与RRU两种)之间的互联都采用了光模块;2.光模块损坏引起的故障隐蔽且少见,目前兰州市维护区域内仅有1例,但随着时间的推移,这种障碍值得我们关注。1.1.12UTRP板件故障【现象描述】网优人员通知,“大雁滩”基站所覆盖区域内无法使用数据业务。【原因分析】由于无法实现基站数据功能,所以故障定位在HECP板件与基站数据上。【处理过程】该基站为归属联通的共享共建基站,通知联通值班人员后进入基站。我方基站为BTS3900设备,打开机柜发现为基站提供数据支持功能的HECM板件无告警指示,但传输扩展板UTRP却存在告警指示。询问BSC侧值班人员,