河南星辰通讯科技有限公司1(23)SDH常见故障处理案例河南星辰通讯科技有限公司技术支援部培训部河南星辰通讯科技有限公司2(23)提纲一、复用段保护故障定位二、通道保护故障定位三、误码问题处理四、指针调整问题处理五、设备对接问题处理河南星辰通讯科技有限公司3(23)一、复用段保护故障定位1.1案例1:复用段节点参数设置错误导致倒换失败组网情况同错误!未找到引用源。。故障现象1-5号和1-4号网元之间断纤后,部分业务中断。查询各个网元的复用段倒换状态,倒换状态不正确。重新启动复用段协议,也不能进入正常的复用段倒换状态。故障分析重新启动协议不能恢复正常,可能与复用段节点参数设置有关。查询环上各个网元的复用段参数,结果为:站名1-1号1-5号1-4号1-3号1-2号查询返回的复用段节点号15432从上表中可以看出,复用段节点参数未按接纤物理顺时针方向设置,设置的方向与顺时针方向相反。处理步骤在网管上按接纤物理顺时针方向重新设置复用段节点参数后,重启协议恢复正常。故障原因复用段节点参数设置错误导致了倒换出现异常。如:1-5号网元复用段协议处理时,默认为西向光盘对应的网元节点号比本身小1,东向光盘对应的网元节点号比本身大1。如果复用段节点参数设置不正确,必将导致协议处理出现异常。经验教训复用段参数的设置必须按接纤物理顺时针方向从“1”逐站递增,最大节点数为环上总节点数。复用段参数的设置和修改要仔细。网管中逻辑配置里可以设置网元的逻辑号(网块号-网元号),但它仅仅是个逻辑上的定义,不能最为复用段保护环节点号的设置参考。EWEWEWEWEW1-1图11-51-41-31-22.5GMSP环河南星辰通讯科技有限公司4(23)1.2案例2:光路误码复用段未倒换组网情况同错误!未找到引用源。。故障现象某日,1-1号站到1-4、1-5号站的部分业务出现了中断。查询相应支路盘的业务没有TU-AIS告警,查询支路盘性能有误码。查询5号东向光盘有MS-SD告警。故障分析可以判断是由于支路盘出现误码导致业务出现了异常,由于出现异常的业务都经过了1-5号网元的东向光盘,而该光盘有MS-SD告警。可以初步定位该段光路误码导致了业务的异常。在光路异常的情况下,复用段保护为什么没有倒换呢?处理步骤1、通过网管单盘配置中的“控制命令”,将1-1号网元西向光盘的激光器关断,1-5号网元上报R_LOS告警,全环复用段保护倒换后,业务恢复正常。2、或者,对1-5号网元进行东向强制倒换。故障原因线路出现了大误码,导致对电路要求高的业务出现了中断。线路出现大误码的原因是1-5号网元收1-1号网元的尾纤受到挤压,导致收光功率过低。而网管没有设置MS-SD误码允许倒换使能,使得在线路误码状态下无法启动保护倒换协议,解决方法是在网管单盘配置中将MS-SD参与倒换使能选项中设置为允许。1.3案例3:穿通业务有时分的节点失效后对业务的影响组网情况同错误!未找到引用源。。EWEWEWEWEW1-1图21-21-31-41-52.5GMSP环河南星辰通讯科技有限公司5(23)故障现象1-5号网元掉电后,其它各网元处于正常的倒换状态中。但1-4号网元经由1-5号网元到1-1号网元的业务中断。故障原因分析1-4号网元到1-1号网元的业务在1-5号网元的穿通配置,发现1-5号网元的该穿通配置进行了的VC-12级别时分交叉:W1.17~32←→E1.1~16。当1-5号网元节点失效后,两侧的网元将进入倒换状态,而双向复用段倒换是以VC-4为基础的,将导致穿通点的时分交叉信息丢失。处理过程重新配置业务,将各站点穿通业务的时分取消。1.4案例4:复用段保护通道故障的定位方法组网情况某局SDH组网为一2.5G复用段保护环,组网图如下图4所示,1-1号站为网管中心站。2M业务时隙分配表如表1-1所示。时隙表中不同的行表示不同的VC-4,第一行为第EWEWEWEWEW1-1图31-21-31-41-52.5GMSP环EWEWEWEWEW1-1图41-21-31-41-52.5GMSP环河南星辰通讯科技有限公司6(23)一个VC-4,该局共用到了四个VC-4的业务;t1、t2、t3、t4分别表示第一到第四盘位2M支路盘。支路盘后面的数字表示通道号,横线上的数字表示所占用的时隙号。#1#2#3#4#5#1wEwEwEwEwEVC4-1VC4-2VC4-3VC4-4t1:1-16t1:1-161-1617-32t1:1-16t2:1-16t3:1-16t2:1-16t2:1-16t1:1-16t1:1-16t4:1-16t2:1-16t3:1-161-161-161-161-16表1-1该局业务已割接,各站复用段保护倒换协议均启动且为正常状态,业务运行正常。某日,维护人员发现,1-2站、1-3站相连的光盘出现R_LOS告警,各站交叉盘均有保护倒换告警,查询各节点倒换状态正常。但1-3号站与1-1号站的业务中断,其它站业务正常。对应中断的业务,1-1号站相应的通道有TU-AIS告警。故障处理从所描述的情况看,该故障属于复用段保护倒换后业务不通,协议已正常动作,应该是保护通道的问题。现通过自环法进行故障定位。1、中断业务分析样本采样选取1-1号站t2支路盘16个中断业务中的第一个通道业务;先分析该业务1-1号站到1-3号站方向的路径。得到中断业务的分析样盘为:1-1号站的t2:1。2、画中断业务路径图保护倒换前,样本业务1号站的t2:1走的路径如下图所示:321e1:17w1:17w1:17e1:17t2:1t1:1保护倒换后,该业务走的路径如下图所示:e1:17w1:17w9:17w9:17w9:17w9:17e9:17e9:17e9:17e9:17t2:1t1:11215433、逐段环回,定位故障站点业务路径图画出来以后,则可按一般业务中断故障的处理方法进行处理。可在1-1号站第二支路盘的第一个2M通道上挂表测试(或者根本不用挂表测试,而是通过网管观察1-1号站第二支路盘2M通道的TU-AIS告警是否结束),然后逐段进行如下的自环操作:河南星辰通讯科技有限公司7(23)对2号站西向光盘第九个VC4作设备环回,TU-AIS告警消失,仪表测试OK;对1号站东向光盘第九个VC4作线路环回;TU-AIS告警消失,仪表测试OK;对1号站西向光盘第九个VC4作设备环回;TU-AIS告警消失,仪表测试OK;对5号站东向光盘第九个VC4作线路环回;TU-AIS告警消失,仪表测试OK;对5号站西向光盘第九个VC4作设备环回;TU-AIS告警消失,仪表测试OK;........对4号站东向光盘第九个VC4作线路环回,TU-AIS告警不消失;可以定位故障点在4号网元和5号网元之间的光盘上。通过更换4号网元的东向光盘,业务恢复(如果不恢复,可以考虑更换5号网元的西向光盘)。4、注意事项对复用段环,在倒换的情况下再更换线路盘,会导致原本倒换正常的协议受到影响,可能影响更多的业务。在更换光盘后要注意协议是否恢复到原来的倒换状态。河南星辰通讯科技有限公司8(23)二、通道保护故障定位2.1案例1:通道保护倒换始终不恢复组网情况故障现象图5中光路正常,1-3站对1-1站的业务通道始终有SWR保护倒换告警;若将1-1站西向光盘发激光器关闭,1-3站对1-1站的业务中断,1-3站的支路通道出现LP-SLM,TU-LOP等告警。故障分析从以上告警现象分析,1-3站的主环有故障。处理步骤1、将1-1站西向光盘的收发光纤拔掉,强迫1-2站、1-3站、1-4站从主环收1-1站发来的业务,1-1站从备环方向收1-2站、1-3站、1-4站发回的业务。此时1-1站对应1-3站的业务通道出现LP-SLM、TU-LOP告警。2、将1-1站到1-3站的业务在1-2站找一个空闲的通道上下,配置成功后发现1-2站新添加的业务通道有LP-SLM、TU-LOP告警。说明故障点出在1-2站或者1-1站与1-2站相连的光盘上。3、将修改的业务恢复到原配置,通过一尾纤将1-1站东向光盘自环,1-1站上的LP-SLM、TU-LOP等告警消失,说明故障点在1-2站。4、分析中断的业务,发现均在同一个VC4通道内,且告警为TU-LOP、LP-SLM等告警。怀疑2站交叉盘故障的可能性较大。5、更换2站交叉盘,1-1站和1-3站的业务恢复,故障排除。故障原因2站交叉盘某个VC4穿通有故障。WEEWEWEW1-1图51-21-31-42.5GPSP环河南星辰通讯科技有限公司9(23)2.2案例2:光纤接错导致的奇怪现象组网情况某局SDH组网如图6所示,为一622Mbit/s通道保护环,集中型业务,业务中心点为1-1号站。时钟方案为:1-1号站自由震荡;其余各站时钟级别均配置为“锁定线1”。故障现象某日,1-2、1-3站间的光纤被挖断,经与交换机房确认,业务没有中断。但1-3、1-4、1-5、1-6、1-1号站有指针调整性能越限告警,进一步检查各站的告警信息,却发现1-3、1-5、1-6、1-1站2M支路盘有SWR通道保护倒换告警,1-4号站却没有。故障分析正常情况下,若1-2、1-3站间的光纤断了,由于是集中型业务,则1-3、1-4、1-5、1-6的支路盘均应发生通道保护倒换。现1-4号站的支路盘未发生倒换,而且业务正常,说明4号站的西向光盘能正常地接收到1号站发送来的业务信号。因此,可能是1-4号站的光纤接错了:1-5号站的西向光纤接到了4号站的西向;而3号站的东向光纤接到了1-4号站的东向。处理步骤到1-4站检查光纤的连接方向,光纤的确接反,改正光纤连接关系后,4站支路盘出现SWR通道保护倒换告警。故障原因光纤接反。经验总结对于通道保护环,由于其并发选收的特性,因此若某站的东、西向光纤接反,对于一些对指针调整不是很敏感的业务,不会影响。因此故障有一定的隐蔽性。需要我们在维护中注意。2.3案例3:光纤自环导致的业务中断组网情况(23)某局使用622设备,采用通道保护环组网,集中型2M业务,业务中心站为1-1。但由于光缆未到位,1-3与1-4的光纤未连接。因此,实际组网为一个断环,如错误!未找到引用源。7所示。该环业务运行一直正常。故障现象一日,机房维护人员认为1-3和1-4间的光盘一直有R-LOS告警,影响对正常告警的处理,于是决定用尾纤将这两个站点未用的光盘自环。第一天,维护人员到达1-3站点后,用尾纤将该站东向光盘自环,观察光盘红灯熄灭,业务运行正常;第二天,维护人员到达1-4站,用尾纤将1-4西向光盘自环,观察光盘红灯熄灭,业务正常。随即维护人员离开机房。但离开机房不久,即接到网管中心的通知——全网业务中断,且没有任何告警。故障分析1、在1-3和1-4间断纤的情况下,以下业务走的是备环:1-2、1-3到1-1的业务;1-1到1-4的业务。2、当1-3东向光盘自环时,产生的影响是1-3的备环方向恢复正常,因此对各站主备环的收发状态没有影响,即原来收主环的还收主环,收备环的还收备环,业务仍保持正常。3、当1-4西向光盘自环时,产生的影响是1-4的主环方向恢复正常。由于2M业务的通道保护是恢复式的,即如果主环恢复正常,则8分钟后业务将自动倒换回主环。这样,原来收备环方向的业务——1-1收1-2、1-3的业务以及1-4收1-1的业务,8分钟后均将倒换回主环。而此时主环的业务却是1-4环回的业务,也就是说,此时1-4从主环收1-1的业务以及1-1从主环收1-2、1-3的业务都是它们自己从备环发出去而在1-4环回的业务。4、在这种情况下,1-2、1-3从主环收1-1的业务以及1-1从主环收1-4的业务均正常;而1-1收1-2、1-3的业务以及1-4收1-1的业务均为主环方向的自环业务。因此所有站没有任何告警信息。处理步骤维护人员返回1-4机房,将自环尾纤一拔掉,业务立即恢复。查询此时各站告警,1-4以及1-1的