中兴SDH传输设备误码问题分析总结

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

中兴SDH传输设备误码问题分析总结作者姓名(单位名称)摘要:误码问题是传输设备维护中经常碰到的问题。虽然有时小误码问题并不会对传送业务造成明显影响,如语音等业务,但当出现误码时,说明传输系统中局部已经出现性能劣化,需要尽快处理,否则有可能发展成为业务中断等重大事故。本文将结合平时维护中遇到的问题,对误码作一简单的分析,以期可以抛砖引玉,共同提高。关键词:误码、B1、B2、B3、V5目录1.误码知识.............................................................................................31.1误码分段...................................................................................31.2误码上报信息.............................................................................32.误码定位分析.....................................................................................42.1误码的常见原因.........................................................................42.2误码定位分析.............................................................................53.典型案例.............................................................................................73.1光板故障导致误码....................................................................73.2风扇故障导致设备散热不良产生误码.....................................83.3时钟板故障引起误码................................................................93.4外时钟不稳定导致光路出现误码..........................................104结束语...............................................................................................111.误码知识1.1误码分段光同步传输设备中按分段分层的原理对误码进行检测。具体有B1再生段误码、B2复用段误码、B3高阶通道误码、V5低阶通道误码。它们之间的关系可以用图1表示。图1:误码检测关系及检测位置图1中RST、MST、HPT、LPT分别表示再生段终端、复用段终端、高阶通道终端和低阶通道终端。B1、B2、B3以及V5误码分别在这些终端间进行监测。1.2误码上报信息光同步传输系统本端检测到误码时,除本端上报误码性能或告警事件外,本端还将误码检测情况通过开销字节通知对端。根据本端和对端上报的这些性能和告警事件,可以方便地定位是哪一段通道或哪一个方向出现误码。表1给出了与误码相关的性能和告警事件列表。表1:误码越限告警及性能事件检测位置与作用项目本端站检测到有误码,则本端上报事件对端站检测到有误码,则本端上报事件本端站检测到有误码越限,则本端上报事件对端站检测到有误码,则本端上报事件再生段(B1)RSBBEB1-EXC复用段(B2)MSBBEMSFEBBEMS-EXCMS-REI高阶通道(B3)HPBBEHPFEBBEHP-EXCHP-REI低阶通道(V5)LPBBELPFEBBELP-EXCLP-REI性能事件告警事件2.误码定位分析2.1误码的常见原因外部原因:1)光纤性能劣化、损耗过高。2)光纤接头不清洁或连接不正确。3)设备接地不好。4)设备附近有强烈干扰源。5)环境温度过高,导致设备散热不良。6)传输距离过短、未加衰减器,导致接收光功率过载。设备原因:1)线路板接收侧信号衰减过大、对端发送电路故障、本端接收电路故障。2)时钟同步性能不好。3)交叉板与线路板、支路板配合不好。4)支路板故障。5)风扇故障,导致设备散热不良。2.2误码定位分析下面我们就以一个简单的单向业务组网模型来分析出现误码的几种情况。注:为了便于阐述,这里都简化为单向有误码,而反方向没有误码,并且只是某一站点出现某一类型的误码的理想情况,当然实际中要比这复杂得多。组网模型如图2所示:图2单向业务组网模型(1)C或D站出现再生段误码每个站点都对B1字节处理,所以可以考虑出现误码站点和上游站点两RST之间(接口板、光纤通路)。常用的有以下几种定位方法:1)采用测量法测量光功率,可以直接有效地发现线路是否正常。首先测试对端发送光功率是否合乎设备指标,再测试本端接收光功率,如果接收光功率过小,可以逐段测试找出故障点,如果接收光功率过大,导致光模块饱和,此时要适当地加衰减。2)光口环回法可以进一步测试是否本端光板有问题,但要注意将光板自环时需要加衰减,以防止光功率过强损坏光模块。3)采用收发尾纤替换法将本端和对端的收发尾纤同时对调,看误码是否跟着尾纤走,这样可以快速判断光缆线路的好坏。与环回法结合快速定位故障位置。(2)D或E站出现复用段误码对于D站误码来说,由于C站是REG站点,它不对B2字节进行处理,所以很有可能是B站MST出来的信号带过来的,也可能是D站RST与MST之间有故障。此时可以采用光纤自环定位是否D站、B站光接口板有问题。对于E站误码来说,由于D站是ADM站点,它对B2字节进行处理,所以很有可能是D站MST出来的信号带过来的,也可能是E站RST与MST之间有故障。建议用光纤自环的方法定位是否D、E站相连的光接口板有问题。(3)E站出现高阶通道误码这时要分两种情况进行讨论。如果D站对相应业务做VC4穿通,则说明它没有对B3字节做过处理,也就是说没有终结过通道开销。则问题可能出在B站(B站对之做过终结)。也可能是E站MST与HPT之间。如果D站对相应业务VC4开销做过终结,则问题可能是D站HPT与MST之间或E站MST与HPT之间。(4)E站出现低阶通道误码低阶信号复用传输过程经过PPI—LPA—LPT—HPA—交叉板—HPT—MSA—MST—RST,所经路由都可能引入误码,所以误码产生也最为复杂和广泛。如果有高阶误码,我们先处理高阶误码;如果没有高阶误码,我们可以把范围缩小到“PPI—LPA—LPT—HPA—交叉板”这个部分来分析。分析的关键是要找到处理过此低阶通道的最近站点,然后可以采用软件环回的办法判断问题出在本端或者对端。最常用的办法还是逐段环回法,这样可以把问题定位到某一段。如果能定位到设备,可以采取更换单板(支路板、交叉板)的方式来处理。3.典型案例3.1光板故障导致误码(1)故障现象下图为ZXMPS385设备组成的2.5G通道环。某天日常维护中查询D网元1-1-5槽位光板性能值,发现有B1误码,E网元1-1-11槽位光板上报B1-RD1。(2)故障排除当日深夜维护人员到达D站点与E站点。到达D站点后测量1-1-5槽位光板RX口收光功率,正常,与E站点人员联系将两站点的在用光纤对调,再次测试收光功率正常。排除光缆损耗大的问题。加损耗器将1―1-5光板自环,无效。故障定位在该光板故障。更换同型号光板,跟踪测试24小时性能值,没有发现误码。(3)结论主干环网元的日常维护尤显重要,要加强这方面的工作,性能值的查询,模拟性能的跟踪等等。3.2风扇故障导致设备散热不良产生误码(1)故障现象由ZXMPS385设备组成两纤单向通道环,如下图所示。某日发现D站点11#LP16上报少量的B2、B3误码。(2)故障排除为了不影响客户的正常使用,维护人员于次日凌晨到达现场,先测试收光功率,结果正常。随后维护人员仔细检查了设备运行情况,发现设备机壳温度过高,经检查发现设备风扇防尘网堵塞严重,抽出风扇防尘网,误码消失。至此,可以确认故障是由于风扇防尘网堵塞致使设备散热不良所至。将其清洗晾干后插入设备,运行正常。(3)结论和建议在机房的防尘效果不好时,风扇防尘网容易堵塞,这时就需要定期清洗防尘网,否则风扇不能正常散热,导致设备温度过高,会产生大量误码。建议每月清洗防尘网两次。3.3时钟板故障引起误码(1)故障现象组网下图所示。图中A、B、C、D、E网元均为ZXMPS330设备,A、B、C、D网元组成一个155M通道环。网元E是挂在网元B上的支链。网元B及E的ET1板有时会出现少量误码性能值。没有影响业务。(2)故障排除查询B网元设备光板的性能值,有比较大的指针调整。然后查询其ET1板性能值,有较大的指针调整及少量的误码性能值。查询E网元现象相同。查看B网元的当前时钟状态,为捕捉状态。改变线路抽时钟的方向,仍为捕捉状态。通常情况下,误码不会引起指针调整,而大量的指针调整则会引起误码。因此处理指针调整的问题,指针调整则可能是由于上游站或本站光板提供的参考时钟源有问题,也可能是本站的时钟板有问题,而改变抽取方向后,故障仍没有消除则说明是本站的时钟板的问题。维护人员到达现场后,发现该设备时钟板RUN灯一直快闪,ALARM灯有时闪亮。说明该板不能正常工作。将其硬复位,无变化。更换单板,自检完成后,误码消失。在网管上进行24小时误码测试,无误码,故障排除。(3)结论时钟板故障,无法锁定时钟,大量的指针调整导致误码。3.4外时钟不稳定导致光路出现误码(1)故障现象组网如下图所示。由ZXMPS385设备组成两纤单向通道环。A网元接E网元的输出时钟。在D站点挂表测试一条A站到D站155M光路业务的24小时误码发现每隔几分钟就会报一次误码,业务没有中断。(2)故障排除首先检查仪表的各项设置,正常。从网管上查询性能发现从A站开始各站OL16板对应的高阶通道15分钟性能有较大的AU指针调整,查询A站各板各项性能值均正常,排除单板故障。最后将焦点集中在外时钟源上。将A站时钟改为内时钟,故障现象消失。于是直接接入BITS设备,测试正常。(3)结论外时钟源不稳引起较大的指针调整从而引发小误码。4结束语误码问题在平时的维护工作中,经常遇到。由于其告警点的不确定,所以在处理的过程中,必须全盘考虑,不放过每一个可能引发误码的细节,扎扎实实的处理才可以使问题顺利解决。

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功