简单介绍一些SDH系统的误码检测原理知识SDH系统在帧结构中安排了丰富的开销字节用于误码监测,它们是B1、B2、B3和V5字节,分别用于监测再生段、复用段、高阶通道和低阶通道的误码。与这五个字节对应的性能事件是再生段背景块误码RSBBE、复用段背景块误码MSBBE、高阶通道背景块误码HPBBE和低阶通道背景块误码LPBBE。若本端上报BBE性能事件,则表示本端接收侧检测到了误码,远端发和本端收之间的通道存在问题。上面五个性能事件中,除了再生段背景块误码RSBBE没有远端对告外,其余三个性能事件都有对应的远端性能事件,分别为复用段远端背景块误码MSFEBBE、高阶通道远端背景块误码HPFEBBE和低阶通道远端背景块LPFEBBE。若本端上报FEBBE性能事件,则表示远端接收侧检测到了误码,本端发和远端收之间的通道存在问题。T诀窍:通过BBE事件,可以判断是本端接收侧检测到了误码,远端的发和本端的收之间的通道存在问题;通过FEBBE事件,可以判断是远端接收侧检测到了误码,本端的发和远端的收之间的通道存在问题。与上面三个误码远端性能事件对应的还有三个误码远端告警事件,分别为复用段远端差错指示MS-REI、高阶通道远端差错指示HP-REI、低阶通道远端差错指示LP-REI。通过这些远端告警事件的观察,也可以判断远端是否检测到了误码。当误码较大,突破预设的性能门限时,将上报告警事件。与再生段B1误码块、复用段B2误码块、高阶通道B3误码块、低阶通道V5误码块对应的性能越限告警为:B1OVER、B2OVER、高阶通道性能参数越限告警HPCROSSTR、低阶通道性能参数越限告警LPCROSSTR。另外,我们应清楚B1、B2、B3、V5四个误码之间的关系。一般来说,如果有高阶误码,则一般会有低阶误码;若有低阶误码,则不一定会出现高阶误码。例如,有B1误码,则一般会有V5误码;反之,则不一定。也就是说,高阶误码会引起低阶误码。因此,我们在进行误码分析的时候,也要遵循“先线路后支路,先高阶后低阶”的故障定位原则。以上有关误码告警和性能事件的检测位置和作用可以用下表3-1表示。误码告警及性能事件检测位置与作用项目性能事件告警事件本端有误码远端有误码本端有误码远端有误码再生段RSBBE-B1-OVER-复用段MSBBEMSFEBBEB2-OVERMS-REI高阶通道HPBBEHPFEBBEHPCROSSTRHP-REI低阶通道LPBBELPFEBBELPCROSSTRLP-REI误码问题分类有几种分类方法按上报误码的单板来分,可分为线路误码和支路误码。一般B1(再生)、B2(复用)、B3(高阶)误码是在线路板上产生并上报的;V5(低阶)误码是在支路板产生并上报的。但对于PL4板和PL3板,本身也产生并上报B3误码。按15分钟性能检测到的误码块数量来分,可分为少量误码和大量误码。一般15分钟内误码块数量若少于10个,则认为是少量误码。按连续出现误码的时间间隔长短来分,可分为突发性误码和持续性误码。平时我们常说的“零星误码”属于出现误码时间间隔比较长,而误码数量比较少的情况。误码产生的常见原因1)对于线路上的B1、B2、B3误码,常见的原因是:光功率过低,在灵敏度附近;光功率过高,在过载点附近;光功率正常,色散过大;单板的故障;光纤的问题,包括:光缆、尾纤;光纤头不清洁或连接器不正确;时钟同步性能不好等;机房条件,包括:温度、电源稳定行、接地情况等。2)如果只出现支路上的V5误码,则常见的原因是:交叉板与支路板之间配合有问题、支路板有问题等,应检查支路板或交叉板;也有可能是外界干扰引起,如设备接地不好,设备附近有大的干扰源等;设备工作温度过高也可能引起支路误码。误码问题处理的常用方法1、首先需要有网络长期运行的性能数据,从中分析误码的特点:是持续的小误码、突发的大误码、还是零星小误码。对于每15分钟性能都有B1、B2误码的情况,可以马上通过自环线路板,或对应更换线路板来定位问题所在;其它两种情况则可能需要较长时间才能定位。2、光功率是个重要的因素,所以对出现误码的光路需要了解这几点:光板类型、发光功率、收功率、光纤衰减值、光缆距离、过载点、灵敏度;如果光功率有异常情况,要进行相应调整(主要指接近过载点或灵敏度);对于光功率正常,但光缆距离过长的,就要考虑色散问题:如STM-16的31T16H0和31T16M0(或33T1601)发光功率差不多,但从色散方面考虑,前者为40-80KM光板,而后者为80-120KM光板;对于收功率正常,但光功率衰减过大的,也要考虑局方光缆质量问题。3、为确定误码是由光板产生的,还是由光缆段产生的,大致可采用以下三种方法:①将有误码的相邻两个站的线路板进行东西向对换,观察误码是跟着光板走,还是固定在某个方向。如:#1站东向连接#2站西向,#2站西向收有误码,在检查收、发功率正常以后,可尝试将#1站东、西向线路板,#2站东、西向线路板都进行对换,观察误码出现的位置,如果还是出现在#2站西向,则可能光缆有问题,如果出现在#1站西向对应站,则可能#1站原东向线路板有问题,如果出现在#2站东向,则可能是#2站原西向线路板有问题。②将一段光路的收、发两个方向的光缆芯纤进行对换,观察误码是随着板子走还是随着芯纤走,也可以大概定位误码产生的原因;当然,以上两种方法只能进行初步定位,而使用仪表的话则可以进行精确定位:③可以在产生误码的光路发端、收端分别挂上仪表,当从网管性能事件中查到线路板有误码时,检查在哪个仪表上出现了误码,如果发端表没有误码、收端表有误码的话,则误码是在光缆产生;如果发端表就有误码的话,则可以判断线路板存在问题。对于有穿通功能的仪表可以直接将仪表串在光路上,如果仪表没有穿通功能,则需要使用分光器,此时需要注意分光以后线路板的收功率是否正常。4、对于怀疑光缆问题,则需要重点检查环境条件(包括:机房条件、尾纤是否受压迫、光缆是否受外界影响等)。温度是对设备影响较大的一个因素,在具备机房空调的条件下,还必须定期清理风扇,由于温度过高产生光路误码的例子还是很多;设备到ODF这一段尾纤以及光缆出机房这一段比较脆弱,可以检查一下是否有被压迫的地方、或者检查有没有压痕;室外光缆则需要了解是否架空或地埋,因为两者会受不同的影响,如地埋光缆易受地面施工的影响,而架空光缆则受天气因素干扰更大。还有一点需要注意,由于设计上的问题,线路板上的法兰盘很容易松动,特别是在多次转动的情况下,所以在现场不妨检查一下,说不定它就是罪魁祸首。对于其它外界条件,如:电源、接地,从实际情况来看,很难收集证据去说明它和误码的关系,但可以作为要求局方重点整改的项目提出来,也可以起到一定作用。误码处理的一般步骤首先排除外界因素,如附近有干扰源或设备运行温度过高(风扇防尘网堵塞或风扇故障)。其次观察有无严重的指针调整事件,若有,则先排除指针调整问题。然后,通过告警、性能事件分析法初步定位误码所在的路径区段以及站点范围。当然,在通过告警性能事件分析法一时无法确定故障点的情况下,也可以直接应用逐段自环的方法将故障定位到单站或两站之间的光板。最后通过单板替换法排除误码问题.典型误码问题处理光路误码:如A、B两站之间光路上有误码,A站光板上有MSBBE误码;B站光板上有MSFEBBE误码。在排除外部因素和时钟问题后,我们可判断故障原因可能是A站的收有问题或B站的发有问题或光纤有问题。可按如下步骤进行处理:第一步:先通过软自环命令分别对A站光板和B站光板进行内自环。若哪一站的光板自环后仍报误码,则说明是那站的光板有问题,需进行更换;若自环后都没有误码,则进行下一步。第二步:通过尾纤分别对A站的光板和B站的光板进行硬自环(注意不要光功率过载)。若哪一站的光板自环后仍报误码,则说明是那站的光板有问题,需进行更换;若自环后都没有误码,则说明可能是光板或光纤线路性能不好,如光板的色散太大,光板的发送光功率或接收灵敏度指标不合格;或者是光纤线路本身的衰耗太大等。此时需进行测试或更换单板。支路误码:对于仅存在支路误码的情况,可通过更换交叉板或支路板来排除。当然,也要考虑可能的外部原因。零星误码:对于零星误码,没有好的解决办法,只能通过长期的观察和尝试替换相应的单板和光纤解决。常见的误码问题PL3用于155/622(GTC)设备易产生误码的问题PL3用于155/622子架时必须使用STG板,不能用于扩展子架(无STG板)。SS11PL3、SS11PL4板与GTC板配合时时序较紧张,容易出现误码,必须更换支路板的FPGA软件方可解决。对于有PL3、PL4板与GTC配合的局,维护时请注意。请工程师注意光板的激光头是否脏或松动公司维修部传输车间在一星期内所修的8块线路板中,有6块是因为激光头脏或松动造成灵敏度低而表现为误码。故工程部提出以下要求:1、运输及使用时注意防尘,未插光纤时应戴上防尘帽。目前发现,返回公司的坏板,大多数光板的光接口都没有带上防尘帽。2、用服人员在现场发现光板有因光功率或灵敏度低而产生的故障时,请先检查外部尾纤头是否与法兰盘连接好,光板内部的尾纤头与法兰盘是否松动。必要时拆下尾纤用棉花或软布将光纤头擦拭干净,然后重新上好,这样一来可以解决相当数量的故障光板,不用发回公司维修。3、请大家备好无水酒精、棉球,保证开局时尾纤和光板上接头的干净。