OptiX误码原理和问题处理专题1误码性能事件介绍误码是指在传输过程中码元发生了错误。确切地讲,误码是接收与发送数字信号之间单个数字的差错。充分理解和掌握误码性能事件,是做好SDH系统维护的基础。1.1误码性能事件列表OptiX系列SDH传输设备检测或上报的误码性能事件,如下表所列:BBEBackgroundBlockError背景块误码FEBBEFarEndBackgroundBlockError远端背景块误码ESErroredSecond误码秒FEESFarEndErroredSecond远端误码秒SESSeverelyErroredSecond严重误码秒FECESFarEndConsecutiveErroredSecond远端连续误码秒CSESConsecutiveSeverelyErroredSecond连续严重误码秒FECSESFarEndConsecutiveSeverelyErroredSecond远端连续严重误码秒UASUnavailableSecond不可用秒1.2SDH误码性能定义说明EB:块是通道上连续比特的集合,通俗地说就是一组比特。每一比特属于,且仅属于唯一的一块。将一组码看成一个整体,在其中有1个或多个比特差错,则称块差错,即G.826建议中所用的术语“误块”(ErroredBlock)。BBE:背景误块,是指发生在SES以外的误块。ES:误码秒:G.821定义,在一秒时间周期有一个或多个差错比特,称误码秒;误块秒:G.826定义,在一秒时间周期有一个或多个误块,称误块秒;差错秒:误码秒和误块秒的统称。SES:严重误码秒:G.821定义,在1秒时间周期的比特差错率≥10-3。严重误块秒:G.826定义,在1秒中含有≥30℅的误块,或至少有一个缺陷。UAS:不可用秒:一个不可用时间周期从10个连续的严重误码秒(SES)事件的第一秒开始,这10秒被认定为不可用时间的一部分;一个新的可用时间周期从10个连续的非严重误码秒事件的第一秒开始,这10秒被认定为可用时间的一部分。CSES:连续严重误块秒:表示连续的X个SES,X介于2~9之间。1.3误码率/误码比BER:传统上常用平均误码率BER来衡量系统的误码性能。即在某一规定的观测时间内(如24小时)发生差错的比特数和传输比特总数之比。如1×10-10。但平均误码率是一个长期效应,它只给出一个平均累积结果。而实际上误码的出现往往呈突发性质,且具有极大的随机性。因此除了平均误码率之外还应该有一些短期度量误码的参数,即误码秒与严重误码秒。ESR:误块秒比,在规定测量间隔内出现的ES与总的可用时间之比。SESR:严重误块秒比,在规定测量时间内出现的SES数与总的可用时间之比。BBER:背景块差错比,BBE数与扣除不可用时间和SES期间所有块数后的总块数之比。在上述ESR、BBER和SESR三项指标中,SESR最严,BBER最松。只要通道满足ESR指标要求,BBER指标一般也可自动满足。2误码性能事件与相关的告警2.1远端误码性能和告警通过BBE事件,可以判断是本端接收侧检测到了误码,是远端的发和本端的收之间的通道存在问题;通过FEBBE事件,可以判断是远端接收侧检测到了误码,是本端的发和远端的收之间的通道存在问题。与MSFEBBE、HPFEBBE、LPFEBBE三个误码远端性能事件对应的还有三个误码远端告警事件,分别为复用段远端差错指示MS-REI、高阶通道远端差错指示HP-REI以及低阶通道远端差错指示LP-REI。通过这些远端告警事件的观察,也可以判断远端是否检测到了误码。2.2各类误码性能事件对应关系当误码较大,突破预设的性能门限时,将上报误码越限/劣化告警事件。再生段:再生段误码越限告警(B1OVER);复用段:复用段误码越限告警(B2-OVER)、劣化告警(B2-SD);高阶通道:高阶通道误码越限告警(B3-OVER)、劣化告警(B3-SD);低阶通道:低阶通道误码越限告警(BIP-OVER)、劣化告警(BIP-SD)。说明:1)缺省情况下,误码越限对应的门限是1×10-3;误码劣化对应的门限是1×10-6;2)复用段误码越限属于复用段倒换条件,劣化是可选条件;高阶、低阶通道误码越限/劣化门限属于SNCP或PP环的可选倒换条件。详细内容参考:《optiX自愈网络误码倒换功能》。下表中给出了与误码相关的性能和告警事件,以及检测位置与作用:项目性能事件告警事件本端站检测到有误码,则本端上报事件对端站检测到有误码,则本端上报事件本端站检测到有误码越限/劣化,则本端上报事件对端站检测到有误码,则本端上报事件再生段RSBBE-B1OVER-复用段MSBBEMSFEBBEB2OVER;B2-SDMSREI高阶通道HPBBEHPFEBBEB3OVER;B3-SDHPREI低阶通道LPBBELPFEBBEBIP-EXC;BIP-SDLPREI3误码性能检测的机理如果检测到误码,SDH可以将此信息插入相反的信道中,回送给远端网元;也可以插入向下游传送的信号中,送至通道终端;还可以作为性能管理的事件送给网管系统。3.1SDH误码性能检测字节SDH系统帧结构中,开销字节B1、B2、B3、V5分别用于监视再生段、复用段、高阶通道和低阶通道的误码。误码监视采用比特间插奇偶校验方式(BIP)的偶校验。各误码的检测点,以及其与远端误码指示的对应关系,可参见告警信号流。下表总结了指示各种误码的开销字节:开销字节用途类别计算方法B1再生段误码性能BIP-8B2复用段误码性能BIP-24*NM1复用段远端误码指示告警B3高阶通道误码性能BIP-8G1(bit1~4)高阶通道远端误码指示告警V5(bit1~2)低阶通道误码性能BIP-2V5(bit3)低阶通道远端误码指示告警3.2BIP误码校验的原理比特间插奇偶(BIP)校验是一种监视传输质量的方法。其原理是:发送端将附加的奇偶信息插入发送信号中,接收端对同一奇偶性进行核算,并与信号中插入的奇偶信息相比较,如二者不一致,则表明传输过程中发生了差错。但是,这种方法不能说明产生的差错是多少。SDH系统再生段、复用段、高阶通道、低阶通道的误码检测,都基于同样的原理,只是校验长度(位数)不同而已。再生段误码监视,B1:用于再生段的误码检测,采用BIP-8。产生B1字节的方法是对前一个STM-N扰码后的所有比特进行BIP运算,将得到的结果置于当前这一个STM-N帧扰码前的B1字节位置。现以再生段的BIP-8为例说明BIP校验算法。在发送端产生B1字节的过程和接收端核算过程是相同的,具体步骤如下:1)接收有关的一些比特,即STM-N帧中的全部比特;2)将这些比特分成8列;3)对每列计算奇偶性。如在一列中有偶数个“1”,则奇偶性为“偶”(以“0”表示);4)在发送端将一列的计算结果,放入下一帧的B1字节处。在接收端将每一列的计算结果与下一帧的B1字节比较。奇偶计算举例如下:复用段误码监视,B2:用于复用段的误码检测。产生B2字节的方法是对前一个STM-N帧中除再生段开销以外的所有比特作BIP运算,将其结果置于当前STM-N帧扰码前的B2字节处。高阶通道误码监视,B3:用于高阶通道误码检测,采用BIP-8。在实际高阶通道的始端产生B3,并在终端监视和核算。产生B3的方法是对整个VC-4-Xc、VC-4或VC-3进行核算,将结果放入下一个VC-4-Xc、VC-4或VC-3的B3字节。说明:高阶通道的开销穿通模式有两种:穿通模式和终结模式。在终结模式下,B3误码不能透传到(业务)下游方向。低阶通道误码监视,V5(b1,b2):用于低阶通道误码检测,采用BIP-2。在通道始端产生V5(b1,b2)的方法始对整个VC12进行运算,将结果放入下一个VC12的V5(b1,b2)。说明:SDH误码检测准确性:对于比较少的、离散分布的误码,具有比较高的检测率,检测准确度高。对于大量误码或在一个块中出线多个误码的情况,不能正确检测。3.3误码性能的检测上报点一般情况下,开销字节的检测和上报是在接收端进行的。掌握此规律,可以分析出误码产生的源头。1)对于STM-N线路板:如下图所示,检测的是线路侧方向(外输入信号)的误码性能,包括RS、MS、HP等性能事件。S16xcsS16WE检测点检测点2)对于PDH接口板:如下图所示,检测的是交叉板方向进来的低阶业务的误码性能。S16xcsPQ1检测点PDH板,不提供外部输入信号(如从交换输入的2Mbit/s)的检测功能。正常情况下,从交换机、基站等过来的2M信号,不会导致PQ1等板产生V5误码性能事件。说明:涉及到的几个名词,本端、远端、下游(网元)说明如下。业务配置如同所示:NE-BS16xcsS16S16S16WENE-ANE-CBVC4A对于该方向的VC4业务,如果NE-B网元西向检测到HPBBE误码,则“本端”就是指NE-B网元西向单板;“远端”就是指NE-A网元内与之对应的光板;“下游”方向就是指NE-C方向。3.4iManager网管误码性能管理可以监视的对象包括所有的复用段,再生段,高阶通道和低阶通道的所有性能参数。iManager的性能管理主要提供以下几种功能:设置网元性能监视的时间和事件选择模式网元监视的时间和事件选择模式说明了选中的网元从什么时候开始,选择对何种性能对象进行监视。已运行的设备,要求必须打开性能事件检测的功能,以利于日常维护和故障定位。设置和清除监视事件查看、维护网元和网管库中的性能数据设置/取消性能事件自动上报建议:建议性能事件设定为不自动上报:频繁的15m和24h性能事件自动上报,会导致上报给网管的数据量非常巨大,容易导致ECC堵塞并增加网管的负荷。设置门限利用网管可设定误码性能事件设置门限值,具体门限值应能在一给定的范围内任意设置。一旦设定的某性能事件如SES门限被突破,网元将自动产生门限突破通知并报告给网管。3.5当前和历史寄存器(15分钟&24小时)对于每一监视对象,网元都有寄存器存储收集到的数据。寄存器按监视周期分为15分钟和24小时两种,按存储数据的收集时间分为当前和历史两种。对每一个监视对象有一个当前15分钟寄存器,一个当前24小时寄存器,16个历史15分钟寄存器和6个历史24小时寄存器。这里寄存器的个数只是逻辑上的概念,是以次数为单位的。当前寄存器收集的数据满15分钟或24小时后,只要数据非0则转存入历史寄存器,若历史寄存器已满则覆盖存储了最早的历史数据的寄存器。当一个段或通道的SES(严重误码秒:一秒钟以内出现的误码块达到30%)连续出现10个后,则认为发生UAT(不可用时间)。对于每一个段和通道,网元都有6个存储器存储曾经发生的UAT,同时上报网管提请注意。网元寄存器示意如下图:说明:历史寄存器的数据采用0抑制原则,即如果一个监视周期内,一个性能监视对象的所有性能事件的数据值为0值,则该性能监视对象在该周期结束时不产生近期性能数据,不保存到近期寄存器中。3.6性能事件双门限说明有些性能事件如BBE、ES有上下双门限。设置上下门限便于系统屏蔽掉一些突发事件的抖动影响;并且在业务受影响前,操作系统就能及时了解情况并可采取某些行动。4误码性能在维护的应用尽管不停业务测试不如停业务测试准确,但由于某些性能故障的瞬间特性,不停业务的性能监视在设备维护中显得更为有用。网管性能监视就属于这一类,应用网管的RS、MS、HP、LP误码性能监视和MSA和HPA指针调整性能监视对于单板性能故障定位是非常有效的。4.1误码检测关系及检测位置光同步传输设备中按分段分层的思想对误码进行全面系统的检测。具体有B1再生段误码、B2复用段误码、B3高阶通道误码、V5低阶通道误码。它们之间的关系可以用下图表示:RST、MST、HPT、LPT分别表示再生段终端、复用段终端、高阶通道终端和低阶通道终端。B1、B2、B3以及V5误码分别在这些终端间进行检测。由上图可以看出,如果只是低阶通道有误码,则高阶通道、复用段和再生段将检测不到该误码;如果再生段有误码,则将导致复用段、高阶通道、低