告警维护文档BSCAlarmADISCO1UCCcard1.1InterUCCCommunicationFailure可能原因:1.DISCO之间失去通信。2.DISCOUCC之间的通信电缆中断或未连接。3.UCC卡故障处理方法:1.查看两个DISCO的状态是否正常。2.查看UCC卡是否插在正确的位置。3.检查UCC卡之间的电缆连接是否正常。4.如果以上情况都正常则更换UCC卡之间的电缆。5.如故障还不能清除,则更换UCC卡。1.2MemoryAllocationFailed可能原因:板卡或设备存储单元不足,这可能是要发生大故障的征兆。处理方法:1.重新初始化UCC卡2,如果还不能解决,收集事件log和软、硬件信息寻求技术支持。2DISCOC2.1ATMICswitchoverfailure可能原因:一张ATMIC卡或ATM-port在TFU切换中不再处于正常状态。处理方法:1.从TFOMO中查看对应DISCO中的主用ATMIC卡,与实际DISCO中主用的ATMIC卡是否一致。2.查看告警对应的ATMIC卡是否处于正常工作状态(Enabled/Unlocked)如板卡状态为Locked,马上把板卡放开。3.如板卡告警还不能清除,则更换对应的ATMIC卡。4.寻求技术支持。2.2ATMICswitchoverinitiationfails:standbyATMIChaschip_x8_clockcriticalfaultactive可能原因:1.备用的ATMIC卡故障。2.备用的ATMIC卡连接的TFU故障。3.ATMIC卡和TFU连接的电缆故障。处理方法:1.查看备用的ATMIC卡是否正常,如不正常则更换。2.查看备用的ATMIC卡连接的TFU是否正常,如不正常则更换相应的硬件。3.查看ATMIC卡和TFU之间的电缆连接是否出错,如不正常则更换电缆。3BCNIC3.1Cardarbitererror可能原因:BCNPort和ATMIC卡之间的处理器有故障。处理方法:更换相应的BCNIC卡。3.2Cardswitchbusfailure可能原因:1.当ATMI切换时背板总线故障,可能是BCNI卡的驱动器/接收器故障,也可能是ATMIC卡的驱动器/接收器故障。处理方法:1.如果是BCNI卡的驱动器/接收器故障,则更换BCNI卡。2.如果是ATMIC卡的驱动器/接收器故障,则更换ATMIC卡。3.3Cardinterruptactive可能原因:1.一张主用的BCNI卡被中断,由于COBEN中断位被设为超过1位。2.COPIM中断位被设定至少1位。3.DISPIM中断位被设定至少1位。处理方法:更换BCNI卡。3.4Softwarenotinitialized可能原因:当重新初始化BCNI卡时,一个处理器故障发生在DISCO-UCCMO上。处理方法:1.人工重新初始化BCNI卡,通过命令Lock/Reset/Inialize/Unlock。2.如果告警还出现,重新复位BCNI卡,重作步骤1。3.如果告警还不能清除,则更换BCNI卡重新初始化BCNI卡。4BCNPort4.1PortCOPIMBufferOverflow可能原因:BCNIC卡损坏。处理方法:1.重新初始化BCNPort通过命令Reset/Inialize。2.如果告警还不能清除,则更换BCNI卡。4.2PortDeviceNotAccessible可能原因:1.端口配置不正确。2.配置数据与软件版本不一致。处理方法:1.重新初始化BCNPort端口。2.如果告警还不能清除,则更换BCNI卡。4.3PortDISPIMPacketBufferOverflow可能原因:1.如果端口的时钟设定为外部时钟,而端口连接的系统不向它提供时钟,只是用它传输数据。2.如果端口的时钟设定为内部时钟,可能由于丧失时钟3.发送到缓冲记存器的数据比从记存器向外发送的数据快。处理方法:1.如果端口的时钟设定为内部时钟,则重新初始化端口,如告警还不能清除则更换BCNI卡。2.如果端口的时钟设定为外部时钟,检查系统是否连接到一个外接时钟上。3.如果上两条方法都不能解决,可能是吞吐量的问题,检查端口的波特率是否设定为推荐的数值。4.4PortHDLCReceiveClockFailure可能原因:1.可能是CDSU或信道卡没有发送时钟。2.BCNI卡故障。处理方法:1.检查CDSU和信道卡看是否发送时钟。2.如果远端确认无问题,那有可能是BCNPort端口故障。3.通过Rove故障卡更换。4.5PortHDLCTransmitClockFailure可能原因:远端的板卡或BCNI卡都有可能故障。处理方法:1.当BCNI卡为主用时,检查远端是否向BCNPort口发送时钟。如果远端确认没问题,那么BCNI卡有故障,通过Rove更换BCNI卡。2.当BCNI卡为备用卡时,BCNI卡故障,更换BCNI卡。4.6PortReceiveCRCError可能原因:1.端口配制不正确。2.连接系统的电缆损坏。处理方法:1.重新初始化端口Lock/Reset/Inialize/Unlock2.检查端口的波特率与他连接系统的波特率一致。3.检查电缆,确认电缆是否有损坏。4.如告警还不能清除,则更换BCNI卡。4.7PortTransmitCRCError可能原因:BCNI卡故障或ATMI卡故障。处理方法:1.Rove并更换出告警的BCNI卡。2.如果很多BCNI卡上的BCNPort口有这告警,则切换ATMI卡,如告警消失则更换ATMI卡。BSBS1SBS1.1AnOutageFootprinthasbeendetected.PleaseuploadthelogsASAP可能原因:1.Trap或severse软件故障。2.OFP协议没有报告。处理方法:在BSMGUISBSMO上传log,如果上传log失败,用DMI工具上传log。1.2BSMhaslostcommunicationwithSBS.可能原因:1.BSM和DISCO通信失败。2.DISCO状态不是AppRunning而是NippRunning或Unknow状态。3.DISCO和SBS的路游中断BCN电缆中断或BCNPort故障。4.DISCO被复位。处理方法:1.查看DISCOSBS状态是否是AppRunning。2.查看SBS和DISCO的路游是否连通,BCN电缆是否中断,BCNPort口是否有故障。3.同步MTXMO,在MTX1MO作sync操作。1.3ContinuousEvenSecondLost可能原因:在SBS机框上偶秒丢失。处理方法:在等到TFU恢复后,标识告警,查看ESEL卡是否为Unlock,Enable状态。1.4InitializationfailureFTS可能原因:1.ESEL卡不在NIP-running状态。2.需要应用的文件没找到。处理方法:1.复位该卡,重新初始化该卡。2.确认需要应用的文件是否在。3.如还不能解决,则更换ESEL卡。1.5LossofsignalonT1Line1/RecoveryofsignalonT1Line1可能原因:指定的T1线物理损坏或没有连接。处理方法:1.检查指定的T1线从SCIS卡到ICP的连接是否正常,如有问题则更换。2.如问题还不能解决,寻求技术支持。1.6PSCERR_FM_CRITICAL_ERROR可能原因:系统内部缺少存储器。处理方法:1.当这条告警只是偶尔出现时,忽略这条告警,当系统负荷降低时,告警将自动清除。2.如果这条告警经常出现,系统内部存储器资源可能丢失,重新初始化SBS。3.如果告警还经常出,寻求技术支持。1.7PSCERR_MAJOR_PROCESSING可能原因:1.系统负荷过高。2.内存丢失。处理方法:1.当这条告警只是偶尔出现时,忽略这条告警,当系统负荷降低时,告警将自动清除。2.如果这条告警经常出现,系统内部存储器资源可能丢失,重新初始化SBS。3.如果告警还经常出,寻求技术支持。1.8SBCERR_50HZ_INTERRUPT_TEST_FAILED可能原因:这是一个内部告警,测试管理器发现一个错误,在数据包接口管理器。处理方法:寻求北电的技术支持。1.9SBCERR_EVEN_SECOND_INTERRUPT_TEST_FAILED可能原因:这是一个内部告警,测试管理器发现一个错误,在偶秒管理器。处理方法:寻求北电的技术支持。1.10SBCERR_PIM_TEST_FAILED可能原因:在诊断测试时,测试管理器发现一个错误,在数据包接口管理器。处理方法:更换SBSC卡。1.11SBCERR_PLL_TEST_FAILED可能原因:测试管理器发现一个错误,在定向环路中。处理方法:寻求北电的技术支持。1.12SBSpowersupplyfailurealarm可能原因:1.模块没有加上电。2.模块从机框中移出。3.硬件故障。处理方法:1.检查模块是否加上电。2.检查模块是否插在正确的位置。3.如故障还不能清除,更换该模块。1.13SBSCfailurealarm可能原因:1.卡上没加上电。2.硬件或软件故障。处理方法:1.确定卡插在正确的位置。2.检查卡上是否连接上电。3.如还不能解决更换该卡。1.14Softwareerrorlogexceededcapacitythreshold.Pleaseuploadthelogs可能原因:软件(SWEER)出错。处理方法:从MO上传SWEERlog通过命令UploadLogs,当SWEERlog上传到BSM告警将自动清除。1.15SRMNotificationactionfailedbecauseSBSIdwasnotrecognizedbytheMTX.VerifythattheSBSIdattributevalueintheSBSMOmatchesatupleintheMTXTableSBSINV.SyncMTXMOtoretrySRMNotification可能原因:在BSM管理系统中SBSId的参数数据,与MTX中的表格SBSINV中的数据不匹配,导致SRM通知出错。处理方法:1.确认BSM中SBSId的参数数据与MTX中的表格SBSINV中的数据是否匹配。2.在BSM中的MTX1MO作同步操作,如果BSM中的MTX数据校验起作用,当SRM校验运行时告警将自动清除,当SRM通知完成时。1.16SRMNotificationactionfailed.SyncMTXMOtoretry可能原因:1.软件出错。2.连接故障。处理方法:1.用logview工具检查BSM调试log,查看系统的本身错误。2.在BSM中的MTX1MO作同步操作,如果BSM中的MTX数据校验起作用,当SRM校验运行时告警将自动清除,当SRM通知完成时。1.17Subsystemsoftwareversionchangenotificationfailed可能原因:1.BSC和系统之间的T1连接损坏或支持该T1的设备出错。2.BSM和DISCO之间的连接出错。3.BSM管理者正在做LockBSM操作。4.当时RootMO不在Couple状态,因此无法接收软件版本改变通知。处理方法:1.查看BSM和SBS系统连接是否正常,通过做“SubsystemStatus”操作,看系统返回的信息是否是“AppRunning”。2.查看在RootMO是否是Coupled状态。3.在SBSCMO上做SubsystemNotifySoftwareVersion操作,查看返回的信息是否是“Successful=(Type=bool,al=true)”。1.18Subsystemcongestiondetected:0eventsdroppedbeforedetection可能原因:当QMIP信息发出系统拥塞告警时,在RootMO拥塞告警发出以告诉维护者系统处于拥塞状态,同时当告警送出时,伴随有掉话现象。处理方法:从MTX侧查看系统的SBS资源和CI