华为IPPBX系统故障处理指南V3.02015年6月目录一、故障处理概述...............................................................................................................31.1故障级别....................................................................................................................31.2故障类别....................................................................................................................41.3故障处理注意事项....................................................................................................41.4故障处理流程............................................................................................................5二、常见故障定位方法.......................................................................................................62.1呼叫分析........................................................................................................................72.2告警分析.........................................................................................................................82.3日志分析.......................................................................................................................102.4信令分析.......................................................................................................................112.5网络分析.......................................................................................................................14一、故障处理概述了解故障类别、处理故障时需要注意的事项、故障的来源、故障处理流程等信息。故障级别按照故障的范围和影响,将故障分为紧急故障和一般故障。故障类别了解故障类别,能够更有效的解决故障。故障处理注意事项维护人员开展故障定位和处理过程前,需要了解有关注意事项。故障来源故障来源帮助您了解从哪些途径可以获悉可能发生或已经发生的故障。故障处理流程介绍故障处理的通用流程,并说明流程的每一个环节的处理方法。1.1故障级别按照故障的范围和影响,将故障分为紧急故障和一般故障。1.1.1紧急故障是指发生突然、影响面广、涉及范围大、并可对网络的安全运行与服务质量造成严重后果的设备或网络事故,如主机设备瘫痪、全局业务阻塞。当出现以下任何一种情况时,则为紧急故障。设备在网络中功能完全丧失或大部分丧失。单个或所有单板功能完全丧失。机箱掉电。SoftCo长时间的、全局范围内的业务中断或呼叫阻塞事故。全部媒体网关均不能正常注册,如无法注册、注册后又立即断开。全部用户终端均发生呼叫阻塞,如无法呼入、无法呼出、摘机后无拨号音或听忙音。全部局向均发生呼叫阻塞,如无法呼入、无法呼出。SoftCo长时间的、局部范围内的业务中断或呼叫阻塞事故。少量媒体网关不能正常注册,如无法注册、注册后又立即断开。少量用户终端均发生呼叫阻塞,如无法呼入、无法呼出、摘机后无拨号音或听忙音。少量局向均发生呼叫阻塞,如无法呼入、无法呼出。1.1.2一般故障是指紧急故障以外的故障。紧急故障和一般故障的处理策略和参考文档均不同。一般故障和紧急故障处理方式故障级别处理策略参考文档一般故障定位故障根源,彻底清除故障。故障处理指南紧急故障以尽快恢复业务为目的,快速定位到故障根源,彻底清除故障。应急维护1.2故障类别了解故障类别,能够更有效的解决故障。常见故障类别有:通话故障通话故障包括语音单通、语音双不通、通话质量差、呼叫接续异常、无法送号与收号不全、号码显示异常、提示音异常等。中继故障常见中继类故障包括E1/T1中继故障、通过PRA中继呼叫失败、SIP中继故障、通过SS7中继呼叫失败、通过R2中继呼叫失败等。业务故障常见业务类故障包括呼叫受限、呼叫前转业务失败、呼叫转移业务失败、自动总机业务故障、传真业务故障等。系统设备故障系统设备类故障一般分为升级类故障和电源类故障,包括蜂鸣器长鸣、文件上传或下载失败、ping不通其他设备、系统数据损坏、主机启动失败等。1.3故障处理注意事项维护人员开展故障定位和处理过程前,需要了解有关注意事项。维护人员在上岗前必须接受必要的维护培训,学习必要的设备维护知识、掌握设备的操作技能和故障处理技能。严格遵守操作规程和行业安全规程,确保人身安全与设备安全。更换和维护设备部件过程中,要做好防静电措施,佩戴防静电腕带。在维护过程中遇到的任何问题,应详细记录各种原始信息,如处理步骤、故障现象、告警信息、日志信息。所有的重大操作(如重新启动系统、加载软件等)均应作记录,并在操作前仔细确认操作的可行性,在做好相应的备份、应急和安全措施后,方可由有经验的操作人员执行。数据的修改应授权、受控进行,维护人员在修改前必须进行数据备份操作,并对修改的内容进行记录。除华为公司正式发布的版本软件以外,请勿使用其他任何软件直接对数据库进行数据变更等操作。1.4故障处理流程介绍故障处理的通用流程,并说明流程的每一个环节的处理方法。故障处理流程下图所示。故障处理流程说明处理过程过程说明分析故障现象根据故障现象判断故障种类和级别。评估是否为一般故障根据故障现象判定是一般故障还是应急故障。执行应急维护流程请参见应急维护,找出故障原因,实现适当的措施清除故障。参考故障案例处理故障参考故障案例找出故障原因,实施适当的故障处理措施。故障是否清除认定一个故障原因、实施故障清除步骤之后,都需要检查故障是否被真正清除。收集故障信息获取技术支持如果采用本手册所述的方法不能清除故障,则请参见填写和上报故障信息尽可能详尽地获取各种原始信息,然后再寻求服务提供商帮助。二、常见故障定位方法SoftCo故障处理提供多种故障定位方法,在故障定位过程中,各种定位方法可以交叉应用,互为补充。呼叫分析用来分析基于SIP/PRA/R2/SS7/QSIG中继的呼叫流程。告警分析告警是故障或者事件发生的重要提示信息。通过查看告警,能够帮助您及时发现系统运行中的故障信息,并根据告警建议及时进行故障定位和故障排除。日志分析日志用来记录程序运行时的关键事件和信息。通过查看与分析日志,能够及时发现系统运行中的故障信息,并能够根据日志内容,查找出可能的故障原因,从而尽快解决故障。信令分析信令用来记录通话建立全过程。通过信令分析,查找出呼叫建立失败的可能故障原因,从而尽快解决故障。网络分析使用ping命令查看网络互通、延时、丢包等异常现象。2.1呼叫分析呼叫分析用来分析基于SIP/PRA/R2/SS7/QSIG中继的呼叫流程。在线分析假设通过LMT登录IP为172.16.15.60的SoftCo设备。1.使用LMT工具登录设备。2.选择“日志管理呼叫分析”。3.勾选“在线分析”。4.建立通话,呼叫日志信息显示在界面上,如下图所示。5.单击“分析呼叫日志”。6.在“呼叫分析”页面,单击具体呼叫记录,在流程图区域显示呼叫流程图如下图所示:离线分析1.在菜单中选择“信息文件查看呼叫分析文件”。2.单击“打开呼叫文件”,导入已存在的呼叫日志文件。3.单击“分析呼叫日志”。4.在“呼叫分析”页面,单击具体呼叫记录,在流程图区域显示呼叫流程图。2.2告警分析告警是故障或者事件发生的重要提示信息。通过查看告警,能够帮助您及时发现系统运行中的故障信息,并根据告警建议及时进行故障定位和故障排除。在故障处理时,针对不同的告警级别,其处理的优先级也是不同的。紧急告警:全局性的、将危及设备正常运行的告警。如电源故障,需要立即处理,否则系统有瘫痪危险。重要告警:局部范围内的单板或线路告警。如物理线路故障,需要及时处理,否则将导致业务不能正常运行。次要告警:一般性的,描述各单板或线路工作是否正常的状态告警。需要查找告警原因,消除故障隐患。提示告警:提示性信息。如设备恢复正常的提示,不影响系统性能和业务,无需处理。说明:如果使用LMT查看告警,在告警界面将显示告警级别。告警处理过程如下:1.根据告警级别从告警中过滤出紧急告警和重要告警。2.逐条查看告警产生的原因并处理告警。3.告警处理完成后查看是否产生恢复告警。o如果产生恢复告警,则故障清除。o如果故障未清除,继续排查可能的原因。您可以观察SoftCo指示灯或使用LMT查看告警信息:通过查看SoftCo指示灯状态查看告警信息。告警指示灯含义指示灯标识颜色状态说明告警指示灯ALARM红色对于SCU/SMCU/CVP单板:灯闪烁,表示存在告警。灯灭,表示不存在告警。对于其他单板:灯闪烁,表示单板正在启动中,或者启动后用户未通过命令添加该单板。灯灭,表示单板运行正常。通过LMT在线查看告警信息。操作步骤如下:1.登录LMT,在菜单中选择“告警管理告警台”。界面上显示当前设备的所有告警。2.双击某条告警信息,出现告警的详细信息对话框。3.单击“告警建议”页签。请根据此处显示的告警处理建议修复告警。4.告警成功处理后,系统会显示告警恢复消息。通过LMT查看离线告警信息。1.在菜单栏中选择“信息文件查看告警文件”,单击“打开告警文件”导入已存在的告警信息文件。2.查看具体告警信息请执行2~4。2.3日志分析日志用来记录程序运行时的关键事件和信息。通过查看与分析日志,能够及时发现系统运行中的故障信息,并能够根据日志内容,查找出可能的故障原因,从而尽快解决故障。运行日志1.使用LMT工具登录设备。2.选择“日志管理运行日志”。界面显示运行日志信息。操作日志1.使用LMT工具登录设备。2.选择“日志管理操作日志”。界面显示操作日志信息。呼叫日志1.使用LMT工具登录设备。2.选择“日志管理呼叫日志”。3.单击“模块开关配置”。4.请参见LMT页面级帮助设置参数。说明:配置号码后,单击“查询配置”可以查看当前已配置的查询项。单击“关闭所有配置”取消所有已配置的查询项。5.单击“开启配置”。6.单击,关闭页面。7.单击获取日志信息。8.单击暂停获取日志信息。9.双击显示的日志信息或右键单击显示的日志信息,选择“查看详细信息”,页面显示详细信息。说明:如果获取的日志是PRA或R2的呼叫日志,则右键单击显示的日志信息,选择“PRI/R2图形解析”可以查看呼叫流程图。2.4信令分析信令用来记录通话建立全过程。通过信令分析,查找出呼叫建立失败的可能故障原因,