省信息产业服务有限公司市分公司固网设备维护组2012年5月Page1机房设备故障处理省信息产业服务有限公司市分公司固网设备维护组2012年5月Page2目标学习完此课程,您将会:了解某公司设备分类了解故障处理流程和方法熟悉故障信息搜集了解典型故障处理案例集省信息产业服务有限公司市分公司固网设备维护组2012年5月Page3第1章某公司机房及设备分类第2章故障处理流程和方法第3章PON宽带业务故障处理第4章语音业务故障处理省信息产业服务有限公司市分公司固网设备维护组2012年5月Page4某公司机房分类A类机房:B类机房:C类机房:。。。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page5某公司机房常见设备一、接入设备:语音接入;宽带接入二、传输设备:SDH、PDH、光电转换器三、接入交换机:三层交换机、二层交换机、路由器四、交换设备:程控交换机、软交换五、配线架:ODF、DDF。。。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page6第1章某公司机房及设备分类第2章故障处理流程和方法第3章PON宽带业务故障处理第4章语音业务故障处理省信息产业服务有限公司市分公司固网设备维护组2012年5月Page7故障处理流程和方法故障信息来源故障处理流程故障处理常用方法省信息产业服务有限公司市分公司固网设备维护组2012年5月Page8一、故障信息来源用户或客户服务中心的故障申告(电子工单)。日常维护或巡检中所发现的异常。网管告警系统的告警输出(中心机房)。对接设备维护人员的故障通告(外线,各分公司申告)。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page9二、故障处理流程开始收集并记录相关信息能否判断故障范围和类别确定故障范围和类别是否为紧急故障定位故障原因屏蔽隔离故障排除故障故障是否被排除?记录故障处理过程及结果联系厂家技术支持人员否是否应急维护处理是省信息产业服务有限公司市分公司固网设备维护组2012年5月Page10故障处理流程1、收集并记录故障信息在故障处理的初期收集各种相关信息,可以帮助定位故障原因,提高维护人员处理故障的效率。2、确定故障范围和类别在获取故障信息以后,需要对故障现象进行分析,确定故障的范围和类别。3、定位故障原因故障定位就是从众多可能原因中找出具体原因的过程。维护工程师使用各种方法分析、比较各种可能的故障原因,排除不可能的原因,最终确定故障发生的具体原因。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page11故障处理流程4、屏蔽/隔离故障正确定位故障原因后,对故障进行屏蔽或隔离来恢复业务或避免故障范围扩大。5、排除故障排除故障是指采取适当的措施清除故障、恢复设备正常运行的过程,如检修线路、更换部件、修改配置数据、复位单板等。判断是否需要到现场,6、确认故障处理结果在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进行验证测试,来确认故障现象是否消失。7、联系技术支持如果在故障处理过程中遇到难以解决的问题,需要联系技术支持进行处理。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page12收集并记录故障信息信息收集的内容故障发生时,需要第一时间收集故障信息。主要收集以下故障信息:故障发生的具体时间、地点。故障现象的详细描述。故障点设备类型及接入类型。故障后已采取的措施和结果。问题的级别及希望解决的时间。用户及电信联系人信息。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page13确定故障范围和类别确定故障的范围确定故障的范围就是确定故障处理的方向,也就是说在什么地方、顺着什么思路去查找故障的具体原因。确定是设备接入的所有用户出现故障还是部分用户出现故障:如果是所有用户出现故障,进一步了解上端设备接入的其他设备或用户是否同时出现故障。如果是部分用户出现故障,进一步了解:故障用户的业务类型,其他业务是否出现故障。故障用户与正常用户的业务单板是否相同。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page14定位故障原因故障定位就是从众多可能原因中找出具体原因的过程。维护工程师使用各种方法分析、比较各种可能的故障原因,排除不可能的原因,最终确定故障发生的具体原因。准确并快速的定位故障是故障处理过程中的重要环节:有利于提高故障处理的效率。有效避免盲目处理导致的故障扩大等人为事故。为排除故障提供指导和参考。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page15屏蔽/隔离故障正确定位故障原因后,对故障进行屏蔽或隔离来恢复业务或避免故障范围扩大。常用的故障屏蔽或隔离的方法有:手动重启系统。进行主备倒换。采用迂回路由,隔离故障设备。如果是某项功能故障,可以使用命令关闭该功能。如果是单个用户业务故障,可以将故障影响的用户转移到正常的端口。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page16排除故障排除故障是指采取适当的措施清除故障、恢复设备正常运行的过程,如检修线路、更换部件、修改配置数据、复位单板等。屏蔽或隔离故障后,启动排除故障的工作。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page17确认故障处理结果在完成故障排除的工作后,还需要根据故障影响的范围,对受影响的相关业务进行验证测试,来确认故障现象是否消失。要进行全面验证,保证故障现象完全消失且没有新的问题被引入。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page18三、故障处理常用方法告警分析性能分析分段处理仪表测试对比分析互换分析配置数据分析协议分析省信息产业服务有限公司市分公司固网设备维护组2012年5月Page19告警分析通过分析告警,可以定位故障的具体部位或原因,也可以配合其他方法定位故障原因。告警信息是指设备网管告警系统输出的信息,通常以屏幕输出的形式提供给维护人员,具有简单、明了的特点。告警信息涉及硬件、链路、业务等各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。告警信息包含以下内容:告警的描述告警发生的位置告警发生的可能原因告警的修复建议省信息产业服务有限公司市分公司固网设备维护组2012年5月Page20性能分析通过设备提供的性能统计手段,对发生故障的业务进行性能指标的分析,定位故障原因。多种故障的定位过程中都需要了解系统性能统计信息。针对不同的故障类别,需要查看不同的统计信息,这要求维护人员:熟悉系统的结构和运行机制。了解系统能够提供哪些统计信息。了解如何查看、分析统计信息省信息产业服务有限公司市分公司固网设备维护组2012年5月Page21分段处理在故障现象复杂,可能涉及到多个环节时,使用分段处理的方法逐个排除正常的环节,最终定位故障。对进行分段处理工作的工程师有以下要求:对设备的系统结构和原理有深入的了解。对可能导致业务故障的各个环节全面了解。熟练掌握环回操作。熟练使用测试仪器。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page22仪表测试仪表测试法是指使用各种仪器、仪表取得实际的各种性能参数,对照理论的参数值来定位和排除故障。仪器、仪表以直观、量化的数据直接反映设备运行状态,在故障处理过程中有着不可替代的作用。常用的仪器、仪表包括:万用表光功率计示波器可调光衰减器线路测试仪省信息产业服务有限公司市分公司固网设备维护组2012年5月Page23对比分析对比分析是指将故障的部件或现象与正常的部件或现象进行比较分析,通过找出不同点来定位故障。对比分析适用于故障单一的场合。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page24互换分析在更换备件后仍不能定位故障时,使用互换分析法定位和排除故障。互换是指将处于正常状态的部件(如单板、光纤等)与可能故障的部件对调,在以下情况下使用:在更换备件后,仍然不能确定故障的范围或故障点时使用。通过比较对调后二者运行状况的变化,确定故障的范围或故障点。适用于故障复杂的场合。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page25配置数据分析配置数据分析是指通过分析设备的配置数据来定位问题,在新开局点或更改配置后应推荐使用此分析方法。数据配置错误或更改是引起故障的重要原因之一,配置数据分析是故障定位不可缺少的一个方法。例如:一台MA5680T下所有用户无法收看组播节目,通过检查配置数据发现:组播源设置的TTL值太小,导致组播数据在MA5680T上转发时,由于TTL值等于0而被丢弃。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page26协议分析(一般用不到)协议分析是指通过信令跟踪、捕获数据包等手段对故障进行分析的方法。协议分析用于当接入设备和上层设备的对接出现问题时定位和排除故障。协议分析要求维护工程师对协议有深入的了解,掌握各种协议报文的交互流程,从而能够从获得的报文中定位故障。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page27小结本章主要介绍了故障处理的一般步骤和常用方法小结省信息产业服务有限公司市分公司固网设备维护组2012年5月Page28第1章某公司机房及设备分类第2章故障处理流程和方法第3章PON宽带业务故障处理第4章语音业务故障处理省信息产业服务有限公司市分公司固网设备维护组2012年5月Page29故障处理流程开始初步定位故障位置检查光纤状况检查设备状态检查设备运行状况检查设备数据配置检查设备统计信息检查上层设备状态结束省信息产业服务有限公司市分公司固网设备维护组2012年5月Page30初步定位故障位置个别端口用户无法上网:用户终端或者线路故障。EPON或交换机端口故障。数据配置问题。整板用户无法上网EPON单板故障。光路问题。整框用户无法上网光路问题。主控板或者是上行单板故障。网络攻击。BRAS设备下的所有用户无法上网上行设备问题。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page31检查光纤状况在EPON业务发生故障时,通过检查光纤状况排除故障。主要检查:光纤是否插好。光纤是否弯曲严重。光纤是否有断线。平均发送光功率是否正常。接收光灵敏度是否正常。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page32检查ONT状态Power(主电源指示灯)常亮表明电源供电正常。熄灭请检查电源连接是否正确。请检查电源适配器是否匹配。如果电源正常,所有指示灯都熄灭,请更换ONT。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page33检查ONT状态AUTH(EPON注册指示灯)常亮设备认证成功。熄灭设备认证失败。检查MA5680T上是否添加了该ONT。检查配置的ONT的MAC地址与ONT实际MAC地址是否一致。LINK(EPON链路指示灯)亮PON端口链路状态正常。熄灭检查光纤是否插好(插得太紧或太松都会有问题)。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page34检查ONT状态LAN常亮以太网端口的链路正常。熄灭以太网端口的链路故障。检查以太网端口的物理连接是否正常。检查与以太网端口连接的物理设备是否正常。省信息产业服务有限公司市分公司固网设备维护组2012年5月Page35在线查询ONT状态•如果“ControlFlag”为激活态,且“Runstate”为up,说明ONT正常,说明用户上线且认证通过。•如果“ControlFlag”为去激活态,ONT进行注册时被禁止,需要在EPON模式下使用ontactivate命令激活控制开关。•如果“ControlFlag”为激活态,而“RunState”为down,则说明用户未上线。•如果ONT的“MAC”与实际的ONT不一致,会导致注册失败。•如果“ConfigState”为“Normal”状态,说明ONT配置恢复状态正常。•如果“ConfigState”为“Failed”