华为机密,未经许可不得扩散资料编码产品名称使用对象产品版本编写部门数据通信技术支持部资料版本V1.0数据通信产品日常维护建议拟制:张红军日期:2004-03-18审核:日期:审核:日期:批准:日期:华为技术有限公司版权所有侵权必究数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散修订记录日期修订版本描述作者数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散目录第1章设备运行环境维护.............................................................................................................21.1设备基本运行信息检查...........................................................................................................21.2端口流量信息监控.................................................................................................................3第2章常见故障分析、处理建议..................................................................................................52.1设备互联问题诊断..................................................................................................................52.1.1以太网互联故障诊断....................................................................................................52.1.2PPP链路互联故障诊断...............................................................................................62.2普通IP业务互通性故障诊断..................................................................................................72.3静态路由问题故障诊断...........................................................................................................92.4OSPF协议故障诊断............................................................................................................112.5BGP协议故障诊断..............................................................................................................132.6MPLS-VPN业务互通性故障诊断........................................................................................152.7NAT问题故障诊断..............................................................................................................172.8网速问题诊断......................................................................................................................19第3章故障信息收集..................................................................................................................22数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散摘要:本文主要为日常设备维护和常见故障定位提供了建议。内容旨在提供日常维护中遇到的问题分析思路和步骤,其中涉及的“专用名词、术语”和具体的维护、配置命令需要参考数据通信基本原理书籍和《用户命令手册》。本文内容不可能涉及所有设备维护和业务开展中遇到的问题,主要对常见故障和典型问题进行分析,包括:“普通IP业务互通性故障诊断”、“动态路由协议故障诊断”、“MPLS-VPN业务互通性故障诊断”等。详细的诊断、操作步骤参见各章节详细内容。同时华为公司为客户提供24小时技术支持热线:800-830-2118。如果您在问题处理过程中遇到疑难问题,请拨打技术支持热线,我们的工程师回以饱满的工作热情和扎实的技术水平协助您处理问题。参考资料清单:《用户命令手册》《华为数据通信产品故障信息收集方法》数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散第1章设备运行环境维护数据通信产品的稳定运行一方面依赖于完备的网络规划,另一方面日常的维护和监测,发现设备运行隐患也是非常必要的。本章主要给出华为数据通信产品的日常维护建议,包括设备日志监控、单板运行状态监控、端口流量监控等。1.1设备基本运行信息检查设备运行信息主要是指日志、单板运行转态、路由条目等,下表列举了一些常用的检查项目,可以在进行设备日常维护时参考。表1-1设备基本信息序号检查内容检查方法备注1软件版本[Quidway]displayversion如果是双主控设备,要求主备用主控板版本一致2调试开关[Quidway]displaydebug正常运行时应该全部关闭3日志信息[Quidway]displaylogbuffer4系统时间[Quidway]displayclock应该与实际时间相差小于10分钟5配置文件[Quidway]displaycurrent[Quidway]displaysaved运行配置需要与保存过的配置相同端口描述查看配置文件业务端口都应该有明确的描述信息登陆安全配置查看配置文件需要配置“登陆用户认证”与“特权用户认证”说明:(1)表2-1中应用“displaylogbuffer”命令收集的日志信息为“最近”发生的事件,“以往”发生的日志信息会自动写入硬盘。表1-2路由相关信息序号检查内容检查方法备注1OSPF邻居状态[Quidway]displayospfpeer邻居状态应该正常数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散2IS-IS邻居状态[Quidway]displayisispeer邻居状态应该正常3BGP邻居状态[Quidway]displaybgppeer邻居状态应该正常4路由条目统计[Quidway]displayiproutver主要关注路由条目统计值说明:(1)表2-2中只列出了部分动态路由协议的邻居转态监控方法,如果实际应用中还有其他协议,请参考《用户命令手册》,原则就是要确保邻居状态正常。表1-3软硬件运行状态序号检查内容检查方法备注1接口状态[Quidway]displayinerface正在使用的接口应为UP,未用接口应为down2系统告警[Quidway]displayalarmrecordall应该无异常告警。本次给出的为NE80/40的告警查看命令,其他产品参考《用户命令手册》3单板运行状态[Quidway]displaydevice各单板工作状态正常4电源工作状态[Quidway]displaydevice各电源模块工作状态正常5风扇工作状态[Quidway]displaydevice各风扇模块工作状态正常6查看单板备份状态[Quidway]displayswitchstate系统应该处于“实时备份”状态说明:(1)表2-3中给出的系统状态监控命令是针对NE80/40产品的,其他产品请参考《用户命令手册》。1.2端口流量信息监控网络业务是不断发展的,相应的设备符合也随着业务量的增大而增大,而且网络上存在大量的病毒报文,我们需要对网络上的流量进行监控。一方面可以发现异常、非法流量,采取相应的限速和病毒查杀等操作;另一方面,如果发现网络上的正常流量已经几乎达到设备性能极限,就需要考虑升级或者扩容了。数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散设备端口流量信息的统计方式主要通过两个手段:通过网管系统监控;按时对设备的端口数据包收发进行监控、统计。如果通过网管系统监控,我们可以比较容易的得到设备的端口流量信息。大部分的网管系统都提供流量监测功能,可以输出端口流量曲线。结合流量分析软件,我们还可以知道数据流量的组成,如果发现过多的非法报文,我们可以根据报文的“源IP”、“目的IP”、“协议类型”等特征设置限速或者访问控制。如果无法借助网管系统,只能通过在设备上应用“displayinterface”命令,记录5分钟平均流量统计(回显信息中包括这个信息)的方式来监控端口流量。我们建议在每天的不同时段记录该统计值的结果,主要是针对“业务忙时”进行统计,这样可以起到与网管系统类似的作用。以上提供了常用的设备运行环境维护方式,对于不同的网络,关注重点不同,总之我们需要在确保设备单机运行正常的情况下尽量提升整网的运行质量。如果在设备维护过程中遇到疑难问题,请拨打800技术支持热线,由“技术支持工程师”协助您解决问题。数据通信产品日常维护建议文档密级:内部公开华为机密,未经许可不得扩散第2章常见故障分析、处理建议本章内容旨在提供日常维护中遇到的问题分析思路和步骤,其中涉及的“专用名词、术语”和具体的维护、配置命令需要参考数据通信基本原理书籍和“用户手册”。本章内容不可能包含所有设备维护和业务开展中遇到的问题,主要对常见故障和典型问题进行分析,包括:“普通IP业务互通性故障诊断”、“动态路由协议故障诊断”、“MPLS-VPN业务互通性故障诊断”等。详细的诊断、操作步骤参见各章节详细内容,如果拨打800技术支持热线,需要提供网络基本信息和故障信息,具体的信息收集内容和方法参见“第四章”。2.1设备互联问题诊断当我们进行数据通信设备调试时,首先需要解决的问题就是直联设备之间的互通。直联设备之间的互通完全是链路层方面的内容,与上层路由协议不相关,由于链路层协议类型众多,而且涉及中间传输设备也是多种多样,本维护建议不可能对每一种链路层协议都作分析,这里选取最常用的“以太网互联”和“PPP链路互联”,给出问题诊断建议步骤。2.1.1以太网互联故障诊断以太网互联是我们最常见的工作内容,遇到的问题相对较少,但是如果三层设备之间插入“以太网交换机(LSW)”问题会变得复杂,这里我们给出一台PC机通过LSW与上行路由器子接口互通的模型来进行可能遇到的故障分析。图2-1以太网互联拓扑图在上述网络拓扑中,LSW与PC机互联的端口需要配置为untag接口,LSW与路由器互联的端口需要配置为tag端口。在LSW上每个端口还需要配置“默认Vlanid”,对于untag端口,“默认Vlanid”与端口所属Vlan一致;对于tag端口,理论上我们可以任意指定“默认Vlanid”,但是需要注意与路由器的配合。对于