1路由器网络诊断步骤与故障排除1.1路由器常见故障分类在路由器出现的故障中,大体可以分为两类:一类是硬故障,一类是软故障。这里的分类方法并没有严格的标准,只是为了方便而已,在实践中应该具体问题具体分析。1.硬故障我们把路由器本身部件存在问题的情况归在这一类里。常见的硬故障通常表现在硬件上。通常有这么几种:1)系统不能正常加电表现为当打开路由器的电源开关时,路由器前面板的电源灯不亮,风扇不转。这时要重点检查电源系统。看供电插座是否有电,电压是否在规定的范围内。如果供电正常,应该检查电源线是否完好,接触是否牢靠,必要时可以换一根,如果还不行,可以判定问题应该出在路由器的电源上。可以看看路由器电源保险是否完好,如果烧了应该更换。如果还不行只好送修。2)部件损坏这类情况在硬件故障中是比较常见的一类。这里的部件往往是接口卡。表现为当把有问题部件插到路由器中时,系统其他部分都工作正常,但无法正确识别有问题的部件,这时往往是因为部件本身有问题。还有一种情况,就是部件可以被正确识别,但做完配置后(保证配置正确),接口就是不能正常工作,这时往往是因为存在物理故障。要确认以上这两种情况,最好用相同型号的好的部件替换怀疑有问题的部件,就可以确认问题是否存在。3)系统软件损坏这种故障似乎应该归入软件故障,但由于这种情况往往是路由器本身存在的问题,且与硬件紧密相关,我们不妨把它归类于此。以cisco的路由器为例,如果路由器开机后总是进入rmon状态,这时往往说明系统软件IOS存在问题。4)其它这里所要提到的是这样一些情况,有时我们在对系统软件进行升级时,发现系统无论怎样也不能完成升级,这时不妨检查一下你要升级的软件的大小是否超过了你的路由器的NVRAM的容量。如果超过了,你是无论如何也升不了级的,这时应该先扩充NVRAM的容量然后再升级系统软件。这个问题容易被忽略。2.软故障1)功能无法实现在有些时候,你要作某些特定的配置(如NAT),你反复检查,确认配置正确,可相应的功能就是实现不了,这时先不要急着怀疑设备有问题,最好先找一找系统软件的版本号,并查找相关的说明,看一看你所使用的版本的软件是否支持这个功能。因为路由器的系统软2件往往有许多版本,每个版本支持不同的功能。如果你当前的软件版本不支持这个功能,那就应该找到相应的软件,先进行升级。2)网络规划存在问题有些时候,你的配置似乎没有问题,可路由器就是不能正常工作,或者工作不稳定,总出现一些莫名其妙的问题。这时不妨先不要急着反复调试,不如回过头来看看你的网络规划,看看这上面是不是有问题。比如是不是有重复使用的网段,网络掩码的计算是否正确等等,往往问题就迎刃而解了。3)配置问题这种问题是最常见的,就是你的配置的确存在问题。比如线路两端路由器的参数不匹配或参数错误等等,这种情况只要认真细致地查找,总可以解决。1.2网络故障诊断概述网络故障诊断,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常运行。网络故障通常有以下几种可能:物理层中物理设备相互连接失败或者硬件及线路本身的问题;数据链路层的网络设备的接口配置问题;网络层网络协议配置或操作错误;传输层的设备性能或通信拥塞问题;上三层或网络应用程序错误。诊断网络故障的过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,设法确定通信失败的故障点,直到系统通信正常为止。网络诊断可以使用多种工具:路由器诊断命令,网络管理工具和包括局域网或广域网分析仪在内的其它故障诊断工具。查看路由表,是开始查找网络故障的好办法。ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络工具。如何监视网络在正常条件下的运行细节和出现故障的情况,监视哪些内容呢?利用showinterface命令可以非常容易地获得待检查的每个接口的信息。showbuffer命令提供定期显示缓冲区大小、用途及使用状况。showproc命令和showprocmem命令可用于跟踪处理器和内存的使用情况。可以定期收集这些数据,在故障出现时用于诊断参考。故障诊断步骤第一步,首先确定故障的具体现象,分析造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。第二步,收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。第三步,根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上。第四步,根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原3因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。第五步,执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。网络分层诊断技术物理层的故障主要表现在设备的物理连接方式是否恰当;连接电缆是否正确;Modem、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用showinterface命令,检查每个端口的状态,解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态。查找和排除数据链路层的故障,需要查看路由器的配置,检查连接端口的共享同一数据链路层的封装情况。每对接口要和与其通信的其它设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。例如,对于IGRP路由,选择信息只在同一自治系统号(AS)的系统之间交换数据,查看路由器配置的自治系统号的匹配情况。1.3路由器接口故障排除串口故障排除串口出现连通性问题时,为了排除串口故障,一般是从showinterfaceserial命令开始,分析它的屏幕输出报告内容,找出问题之所在。串口报告的开始提供了该接口状态和线路协议状态。接口和线路协议的可能组合有以下几种:1.串口运行、线路协议运行,这是完全的工作条件。该串口和线路协议已经初始化,并正在交换协议的存活信息。2.串口运行、线路协议关闭,这个显示说明路由器与提供载波检测信号的设备连接,表明载波信号出现在本地和远程的调制解调器之间,但没有正确交换连接两端的协议存活信息。可能的故障发生在路由器配置问题、调制解调器操作问题、租用线路干扰或远程路由器故障,数字式调制解调器的时钟问题,通过链路连接的两个串口不在同一子网上,都会出现这个报告。3.串口和线路协议都关闭,可能是电信部门的线路故障、电缆故障或者是调制解调器故障。4.串口管理性关闭和线路协议关闭,这种情况是在接口配置中输入了shutdown命令。通过输入noshutdown命令,打开管理性关闭。4接口和线路协议都运行的状况下,虽然串口链路的基本通信建立起来了,但仍然可能由于信息包丢失和信息包错误时会出现许多潜在的故障问题。正常通信时接口输入或输出信息包不应该丢失,或者丢失的量非常小,而且不会增加。如果信息包丢失有规律性增加,表明通过该接口传输的通信量超过接口所能处理的通信量。解决的办法是增加线路容量。查找其它原因发生的信息包丢失,查看showinterfaceserial命令的输出报告中的输入输出保持队列的状态。当发现保持队列中信息包数量达到了信息的最大允许值,可以增加保持队列设置的大小。以太接口故障排除以太接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的帧类型。使用showinterfaceethernet命令可以查看该接口的吞吐量、碰撞冲突、信息包丢失、和帧类型的有关内容等。1.通过查看接口的吞吐量可以检测网络的带宽利用状况。如果网络广播信息包的百分比很高,网络性能开始下降。光纤网转换到以太网段的信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用noiproute-cache命令,禁用快速转换,并且调整缓冲区和保持队列的设置。2.两个接口试图同时传输信息包到以太电缆上时,将发生碰撞。以太网要求冲突次数很少,不同的网络要求是不同的,一般情况下发现冲突每秒有三五次就应该查找冲突的原因了。碰撞冲突产生拥塞,碰撞冲突的原因通常是由于敷设的电缆过长、过分利用、或者“聋”节点。以太网络在物理设计和敷设电缆系统管理方面应有所考虑,超规范敷设电缆可能引起更多的冲突发生。3.如果接口和线路协议报告运行状态,并且节点的物理连接都完好,可是不能通信。引起问题的原因也可能是两个节点使用了不兼容的帧类型。解决问题的办法是重新配置使用相同。帧类型。如果要求使用不同帧类型的同一网络的两个设备互相通信,可以在路由器接口使用子接口,并为每个子接口指定不同的封装类型。1.4异步通信口故障排除互连网络的运行中,异步通信口的任务是为用户提供可靠服务,但又是故障多发部位。异步通信口故障一般的外部因素是:拨号链路性能低劣;电话网交换机的连接质量问题;调制解调器的设置。检查链路两端使用的调制解调器:连接到远程PC机端口调制解调器的问题不太多,因为每次生成新的拨号时通常都初始化调制解调器,利用大多数通信程序都能在发出拨号命令之前发送适当的设置字符串;连接路由器端口的问题较多,这个调制解调器通常等待来自远程调制解调器的连接,连接之前,并不接收设置字符串。如果调制解调器丢失了它的设置,应采用一种方法来初始化远程调制解调器。简单的办法是使用可通过前面板配置的调制解调器;另一种方法是将调制解调器接到路由器的异步接口,建立反向telnet,发送5设置命令配置调制解调器。showinterfaceasync命令、showline命令是诊断异步通信口故障使用最多的工具。showinterfaceasync命令输出报告中,接口状态报告关闭的唯一的情况是,接口没有设置封装类型。线路协议状态显示与串口线路协议显示相同。showline命令显示接口接收和传输速度设置以及EIA状态显示。showline命令可以认为是接口命令(showinterfaceasync)的扩展。查看showline命令输出的EIA信号可以判断网络状态。确定异步通信口故障一般可用下列步骤:检查电缆线路质量;检查调制解调器的参数设置;检查调制解调器的连接速度;检查rxspeed和txspeed是否与调制解调器的配置匹配;通过showinterfaceasync命令和showline命令查看端口的通信状况;从showline命令的报告检查EIA状态显示;检查接口封装;检查信息包丢失及缓冲区丢失情况。CISCO路由之排除路由故障2.1静态路由故障1.静态路由和有类别查找当路由选择表进程检查一条使用中间地址(路由选择表中作为下一跳引用的IP地址)的可解析的静态路由时,这个检查总是在有类别方式下完成的,无论是否使用ipclassless命令如果在路由选择表中有类别方式下的中间地址不能解析,则删除该静态路由。使用showiproute查看路由选择表。使用debug可以显示某个网络宕掉了。如果使用无类别方式并有一条默认路由存在,那么具有高管理距离的备份表态路由将永远不会在主静态路由失效时装入到路由选择表中。这是因为任何静态路由,即便是指向不存在的中间地址的静态路由,都会使用默认路由进行解析。CISCO路由选择表进程每60S调用一个检查路由选择表的静态路由功能来根据动态变化的路由选择表安装或删除静态路由。2.静态路由和中间地址静态路由可以使用中间网络地址或出接口来创建。大多数情况下,使用出接口在路由选择表进程中解析静