第2章广域网故障排除2-1第2章广域网故障排除本章采用串行线路技术来分析、排除广域网故障,主要分析串口、HDLC、PPP、Frame-relay、X.25的常见故障。本章内容:串口故障排除HDLC故障排除PPP故障排除Frame-relay故障排除X.25故障排除2.1串口故障排除2.1.1串口故障排除基本思路1.分析本端物理原因检测方法:使用showinterface命令查看物理信号是否全部UP,检测本端连线、接口类型(V24/V35)、设备是否正常。2.分析远端物理原因检测方法:在线路上一段一段的打环测试各段线路是否正常。3.检查接口参数配置检测方法:查看通信两端配置是否正常,并使用相关广域网协议的debug命令进一步确定问题所在。2.1.2串口常见故障处理故障一:物理信号没有全部UP可能的原因判断方法和解决方案1.路由器与DCE设备接口类型(V24/V35)不一致1.showinterface发现物理信号没有全部UP,检查路由器与DCE设备的接口类型是否一致。第2章广域网故障排除2-22.路由器工作为DCE方式,但没有配置时钟(缺省工作为DTE方式,不用配置时钟;但例如:路由器与路由器背靠背连接时,需要其中的一台工作为DCE方式)1.showinterface发现物理信号Txc为down,其它信号UP,如果路由器需要工作为DCE方式,此时要在接口上配置时钟:clockrate(请参看配置手册)。3.路由器与DCE设备之间的连接线有问题1.showinterface发现物理信号没有全部UP,换另一条连接线试试。4.路由器或DCE设备有问题1.在确保接口类型一致、连接线正常后,showinterface查看具体物理信号状态;2.如果DCE、DSR、CTS、TXC中的某些信号状态为down,说明问题在DCE设备,可能本端DCE设备本身有问题,也可能远端DCE设备有问题或本端DCE设备与远端DCE设备连接有问题,此时可以打环进一步确定问题所在;3.如果DTR、RTS信号状态为down,说明问题在路由器,检查接口配置是否做了shutdown的操作,没有的话可能问题在串口模块本身或路由器插槽,先换串口模块、再换插槽来进一步确定问题。故障二:物理信号全部UP、但广域网协议不能UP可能的原因判断方法和解决方案1.路由器与DCE设备接口类型(V24/V35)不一致或设备兼容性有问题1.有时路由器与DCE设备接口类型不一致,物理信号也会全部UP,此时showinterface一般会有一些错误信息(rxNoOctet、rxAbtErrs、rxCrcErrs、rxOverrun、rxLenErrs、txUnderrun);2.在确定接口类型一致后,错误统计信息依然在增加,可能DCE设备本身有问题或路由器与此DCE设备兼容性第2章广域网故障排除2-3有问题,此时可以尝试在路由器广域口上配置发送或接收时钟翻转、或时钟复用、或同时使用:clockinvert(把路由器的发送时钟翻转,消除线路上半个时钟周期的时延)、invertrxclock(把路由器的接收时钟翻转,消除线路上半个时钟周期的时延)、clockmultiplex(将发送时钟复用为路由器的收/发时钟);3.如果还是没有效果,可以换路由器模块、整台路由器和DCE设备调试来进一步确定问题。2.广域网两端接口协议或相关协议参数配置不一致i.showinterface发现接口下rxFrames、txFrames两项数值都有增加、且没有错误信息增加,此时一般DCE上的收发灯都正常闪动,先检查广域网两端协议配置是否一致,再打开相关协议的debug信息进一步确定问题(具体请参照下面几节协议故障排除)。3.广域网两端之间线路或设备有问题1.showinterface发现接口下txFrames在增加、但rxFrames没有增加或错误统计信息在增加。此时可以通过打环来检测;2.检测本端问题:在路由器接口上配置HDLC协议,并在本端的DCE设备上打本地环,如果本端发送、接收的数据都在增加且showinterface看到环(显示linelooped),说明本端没有问题;如果没有增加,则检查本端路由器、DCE设备、连接线的问题;3.检测线路问题(本端已经确定没有问题):看两端DCE设备的收发灯是否都在闪烁,在本端DCE打远端环检测对端路由器是否有收有发,或在对端DCE打网络环检测本端路由器是否有收有发且有环,如果两端都没有收发且看不到环,可能是中间线路上的问题,查中间线路。4.检测对端问题:在对端路由器接口上配置HDLC协议,第2章广域网故障排除2-4并在对端的DCE设备上打数字环,如果对端发送、接收的数据都在增加且showinterface看到环,说明对端没有问题;如果没有增加且看不到环,则检查对端路由器、DCE设备、连接线的问题;故障三:物理信号全部UP、协议UP,但丢包严重可能的原因判断方法和解决方案1.路由器工作在DTE方式,但错误的配置了时钟clockrate1.查看接口下配置,在DTE方式下,路由器不能配置clockrate,时钟应该由DCE设备提供2.路由器与DCE设备接口兼容性不好1.从本端路由器ping对端路由器广域口地址,时通时断,丢包严重,但没有规律(有规律的丢包可能是路由原因,如通一个、丢一个),此时showinterface一般会有一些错误信息(rxNoOctet、rxAbtErrs、rxCrcErrs、rxOverrun、rxLenErrs、txUnderrun);2.ping包的过程中,错误信息在不断增加,可能DCE设备本身有问题或路由器与此DCE设备兼容性有问题,此时可以尝试在路由器广域口上配置发送或接收时钟翻转、或时钟复用、或同时使用:clockinvert(把路由器的发送时钟翻转,消除线路上半个时钟周期的时延)、invertrxclock(把路由器的接收时钟翻转,消除线路上半个时钟周期的时延)、clockmultiplex(将发送时钟复用为路由器的收/发时钟);3.如果还是没有效果,可以换路由器模块、整台路由器和DCE设备调试来进一步确定问题。3.广域网两端之间线路或设备有问题1.showinterface发现接口下txFrames、rxFrames在增加,错误统计信息也在增加。此时可以通过打环来检测;2.检测本端问题:在路由器接口上配置HDLC协议,并在本端的DCE设备上打本地环,本端接口正常情况能UP,第2章广域网故障排除2-5ping本端接口的地址,如果没有丢包,说明本端没有问题;如果丢包严重,则检查本端路由器、DCE设备、连接线的问题;3.检测线路问题(本端已经确定没有问题):在路由器接口上配置HDLC协议,并在对端DCE打远端环,本端接口正常情况能UP,ping本端接口的地址,如果没有丢包,说明线路没有问题;如果丢包严重,则检查线路;4.检测对端问题:如果做过以上操作后,都正常,可能问题在对端,此时需要根据对端设备情况打环测试,进一步确定问题。4.数据流量超过线路带宽1.当跑业务时丢包严重,但停止业务时ping包正常,此时就应该考虑业务流量是否超过线路带宽。2.当跑业务丢包时,showinferface,查看接口下是否有较多的inputerrors、outputerrors,还可以看5分钟接收、发送流量统计是否接近线路带宽,如果是,基本可以说明线路负载过重,此时应该查本端以及对端局域网是否有较多的非业务数据流经过广域网,可以在以太口或广域口通过一些手段(如访问列表)来过滤这些非业务数据流,如果都是业务数据的话就应该提高线路带宽了。2.1.3串口显示信息说明在MP系列路由器的接口类型越来越多的情况下,有必要将常用接口的显示信息具体地说明一下,以便对此种接口和上层协议运行情况进行分析。下面就以串口跑同步方式PPP协议为例来介绍接口统计信息。当我们在路由器的特权模式下,键入showinterfaceserial0/0后,显示如下信息:router#showinterfaceserial0/0serial0/0:1Flags:(0x80f1)UPPOINT-TO-POINTMULTICASTRUNNING第2章广域网故障排除2-62Type:PPP3Internetaddress:3.3.3.9/84DestinationInternetaddress:3.3.3.15Queuestrategy:FIFO,Outputqueue:0/40(current/maxpackets)6Metric:0,MTU:1500,BW:128Kbps,DLY:20000usec,VRF:kernel75minuteinputrate1000bits/sec,1packets/sec85minuteoutputrate1000bits/sec,1packets/sec954packetsreceived;56packetssent100multicastpacketsreceived110multicastpacketssent125inputerrors;0outputerrors130collisions;0dropped&因为数据冲突和不能入IP队列而丢掉的错误统计14LCP:OPENED链路控制协议15IPCP:OPENEDNDSPCP:OPENED%IPCP(IP控制协议)、NDSPCP(NDSP控制协议)均处于OPEN状态。16rxFrames:905,rxChars53734物理上接收帧的数目和字节数17txFrames:903,txChars52832物理上发送帧的数目和字节数18rxNoOctet0,rxAbtErrs0,rxCrcErrs0%rxNoOctet为接收8位不对齐,rxAbtErrs为接收到ABORT(终止帧)错误,rxCrcErrs为接收CRC错误19rxOverrun0,rxLenErrs0,txUnderrun0&rxOverrun为接收overrun(CPU处理不及)错误,rxLenErrs为接收长度错误,txUnderrun为发送underrun(接口发送不及)错误20DCD=upDSR=upDTR=upRTS=upCTS=upTxc=upDCD:载波监测;DSR:数据设备就绪;DTR:数据终端就绪;RTS:请求发送;CTS:允许发送;TxC:检测接口时钟是否正确接口属性和IP层属性:1Flags标志表示当前接口的状态(即:UP/DOWN)2Type表示当前接口的封装类型。S0/0接口为PPP第2章广域网故障排除2-73显示接口的本地地址为3.3.3.9,子网掩码长度为84显示接口的对端地址为3.3.3.15显示接口上的队列策略为FIFO(firstinfirstout)6显示接口上的Metric(度量值)为0,MTU(最大传输单元)为1500,BW(网络带宽)为128Kbps,DLY(网络延迟)为20000usec,VRF(VPN路由转发)为kernel(核心)接口IP层统计:7-8显示接口的5分钟流量统计信息。即:5分钟内平均每秒接收和发送的比特数及数据包9显示到目前为止,接口上接收和发送的数据包数目10-11显示到目前为止,接口上发送和接收的多播报文的数目12因为数据报文格式错误等出现的输入输出错误统计(如果outputerror较多,可能是线路流量太大,超过带宽)13因为数据冲突和不能入IP队列而丢掉的错误统计接口链路层统计及物理层属性:14-15显示当前接口上PPP协议运行状态。LCP(链路控制协议)、IPCP(IP控制协议)、NDSPCP(NDSP控制协议)均处于OPEN状态。16-17显示物理上接收和发送帧的数目以及接收和发送的字节数18rxNoOctet为接收8位不对齐,rxAbtErrs为接收到ABORT(终止帧)错误,rxCrcErrs为接收CRC错误19rxOverrun为接收overrun(CPU处理不及)错误,rxLenErrs为接收长度错误,txUnderrun为发送underrun(接口发送不及)