常见网络故障排除北京北大方正宽带网络科技有限公司学习目标描述故障排除的基本方法和步骤掌握故障排除常用工具软件的使用分析处理基本的网络故障问题学习完本课程,您应该能够:课程内容网络故障排除模型故障排除工具典型故障排除案例小结网络现状接入层地市2骨干网汇聚层NE16ES5516S8016MPLSVPNNE16ENE16ENE16ENE80NE80S8016S8016S5516S5516S3026R36/2600R36/2600支持包括数据、音频和视频集成传输的综合应用新技术不断出现现代网络与传统网络的共存对网络管理人员的要求目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:确保网络尽量稳定运行掌握故障排除方法熟悉各种协议可能故障点,迅速定位排除故障网络故障的一般分类连通性问题硬件、媒介、电源故障软件配置错误兼容性问题链路问题性能问题路由环路网络攻击网络拥塞配置问题路由交换配置错误服务器配置错误一般故障的解决步骤故障现象观察故障相关信息收集各种可能原因列表故障排除过程文档化对每一原因实施排错方案经验判断和理论分析恢复实施方案前的网络状态故障排除?YN循环1循环2分层故障排除法1物理层2数据链路层4高层3网络层主要关注:电缆、跳线连接头、网口、设备硬件负责介质的连接分层故障排除法1物理层2数据链路层4高层3网络层主要关注:端口的状态,协议是为UP,则为链路层工作正常。同时和端口负载有关。封装的不一致分层故障排除法1物理层2数据链路层4高层3网络层主要关注:地址和子网掩码是否正确,路由协议配置是否正确。排除时沿着源到目的地的路径查看路由表。同时检查接口的IP地址。分段打包和重组及差错报告分层故障排除法1物理层2数据链路层4高层3网络层主要关注:网络终端的高层协议,以及终端设备软硬件运行良好。负责端到端的数据分块故障排除法配置文件可分为以下几块:管理部分(路由器名称、口令、服务、日志等)端口部分(IP地址、封装等)路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)策略部分(路由、策略路由、安全配置等)接入部分(CONSOLE、Telnet、SSH、拨号等)其他应用部分(ACL配置、VLAN配置、Qos配置等)可以把故障归入上述一类或几类分层故障排除法把网络分段,逐段排除故障汇聚交换以下内网一段汇聚设备到IDC主交换一段IDC主交换到核心层的这一段IDC主交换层本身问题核心层到供应商对端的这一段核心层本身问题WAN(外网)链路替换法替换法是检查硬件问题最常用的方法当怀疑是网线(光跳线)问题时,更换一根确定是好的网线(光跳线)试一试;当怀疑是接口(接口模块)有问题时,更换一个其它接口(接口模块)试一试当服务器不通无法判断故障原因时可使用笔记本或其他服务器替换故障服务器测试链路状态分块排除当其他正常但无法判断是否为设备问题时建议用相同配置设备替换现有设备,如此操作无效换回设备并恢复原网络拓扑状态在实际网络故障排错时,可以先采用分段法确定故障点,再通过分层或其它方法排除故障课程内容网络故障排除模型常用命令和故障排除工具典型故障排除案例小结常用故障诊断命令以及工具思科、华为网络设备故障诊断主要有以下命令:ping命令tracert命令Pathping命令Show、display命令Reload、reboot命令debugging命令Ethereal抓包工具IP地址查询()LinkWan()Tracertroute()查看BGP-AS路由表Linux系统常用命令ping(ping-c100-s1000202.108.33.32-Ieth1)Traceroute(traceroute202.108.33.32-In-ieth1)Tcpdump(tcpdump-nnn-parp-ieth1、tcpdump-nnn-e-c500-ieth1)Ifconfig查看本机网络接口信息课程内容网络故障排除模型故障排除工具典型故障排除小结服务器不通,内、外网无法访问首先问清客户具体情况以何种方式无法访问,还是完全不通。用ping和tracert查看用户反应是否属实(部分服务器设置禁ping)查看服务器硬件(电源,网卡,主板等等)、机柜交换机端口、网线等硬件问题服务器接显示器、键盘、鼠标查看服务器现行运行状态,有无启动异常、报错、无法启动等问题(此步建议不要向用户所要用户名、密码等如有问题通知客户现场维护)查看机柜交换机、汇聚交换机、核心设备等配置,有无针对客户服务器IP的路由指空、端口限制、禁用端口等等(需要相应设备权限)替换法用笔记本、服务器等替换现有故障服务器查看网络是否通畅如内网无问题(可ping,能正常访问)查看外网tracert路由是否有环路或不通等问题服务器可访问,内网丢包,外网访问正常此种故障多为IDC网络拓扑汇聚层以下拓扑查看流量图,检查各设备流量是否正常,有无突发异常流量检测核心设备、汇聚交换机、机柜交换机等端口限速是否有问题,端口是否有跑满现象。(端口限速过小或者端口跑满会导致内网丢包,延时大。但此时外网访问没多大影响)使用笔记本或者服务器接入问题网段进行内网抓包,检查内网是否有ARP等病毒影响(建议从机柜接入层到汇聚层全部进行端口隔离或者VLAN划分操作,此操作目的减少各服务器之间互相影响、病毒泛滥等)检测交换机、路由器等网络设备上是否有MAC地址或者IP地址冲突等问题外网ping服务器丢包,延时大等客户如果反应此种问题需详细问清客户所在网络具体情况(如客户使用ADSL、专线、ISP接入等)使用LINKWAN、ADSL等外网链路对服务器进行ping或者tracert测试是否有丢包或延时大问题要求客户提供自己所在网络环境IP等供我方进行tracert和ping测试到客户所在网络是否有丢包和延时大问题查看tracert路由表丢包和延时大出现在哪一段查看接入交换机端口限速、汇聚层设备出口带宽、核心层设备出口带宽、总出口带宽是否跑满路由环路问题出现此种问题时服务器多半会出现无法正常访问,ping不通服务器,tracert路由出现重复环路等根据tracert路由表查找出现路由环路的设备登陆设备,查看设备配置是否正确,如有问题调整路由策略路由策略调整完毕后重新进行tracert测试,查看是否恢复正常,如问题依旧重复上述2、3条操作直至问题解决光纤链路类故障光模块(光收发)link灯不亮,ping对端不通(模块、光缆、光跳线问题)光模块(光收发)link灯亮,ping对端不通,多发生在双芯链路(模块、双芯跳线中一根有问题、光缆两芯中有一芯出问题)光模块(光收发)link灯亮,ping对端通但是丢包(模块与跳线不匹配、光缆衰减大、设备问题)小结网络故障排除是一项重要的工作网络排错方法有分层故障排除法、分段故障排除法、分块故障排除法和替换法等熟悉使用故障排除常见工具,包括网络设备自带的软件诊断工具。通过案例分析和实验,初步掌握网络设备常见故障现象的排除方法。