第九章网络管理与维护计算机网络教研室第九章网络管理与维护网络系统建成以后,能否高效、可靠地运行,发挥其应有的功能和效益,关键在于管理,做好网络系统的日常管理与维护工作,是一个网络管理人员的主要职责。本章的学习目标:■了解网络管理的概念、目的;■掌握网络管理的五大基本功能;■了解网络管理的体系结构和基本要素;■了解常用网络管理系统的特点;■了解网络维护的主要内容;■掌握网络维护的基本方法;■了解网络故障的分类;■掌握常见网络故障的排查方法;■掌握常用网络故障诊断命令的使用方法和技巧。9.1网络系统管理9.1.1网络管理概述1.网络管理的概念网络管理是在网络技术迅速发展形势下提出的新问题,是指对组成网络的各种资源(包括软硬件、信息等)进行有效地综合管理,以便充分发挥这些资源的作用。9.1网络系统管理2.网络管理体系的基本要求(1)同时支持网络监视和控制两方面的能力;(2)能够管理所有的网络协议,容纳不同的网络管理系统;(3)提供尽可能大的管理范围,并且应做到网络管理员可以从任何地方都能对网络进行管理;(4)尽可能小的系统开销,提供较多网络管理信息;(5)网络管理的标准化,可以管理不同厂家的网络设备,实现网络管理的集成;(6)网络管理在网络安全性方面应能发挥更大的作用;(7)网络管理应具有一定的智能,可以根据对网络统计信息的分析,发现并报告可能出现的网络故障。9.1网络系统管理3.网络管理的功能在OSI网络管理框架模型中,基本的网络管理功能被分为配置管理、性能管理、故障管理、计费管理、安全管理等五个功能域,分别完成不同的网络管理功能。(1)配置管理配置管理就是定义、收集、监测和管理系统的配置参数,使得网络性能达到最优。配置管理的目的在于随时了解网络系统的拓扑结构以及所交换的信息,包括连接前静态设定的和连接后动态更新的。9.1网络系统管理(2)性能管理网络性能管理包括性能监测和网络控制两部分。性能管理以提高网络性能为准则,其目的是保证在使用最少的网络资源和具有最小网络时延的前提下,使网络提供可靠、连续的通信能力,并使网络资源的使用达到最优化的程度。性能管理具有监视和分析被管网络及其所提供服务的性能机制的能力,其性能分析的结果可能会触发某个诊断测试过程或重新配置网络以维持网络的性能。9.1网络系统管理(3)故障管理故障管理就是使管理中心能够实时监测网络中的故障,并能对故障原因作出诊断和定位,从而能够对故障进行排除或能够对网络故障进行快速隔离,以保证网络能够连续可靠地运行。(4)计费管理计费管理主要记录用户使用网络情况和统计不同线路、不同资源的利用情况,它可以估算出用户使用网络资源可能需要的费用和代价,以及已经使用的资源。网络管理者还可以规定用户可使用的最大费用,从而控制用户过多占用和使用网络资源。9.1网络系统管理(5)安全管理网络安全管理主要用于保护网络数据不被侵入者非法获取、防止侵入者在网络上发送错误信息以及确保网络管理系统本身不被非法访问。在建立网络管理系统时,应首先确定自身的网管需求;其次根据需求确定网管的管理方式,选择合适的网管软件平台及与网络系统管理相关的网管支持软件版本;再次,在选择网络设备时,还要考虑该网络设备所能支持的网管支撑软件版本;最后考虑既支持网管软件平台,又能满足网络管理要求的硬件设备,最终构成性能价格比比较合适的网管平台。9.1网络系统管理9.1.2网络管理的体系结构1.网络管理系统的组成一个功能完善的网络管理系统通常由多个被管代理Agent、至少一个网络管理站Manager、网络管理协议(SNMP、CMIP)和至少一个网管信息库MIB等四大部分组成,如图9.1所示。9.1网络系统管理一般来说,任何一个被管设备,都应有一个被管代理,如:交换机、打印机、主机。对于一些不能运行附加的代理软件的非标准被管设备(如Modem、Hub等),需要采用委托代理(Proxy)的方式进行管理,如图9.2所示。9.1网络系统管理2.SNMP网络管理体系结构SNMP提供的是一种面向无连接的服务,它不能确保其它实体一定能收到管理信息流。SNMP是通过轮询方式来进行管理的,即管理中心每隔一段时间向各个被管对象发出询问,并通过收到的信息进行相应的管理。但是为了对紧急情况作出迅速的处理,SNMP还引进了汇报,当被管对象发生了紧急情况时就主动向中心汇报。在Internet管理模型中,一个完整的网络管理体系结构如图9.3所示。9.1网络系统管理9.1.3常用的网络管理系统目前常用的网络管理系统主要有通用网管系统、设备厂商网管系统和一些其它网管系统。1.通用网管系统目前主流的通用IP网络管理系统有:HPOpenview、CAUnicenter、IBMNetview等。2.设备厂商网管系统设备制造商网管一般为厂商自身开发的主要面向厂商内部设备管理支持的网络与业务管理系统,各厂商采用专有的管理MIB库,以实现对厂商设备本身的细致入微的管理。如思科Ciscoworks网络管理系统、华为Quidview网络管理系统等。9.1网络系统管理3.其它网管系统9.2网络维护与故障排除网络运行中的故障种类多种多样,要在网络出现故障时及时对出现故障的网络进行维护,以最快的速度恢复网络的正常运行,除了要有扎实的网络技术基础理论以外,还需要掌握一套行之有效的网络维护方法,并有丰富的网络维护经验。9.2.1网络维护的主要内容1.硬件维护主要包括计算机系统各硬件组成部分的维护、网络设备的维护、网络传输介质的维护、网络连接部件的维护等。2.软件维护软件维护是计算机网络维护的主要方面,主要包括计算机网络设置的检查、网络设备运行状态和系统配置的检查、网络性能监测及认证测试、网络安全性的检查、网络连通性的检查、网络系统综合管理等。9.2网络维护与故障排除9.2.2网络维护的基本方法网络维护的主要任务是探求网络故障产生的原因,从根本上消除故障,并防止故障的再次发生。在解决网络故障的过程中,可以采用多种方法。1.参考实例法很多公司或单位在购买计算机或网络设备时,往往考虑到整个网络系统的稳定性以及维护的方便性,从而选择相同型号的计算机和网络设备,并设置相同的参数。只要充分利用这一特点,在设备发生故障的时候,参考相同设备的配置可以帮助网络管理员快速准确地解决问题。9.2网络维护与故障排除采用参考实例法的时候,应该遵守以下原则:(1)只有在可以找到与发生故障的设备相同或类似的其他设备的条件下,才可以采用参考实例法。(2)在对网络配置进行修改之前,要确保现用配置文件的可恢复性。(3)在对网络配置进行修改之前,要确保本次修改产生的结果不会造成网络中其他设备的冲突。利用参考实例法进行网络系统维护的一般步骤如图9.4所示。9.2网络维护与故障排除2.硬件替换法在对网络系统的故障基本定位后,用能够正常工作的设备替换可能有故障的设备,如果系统得以恢复正常,那么故障也就解决了。采用硬件替换法的时候,需要遵守以下原则:(1)故障定位所涉及的设备数量不能太多;(2)确保可以找到能够正常工作的同类设备;(3)每次只可以替换一个设备;(4)在替换第二个设备之前,必须确保前一个设备的替换已经解决了相应的问题。采用硬件替换法的一般步骤如图9.5所示。9.2网络维护与故障排除3.错误测试法错误测试法是通过测试而得出故障原因的方法。网络管理员需要凭借实际经验,能够对故障部位作出正确的推测,找到产生故障的可能原因并有相应的测试和维修工具。采用故障测试法的时候,需要遵守以下原则:(1)在更改设备配置之前,应该对原来的配置做好记录,以确保可以将设备配置恢复到初始状态;(2)如果需要对用户的数据进行修改,必须事先备份用户数据;(3)错误测试必须确保不会影响其它网络用户的正常工作;(4)每次测试仅做一项修改,以便知道该次修改是否能够有效解决问题。采用错误测试法的一般步骤如图9.6所示。9.2网络维护与故障排除9.2.3网络故障的分类1.按照网络故障的性质不同进行划分按照网络故障的性质不同,可分为物理故障和逻辑故障两类。(1)物理故障物理故障指的是因设备或线路损坏、插头松动、线路受到严重电磁干扰等情况产生的网络故障。(2)逻辑故障逻辑故障中最常见的就是网络设备的配置错误,导致网络异常或故障。配置错误可能是路由器端口参数设定有误,或是路由器的路由配置错误以至于路由器循环或找不到远端地址,也可能是路由器中的子网掩码设置错误等。9.2网络维护与故障排除2.按照故障的对象不同进行划分按照故障的对象不同可以划分为线路故障、路由器故障和主机故障。(1)线路故障线路故障最常见的情况就是线路不通,诊断这种故障首先是检查该线路上的流量是否还存在,然后用Ping检查线路远端的路由器端口能否响应等。(2)路由器故障事实上,线路故障中很多情况涉及到路由器,因此也可以把一些线路故障归结为路由器故障。检测这种故障,需要利用MIB(管理信息库)变量浏览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU温度、负载以及路由器的内存余量等数据。9.2网络维护与故障排除(3)主机故障主机故障常见的现象就是主机的配置不当。如主机配置的IP地址与网上其他主机冲突,或主机IP地址与网关地址不在同一网段,这些都会导致主机无法连通。主机的另一个故障就是安全故障。比如,主机没有控制其上的finger、RPC、rlogin等多余服务,而攻击者可以通过这些多余进程的正常服务或bug攻击该主机,甚至获取Administrator的权限等。9.2网络维护与故障排除3.按照引起故障的原因进行划分根据引起故障的原因,可以将网络故障分为连通性故障、网络协议故障、配置故障和安全故障。(1)连通性故障通常引起连通性故障的原因主要有以下几种:①网卡未安装,或未安装正确,或与其他设备有冲突;②网卡本身出现物理故障;9.2网络维护与故障排除③没有安装或没有正确安装相应的网络协议;④网线、跳线或插座等连通性设备没有正确安装,或者出现故障;⑤路由器或交换机没有打开电源,或者出现物理故障,或者相应的通信端口出现故障;⑥USB电源出现故障。9.2网络维护与故障排除(2)网络协议故障产生网络协议故障的原因主要有以下几种:①网卡没有安装或安装错误;②没有安装所需要的网络协议;③相应的网络协议配置不正确;④在组建局域网时或维护过程中人为修改设置,造成一个或多个计算机重名。9.2网络维护与故障排除(3)配置故障配置故障主要指的是系统、工具软件中的配置内容错误。在组建局域网的过程中将涉及到名目繁多的种种配置,如系统相应参数的配置(共享资源的访问权限,用户维护、管理的权限等)、工具软件的配置(代理服务器的设置、局域网通信工具的配置等)。如果配置不当,小则导致某些资源无法使用,大则导致整个网络瘫痪。因此,系统、工具软件配置问题需要引起用户的足够重视。(4)安全故障安全故障通常表现为感染病毒、黑客入侵、安全漏洞等几个方面。当局域网连入Internet时,出现安全故障的概率大大提高,当然也不排除在局域网内部的“交叉感染”,甚至恶意攻击等。9.2网络维护与故障排除9.2.4网络故障的排查方法排除网络故障的方法很多,一般可以从OSI模型各层着手。在OSI分层的网络体系结构中,每个层次都可能发生网络故障,据有关资料统计,网络故障在各层的分布情况大致为:应用层3%,表示层7%,会话层8%,传输层10%,网络层12%,数据链路层25%,物理层35%。由此可见,大约70%的网络故障都发生在OSI七层协议的低三层。很多例子也都说明,在网页浏览器工作不正常时,人们常常浪费很多时间去解决问题,结果却发现原来是计算机未与网络正确连接。9.2网络维护与故障排除1.物理层故障物理层是解决网络问题的根本,不要低估其重要性。许多网络问题追根结底都是由于使用不良的RJ-45接头、插座、压线、中继器、集线器或光缆收发器所致。9.2网络维护与故障排除物理层常见的问题主要包括:缆线太长,例如:UTP双绞线超过100m;网卡硬件故障,例如:电子元件损坏;中继器故障,例如:电源插头是否松动;网线接头不良,例如:质量较差的网线接头