中科院计算所培训中心网络故障管理与排除黎连业中科院计算所培训中心中科院计算所培训中心网络故障管理与排除在信息化的社会里,单位对网络的依赖程度越来越高,网络随时都可能发生故障,影响单位的正常工作,网管员必须掌握相应的技术及时排除故障,有些单位如电信,电子商务公司,游戏运营商等使用的网络一旦发生故障,若不能及时排除,会产生很大的损失,这些单位一般会安装网络故障管理软件,通过软件来管理整个网络的故障。中科院计算所培训中心故障管理网管员经常会遇到故障,遇到后故障后,如果凭借以前的网管经验能立刻解决最好,解决不了的话,可以向有经验的网管员请教。还解决不了的话,可以查看帮助。一般应用程序(如Outlook,IE),操作系统,路由器,交换机都有大量的帮助文档,这些帮助文档中含有大量有用的技术信息。我们在安装软件,购买设备时一般都能获取到这些帮助文档,厂家的网站上也有免费下载。我们还可以通过搜索引擎来获取信息,如图24-1在无法连接后,会得到大量有用信息。中科院计算所培训中心图24-1使用google搜索中科院计算所培训中心另外也可以把我们遇到的问题发表在论坛上,在论坛里有很多网络高手乐于回答别人的问题。如图24-2在中有很多网络高手回答别人的问题图24-2在论坛上发表问题中科院计算所培训中心故障管理的一般步骤对网络进行监测,提前预知故障。发生故障后,找到故障发生的位置。解决故障。记录故障产生的原因,解决方法。故障分析预测。中科院计算所培训中心常用的网络测试命令(1)使用ipconfig查看IP配置使用/All参数查看网络配置情况。点击程序运行输入CMD进入DOS命令行窗口,在DOS命令行窗口中输入ipconfig/all会显示出以画面如图24-3。中科院计算所培训中心图24-3ipconfig/all中科院计算所培训中心在图24-3中显示出了本机Tcp/IP配置情况,显示的信息包括IP地址、子网掩码、网关、DNS等,如果显示出的IP地址不在网络的网段中,本机则无法与其它机器通信,如果网关,DNS配置有误,则本机不能访问外网电脑,也不可能上网。使用/release和/renew参数重新从Dhcp服务器获取IP地址。在网络中电脑经常配置成自动获取IP地址,如果单位的网关,DNS发生了变化。我们则需要运行ipconfig/release释放DHCP配置,然后再运行ipconfig/renew重新连接到DHCP服务器,更新现有配置或者获得新配置。中科院计算所培训中心(2)ping命令参数介绍在DOS命令窗口下输入ping/?可以看到ping的各个参数,如下C:\DocumentsandSettings\Administratorping/?Usage:ping[-t][-a][-ncount][-lsize][-f][-iTTL][-vTOS][-rcount][-scount][[-jhost-list]|[-khost-list]][-wtimeout]destination-listOptions:-tPingthespecifiedhostuntilstopped。Toseestatisticsandcontinue-typeControl-BrTostop-typeControl-C。-aResolveaddressestohostnames。-ncountNumberofechorequeststosend。-lsizeSendbuffersize。-fSetDon'tFragmentflaginpacket。-iTTLTimeToLive。-vTOSTypeOfService。-rcountRecordrouteforcounthops。-scountTimestampforcounthops。-jhost-listLoosesourceroutealonghost-list。-khost-listStrictsourceroutealonghost-list。-wtimeoutTimeoutinmillisecondstowaitforeachreply。中科院计算所培训中心下面分别对参数作介绍/tping指定的计算机直到中断。/a将地址解析为计算机名。C:\DocumentsandSettings\Administratorping-a169.254.188.86Pingingzhangjj[169.254.188.86]with32bytesofdata:通过运行ping-a169.254.188.86可以知道IP为169.254.188.86的电脑的计算机名是zhangjj。-ncount发送count指定的echo数据包数。默认值为4。中科院计算所培训中心-llength发送包含由length指定的数据量的echo数据包。默认为32字节;最大值是65,527。-f在数据包中发送“不要分段”标志。数据包就不会被路由上的网关分段。-ittl将“生存时间”字段设置为ttl指定的值。-vtos将“服务类型”字段设置为tos指定的值。-rcount在“记录路由”字段中记录传出和返回数据包的路由。count可以指定最少1台,最多9台计算机。-scount指定count指定的跃点数的时间戳。中科院计算所培训中心-jcomputer-list利用computer-list指定的计算机列表路由数据包。连续计算机可以被中间网关分隔(路由稀疏源)ip允许的最大数量为9。-kcomputer-list利用computer-list指定的计算机列表路由数据包。连续计算机不能被中间网关分隔(路由严格源)ip允许的最大数量为9。-wtimeout指定超时间隔,单位为毫秒。中科院计算所培训中心使用Ping测试故障的步骤现在有一台电脑不能访问Internet上的WEB服务器,我们可以使用ping命令找出故障的位置,操作步骤如下:第一步:ping127.0.0.1。如果ping不通,则说明本机TCP/IP没有装好。第二步:ping本机的IP地址。如果ping不通,则说明网卡没有装好,或网卡驱动有问题。第三步:ping本网段的其它设备IP地址。如果ping不通,则说明连接本机的线路有问题。如果线路没问题,则可能是交换机的端口有问题,如果交换机的端口没有问题,则可能是交换机本身出了问题。第四步:ping本网段的网关。如果ping不通,则无法上网,因为没有设备能把数据包转发出去,原因可能是路由器没有配置好或代理服务器出了问题。第五步:pingDNS服务器如果ping不通,则说明DNS服务器出了问题,或本机的DNS服务器设置不对,中科院计算所培训中心网络故障管理软件的功能上节所讲的方法只能针对小型网络,在一些大型网络中一般使用网络故障管理软件,一个网络的故障管理系统不但能反应网络平常运行时的故障情况,更应该在发生重大网络故障时,快速准确地报告、定位和排除故障,从而帮助运营商快速的解决问题,并为将来针对故障的多发部分进行网络优化和升级提供真实可靠的参考,从而节约运营成本,提高用户满意度,在竞争中取得优势。能够提供实时故障监测和相关处理、快速定位故障、关联故障,并可提供多厂家,多技术和多业务区的集中管理。对于如此关键的网络故障管理系统来说,最重要的、也常常未受到足够重视的一点就是它自身的质量,它和系统的功能一样至关重要、不可忽视。设想一下,当网络发生严重故障时,系统将集中上报大量的告警,如果一个故障管理系统不够强壮的话,它将随着大量告警的来临而不堪重负,自己也发生故障,无法完成其应承担的任务。凡此种种,不一而足。因此,网络故障管理系统的质量至关重要,这里所谓的质量包含可靠性、可扩展性、稳定性、开放性以及可恢复性等等。中科院计算所培训中心市场上有两款网络故障管理软件功能比较强大,它们是:朗讯公司的NavisNFM故障管理系统。Micromuse公司的Netcool。NavisNFM(NetworkFaultManagement)网络故障管理系统是朗讯科技网络运行系列软件中最著名的产品,其功能强大,能够提供实时故障监测和相关处理、快速定位故障、关联故障,并可提供多厂家,多技术和多业务区的集中管理。另外,“现成的方案”可以快速进行工程实施,并提供本地化的客户和技术支持。中科院计算所培训中心NavisNFM核心功能包括告警信息采集,浏览,过滤,分类等。支持信息压缩,可根据信息发生的次数、数值,时间和分组进行压缩。告警门限设置和级别升级(Critical,Major,Minor,Other,Cleared)。自动的告警通知和告警处理功能(询呼,发送电子邮件,生成工单,网元重新启动等)。多种颜色的故障信息显示及图形化的网络地图显示。支持开放的接口和API(ASCII,SNMPv1-v3,CORBA,X.25,TL1)。远端登录到网元和网元管理系统。NFM可以根据用户的级别,实现分权和分级管理。系统管理员可以为不同的用户设置不同的权限,只定义该用户关心的网元的故障信息的浏览,查找,操作和远程登录等功能。每个用户用自己的帐户登录系统后,只能看到权限之内的信息,及执行被允许的各种操作。同时,NFM还备有用户使用记录,从而实现对人员使用情况的管理,加强对整个系统安全保障。中科院计算所培训中心NFM提供强大的告警抑制功能,可以对非告警类报告提供过滤;根据各种门限进行告警抑制;告警恢复后,NFM可以自动清除原告警,并将其转入已清除告警中;对告警进行域内、域间的相关性处理等,从而大幅度地减少告警的数量,并有效地减少了分析故障根源所花费的时间。用户还可以将客户信息和服务相关数据集成到NavisNFM数据库,NFM可实时地显示与故障相关的客户和服务数据信息,产生针对特定客户和服务的故障报告,并在故障影响客户之前对其影响进行评估。中科院计算所培训中心图24-4NavisNFM对故障的显示方式中科院计算所培训中心网络常见故障网络故障分类网络故障的分类方法比较多(1)根据发生故障的对象来分电脑故障。线路故障。路由器,交换机故障。互联网接入故障。(2)根据软硬件结构来划分软件故障。如IP设置错误,路由器,交换机配置不正确。硬件故障。线路遭到破坏,端口接触不良等。中科院计算所培训中心局域网常见故障解答(1)电脑装完Win2000后,网上邻居属性没有本地连接?答:没有本地连接,可能的原因是网卡没装好,有两种可能,第一种:win2000不能自动识别网卡,解决办法是装驱动,第二种:网卡的插槽是ISA,IO地址和中断号设置不对,进入DOS运行随网卡所带的软盘上的程序,程序运行后,将网卡设置成即插即用的,再进入win2000系统,win2000则会自动给网卡分配IP地址。(2)装了ADSL后,通过软件拔号能上网,电脑设置成自动获取IP地址后,不能上网?答:启用ADSLmodem路由功能,不同的Modem设置方式不一样,请参看Modem的说明书。(3)某些电脑能能上网浏览网页,却不能上QQ?答:很有可能是网络的防火墙做了设置,关闭了QQ用的端口。(4)某个用户能用outlook收邮件,不能发邮件?答:现在邮件smtp服务器都加强了安全,要求用户在发信时必须提供密码,打开outlook后单击工具帐户邮件属性出现下图24-5选中“我的服务器要求身份验证”。中科院计算所培训中心图24-5Outlook设置中科院计算所培训中心(5)单位是通过ADSL上网,上网服务器共享了internet连接,其它电脑配置成自动获取IP地址,突然有一天有很几台电脑不能访问互联网上的网页?答:客户端是通过从上网服务器获取IP地址,如果网络中有人建了一台非法DHCP服务器,如图24-6,客户端就有可能不从上网服务器那里获取IP地址,而从非法DHCP