精品课程——第二课网络故障的排除方法与诊断工具Chp1认识网络故障目录CONTENTSPAGEChp2网络故障排除方法Chp3网络故障诊断工具本章内容简介本章内容认识网络故障网络故障现象网络故障的分析方法网络故障的定位Chp1知识概述网络故障管理网络故障的诊断网络故障的排除网络故障的测试工具Chapter.1认识网络故障Chp1认识网络故障5二、网络故障的排除方法与诊断工具1、认识网络故障网络故障是指网络系统运行过程中,因为硬件、软件、操作或者安全的问题等造成网络不能正常运行的情况。造成网络运行故障的原因很多,如IP地址冲突、交换协议、路由协议、安全、病毒等等。一般常见的网络故障有以下几种:物理故障逻辑故障人为故障下面逐个进行介绍:Chp1认识网络故障61、认识网络故障1、物理故障(1)线路故障线路故障是因为设备之间的连接缆线、接口等发生了故障造成网络连接失败。(2)硬件故障硬件故障是因为设备的物理接口发生问题,比如网卡、交换机端口、路由器端口等发生故障。二、网络故障的排除方法与诊断工具Chp1认识网络故障71、认识网络故障2、逻辑故障(1)规划故障由于对协议理解失误,造成规划出错而引起的故障,例如IP地址冲突、VLAN协议故障、STP故障、路由协议故障等。(2)协议故障网络通信过程中,有大量不同厂家的产品进行对接,因为协议的不同造成网络互连的失败,需要进行协议参数的调整来完成。二、网络故障的排除方法与诊断工具Chp1认识网络故障81、认识网络故障3、人为故障(1)操作故障由于操作失误造成硬件损坏而引起的故障,例如端口被烧、防静电措施不利、无接地措施等。(2)配置故障在实施项目过程中,因为人为配置造成网络故障的情况。二、网络故障的排除方法与诊断工具Chp1认识网络故障Chapter.2网络故障的排除方法Chp2网络故障的排除方法102.1、网络故障排除方法故障排除不是一门精确科学,在出现一个网络故障后,有时需要采用多种办法才能够解决这个问题。但是,当你执行结构化故障排除方法时,可以让你持续进步,更快地解决问题。结构化故障排除方法能够系统全面的分析故障原因所在,能全面的采用各种方法进行故障排除,提高了故障定位的准确度,减少故障排除时间。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法112.1.1、故障排除原则一般来说,一个网络故障的处理要遵循一个逻辑过程,每一步之间都有较强的逻辑关系。图2-1展示了结构化故障排除的流程。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法定义问题解决问题检验假设消除提出假说分析收集信息图2-1结构化故障排除的流程122.1.1、故障排除原则这一结构化方法主要包括以下内容:1.收集信息:需要根据故障的发生情况,确定收集信息的范围和内容,收集信息过程中可能需要做多种测试才能完成。准确有效的信息收集是解决问题的关键。2.分析资料:在对所有收集的信息进行分析后,结合各种专业知识进行故障定位。3.消除可能的原因:完成第2步后,通过对信息的收集和故障现象的分析,淘汰部分问题,进一步确定故障发生的范围。4.制定一个假说:完成信息收集和原因分析后,一个或更多的潜在问题的原因依然存在。对这些问题的原因每个概率会必须进行评估,选择最有可能的,对这个问题提出假设,进一步进行解决。5.检验假设:假设必须进行测试,以证实是否是这个原因造成的故障。最简单的方法,是在此基础上提出的假设解决方案,实施该解决方案,并验证是否解决了问题。如果此方法没有解决,那么假设失效,继续收集更多的信息并进行分析。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法13所有故障排除方法包括收集和分析信息,消除可能的原因,并制定和检验假设。这些每一个步骤都有其优点,并要求一些时间和精力,确保了从一个原因到下一个原因故障排除的准确性。形成一个闭环,不断的收集信息,不断的进行假设,进行验证,直到最终解决问题。如果你不是采用结构化的解决步骤,最终也有可能解决问题,但是这样的过程效率很低。这种结构化解决故障的方法适合任何有无经验的网络管理人员。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法142.1.2、结构化故障排除方法结构化解决故障的思路是作为一个准则用来解决网络故障,但是在具体解决过程中可以采用以下方法:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法1.自上而下:使用这种方法,从OSI模型的应用层到物理层。使用自上而下的解决方法是把网络系统看成一个OSI模型,从应用层到物理层逐层进行假设来进行验证。使用这种方法一般比较适合解决应用类的故障。152.自下而上:从OSI模型的物理层到应用层。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法自下而上的解决办法是从OSI模型的物理层为出发点,逐步扩展到应用层,并验证相关的网络元素的正常运行。这种方法的好处是,在所有的初始故障发生在网络的地方,都可以采用测试命令来完成网络层以下的功能确认。如果你的网络规模较小,而且你发现之前大多数网络故障都和硬件有关,那这种方式比较适合。如果是在大型网络,它将是一个耗时的过程,因为需要利用大量的时间来确认网络的有效范围,再进一步采取措施。163.分而治之:使用这种方法,在OSI模型的中间网络层,然后根据调查结果为基础,向上或向下移动OSI堆栈。二、网络故障的排除方法与诊断工具Chp2网络故障排除方法分而治之的网络故障排除方法,一般是从网络层开始排除,可以执行诸如ping的测试命令,根据测试的结果来判断应该往上还是往下,能够迅速的进行大方向的定位,因此,分而治之的方法被认为是一个非常有效的故障排除方法。4.路径排查:这种方法是基于数据包的通过路径,分析源和目的之间的路径。路径排查的方法是最基本的故障排除技术之一,它是对其他排除方法的补充。路径排查方法首先确定数据包的实际路径,确定从源到目的地之间的链路和设备,故障的范围被确定在某个链路或设备上,加快了排查速度。172.1.3、实施故障排除过程故障排除过程可以遵循结构化方法,但它不是静态的,其步骤也不是完全相同。每个网络都是不同的,每个问题也都不同,而且参与的工程师在技能和经验方面也都不同。但是,基本的解决问题的思路是一致的。通用故障排除过程包括以下任务:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法第1步、确定问题第6步、测试这个假设第2步、收集信息第7步、解决问题第3步、分析信息第4步、消除可能出现的问题原因第5步、制定最有可能的原因假设182.1.3、实施故障排除过程1、确定问题确定问题是在正确判断故障现象的基础上做出的,因此发现故障的工程师要能够清楚的表达故障发生后设备的状态,包括硬件的物理灯的状态、设备板卡的状态、电源的状态、网络互连的状态等。确定问题时可以按照以下步骤:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)收集所有故障现象的信息。(2)对问题和现象进行书面详细描述。(3)尽可能的先对重要数据进行备份。(4)描述网络故障对于业务的影响程度。(5)只做记录不下结论。192、收集信息在完成第一步的基础上,确定要收集的信息内容。收集信息前要有足够的工具作为保障,例如笔记本、配置线缆、通断测试仪、万用电表、成品双绞线等。还包括产品说明书,技术手册,相应的配置软件等。收集信息可以按照以下步骤完成:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)准备收集信息的工具。(2)收集物理链路的通断情况,并列表。(3)收集发生故障的设备数量和用途,并列表。(4)对原始配置进行备份。(5)收集设备的IP地址和管理密码。(6)收集设备的其他参数,比如软件版本、设备运行状态、各协议的运行状态等等。203、分析信息根据收集到的信息,按照网络故障的复杂程度,确定一个人完成还是由一个小组完成。虽然故障的原因很多,但是归根到底无非是硬件问题或者软件问题,确切的来说,网络发生的故障主要就是网络连接性问题、配置文件问题、网络协议等问题。分析过程主要依据故障现象、收集到的信息、工程师的技术水平、故障排除经验等内容作出判断,确定出最有可能的假设。分析信息步骤可以按照以下步骤完成:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)确定和检查收集信息的完整性和准确性。(2)成立故障排除小组。(3)确定出适合本次网络故障的分析方法。(4)组织技术专家进行故障原因讨论。(5)罗列可能的故障原因。214、消除可能出现问题的原因根据罗列的可能故障原因,逐条进行排查,组织研讨会,进行头脑风暴的研讨,消除可能出现问题的原因。把引起网络故障的原因尽量缩小范围。消除可能出现问题的原因可以按照以下步骤完成:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)根据可能性对网络故障原因进行排序。(2)组织研讨会进行逐个原因讨论。(3)缩小可能引起的故障原因。(4)确定最有可能的故障原因。225、制定最有可能的原因假设在确定最有可能的故障原因后,根据实际情况,确定最有可能的原因假设,根据这个假设准备相关工作,包括设备备件、线路、工具、软件等,并作出故障解决方案,为解决问题做好准备。制定最有可能的原因可以按照以下步骤完成:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)确定最有可能的原因。(2)做好准备工作。(3)讨论方案。(4)协调业务要求,选择故障处理的最好时间。236、测试这个假设这个阶段是为最终解决问题做最后工作,如果有条件可以在备件环境中进行测试,这样可以减少因为测试失败造成更大的网络故障。如果没有测试环境,必须在真实环境中完成测试,那需要做好以下工作:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)审查测试方案。(2)确定测试的人员。(3)准备测试工具。(4)确定测试时间。(5)确定测试失败的回退方案。(6)对业务进行测试。(7)形成正确测试结果。247、解决问题作为网络故障排除的最后一个阶段,解决问题阶段主要完成故障的处理,把网络系统恢复到正常运行状态。这个阶段主要完成以下任务:二、网络故障的排除方法与诊断工具Chp2网络故障排除方法(1)依据测试结果,修正最终故障排除方案。(2)确定人员和时间。(3)准备解决问题的各项条件。(4)组织实施故障处理。(5)实施完成后进行业务测试。(6)更新维护文档。(7)故障案例总结。Chapter.3网络故障诊断工具Chp3网络故障诊断工具263.3.1、硬件工具硬件工具在处理物理故障时非常有效,特别是测试链路和连接电缆的连通性时必须采用硬件工具来完成,硬件工具主要有以下设备。二、网络故障的排除方法与诊断工具Chp3网络故障诊断工具1.网络测试仪网络测试仪通常也称专业网络测试仪或网络检测仪,是一种可以检测OSI模型定义的物理层、数据链路层、网络层运行状况的便携、可视的智能检测设备,主要适用于局域网故障检测、维护和综合布线施工中,网络测试仪的功能涵盖物理层、数据链路层和网络层。27二、网络故障的排除方法与诊断工具Chp3网络故障诊断工具网络测试仪的使用可以极大地降低网络管理员排查网络故障的时间,可以提供综合布线施工人员的工作效率,加速工程进度和工程质量。该类设备在国外应用已经很普遍,是网络检测和网络施工过程中必不可少的工具,相对于国外,国内的使用范围还很有限,以设备租用和人工替代为主,主要原因是国内用户对该类产品的认识度还不够,对网络故障的敏感度不高。网络测试仪厂商既有福禄克、安捷伦和理想等国外公司也有信而泰、中创信测、奈图尔等国内公司。网络测试仪按网络传输介质可以分为无线网络测试仪和有线网络测试仪两类:28二、网络故障的排除方法与诊断工具Chp3网络故障诊断工具(1)无线网络测试仪无线网络测试仪主要是针对无线路由和AP进行检测,可以排查出无线网络中连接的终端和无线信号强度,进而能有效地管理网络中的节点,增强网络安全。该类产品技术还不是很成熟,随着无线网络的推广,无线网络测试仪也会越来越受网络管理的重视,成为一种重要的检测工具。(2)有线网络测试仪有线网络中常见的传