AIX故障诊断及处理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司张冬宁高级工程师北京嘉运达科技开发有限公司北京市海淀区知春路111号理想大厦608室AIX操作系统使用培训第二十一章故障诊断及处理北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司首先我们要对系统现状非常了解,定期或实时检查系统的状态其次如果有错误或故障产生,应该尽快的确定问题性质,收集错误信息,找出问题原因,提出可行的解决方案然后排除错误或故障如果遇到机器硬件和软件兼容问题,应考虑升级微码或操作系统补丁21.1故障诊断概述北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1.1预防错误或故障的发生下面列出一些简单方法给系统做常规检查,可以避免系统出现真正的问题1.使用errpt命令检查错误日志,用errpt–a命令检查任何可疑的详细的错误日志记录2.使用df–k命令检查磁盘空间,避免因为文件系统空间被占满导致的系统崩溃3.使用lsvg检查卷组中是否存在未同步的分区,使用syncvg命令来同步它们北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1.1预防错误或故障的发生4.使用lsps–a命令检查系统的页面空间,保障系统拥有足够的页面空间5.用lssrc–a命令检查所有要求的子系统是否正常运行6.通过ping命令检查网络是否通畅北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司AIX系统中有一个错误日志子系统,它把所有的硬件和软件故障记录在错误日志当中查看错误日志#errpt可以查看错误日志#errpt–a可以查看详细错误日志21.1错误日志北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1错误日志错误日志的输出结果如下:北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1错误日志•IDENTIFIER标识符每条错误日志代号•TIMESTAMP错误日志的时间戳,格式为:月、日、小时、分钟、年•TYPE指错误记录的严重程度分为:PEND一个设备或组件的可用性将丢失PERF设备或组件的性能已经下降到一个可接受的水平之下TEMP表示在许多次失败尝试后,错误被修复北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1错误日志UNKN表示不能确定这种错误的严重程度INFO表示记录只是一般消息,不是错误的结果•CLASS指出一般的错误源H表示硬件设备故障或介质错误S表示软件故障O指一个操作者的通知性错误U表示不能确定错误源北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1错误日志•RESOURCE_NAME检测到错误的资源名•DESCRIPTION对记录的错误日志进行简单的描述北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.1错误日志错误日志的输出:#errpt-/tmp/errpt.txt可以将错误日志输出为一个文本文件#errpt–a-/tmp/errpta.txt可以将详细错误日志输出为文本文件#errclear0可以将错误日志清空北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2执行诊断程序当系统中发现了一个问题或故障时,需要先对这个故障或问题进行分析,判断它是关于哪方面,然后再对有故障或问题的部件进行诊断程序,找出原因或提出一个解决方案北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.1诊断技巧要获得很多在线诊断和独立诊断之外的信息,应清楚下面几点:1.错误日志分析是诊断工作的主要部分2.独立诊断不执行错误日志分析,除了在引导独立诊断模式时发生的加电自检错误3.只有在“diagnosticmodeselection”画面中选择“problemdeterminationselection”或者在“taskselectionlist”中选择了“runerrorloganalysis”才将执行错误日志分析北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.1诊断技巧4.当用户无法运行在线诊断时,才去使用独立诊断5.作为错误日志分析的结果,更换了部件,必须作日志纠正操作来防止再次报告这个错误6.有些机器支持快速模式和慢速模式7.系统主板诊断不仅仅测试系统主板功能,而且还测试和检查其他主要的系统组件,如供电系统和风扇等北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.2诊断硬件设备的方法诊断硬件设备有3种方法:1.并发模式:系统正常运行,且有用户使用的时候运行诊断程序2.维护模式:维护模式下机器仍运行AIX系统,但是只启动了最小数量的进程,而且只有rootvg被激活3.从CDROM、磁带或软盘启动的独立诊断模式,此种诊断模式不依赖于机器上的操作系统北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.3在并发模式下诊断硬件设备并发模式诊断有3种方法:1.对某一个具体设备进行诊断,使用如下命令#diag–d[resource_name]2.运行diag命令进入诊断程序主菜单3.使用smit,选择“problemdeterminiation”-HardwareDiagnostics-Currentshell北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.3在并发模式下诊断硬件设备使用第2、3种方式进入diag主菜单:北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.3在并发模式下诊断硬件设备主菜单有4各菜单项:1.诊断程序2.高级诊断程序3.任务选择4.资源选择北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司21.2.3在并发模式下诊断硬件设备当用户选择“diagnosticroutines”或“advanceddiagnosticroutines”时会进入“diagnosticmodeselection”菜单这里有两个选项:1.问题检测:针对某个错误进行硬件设备检测2.系统检测:使用这个选项来检测系统的现状北京嘉运达科技开发有限公司北京嘉运达科技开发有限公司谢谢大家!

1 / 19
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功