SUN小型机日常巡检表格(NSQF)version1.0巡检项目巡检操作参考标准结果信息SUN小型机连接系统网络情况在同网段其他机器或ZONE上PING命令观察5MIN,是否有丢包情况,并记录对SUN小机的telnet情况在其它机器上telnet到主机上观察能否正常连接到主机操作系统版本执行命令uname–a检查操作系统版本文件系统大小执行df–k没有文件系统超过85%文件系统logging功能more/etc/vfstab检查文件系统mount选项是否有logging参数检查近期系统的coredump文件cd/var/crash/hostnamels–l没有近期的coredump文件存在。系统日志检查以root用户用more查看/var/adm/message*及/var/log/syslog*日志中无warning,error,fail,panic等异常提示,没有系统进程重起的提示。磁盘管理软件检查检查项目检查操作参考标准结果信息检查磁盘状态执行format命令没有磁盘的状态为typeunknownorformating检查本地SDS镜像两边是否OKmetastat所有submirror都处于Okay状态,无Maintenance状态Vxvm中所有磁盘状态执行xdisklist所有使用的硬盘状态为onlineVxvm中内置磁盘逻辑卷状态的检测执行vxprint-th-grootdg所有pl和v状态都为Active和enable和RW状态Vxvm中外置磁盘逻辑卷状态的检测执行vxdglist,逐个dg执行vxprint-th所有pl和v状态都为Active和enable和RW状态HA状态检测检查项目检查操作参考标准结果信息Cluster3.2的状态检查执行命令hastat所有节点都在cluster中,所有的私网都为up所有的dateservices都为onDataservices状态检查执行命令hareg所有dataservices都为onHaorcle状态检查haoraclelist双机切换等待时间在主机上执行LogicalHostTimeoutscconfscname–pValue:Step10:1200Step11:1200LogicalHost:600Cluster3.2中网卡状态检查hastat|more1、公网状态应为:Status=OK2、私网状态为interconnect不为Down即可Cluster3.2的状态检查执行命令scstat所有节点都在cluster中所有的私网都为up所有resouregroup及resoure都为online状态主机硬件检测检查操作参考标准结果信息在主机上检查整个系统状态/usr/platform/sun4u/sbin/prtdiag–v检查系统中CPU风扇电源温度等各个方面状态并提示NofailuresfoundinSystem检查Netra系列风扇电源状态(根据现场情况)lominfofan;lominfopsulominfoevents系统中所有风扇电源状态正常,无异常故障。系统性能检测检查项目检查操作参考标准结果信息磁盘IO繁忙度检查以root用户执行:sar-d530sar520输出结果中avque列的值应是0.0,或瞬时大于10.0,不应长时间大于10.0空闲内存检查以root用户执行:top空闲内存应大于50M进程数检查1、以root用户执行:top,查看第二行process参数;2、ps-elf查看第二列中有无Z的进程1.系统总进程数应小于200个,2.无僵死(zombie)进程内存交换区使用检查以root用户执行:swap-l内存交换区的使用率应小于90%CPU资源检查以root用户执行:topCPU的平均空闲率不应低于25%,单个进程CPU占用率不应超过8%,若有则记录进程名并记录该进程占用CPU超过8%的时间。检查系统在无应用情况下I/O状况#mkfile2000mtestfile记录结果采用vmstat来检查内存使用情况#vmstat520记录结果采用netstat来检查网络状况#netstat-i#netstat-a#netstat–r记录结果巡检结论项目经理意见甲方代表意见巡检人:______________厂方确认______________日期:______________日期:____________