服务器巡检项目经理需要定期对硬件、软件及数据库环境进行检查常规检查项如下:1.服务器部分:服务器前面板有无故障灯闪烁,或者面板有无提示报警信息。服务器电源,查看电源模块指示灯是否长亮。服务器硬盘每个硬盘指示灯是否有报警灯闪烁。服务器主机序列号确认,再电话报修原厂商或者对口供货商技术支持人员。2.存储部分:存储系统指示灯是否有报警灯或者错误灯常亮。存储每个硬盘指示灯是否有报警或者损坏的颜色灯亮。存储序列号确认,再电话报修原厂商或者对口供货商技术支持人员。3.网络部分:网络交换机和光纤交换机指示灯是否有报警灯或者错误灯常亮。网络交换机和光纤交换机序列号确认,再电话报修原厂商或者对口供货商技术支持人员。IBM4008101818HP4006102058DELL40088451774008868616HDS4006786793ORACLE80081003654.操作系统部分:查看系统日志Windows系统:利用事件查询器导出系统日志,应用日志,注意日志数量,避免因日志容量限制仅存在日期不足的日志;发现错误日志,尤其连续错误为严重问题应进行排查解决。LINUX系统:查看cat/var/log/messages系统日志,有无报错信息。查看磁盘空间Windows下查看业务磁盘空间,与历史规律比较有无异常增加查看业务数据所使用的临时目录是否存在大量未处理的文件,如果存在应与排除。集群模式下,查看仲裁盘是否有业务数据占用,应禁止除操作系统之外任何业务数据使用。在软件更新过后或业务扩大使用范围后,应重新评估建立新的数据量使用规律,以指定下次检查时间。LINUX下查看业务磁盘空间查看命令df-h时间校准检查所有服务器时间应与标准时间差异在30秒以内。Windows查看右下角日期时间部分,如果有差异请调整。Linux查看命令date,如果有差异用date–shh:mm:ss更新时间对于oracleRAC的集群环境,请先关闭CRS和一个instance实例再同步系统时间,否则会导致节点重启。5.数据库部分:查看数据库alterlog;/u01/app/oracle/diag/rdbms/emr/emr1/trace/alter{sid}.log查看RAC集群的CRS状态:crs_stat-tNameTypeTargetStateHost------------------------------------------------------------ora.DATA.dgora....up.typeONLINEONLINErac1ora....ER.lsnrora....er.typeONLINEONLINErac1ora....N1.lsnrora....er.typeONLINEONLINErac2ora.OCR.dgora....up.typeONLINEONLINErac1ora.asmora.asm.typeONLINEONLINErac1ora.eh.dbora....se.typeONLINEONLINErac1ora.emr.dbora....se.typeONLINEONLINErac1ora....networkora....rk.typeONLINEONLINErac1ora....SM1.asmapplicationONLINEONLINErac1ora....C1.lsnrapplicationONLINEONLINErac1ora.rac1.vipora....t1.typeONLINEONLINErac1ora....SM2.asmapplicationONLINEONLINErac2ora....C2.lsnrapplicationONLINEONLINErac2ora.rac2.vipora....t1.typeONLINEONLINErac2ora.scan1.vipora....ip.typeONLINEONLINErac2查看表空间使用大小及自动增长SelectFILE_NAME,TABLESPACE_NAME,BYTES/1024/1024,USER_BYTES/1024/1024,AUTOEXTENSIBLEasAUTfromdba_data_files;查看数据库归档路径使用命令archiveloglist;然后再根据归档路径查看归档空间大小。删除5天前的归档日志rmantarget/Deletenopromptarchivelogallcompletedbefore'sysdate-5';查看DATAGuard使用命令查看归档间隙Select*fromv$archive_gap;使用命令查看归档日志应用恢复状态SELECTSEQUENCE#,APPLIED,FIRST_TIME,NEXT_TIMEFROMV$ARCHIVED_LOGORDERBySEQUENCE#;查看归档日志归档路径Archiveloglist;查看归档文件夹大小df–h删除已经应用恢复的归档日志Rmantarget/deletenopromptarchivelogallcompletedbefore'sysdate’;或使用系统命令直接删除归档日志文件rm–rfxxx.dbf