服务器硬件故障处理方案目的为提高处理公司服务器故障的能力,形成科学、有效、反应迅速的应急工作机制,确保公司各系统的安全和高效,最大限度地减小服务器故障对生产的影响,保护公司利益,特制定本预案适用范围本预案适用于公司局域网中提供公共服务的服务器发生硬件故障。服务器硬件故障预防与排除故障预防准备相应的应急备用服务器。当服务器出现不可恢复的硬件故障时,马上启动备用服务器,从而减小服务器硬件故障风险。故障排除当服务器出现硬件故障,通过以下步骤排除:(1)确定故障原因。依次查看电源、硬盘、内存、主板、处理器等,如条件许可,可使用替换法检测各硬件。(2)恢复固件缺省配置。比如去除第三方厂商备件和非标配备件;清除CMOS,恢复资源初始配置。3、故障处理(1)硬盘故障处理:当硬盘出现黄灯提示预警时,应先查看硬盘数据是否丢失,如数据存在应先做好数据备份,将此服务器各应用迅速转移,然后排查报警具体原因,如由于错误操作或硬盘连接不好引起的报警,可尝试重启服务器,重新插拔硬盘等操作即可解决问题。如硬盘损坏,应及时将备用硬盘替换下故障硬盘,使服务器恢复正常工作。排查过程中,如不能正确判断问题原因,不能随便操作,可向IBM售后服务咨询处理。(2)内存故障:由于我们的服务器有多组内存,单条内存故障时,会对服务器性能稍有影响,当不会影响整体使用,所以如发现内存条损坏时,安排时间将损坏的内存条替换掉即可(3)RAID卡故障:服务器的RAID卡出现故障时,系统会无法识别出硬盘,服务器不能正常使用,所以应第一时间启动备用服务器。将故障服务器移出生产网络后更换RAID卡,RAID卡通过硬盘重新读取RAID配置信息后即可恢复使用!(4)电源故障:服务器都升级双电,这样在一个电源故障时,才有充足的时间将故障电源替换掉,从而减小电源故障对服务器的影响。(5)CPU故障:我们的服务器多为双CPU,所以在CPU故障时同内存一样,只会对服务器性能有所影响,不会影响整体使用,所以及时安排时间将有问题的CPU换掉即可。(6)网卡故障:启用本机备用网卡,顶替故障网卡。有关应急预案服务器硬件故障应急预案(1)核心服务器双机配置,配置好备用服务器,随时待命。(2)发生服务器硬件故障后,相关人员应及时查找、确定故障原因,进行先期处置。若故障服务器在短时间内无法修复,相关人员应启动备用服务器,保持局域网系统的正常运行;将故障服务器脱离网络,进行故障排除工作。