X3850X5服务器无法开机故障处理-微码升级

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

编号密级IBMX3850X5服务器无法开机故障处理步骤V1.0一、设备概况客户名称机房位置设备型号IBMX3850X5设备序列号操作系统微码版本应用软件硬件配置二、问题描述接到客户报修,一台IBMX3850X5服务器宕机后无法开机,诊断面板上BRD指示灯亮起,立即赶往现场处理。经过现场确认,设备电源可以正常加电,但按下开机按钮后无法启动,液晶面板在01、FR间循环显示,断电重新加电现象相同。通过用客户管理电脑连接IMM管理端口查看日志,有如下报错信息:1.I----7/6/2016:6:24:35--N--0x4000000e00000000--RemoteLoginSuccessful.LoginID:USERIDfromWebatIPaddress192.168.70.12.E----7/2/2016:2:6:35--C--0x800706081410ffff--SensorI/OBoardVRDhastransitionedtonon-recoverable3.I----7/2/2016:2:6:29--N--0x806f00091381ffff--HostPowerhasbeenturnedoff4.E----7/2/2016:2:6:26--C--0x80070608140bffff--SensorCPU2VRDhastransitionedtonon-recoverable三、处理步骤通过设备维护手册查询,报错内容“SensorCPU2VRDhastransitionedtonon-recoverable”为CPU板故障,报错内容“SensorI/OBoardVRDhastransitionedtonon-recoverable”为PCI板故障。这两个故障都可能导致目前无法开机的现象,从时间点看CPU板首先故障,所以CPU板故障可能性最大并准备备件准备更换,同时准备PCI板现场备用。CPU板更换步骤如下:1.现场准备好新的备件。2.关闭服务器和外围设备,并根据需要断开电源线和所有外部电缆连接,以更换设备。3.卸下顶盖。4.卸下顶盖支架)。5.卸下电源。6.从微处理器板组合件卸下I/O板滑盖。7.卸下内存卡。8.卸下ServeRAID适配器。9.卸下中间风扇。10.卸下内存卡仓。11.卸下微处理器。12.断开以下电缆连接:前部风扇、可扩展指示灯、操作员信息面板和CD/DVD电源。13.拧松服务器后部的指旋螺钉。14.将组合件轻轻向服务器前部滑动;然后使用左侧的微处理器板手柄,从一定角度取出组合件。15.更换成新的CPU板,按相反步骤进行安装后加电开机测试。更换新CPU板后主机可以正常开机,但在启动过程中会有如下报错并无法进入操作系统:thereareofflineormissingvirtualdriveswithpreservedcache.pleasecheckthecablesandensurethatalldrivesarepresent.Pressanykeytocontinueor'C'loadtheconfigurationutility.按照提示进行RAID卡管理界面,有如下内容提示:以上提示内容原因为RAID卡cache中有脏数据未能正常写入磁盘,选择Discardcache选项丢弃,然后退出管理界面,设备正常进入操作系统。自此设备硬件故障已经修复,但查看诊断面板仍然有Log报错灯亮起,通过登陆IMM管理台查看,有如下报错信息:报错为FPGA微码版本不匹配,通过看到VPD信息发现FPGA微码版本高于IMM和UEFI微码版本,于是与客户沟通将所有微码升级到最新版本。升级前先进入主机BIOS,将systemlogevents清除,升级过程如下:1、到官网下载最新的微码版本;a)IMM:ibm_fw_imm_yuooh2b-1.51_linux_32-64b)FPGA:ibm_fw_fpga_g0ud92b-5.02_linux_32-64c)UEFI:ibm_fw_uefi_g0e185a-1.85_linux_32-642、重启服务器,按F1到UEFI界面下;3、打开浏览器连接IMM管理台,默认IP地址:192.168.70.125,用户名/密码:USERID/PASSW0RD(0为数量0);4、首先升级IMM模块微码,点击FirmwareUpdate菜单中的浏览,选择下载好的IMM微码包,点击update进行升级,升级过程大概10-15分钟,升级完成后点击RestartIMM菜单重启IMM模块,整体升级过程中千万不要重启服务器;5、重新连接IMM后,按照以上方法分别顺序升级FGPA和UEFI微码;6、都升级完成后,关闭服务器电源并拔掉电源线;7、等待5-10分钟,连接电源线并启动到BIOS界面,查看VitalProductData(VPD)中微码版本是否更新(在IMM也可以查看),同时检查CPU、内存状态是否都正常;8、确认状态都正常后,退出BIOS并进行操作系统,同时LOG报警灯亮的问题也已解决,故障处理完成。四、经验总结对于服务器无法开机的问题,首先判断电源是否正常,同时结合服务器诊断面板和IMM管理台,综合判断可以快速定位故障。

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功