上海天玑科技股份有限公司工程师手册PCServer平台技术中心符满仓2009‐10‐15版本:1.0上海天玑科技股份有限公司第2页共22页文档信息文档名称:工程师工作手册-PC平台文档所属部门:上海天玑科技股份有限公司维保服务部当前版本:1.0发布日期:2009/10/15文件级别:普通秘密机密绝密文档起草人:符满仓起草日期:2009/10/12文档负责人:符满仓责任人接管日期:2009/10/12复审人:复审日期:分发名单来自From日期电话/传真给To行动*截止日期电话/传真各地PC工程师阅读版本记录版本编号版本日期修改者说明Version1.02009/10/12符满仓PCServer平台工作手册文档摘要本文档为PC平台工程师手册,包括“常见故障及处理流程”、“PC平台信息收取方法”。上海天玑科技股份有限公司第3页共22页目录PCServer平台....................................................................................................................................1第一章常见故障建议处理流程.................................................................................................51.DISK故障的判断及处理.............................................................................................52.IOcard故障的判断及处理........................................................................................82.1NIC常见故障定位及故障处理...................................................................................82.2SCSI卡常见故障定位及故障处理............................................................................92.3RAID卡常见故障定位及故障处理.........................................................................103.CPU、VRM、MotherBord故障的判断及处理....................................................113.1CPU故障的判断及处理............................................................................................113.2VRM故障的判断及处理..........................................................................................123.3MotherBord故障的判断及处理................................................................................134.FAN故障的判断及处理...........................................................................................145.Memory故障的判断及处理....................................................................................156.Power故障的判断及处理........................................................................................167、HPProLiant系列服务器-使用SmartStart光盘配置阵列卡过程...............178、HPProLiant服务器-在不破坏原有系统的情况下配置RAID........................239、DELL常见机箱LCD显示屏显示代码对应信息详解..............................................3110、IBMDiagnosticpanelLEDs.................................................................................3211、IBMServerGuide引导安装指南..........................................................................35第二章PC平台备件信息获取方法.........................................................................................441、包含字段.......................................................................................................................442、字段说明.......................................................................................................................443、信息收集方法...............................................................................................................44附录1:常用网站......................................................................................................................45上海天玑科技股份有限公司第4页共22页产权说明本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属上海天玑科技有限责任公司所有,受到有关产权及版权法保护。任何个人、机构未经上海天玑科技有限责任公司的书面授权许可,不得复制或引用本文件的任何片断,无论是通过电子形式或非电子形式。文档目的本文档的主要目的是指导工程师的日常工作,使其工作有规可循。上海天玑科技股份有限公司第5页共22页第一章常见故障建议处理流程1.DISK故障的判断及处理故障编号PC0001主机类型■HP□IBM□DELL□其他故障名称PC主机硬盘故障故障级别■一般故障□严重故障□重大故障故障描述活动LED指示灯(1)联机LED指示灯(2)故障LED指示灯(3)条件灭灭灭存在以下一种或多种情况:1、驱动器未配置为阵列的一部分;2、驱动器已配置为阵列的一部分,但它是当前未被访问或重建的更换驱动器;3、驱动器已配置为联机备用驱动器;如果驱动器连接到阵列控制器,则可以联机更换驱动器。灭灭琥珀色由于硬盘驱动器故障或子系统通信故障,驱动器已置为脱机状态。需要更换驱动器。亮、灭或闪烁亮灭驱动器处于联机状态且以配置为阵列的一部分。如果阵列的配置已考虑容错,阵列中其它所有驱动器都处于联机状态,并且接收到故障前兆警报或正在升级驱动器容量,则可以联机更换驱动器。亮或闪烁闪烁灭禁止卸下驱动器。驱动器正在重建或正在扩展容量。亮灭灭禁止卸下驱动器。该驱动器正被访问,但(1)它尚未配置为阵列的一部分;(2)它是更换的驱动器且尚未开始重建;(3)它在POST期间旋转加速亮、灭或闪烁亮或灭闪烁已接收到该驱动器的故障前兆警报。请尽快更换驱动器闪烁闪烁闪烁禁止卸下驱动器。存在以下一种或多种情况:1、该驱动器属于阵列配置实用程序正在选择的阵列;2、已选定HPSIM中的驱动器标识;3、正在更新驱动器固件。上海天玑科技股份有限公司第6页共22页故障编号PC0002主机类型□HP■IBM□DELL□其他故障名称PC主机硬盘故障故障级别■一般故障□严重故障□重大故障故障描述:LED指示灯名称含义HarddiskdriveactivityLED:WhenthisLEDisflashing,itindicatesthattheassociatedharddiskdriveisinuse.HarddiskdrivestatusLED:WhenthisLEDislitcontinuouslyitindicatesthattheassociatedharddiskdrivehasfailed.TheinterpretationofaflashingstatusLEDdependsontheSCSIcontrollerthatisconnectedtothehot-swapdrive,asfollows:WhenthedriveisconnectedtotheintegratedSCSIcontrollerwithRAIDcapabilities,aflashingstatusLEDindicatesthatthedriveisasecondarydriveinamirroredpairandthedriveisbeingsynchronized.WhenthedriveisconnectedtoanoptionalServeRAID™controller,aslowlyflashing(oneflashpersecond)statusLEDindicatesthatthedriveisbeingrebuilt.WhentheLEDisflashingrapidly(threeflashespersecond),itindicatesthatthecontrollerisidentifyingthedrive.上海天玑科技股份有限公司第7页共22页故障编号PC0003主机类型□HP□IBM■DELL□其他故障名称PC主机硬盘故障故障级别■一般故障□严重故障□重大故障故障描述活动LED指示灯状态指示灯条件灭灭主机未加电,或者主机未能识别硬盘灭亮色绿主机未进行数据对些亮且闪烁亮绿色主机进行数据读写或者和其他RAID组成员进行数据同步亮或闪烁亮琥珀色RAID组成员故障或者掉线灭亮琥珀色硬盘故障故障处理方法询问、观察并初步分析故障情况,尤其是数据安全相关情况。强烈建议用户对数据进行备份。确认数据无安全隐患后再进行操作,否则需要进行风险分析,按相关流程进行处理。通过RAID卡管理界面或者存储管理软件等对硬盘的状态以及RAID的配置情况进行分析。确认无异常情况后,进行硬盘更换,若有两块硬盘先后掉线,需按单块以及掉线顺序进行更换或者强制Online。根据指示灯以及系统相关情况确认故障恢复情况。恢复系统并协助用户恢复业务。和用户沟通故障情况以及大致处理过程,提出相应建议。填写现场服务报告,关闭CALL编写人员符满仓编写日期2009年10月12日上海天玑科技股份有限公司第8页共22页2.IOcard故障的判断及处理2.1NIC常见故障定位及故障处理故障编号PC0004主机类型■