Vmware故障处理1、为主机应用HostProfiles提示compliance错误故障状态:为主机应用HostProfiles失败,提示如下错误:01.Specificationstateabsentfromhost:device'datastore'stateneedstobesetto'on'02.Hoststatedoesn'tmatchspecification:device'datastore'needstobereset03.Specificationstateabsentfromhost:device'datastore'PathSelectionPolicyneedstobesetto'VMW_PSP_FIXED'04.Hoststatedoesn'tmatchspecification:device'datastore'PathSelectionPolicyneedstobesettodefaultforclaimingSATP故障分析:这是由于PSA组件导致的;解决方案:1、右击HostProfiles后点击Enable/DisableProfiles配置选项;2、展开“StorageConfiguration”选项,展开“PluggableStorageArchitecture”这个uxanxiang;3、去掉“PSADeviceConfiguration”;4、展开“NativeMuti-Pathing(NMP)”这个选项后,接着展开“PSPandSATPconfigurationforNMPdevi”选项;5、去掉“PSPconfigurationfor”这个选项后点击OK即可。2、分析、解决IOPS导致的虚拟机/存储性能下降和虚拟机磁盘延时较大的问题故障状态:1、虚拟机性能较低;2、在执行备份时磁盘延时很厉害;3、虚拟磁盘vmdk延时较大;故障分析:这种问题基本都是由于虚拟机没有足够的IOPerSecond(IOPS),或者IOPS低于30;解决方案:在解决问题前,首先要解决以下两个问题:问题1:什么是IOPS?IOPS全称为Input/OutputPerSecond,它是衡量一个磁盘(虚拟磁盘和物理磁盘)、存储的基本也是十分重要的标准。不同的磁盘、存储有着不同的IOPS。IOPS的高低直接会影响着系统的性能。当前,VMware虚拟化环境中最大的瓶颈也就在于这个IOPS。针对数据密集型业务的数据库业务和流媒体业务,由于它们的IOPS很大,所以在虚拟化环境中部署它们一定要充分考量它们的负载,也就是IOPS大小,结合实际的存储性能来查看是否符合业务标准。问题2:如何计算IOPS?如何计算每台虚拟机的IOPS?要想计算每个虚拟机的总的IOPS数量,首先就要确认磁盘类型以及它们的IOPS是多少。处于RAID阵列里面的每个盘的IO有利于增长整体存储的可用IOPS。而位于这个存储上面的单台虚拟机的IOPS,则可以通过将这个存储的总IOPS除掉虚拟机数量即可基本得到单台虚拟机的IOPS。现实案例:假定有6颗10000RPM的磁盘,那么它们的总的可用IOPS大约为150x6=900。如果LUN上面运行的虚拟机数量为50个,则单台虚拟机的IOPS为900/50=18IOPS。如果以这个为标准,则意味着虚拟机的性能相对底下。如果想要满足虚拟机的基本IOPS需求,那么应该为900/30=30,也就是说同一个Volume里IOPS为30(最低要求)虚拟机需要数量控制在30台以下。备注:备份存储会消耗更多的IOPS,同时也会给Volume带来更多额外的符合。如果是这样,则需要用额外手段解决备份时的额外资源消耗(可以通过I/Ometer软件来测试IOPS)3、丢失或锁定文档导致虚拟机无法PowerOn故障状态:1、虚拟机无法开启;2、尝试开启虚拟机时,看到类似如下错误信息:•UnabletoopenSwapFile;•Unabletoaccessafilesinceitislocked;•UnabletoaccessVirtualmachineconfiguration;3、在/var/log/vmkernel文件里可以看到类似如下信息:WARNING:World:VMxxxx:xxx:FailedtoopenswapfilepathockwasnotfreeWARNING:World:VMxxxx:xxx:Failedtoinitializeswapfilepath4、当尝试开启虚拟机的console控制台时,可能会收到如下错误信息:Errorconnectingtopathvirtualmachine.vmxbecausetheVMXisnotstarted5、在开启虚拟机时,卡在95%位置无响应;6、从模板部署一台新的VM之后无法开启虚拟机;7、虚拟机在vCenterServer和ESXi/ESX主机之间报告控制台电源状态冲突;故障分析:导致这个问题的因素可能很多,但是众多问题中,都穿插或包含着文件损坏或文件被锁定等问题的可能。虚拟机常用的文件包括:•*.vswp•*-flat.vmdk•*-delta.vmdk•*.vmx•*.log解决方案:首先需要确认哪些文件处于锁定状态:1、利用vSphereClient登录ESXi/ESX主机、vCenterServer主机;2、在Datastore里找到想要开启但是无法开启的虚拟机所在位置;3、尝试开启虚拟机,如果无法开启且console显示错误,先查阅vmware.log日志文件的相关信息来确认问题;4、利用SSH或COS选用root权限登录到ESXi/ESX主机之后执行下面的命令查看虚拟机的完整路径:#vmware-cmd-l系统将输出类似如下信息来显示注册到ESXi/ESX主机的虚拟机:/vmfs/volumes/UUID/虚拟机目录/虚拟机名.vmx5、执行下列命令切入到这个虚拟机所在的目录:#cd/vmfs/voluems/UUID/虚拟机目录6、然后查阅vmware.log日志,在文件的尾部查看什么原因导致这个问题后再针对性的分析。准确定位并删除掉锁定文件由于虚拟机可以在主机之间移动,如果虚拟机注册到的主机保持对文件的锁定状态,那么,这个锁定文件可以有效保障ESXi/ESX主机对虚拟机文件的控制权和有效保护虚拟系统。主机由ServiceConsole接口的MAC来确定。lock由VMkernel或ServiceConsole负责维护;备注:ESXi服务器没有ServiceConsole所以,lock由VMkernel单独负责维护;首先要确定VMkernel可能锁定的文件:1、执行下面的命令来报告锁定目录所在的MAC地址:#vmkfstools-D/vmfs/volumes/UUID/虚拟机目录/锁定状态文件2、由于负责锁定.vmdk文件的主机会将MAC地址写入到vmkernel日志里面,那么可以用下面的命令查阅:#tail/var/log/vmkernel4、StoragevMotion失败:lookingforlinesstaringwithCBTMotion故障状态:1、执行StoragevMotion失败;2、系统提示如下错误信息:01.Ageneralsystemerroroccurred:StorageVMotionfailedtocopyoneormoreoftheVM'sdisks.PleaseconsulttheVM'slogformoredetails,lookingforlinesstartingwithCBTMotion-.复制代码3、/var/log/vmware/hostd.log文件里有类似如下信息:01.Failedwitherror340983807:StorageVMotionfailedtocopyoneormoreoftheVM'sdisks.PleaseconsulttheVM'slogformoredetails,lookingforlinesstartingwithCBTMotion.复制代码故障分析可能由于虚拟机的硬件版本号过老导致;解决方案:关掉虚拟机后右击uxniji选择UpgradeVirtualMachineHardware即可。5、添加LUN时提示HostDatastoreSystem.QueryVmfsDatastoreCreateOptions故障状态:系统能够扫描到DevicesLUN,但是在添加过程中却提示如下错误信息:HostDatastoreSystem.QueryVmfsDatastoreCreateOptions,如图所示:故障分析:这样的问题一般都是由于LUN的尺寸过大导致,一般来说,VMwareESXi/ESXServer标准支持最大的LUN尺寸为2TB-512Byte,但是由于国内很多技术人员对这个-512Byte并不太在意,所以习惯型的讲成2TB,这就导致很多用户在使用时,直接分配了2TB的空间,这就可能导致了上述问题;解决方案:针对这样的问题,建议如下:1、如果已经分好了2TB的LUN,建议调整为1.88TB左右后再尝试添加;2、新LUN规划用户则请严格参照官方文档的参数设计,建议是1.88TB左右为一个LUN生成Datastore6、vCenterConverter推送Agent出错:ConverterAgentinstaller/uninstallerFailed故障状态:1、利用vCenterConverter推送Agent到WindowsServer2003服务器上时,失败;2、系统提示类是如下错误信息:01.ConverterAgentinstaller/uninstallerfailedon'xxxxxxxxx'.3、VMwarevCenterConverter的日志文件converter-server.log里面有类似如下错误提示:01.[#6][2011-01-2110:50:55.97604080info'App'][agentManager,83][AgentManager]InstallAgenton192.168.10.1002.[#6][2011-01-2110:51:16.97604080error'App'][agentManager,95][AgentManager]InstallAgentfailed:converter.fault.AgentDeploymentFault03.[#7][2011-01-2111:18:37.28903976info'App']ReusingexistingVIMconnectionto192.168.30.15004.[#7][2011-01-2111:18:37.47603976error'App']FounddanglingSSLerror:[0]error:00000001:lib(0):func(0):reason(1)05.[#7][2011-01-2111:19:00.94502756info'App'][agentManager,83][AgentManager]InstallAgenton192.168.10.1006.[#7][2011-01-2111:19:21.96102756error'App'][agentManager,95][AgentManager]InstallAgentfailed:converter.fault.AgentDeploymentFault7.[#7][2011-01-2111:19:32.44503976info'App'][diagnosticManager,357]GeneratingConverter.Serverlogbundle.故障分析:以下几种情况可能导致这样的问题:1、445端口没能打开;2、曾经手动安装过Agent后卸载;3、Windows服务管理其中的serv