1双机检验关于本章必须保证双机系统的启动、切换和停止都正常。8.1检查双机启动8.2检查双机切换8.3检查双机停止1.1检查双机启动检查双机状态1.在两个节点上执行如下命令,启动双机。#hastart2.执行如下命令,检查双机资源、资源组状态。#hastatus如果smcsrv1和smcsrv2的状态都为running,smccluster资源组的所有资源在其中一台主机为online,在另外一台主机为offline,表示双机正常。显示信息如下所示。查看资源的状态可以使用hares-state。attemptingtoconnect....connectedgroupresourcesystemmessage---------------------------------------------------------------------------smcsrv1RUNNINGsmcsrv2RUNNINGsmcclustersmcsrv1ONLINEsmcclustersmcsrv2OFFLINE-------------------------------------------------------------------------RawRessmcsrv1ONLINERawRessmcsrv2OFFLINESmcAppsmcsrv1ONLINESmcAppsmcsrv2OFFLINESmcVGsmcsrv1ONLINE-------------------------------------------------------------------------SmcVGsmcsrv2OFFLINEserviceipsmcsrv1ONLINEserviceipsmcsrv2OFFLINEmountlv_billsmcsrv1ONLINEmountlv_billsmcsrv2OFFLINE-------------------------------------------------------------------------SmcNicsmcsrv1ONLINESmcNicsmcsrv2ONLINELSNR_ora11_lsnrsmcsrv1ONLINELSNR_ora11_lsnrsmcsrv2OFFLINEORA_SRVsmcsrv1ONLINE-------------------------------------------------------------------------ORA_SRVsmcsrv2OFFLINE如果有资源的状态为STALE_ADMIN_WAIT,请执行如下命令,手工拉起资源。#hasys–forcesmcsrv13.执行如下命令查看双机状态:#hastatus-sum--SYSTEMSTATE--SystemStateFrozenAsmcsrv1RUNNING0Asmcsrv2RUNNING0--GROUPSTATE--GroupSystemProbedAutoDisabledStateBsmcclustersmcsrv1YNONLINEBsmcclustersmcsrv2YNOFFLINE显示信息中状态为“ONLINE”的为主用。检查浮动IP地址在主备机上分别执行ifconfig-a。在当前的主机上有bond0:0,IP地址为浮动IP地址,如下所示。bond0:0Linkencap:EthernetHWaddr00:18:82:55:93:4Ainetaddr:10.71.101.60Bcast:10.71.101.255Mask:255.255.255.0UPBROADCASTRUNNINGMASTERMULTICASTMTU:1500Metric:1检查SMC进程1.以smc用户登录主备机,执行p命令,分别检查SMC的进程。如果SMC启动成功,则显示信息如下所示。ProcessListOfShortMessageCenter----------------------------------------------------USERPIDPPIDCOMMANDsmc80651clustermngsmc80828065smcappsmc80888065dbdaemonsmc80768065billcreatersmc80708065backupdaemonsmc81068065filemirrorsmc81008065mapserversmc80948065mtiserversmc80958065l2cachedaemonsmc80968065fccCount102.在主备机上执行smcdbg命令,检查SMC各进程的状态。正常情况下,在当前主机上,clustermng监控的所有进程的状态应该为Master,在当前备机上,clustermng监控的所有进程为Slave状态。以下是在主机上的显示结果。Linuxsmcsrv22.6.16.46-0.12-smp#1SMPThuMay1714:00:09UTC2007x86_64===Copyright(C)1988-2009,HuaweiTech.Co.,Ltd.===SMSCCenterSmcdbgVersion:infoXSMSV300R002.1De[Page1/3]?°?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?′?|CommonOptionsPage?|?|?|?|TraceStatInfoResetMaster?|?|FlagFlagDispStatSlave?|?|SmcApp[][][][clr][Master]?|?|DBDaemon[][][][clr][Master]?|?|BackupDaemon[][][][clr][Master]?|?|BillCreater[][][][clr][Master]?|?|ClusterMng[][][][clr][Master]?|?|FileMirror[][][][clr][Master]?|?|MapServer[][][][clr][Master]?|?|MTIServer[][][][clr][Master]?|?|L2CacheDaemon[][][][clr][Master]?|?|AlertDaemon[][][][clr][Slave]?|?|Fcc[][][][clr][Master]?|?|MTServer[][][][clr][Slave]?|?|CMapServer[][][][clr][Slave]?|?|CCM[][][][clr][Slave]?|???¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤?¤??DCSProxy[][][][clr][Slave]检查数据库状态以oracle用户登录主备机,执行如下操作,连接数据库。oracle@smcsrv1:~sqlplus/nologSQLconnsystem/oracle在当前主机上的显示结果如下所示。Connected.在当前备机上的显示结果如下所示。ERROR:ORA-01034:ORACLEnotavailableORA-27101:sharedmemoryrealmdoesnotexistLinux-x86_64Error:2:NosuchfileordirectoryProcessID:0SessionID:0Serialnumber:0在当前主机上执行如下命令,验证tnsname配置是否生效。SQLquitoracle@smcsrv1:~tnspingorasmc执行成功后,显示信息如下所示。TNSPingUtilityforLinux:Version11.1.0.7.0-Productionon26-MAR-200908:44:39Copyright(c)1997,2008,Oracle.Allrightsreserved.Usedparameterfiles:/home/oracle/product/11g/db/network/admin/sqlnet.oraUsedTNSNAMESadaptertoresolvethealiasAttemptingtocontact(DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=10.71.101.60)(PORT=1521)))(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=orasmc)))OK(0msec)检查文件系统状态在主备机上执行如下命令,检查文件系统。#df在当前主机上可以看到如下文件系统,在备机上则不会显示如下文件系统。/dev/mapper/appvg-lv_bill60426324131488572252961%/home/smc/billdata1.2检查双机切换操作步骤步骤1手工切换双机。在主机或者备机上执行如下命令,切换双机。#hagrp-switchsmccluster-tosmcsrv2其中,“smccluster”是在main.cf文件中配置的群组名。“smcsrv2”是希望切换到的节点名。请以实际配置的名称为准。切换完成后,请参见8.1检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。双机切换后的结果如下。切换前的主机变成当前的备机,切换前的备机变成当前的主机。在主备机上均可查看到SMC的“clustermng.ini”中配置的进程。在当前主机上,所有监控进程的状态都为Master,在当前备机上,所有监控进程的状态都为Slave。在当前主机上能够连接数据库,但是在当前备机上不能连接数据库。在当前主机上执行df命令,能够查询到“/home/smc/billdata”和“/home/smc/mnt”文件系统。步骤2检查网卡故障时的双机切换。1.在当前主机上执行如下命令,检查绑定网卡当前的状态。#cat/proc/net/bonding/bond0显示信息如下所示。EthernetChannelBondingDriver:v2.6.0(January14,2004)BondingMode:fault-tolerance(active-backup)PrimarySlave:NoneCurrentlyActiveSlave:eth1MIIStatus:upMIIPollingInterval(ms):200UpDelay(ms):0DownDelay(ms):0SlaveInterface:eth1MIIStatus:upLinkFailureCount:0PermanentHWaddr:00:18:82:55:93:4aSlaveInterface:eth2MIIStatus:upLinkFailureCount:0PermanentHWaddr:00:18:82:55:93:4b从以上信息可以看出bond0是由eth1和eth2绑定而成的,当前在eth1上为激活状态。2.拔掉当前上层主用交换机到当前交换网板的网线,观察单板网络是否中断。在正常情况下,不会发生双机切换,网络不会中断。3.检查双机资源组和资源的状态。#hastatus双机资源不发生任何切换。4.测试后,再把断开的网线连接好。步骤3检查浮动IP地址故障时的双机切换。在当前主机上执行如下命令,检查浮动IP地址切换。#ifconfigbond0:0down在正常情况下,禁用浮动IP地址时会发生双机切换。切换完成后,请参见8.1检查双机启动,检查双机状态、SMC进程、数据库状态和文件系统状态。步骤4检查应用故障时的双机切换。在当前主机上执行kill-9C