华为技术有限公司研发经验案例内部公开2020-01-03版权所有注意保密第1页共3页将一台服务器动态加入VCScluster的方法作者:池冰最小部门:网络资源开发部所属产品:UAP/URP/VRS/MRS文件服务器来源:开发关键词:VCS、cluster1、现象、问题描述在实验室测试过程中,现网某些局点都曾出现过Linux文件服务器双机中,有机器异常掉电、重启后系统崩溃的情况,有些情况可以修复,但是如果无法修复,就必须重装系统。如果系统崩溃的只是双机中的一台,原来的做法是装好这台机的Linux操作系统,把另外一台正常的机器的VCS软件卸载,再重新安装VCS。这在实验室还好办,如果是网上的系统,这样做就得先切换到单机方式再操作,否则会中断业务,而单机方式转换为双机的过程中,又有很多细节需要注意,例如浮动IP的配置,exports文件内容需要删除等,一不小心就会引发新的问题。因此,必须找出让新安装系统的服务器,动态加入到原来的cluster中的方法,才能避免这些问题。2、关键过程、根本原因分析原来由于对文件服务器和VCS双机软件的机制了解不够,不知道将一台服务器动态加入cluster的方法,也没有意识到有这样做的必要性。但是随着维护工作深入,发现测试、现场支持中都对这种操作方法有迫切的需要。后来对VCS机制,包括llt、gab程序的配置文件作用都有了了解以后,逐步弄清楚了具体的实现方法。3、结论、解决方案及效果具体说明如下:假设文件服务器双机的机器名分别为FS1和FS2,FS1正常,FS2重启系统崩溃。此时VCS在FS1上仍然正常运行,只是查看状态时,备机FS2是EXITED的,不是OFFLINE的。华为技术有限公司研发经验案例内部公开2020-01-03版权所有注意保密第2页共3页安装步骤:一、重装FS2的系统,重新配置好机器名称、心跳网卡和业务网卡的IP、/etc/hosts文件,注意与原来正常时保持一致。在FS1上删除/root/.ssh目录,给两台机重做SSH。二、然后在FS2上重装VCS软件:选择安装机器名时,只填写本机的机器名,即FS2。(正常初始安装时,需要输入FS1和FS2)这样的话,安装过程中不会提示输入心跳网卡,其他过程与正常初始安装时的步骤一样。其中输入ClusterName时,注意要与原来的名称一致。记得安装完VCS4.1后还要打上MP2补丁。三、配置VCS的llt和gab:安装完以后,把FS1上,/etc目录下的llthosts、llttab、gabtab三个文件拷贝到FS2的相同目录下,这三个文件内容以及需要修改的说明如下:llthosts文件(不需修改):0FS11FS2llttab文件:set-nodeFS1//此处需要修改为本机机器名FS2set-cluster1linketh0eth—XX:XX:XX:XX:XX:XX–ether--//拷贝过来的是对端机器eth0的mac地址,用ifconfigeth0查看本机eth0的mac地址,并修改替换,本实例中使用eth0和eth1作为心跳,现场视具体情况而定。//这是VCS4.1的情况,如果是VCS2.2,这里稍有不同,请参考FS1上的文件linketh1eth—XX:XX:XX:XX:XX:XX–ether--//参考上一行gabtab文件(不需修改):/sbin/gabconfig–c–n2四、配置main.cf文件:只需要把main.cf文件从FS1的/etc/VRTSvcs/conf/config目录拷贝到FS2的相同目录下就可以了;五、在FS2上起VCS程序:按照下面的命令顺序执行,分别起llt、gab和ha,最后查看双机状态就会发现FS2作为备机加入到FS1所在的cluster内,双机正常运行。#/etc/init.d/lltstart//启动llt#/etc/init.d/gabstart//启动gab华为技术有限公司研发经验案例内部公开2020-01-03版权所有注意保密第3页共3页#/opt/VRTSvcs/bin/hastart//启动ha#/opt/VRTSvcs/bin/hastatus//查看双机状态在这样的整个操作过程中,FS1上VCS双机软件正常运行,业务不需要中断。重新安装时,veritas双机软件序列号怎么找?Vxlicrep命令可以找到.