双机热备技术培训传输产品部徐晓明2011-10目录一、双机热备产生背景二、双机热备原理和准备三、双机热备与NViewNNM集成四、常见问题中心机房一、双机热备产生背景DCNNViewNNM服务器运行商用户投诉:业务怎么中断了目录一、双机热备产生背景二、双机热备原理和准备三、双机热备与NViewNNM集成四、常见问题二、双机热备原理和准备---热备软件与网管的关系Windowsserver2003/2008操作平台命令服务NECEXPRESSCLUSTER集群管理NViewNNM应用程序二、双机热备原理和准备---切换原理双机热备工作原理:数据同步磁盘监测心跳监测网络监测二、双机热备原理和准备---切换原理主机A主机B镜像磁盘F:镜像磁盘F:DCN二、双机热备原理和准备---名词解释两台物理服务器除各自的实际IP地址之外,需要一个浮动IP地址来提供NViewNNM网管系统的各项服务!浮动IPIP:192.168.18.1IP:192.168.18.2浮动IP:192.168.18.3二、双机热备原理和准备---名词解释对于不在同一网段的两台服务器需要在路由器上添加一条静态路由,用于实现转换!浮动IPIP:192.168.18.1IP:10.168.18.2浮动IP:192.168.18.3Routting:10.168.18.2192.168.18.3二、双机热备原理和准备---准备工作高性能服务器相同磁盘分区相同集群分区IP地址规划主机名称规划Clpvolszc:XXX,XXX目录一、双机热备产生背景二、双机热备原理和准备三、双机热备与NViewNNM集成四、常见问题三、双机热备与NViewNNM集成---整体流程安装双机热备软件简单配置资源安装我司网管软件详细配置资源三、双机热备与NViewNNM集成---安装方法三、双机热备与NViewNNM集成---安装方法双机热备添加的几个服务项三、双机热备与NViewNNM集成---安装方法EXPRESSCLUSTER采用B/S架构安装JDK后输入:服务器IP+端口号29003三、双机热备与NViewNNM集成---三种模式操作模式•启动停止集群操作•磁盘同步镜像操作•服务器切换操作设定模式•创建集群•添加组资源•添加监视器资源参照模式•只能查看操作模式下的资源三、双机热备与NViewNNM集成---整体流程安装双机热备软件简单配置资源安装我司网管软件详细配置资源三、双机热备与NViewNNM集成---简单配置资源创建集群添加服务器添加组资源添加监视器保存启动集群磁盘镜像同步三、双机热备与NViewNNM集成---创建集群内核模式•按照优先级来选择谁是数据线路•建议将私网设置为高优先级镜像专用模式•只作为数据镜像线路使用•不建议选择该模式创建集群三、双机热备与NViewNNM集成---创建服务器•服务器名规划•输入服务器IP地址主服务器•组名称•选择服务器组成员服务器组添加服务器三、双机热备与NViewNNM集成---创建组、监视器1、浮动IP资源•复归操作•IP地址2、镜像磁盘资源•依赖关系•选择数据分区和集群分区3、镜像监视资源•自动生成镜像连接监视和镜像磁盘监视4、IP监视资源·复归对象·IP地址添加组资源添加监视器三、双机热备与NViewNNM集成---镜像同步磁盘镜像同步自动同步解除镜像镜像中断全盘拷贝三、双机热备与NViewNNM集成---整体流程安装双机热备软件简单配置资源安装我司网管软件详细配置资源三、双机热备与NViewNNM集成---安装网管软件版本•安装相同版本的网管软件IP•服务器IP地址选择浮动IP目录•安装目录选择磁盘镜像目录升级•为升级方便,安装完成后不要启动网管服务器,直接升级(方便测试)三、双机热备与NViewNNM集成---整体流程安装双机热备软件简单配置资源安装我司网管软件详细配置资源三、双机热备与NViewNNM集成---详细配置资源配置服务资源配置应用程序资源配置脚本资源配置监视资源保存启动集群三、双机热备与NViewNNM集成---配置服务资源•依赖于镜像磁盘资源•调整—在服务已启动时不报错Nms_database_engine•依赖于镜像磁盘资源•调整—在服务已启动时不报错PerfData_Engine配置服务资源三、双机热备与NViewNNM集成---配置应用程序资源•依赖于Nms_database_engine服务•准许桌面对话、当前目录、窗口大小普通•账户、密码、从命令窗口执行RunServer_Debug.exe•依赖于PerfData_Enginee服务•准许桌面对话、当前目录、窗口大小普通•账户、密码、从命令窗口执行Run_PMS_Debug.exeRun_PME_Debug.exe配置应用程序资源三、双机热备与NViewNNM集成---配置脚本资源•taskkill/imsystemtray.exe/f•taskkill/imjava.exe/f•准许桌面会话•依赖于应用程序资源Stopscript配置脚本资源三、双机热备与NViewNNM集成---配置监视资源应用程序•选择已有应用程序资源•选择失效切换的复归对象服务资源•选择已有服务资源•选择失效切换的复归对象配置监视资源目录一、双机热备产生背景二、双机热备原理和准备三、双机热备与NViewNNM集成四、常见问题、保存配置失败,因为停止集群失败,此时可能由于磁盘镜像正在运行。2、在双机热备的机器上启动网管服务器,分布式客户端资源模型加载失败,原因是软件本身没有透传浮动IP的功能(网管软件bug)。3、NEC管理程序远程配置时,必须使用工作服务器的真实IP和端口。原因是一旦进行保存配置则需要进行暂停集群操作,此时浮动IP会失效,后续保存确认工作无法进行。四、常见问题四、常见问题4、启动集群失败,可能是配置有错误,或License到期。5、安装NEC软件并配置完成双机的磁盘镜像后,在进行NNM的安装时,必须使用浮动IP地址进行安装。而且需要先在一台上安装NNM相关程序,然后切换双机,在另一台上安装。6、异常关机后需先做镜像同步操作。