北京时代朝阳数据库技术中心HACMP简介HACMP集群组成及典型结构HACMP集群的设计HACMP集群实现实验内容HACMP集群的测试课程内容.北京时代朝阳数据库技术中心?HACMP(HighAvailabilityClusterMulti-Processing)是IBM公司在P系列AIX操作系统上的高可靠集群软件,配置冗余、消除单点故障,保证整个系统连续可用性和安全可靠性主要组成部分:高可用(HA)集群多处理(CMP).北京时代朝阳数据库技术中心高可用(HA):是通过避免或消除计划内或计划外应用和系统拓机,为客户端应用提供连续服务的组件之一,它是通过消除硬件和软件单点故障(SPOF)来实现的群集多处理技术(CMP):多个应用运行在共享或并发访问数据的多个节点上.北京时代朝阳数据库技术中心单点故障(SPOF)单点故障(SPOF)指集群中的某些独立组成失败,导致终端用户无法访问应用避免单点故障要做的冗余的服务冗余的网络路径冗余存储路径镜像失败检测和诊断自动的应用失败转移自动的资源重聚.北京时代朝阳数据库技术中心术语Cluster(集群):多个服务器节点一起工作,使用TCP/IP进行通讯,每个节点上运行ClusterManager进程。Node(节点):HACMP集群的核心物理组成,即一台运行AIX和HACMP软件的服务器Applicationserver(应用服务器):受HACMP控制的一组应用的启动和停止脚本。Reintegration(重聚):将故障节点、网络、网卡重新带回群集的过程。Synchronization(同步):从cluster中单点升级globalODM到所有节点的进程。Event(事件):群集中发生的一些事情,即群集状态的改变,包括节点up/down,网络up/down,网卡故障等等。.北京时代朝阳数据库技术中心的基本概念Topology(集群拓朴):包含基本集群成员节点、网络、通信接口、通信设备和通信适配器Resources(资源):将要使其高度可用的实体(例如,文件系统、裸设备、服务IP标签和应用程序),资源的集合为资源组Fallover(故障转移):对主节点失败的反映,表示资源组从一个主节点到另一个节点(备用节点)的动作Fallback(回退):表示资源组从一个备用节点回到之前节点(当它可用时)的动作北京时代朝阳数据库技术中心群集的硬件组成节点(nodes)外部共享磁盘设备(sharedextenaldiskdevices)网络(networks)网卡(networkinterfaces)客户端(clients).北京时代朝阳数据库技术中心双机系统结构图主机(服务器)A安装Hacmp软件共享磁盘阵列(存储子系统)心跳线(tty)ServiceA主机(服务器)B安装Hacmp软件ServiceBServiceNetworkStandbyNetwork.北京时代朝阳数据库技术中心(ExtendedDistance)HighAvailabilityGeographicCluster.北京时代朝阳数据库技术中心层管理通信HACMP层RSCT层AIX层提供系统服务LVM层管理磁盘空间TCP/IP层管理通信HACMP层对应用提供高可用服务RSCT层子系统的监视和协调应用层提供客户端服务NodeANodeBHACMP的软件结构RSCT(ReliableScalableClusterTechnology)北京时代朝阳数据库技术中心集群设计资源组设计网络设计存储设计.北京时代朝阳数据库技术中心群集设计要点努力做到“没有单点故障”:这是设计的前提,应贯穿设计的始终自动故障恢复:故障恢复应无需人工干预权衡投资、性能和可用性的关系:在保证可用性和性能的条件下,使硬件投资最大程度地发挥效力.北京时代朝阳数据库技术中心考虑应用软件:认真编写启动和停止脚本,使应用在故障时能自动恢复设计高可用网络考虑客户机:使客户机受群集故障影响最小其它需要考虑的问题:各节点的用户帐号和用户目录,批处理、打印队列、邮件、备份等其他应用和服务.北京时代朝阳数据库技术中心资源组设计资源组中的资源可能是:共享存储卷组文件系统裸逻辑卷裸磁盘服务IP地址/标签(客户端访问应用数据)应用服务器应用启动脚本应用关闭脚本.北京时代朝阳数据库技术中心资源组设计三种资源组接管方式:Cascading(级联)Rotating(循环)Concurrent(并发)HACMP控制资源组在以下情况下的行为:集群启动节点失败节点重聚集群关闭.北京时代朝阳数据库技术中心(级联)资源组Cascading级联资源组定义了一个可以控制该资源组的所有节点的列表,以及每个节点接管资源组的优先级集群启动时,优先级最高的节点拥有资源组,当该节点发生失败时,资源组被优先级较高的节点接管,当失败节点重新加入集群后,它将从接管节点夺回资源组的控制权。.北京时代朝阳数据库技术中心资源组(reintegration).北京时代朝阳数据库技术中心(循环)资源组----节点性能类似一个Rotating资源组和一组节点相关联。资源组在所有被定义的节点之间轮转集群启动时,优先级最高的节点拥有资源,当控制资源的节点失败时,节点列表中对资源组具有较高优先级的节点将接管资源组。当失败节点重聚到群集后,不再取回资源组,将成为备用节点。.北京时代朝阳数据库技术中心资源组(reintegration)ssaSerialnetworkEthernetnetworksNodeASharedVGNodeBResources.北京时代朝阳数据库技术中心(并发)资源组----同时工作Concurrent资源组由多个节点共享,集群启动时,所有并发访问资源组的节点都获得该资源组,节点之间没有优先级的区别。当某节点失败,资源组只在该节点offline,当故障节点重新回到集群后,资源组在该节点online。.北京时代朝阳数据库技术中心资源组(reintegration)ssaSerialnetworkEthernetnetworksNodeASharedVGNodeBResourcesResources.北京时代朝阳数据库技术中心自定义资源组自定义资源组接管的三种策略StartupOnlineOnHomeNodeOnlyOnlineOnFirstAvailableNodeOnlineusingdistributionpolicyOnlineOnAllAvailableNodesFalloverFalloverToNextPriorityNodeInTheListFalloverUsingDynamicNodePriorityBringOffline(OnErrorNodeOnly)FallbackFallbackToHigherPriorityNodeNeverFallback.北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心(onerroronly).北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心北京时代朝阳数据库技术中心集群网络设计建议的网络设计方案:网络设计的主要目的:采用冗余设计集群网络拓朴,以消除网络组成导致单点失败.北京时代朝阳数据库技术中心