Sun Cluster 3.x 基础

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

SunCluster3.SunCluster3.xx基础基础黄雨2008.09.08因为专注,所以专业!本文稿首发于CU,发布网名为yuhuohu版权属本人所有版权属本人所有版权属本人所有版权属本人所有,,,,未经本人许可未经本人许可未经本人许可未经本人许可,,,,严禁任何人用任何名义以任何形式转载严禁任何人用任何名义以任何形式转载严禁任何人用任何名义以任何形式转载严禁任何人用任何名义以任何形式转载!!!!违者本人将保留追诉权利违者本人将保留追诉权利违者本人将保留追诉权利违者本人将保留追诉权利!!!!内容纲要内容纲要集群/群集的基本概念SunCluster的硬件和软件环境SunCluster的集群控制台SunCluster的拓扑与仲裁机制SunCluster的安装准备工作集群集群//群集概述群集概述定义分类标配目标HA与Scalable1.11.1集群的定义集群的定义多台独立的服务器组成一台逻辑上的主机,对外提供统一的服务常见的集群软件–HPMC/Service-Guard–IBMHACMP–SUNSunCluster–FujitsuPrimeCluster(PCL)–EMCAutoStart–SymantecVERITASClusterServer(VCS)–RedHatRHCS–OracleRAC–……1.21.2集群的分类集群的分类高性能集群(Highperformancecluster,HPC)–多个节点共同完成一个任务,多用于科学运算,比如天气预报、环境监控等数据量大、计算复杂的环境中,在商用环境中很少使用,比如3DMAX高可用性集群(Highavailabilitycluster,HAC)–利用集群中冗余的系统,当主系统出故障时由备机接管相应的应用,如HACMP/VCS负载均衡集群(Loadbalancecluster,LBC)–可伸缩性集群(ScalableCluster)–多台主机分担来自所有用户的并行的小的工作,比如Oracle的RAC,WebLogicCluster1.31.3集群的标准配备集群的标准配备独立的服务器节点独立的服务器节点独立的服务器节点独立的服务器节点–每个节点拥有自己的(独立的,非共享的)操作系统专用的互连硬件专用的互连硬件专用的互连硬件专用的互连硬件–用于在同一个集群内进行专用的数据通信多端口存储多端口存储多端口存储多端口存储–一个集群内至少有两个节点和存储有物理连接,提供至少两条对存储的访问路径(分别经过两个节点,一个节点一条路径),为在集群中运行的应用提供数据存储服务1.41.4集群的基本目标集群的基本目标HA和Scalability–集群的目标是为集群中运行的应用提供高可用性(HA,high-availability)和可伸缩性(scalability)服务支持多种应用–无集群意识(cluster-unaware)的应用–有集群意识(cluster-ware)的应用1.51.5HAHA和和ScalableScalableHA的定义–高达5个9的可用性(99.999%)–一年的宕机时间不超过5分钟–单台硬件设备无法实现HAScalable的定义–应用同时运行在多个节点–某节点出故障时,该节点承担的负荷自动转移到其他节点(缩),恢复后集群会自动会为该节点分配负荷(伸)–与HA并不矛盾SunClusterSunCluster环境环境硬件环境软件环境应用类型SunCluster的软件框架全局命名、全局设备、全局文件系统2.12.1SunCluster3.SunCluster3.xxSunCluster是SUN公司的集群软件产品少有的可支持小型机和PCServer的产品–分为forSPARC和forX86版本免使用许可证的优秀产品专门针对专门针对专门针对专门针对SunCluster的认证的认证的认证的认证–Sun集群集群集群集群3.2软件认证系统管理员软件认证系统管理员软件认证系统管理员软件认证系统管理员(CX-310-345)–链接见备注区链接见备注区链接见备注区链接见备注区2.22.2SunClusterSunCluster的特点的特点SunCluster软件最新版本为3.2–支持2~16个节点–全局设备–全局文件系统–集群框架服务直接嵌入内核中,更稳定–内嵌多种已为各种应用定制好的数据服务代理–通过内置的负载均衡(全局接口),使部分事先定制的应用能够实现可伸缩性服务–详见备注2.32.3SunClusterSunCluster硬件环境硬件环境2.3.2.3.aa双节点集群(拓扑)双节点集群(拓扑)解释见备注2.3.22.3.2集群所支持的硬件平台集群所支持的硬件平台SunCluster集群环境支持大量的Sun硬件平台,从机架式的服务器(NetraT1M100),到大型企业级服务器,包括SunFire15K等SunCluster集群环境同样支持大量异构环境,即在一个集群内的节点可以是不同类型的服务器。这取决于网络和存储主机适配器(storagehostadapter),而不是服务器本身。2.3.32.3.3集群传输接口(集群传输接口(11))一个集群内的所有节点都通过集群专用传输连接到一起(集群专用互连),群集专用互连必须是冗余的链路(双链路),作用如下:–集群范围内监视和恢复–全局数据存取(这个操作对应用而言是透明的)–为有集群意识的应用(cluster-awareapplications)提供特定的传输(比如OracleParallerServer)集群专用互联至少需要两个独立的“专用网络”,在特定的环境中,甚至可以定义更多的链路用于专用互联,比如在进行全局数据访问时,流量可以以类似条带的方式分布在所有的专用互联链路上。2.3.32.3.3集群传输接口(集群传输接口(22))双节点集群通常使用交叉电缆(也可选用交换机,有点浪费);当集群内的节点数多于两个时,必须使用交换机进行互联。以下几种类型的硬件可用于集群传输互联(心跳):–以太网(100Mb或Gigabit),绝大多数是使用这种类型的集群互联–用于RSM(remotesharedmemory,远程内存共享)应用的SCI(Scalabelcoherentinterface,可扩展性一致接口)–SunFire专用的互联硬件,用于RSM应用,支持的型号有SunFire3800-6800,15K,25K2.3.42.3.4公共网络接口公共网络接口每个节点必须有公共网络接口用于传输数据,公共网络接口由SolarisIP多路径软件(IPMP,IPMultipathing)控制。强烈建议每个节点都至少有两个接口(构成一个IPMP组)连接到每个子网。在集群中的绝大多数应用都有这样的需求:集群内可能运行该应用的节点必须处在同一个子网内。SunCluster集群内的节点可以连接到多个子网,但不能作为路由器使用2.3.52.3.5集群磁盘存储集群磁盘存储集群磁盘存储集群磁盘存储集群磁盘存储集群磁盘存储集群磁盘存储集群磁盘存储SunCluster集群的硬件环境中支持几种型号Sun的存储设备,这些存储设备必须支持多主机连接。SunStorEdgeT3仅能连接一台主机,因此要通过专用的hub或交换机扩展端口才可以在SunCluster集群环境中使用。绝大部分存储支持两台主机物理连接,部分存储支持多台节点物理连接到存储通过VxVM(VERITAS卷管理器)或SVM(Solaris卷管理器),可以对存储进行跨控制器的镜像2.3.62.3.6启动盘启动盘启动盘启动盘启动盘启动盘启动盘启动盘每个节点的启动盘都必须是本地硬盘,而不能是从多端口存储阵列上映射过来的盘。推荐使用两个本地硬盘,并通过VxVM或SVM做镜像,然后优先选择从其中一块盘启动。2.3.2.3.bb多节点集群(拓扑)多节点集群(拓扑)解释见备注2.3.2.3.cc对硬件环境的要求对硬件环境的要求要构成SunCluster集群环境,必须满足以下硬件要求:–必须:冗余服务器节点–必须:冗余传输(心跳网卡)–必须:冗余存储阵列–必须:跨数据控制器进行软件镜像–推荐:每子网实现冗余公共网络接口–推荐:冗余启动盘–可选:硬件RAID存储阵列解释见备注2.3.2.3.dd基于域的集群基于域的集群SunCluster能够部署在基于域技术的主机,比如:–SunFire15K/25K–SunFire3800-6800–SunEnterprise10000基于域部署集群,远不如来自独立服务器的集群可靠。解释见备注2.42.4SunClusterSunCluster软件环境软件环境解释见备注2.52.5应用类型应用类型SunCluster软件环境支持高可用性和可伸缩性应用–无集群意思的应用–有集群意思的应用2.5.12.5.1无集群意识的应用无集群意识的应用集群内的绝大多数应用属于无集群意识的应用(cluster-unwareapplications),此种应用可分为两种类型:–失效切换应用(主备模式,Failoverapplications)–可伸缩性应用(负载均衡,Scalableapplications)不管是哪种类型,都含有以下要素:–集群资源组管理器(RGM,resourcegroupmanager),负责掌控所有的资源起停操作。这些起停操作绝对不能由传统的(Solaris的)运行控制脚本来实现。–通过特定的应用的数据服务代理,把应用和SunCluster胶合在一起,使应用能够在集群环境中正确的工作。包括在集群内正确的起停应用的方法,应用特定的故障检测器等。2.5.12.5.1aaFailoverFailover应用应用应用应用应用应用应用应用Failover是集群中最容易实现的模式。Failover应用同一时间只在一个节点上运行;通过(在同一个节点或另一个节点上)自动重启服务来实现高可用性。通常由两个节点构成Failover应用,对外提供一个应用专用的ip地址;当执行失效切换时,这个ip地址总是随应用从一个节点切到另外一个节点;对于客户机而言,相当于一台逻辑主机在为它提供服务,而不会意识到服务是在哪个节点上运行也不会知道此服务是由集群提供的。在同一个资源组(resourcegroup)内的多个应用可以共享一个IP地址,这种情况下,这些应用必须/只能同时在一个节点上运行(不推荐这种方式)2.5.12.5.1bbScalableScalable应用应用应用应用应用应用应用应用(1)(1)可伸缩性应用指的是在一个集群内同时运行多个实例(一个节点一个实例),通过全局接口的方法,仅对外提供一个ip地址并实现负载均衡,使其看起来就像一个单一的服务一样。可伸缩性应用也是现成定制好的(off-the-shelf),不是所有应用都可以配置成可伸缩性应用。写数据时没有任何锁机制的应用,应当以failover模式运行,而不是配置成可伸缩性应用。比如apache服务和SunONEWebServer应用服务2.5.12.5.1bbScalableScalable应用应用应用应用应用应用应用应用(2)(2)解释见备注2.5.22.5.2有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用有集群意识的应用是指那些在软件中内置了集群功能的应用,有集群意识的应用和无集群意识的应用的主要区别点在于:–运行在不同节点上的应用的多个实例能够互相意识到各自的存在,并且通过专用传输网络(privatetransport)进行信息交换。–无需SunCluster软件框架中的RGM来起停这些应用。因为这些应用是有集群意识的,它们能够采用自带的脚本来启动,或手工启动。–有集群意识的应用不需要通过外部应用IP地址(applicationipaddress)把它们逻辑上编成一组2.5.22.5.2aa并行数据库应用并行数

1 / 79
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功