1©Copyright2013EMCCorporation.Allrightsreserved.EMCVPLEX提供Oracle远程RAC双活数据库连续性李君鹏EMC资深产品顾问Mike.j.li@emc.comCertified2©Copyright2013EMCCorporation.Allrightsreserved.议程•OracleRAC介绍–李君鹏•EMCVPLEX介绍–李君鹏•OracleRAC运行在VPLEX上的最佳实践–李君鹏•EMC针对OracleextendedRAC提供的关键业务连续性和灾难恢复Demo–时祎•Q&A3©Copyright2013EMCCorporation.Allrightsreserved.OracleRAC介绍4©Copyright2013EMCCorporation.Allrightsreserved.客户面临的挑战•应用程序和数据库的可用性–许多关键任务系统要求5个9(99.999%)的可用性:每年无计划宕机不超过6分钟•无计划宕机对收入的影响–独立审计机构调查表明每24小时停机与无计划宕机相关的收入影响从几万美元到几百万美元•广泛的应用程序可用性–整个应用程序栈而不仅仅是数据库的可用性5©Copyright2013EMCCorporation.Allrightsreserved.什么是OracleRealApplicationCluster?10GbE交换机物理RAC节点SAN网络RAC互联SAN存储阵列•RealApplicationClusters(RAC)是服务器(也叫”RAC”节点)的联合,提供以下好处:•容错•可扩展性•易管理型•滚动升级•大多数客户使用OracleRAC主要原因是容错和可扩展性DatabaseListenerDatabaseListenerDatabaseListener6©Copyright2013EMCCorporation.Allrightsreserved.什么是Oracle自动存储管理ASMASM将文件分成1MB大小的区间并将每一个文件的区间均匀分布在磁盘组中的所有磁盘上在磁盘间移动数据重新平衡以确保每一个文件均匀分布到磁盘组中的所有磁盘上增加一个磁盘后,ASM重新平衡操作移动数据到新磁盘上7©Copyright2013EMCCorporation.Allrightsreserved.扩展的OracleRAC恢复类型10GbE交换机物理RAC节点SAN网络RAC互联SAN存储阵列如果一个服务器失败了,会发生什么事情?•一个叫做“ClusterManager”的服务在群集成员池中报告这个变化•正在进行的交易在健康的节点上重启•数据库的可扩展性和性能由于在群集中失去了一个节点而暂时降低了•恢复牵扯到重新配置RAC节点到群集中DatabaseListenerDatabaseListenerDatabaseListener8©Copyright2013EMCCorporation.Allrightsreserved.扩展的OracleRAC和容错10GbE交换机物理RAC节点SAN网络RAC互联SAN存储阵列OracleRAC增加了正常运行时间•RAC网格中的每一个节点都积极地服务数据库会话•透明应用程序故障切换(TAF)使用OracleCallInterface(OCI)调用接口,提供以下故障切换类型:•SELECT:在一个健康的节点上恢复数据库交易•SESSION:将一个会话故障切换到一个健康的节点上•虽然TAF可以恢复或故障切换,但可能会有关联的延迟•具备TAF功能的应用程序必须设计使用OCIAPIDatabaseListenerDatabaseListenerDatabaseListener9©Copyright2013EMCCorporation.Allrightsreserved.扩展的OracleRAC:冗余的层:•物理的•服务器联合形成RAC节点•使用NICbonding(网卡绑定)和teaming(网卡聚合)•软件的•跨所有的节点复制RAC服务什么是单点故障?存储阵列故障会造成所有的应用程序停止运行*例外:ASM伸展的镜像几乎每一层都是冗余的NICNICNICNICNICNIC10GbE交换机物理RAC节点SAN网络RAC互联SAN存储阵列10©Copyright2013EMCCorporation.Allrightsreserved.EMCVPLEX是如何解决这些挑战的?•是硬件和软件虚拟存储解决方案–在数据中心内和在数据中心间–甚至跨两个物理分离的站点•简化了OracleRAC部署–解决方案对RAC和其它应用程序透明–关掉ASM保护,将votingdisk(表决磁盘)放在虚拟卷上•得到Oracle的认证–EMC与Oracle一起工作,认证这共同的解决方案•使动态工作负载可用性成为可能–跨数据中心访问活动/活动数据库和应用程序–虚拟化提供了不中断移动虚拟机的能力11©Copyright2013EMCCorporation.Allrightsreserved.EMCVPLEX介绍12©Copyright2013EMCCorporation.Allrightsreserved.VPLEX系列概述它是什么呢?一个硬件与软件虚拟化平台作为基于SAN的解决方案予以实施可实现本地和分布式联合有什么独特之处?FederatedAccessAnywhere高可用性、横向扩展群集体系结构利用独特技术支持员工跨远距离协作13©Copyright2013EMCCorporation.Allrightsreserved.EMCVPLEX系列产品概述移动性.可用性.协作性.GeoSynchrony操作环境VPLEXLocal在一个数据中心内VPLEXMetro跨数据中心同步距离VPLEXGeo跨数据中心异步距离RecoverPoint操作上的和第三站点恢复Oracle扩展的RAC14©Copyright2013EMCCorporation.Allrightsreserved.VPLEX体系结构横向扩展群集体系结构–在可预测的服务级别从小到大逐步扩展性能高级数据缓存–提高I/O性能并减少存储阵列争用分布式缓存一致性–在数据中心内和数据中心之间实现存储域自动平衡和故障切换VPLEXHP、Oracle(Sun)、Microsoft、Linux、IBMOracle、VMware、MicrosoftBrocade、CiscoBrocade、CiscoHP、Oracle(Sun)、Hitachi、HP(3PAR)、IBM、EMC15©Copyright2013EMCCorporation.Allrightsreserved.VPLEX引擎功能描述VPLEX群集包含一个、两个、或四个引擎VPLEX引擎包含两个控制器、管理模块、电源、电池电源和风扇VPLEX控制器包含一些I/O模块、SSD、CPU和RAM可扩展性容错主机和阵列端口CoreCoreCoreCoreCoreCoreCoreCore主机和阵列端口CoreCoreCoreCoreCoreCoreCoreCore前端后端前端后端引擎控制器A控制器B分布式缓存分布式缓存群集间通信端口BA群集间通信端口BA群集间通信端口BA群集间通信端口BA16©Copyright2013EMCCorporation.Allrightsreserved.•完全冗余的硬件安装在两个机架中(机架可以从EMC购买,也可以客户自己提供)•在一个VPLEXMetro配置中,总共可以有2到8个引擎–每个机架可以有1–4引擎组成•FC-WAN8Gb光纤通道端口–4个每引擎/2个每控制器•10GbE-WAN10Gb以太网端口–4个每引擎/2个每控制器VPLEXMetro配置往返5ms延迟SPS8-端口FC交换机8-端口FC交换机SPSSPSSPSUPSUPS管理服务器SPS8-端口FC交换机8-端口FC交换机SPSSPSSPSUPSUPS管理服务器AccessAnywhere同步17©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:逻辑存储结构VirtualVolume(虚拟卷):从设备上创建,这是VPLEX使用前端端口呈现给主机的元素Device(设备):由一个或多个extents构成,可以组合成更复杂的RAID配置Extent(扩展区):用于划分卷的机制存储卷18©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:本地和远程存储虚拟卷Extent扩展区存储卷Extent扩展区设备设备本地存储远程存储19©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:写确认本地存储远程存储VPLEXMetro和Local使用直写缓存:写首先由存储确认,然后给主机确认只有接到本地和远程存储确认之后,才会给主机确认20©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:敏捷性和RAID•呈现给主机的虚拟存储可以在后端存储阵列内和后端存储阵列之间不中断的移动•推荐RAID保护在存储阵列上实现,这样可以保持存储和VPLEX之间的映射简单而且允许使用存储类似创建快照、克隆和附加的DR等特性21©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:分布式虚拟卷站点A站点B光纤通道或FCIPVPLEXMetro分布式虚拟卷•在两个站点的主机可以即刻访问分布式虚拟卷•一旦创建,分布式虚拟卷就开始同步•写-同时写到站点A和B的存储上•读-可以从VPLEX缓存或本地存储上读取数据22©Copyright2013EMCCorporation.Allrightsreserved.一致性组:写入顺序保真的重要性一致性组写入顺序保真和确定性I/O连续行为所有的数据库LUN卷(例如:Oracle数据、控制和log日志文件)都需要保留写入顺序保真以维护数据的完整性,因此应该始终将这些卷放到一个一致性组中。122323©Copyright2013EMCCorporation.Allrightsreserved.VPLEXMetro:分离规则本地:winner:cluster-1远程:暂停I/O用于当与远程的群集的连接失去后确定一致性组I/O处理的预定规则24©Copyright2013EMCCorporation.Allrightsreserved.VPLEXWitness失败域#3失败域#1失败域#2IP管理网络群集间网络A群集间网络B25©Copyright2013EMCCorporation.Allrightsreserved.EMCVPLEXMetro与扩展的OracleRAC同步AccessAnywhere提供了城域范围的弹性站点A站点BRAC互联LAN骨干网LAN骨干网VPLEXWitness第三域同一虚拟卷VPLEX互联VPLEXWitness通过存储监控提供故障弹性是VPLEX用于扩展OracleRAC的必要组成部分虚拟卷通过VPLEX互联网络同步复制OracleRAC跨互联网络管理节点26©Copyright2013EMCCorporation.Allrightsreserved.扩展的OracleRAC没有EMCVPLEX站点A站点BRAC互联LAN骨干网LAN骨干网votingdisk表决磁盘在第三站点使用NFS或iSCSIVotingDisk表决磁盘是一个共享的磁盘设备或文件用于确定节点的可用性(确定法定人数)和解决脑裂现象:所有节点写到表决磁盘(checkin)必须存在一个裸分区上或类似ASM这样的群集文件系统的一个合适的文件上防止脑裂综合征27©Copyright2013EMCCorporation.All