Power+Systems业务连续性解决方案

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

IBMPowerSystemsIBMPowerSystems李一峰liyifeng@cn.ibm.comPowerSystems业务连续性解决方案IBMPowerSystems©2010年3月IBMCorporation3Poweryourplanet.议题客户的需求IBMPowerSystems高可用性解决方案•高可靠的硬件RAS(Reliability,AvailabilityandServiceability)•分区在线迁移(LivePartitionMobility)•AIX操作系统的高可用性•高可用系统软件PowerHAPowerHA/XD•高性能高可靠的并行文件系统-GPFS•并行数据库OracleRACDB2pureScale高可用性解决方案小结IBMPowerSystems©2010年3月IBMCorporation4Poweryourplanet.客户需求IBMPowerSystems©2010年3月IBMCorporation5Poweryourplanet.这个世界比过去有着更多的“风险”FinancialTimesDisasterrecovery:Thecrucialthingistobeprepared1USATODAYTheftofpersonaldatamorethantriplesthisyear2TheEconomicTimesDatabackup,recoverybecomingcriticaltoall3环境在不断变化–风险接触范围在不断扩大–全球及区域间的依存关系在不断增大–供应链每时每刻都存在中断的风险业务中断将导致更大的影响–宕机可能导致更大的财务影响–宕机可能对品牌造成伤害–宕机可能导致数据失去完整性更繁杂的规范–产业和监管标准在不断变化–产业分工在地理分布上更趋分散–每个国家都可能有自己相应的规范更多的灾害–经济危机、恐怖主义、飓风、地震、–停电、火灾和疾病的大规模威胁IBMPowerSystems©2010年3月IBMCorporation6Poweryourplanet.灾难的分类每年的发生频率每次发生的结果(单次发生损失)(美元)1,0001001011/101/1001/1,0001/10,0001/100,0001美元10美元100美元1千美元1万美元10万美元100万美元1000万美元1亿美元病毒蠕虫磁盘故障组件故障电源故障常见不常见低高自然灾害应用中断数据损坏网络问题建筑火灾恐怖行动/国内动荡与可用性相关的与恢复相关的业务连续运营IBMPowerSystems©2010年3月IBMCorporation7Poweryourplanet.业务连续性问题及面临的挑战差距不断加大更多的业务在线更多的应用和数据增长的需要通过传统的备份与恢复满足业务需求的能力更多复杂的系统更少的恢复时间窗口更小的对停机时间的容忍度日益增加的信息不可用所造成的影响备份与恢复vs.HA高可用重新运行批处理日终作业手动的应用与数据的恢复丢失数据最好的意图vs.RTO,RPO,SLA规范的设计……收入和利润受损失负面的社会影响罚款和罚金涉及法律依从及会计的问题员工的劳动强度和费用对日常的业务规划和运作产生影响……•60%的客户正在关注如何提高可用性•接近50%的客户希望有显著的安全提升•超过25%的客户希望实施高可用集群IBMPowerSystems©2010年3月IBMCorporation8Poweryourplanet.业务连续性的考虑ConsiderationforBusinessContinuity软硬件的容错、冗余和故障自动侦测及恢复。同城或异地实时复制数据对于计划外的应用/系统的中断,自动恢复到故障点并保证恢复时间。高可用HighAvailability数据复制DataReplication灾难恢复DisasterRecovery业务连续性BusinessContinuityIBMPowerSystems©2010年3月IBMCorporation9Poweryourplanet.IBMPowerSystems高可用性解决方案IBMPowerSystems©2010年3月IBMCorporation10Poweryourplanet.HA(高可用)和DR(容灾)的区别HighAvailability自动的接管一般适用发生在本地的错误针对物理设备的保护服务器硬盘适配器卡网络针对致命的软件错误的保护操作系统数据库应用服务DisasterRecovery手动的切换流程针对于主站点完全失效方面的保护覆盖的错误包括:HA方案失效主站点(基础架构)失效逻辑错误(如应用或数据)致命的用户失误导致的原因是自然灾害、战争、……对主站点有严重的影响制定灾难恢复计划是必要的IBMPowerSystems©2010年3月IBMCorporation11Poweryourplanet.基本可用性无数据丢失恢复点目标DataCurrencyLatest持续可用性数据传输(每个交易的价值)可用水平恢复时间目标和缩短的计划内停机时间AvailabilityLevelSAN磁盘备份服务多服务器解决方案single-server单服务器solutions解决方案备份周-日场外存储RAID-5日志组合磁盘镜像SANAIX,Linux,Intel群集连续数据复制群集可切换集群在线维护CUoD高速磁带LPARTSMBCRSSWA网络分配器冗余网络(LAN/SAN)支持业务连续性与灾备的系统组件IBMPowerSystems©2010年3月IBMCorporation12Poweryourplanet.高可用(HighAvailability)解决方案的架构Availabilityby应用–按照高可用的要求来设计应用架构Availabilityby中间件–DB2HADR、WAS集群,CICS集群–OracleRAC、DB2pureScaleAvailabilityby操作系统–AIXLVM镜像、PowerHA(HACMP)forAIXAvailabilityby硬件冗余–服务器•冗余的处理器/I/O适配器卡/电源/•内置磁盘RAID技术保护–外置磁盘,I/O总线、SAN交换机、LAN、LAN交换机•冗余的部件•磁盘RAID•多路径(Multi-Path)软件(SDD、RDAC)–通过磁盘复制的可用性•FlashCopy,Metro/Globalmirror–网络IBMPowerSystems©2010年3月IBMCorporation13Poweryourplanet.HardwarePowerSystems(RAS)LivePartitionMobility(分区在线迁移)PowerSystemsSoftwarePowerHAPowerHA/XDApplicationOperatingSystemAIXLiveApplicationMobility(应用在线迁移)IBMPowerSystems高可用解决方案IBMPowerSystems©2010年3月IBMCorporation14Poweryourplanet.高可靠的硬件-RAS(Reliability,AvailabilityandServiceability)IBMPowerSystems©2010年3月IBMCorporation15Poweryourplanet.IBM服务器的RAS理念IBMRASpractices(orderedlist):1.Correctresultsallthetime,Neverfails高可靠2.HighAvailability,Neverstops高可用3.HighServiceability,Easytoupgradeandrepair高可服务性(concurrentlyifpossible)4.Highperformance,Neverslowsdown高性能IBMPowerSystems©2010年3月IBMCorporation16Poweryourplanet.IBMPowerSystemsRAS架构避免错误恢复,重试诊断,重新配置修复,服务IBMPowerSystems©2010年3月IBMCorporation17Poweryourplanet.IBMPOWER服务器的RASProcessorInstructionRetry(处理器指令重试)AlternateProcessorRecovery(替换失效处理器)FirstFailureDataCapture(首次数据失败捕获)DDRChipkill™memory(类似磁盘阵列校验保护的功能)Bit-steering/redundantmemory(校验保护扩大到不同的内存板上)ServiceProcessorFailover*(服务处理器)DynamicFirmwareMaintenance*(动态升级服务器微码)HotI/ODrawerAdd*I/OerrorhandlingextendedbeyondbasePCIadapterECCextendedtointer-chipconnectionsforthefabric/processorbusesMemoryandL3CachesoftscrubbingHardwareAssistedL2&L3CacheLineDeleteHardwareAssistedMemoryScrubbingLivePartitionMigration(分区在线移动)IBMPowerSystems©2010年3月IBMCorporation18Poweryourplanet.IBMPOWER服务器的RAS-ContinuedRedundantpower,fansDynamicProcessorDeallocationDynamicprocessorsparingECCmemoryPersistentmemorydeallocationHot-plugPCIslots,fans,powerInternallightpathdiagnosticsHot-swappablediskbaysIBMPowerSystems©2010年3月IBMCorporation19Poweryourplanet.POWER7ReliabilityandAvailabilityFeaturesPCIAdapterFabricBusInterfacetootherChipsandNodesECCprotectedNodehotadd/repairCoreRecoveryLeveragespeculativeexecutionresourcestoenablerecoveryErrordetectedinGPRsFPRsVSR,flushedandretriedStackedlatchestoimproveSERAlternateProcessorRecoveryPartitionisolationforcorecheckstopsL3CacheECCprotectedSUEhandlingPurgeandLinedeleteGXIOBusECCprotectedI/oHubConcurrentadd/repaircapabilitiesInfiniBand®InterfaceRedundantpathsRetry/FreezebehavioroptionsforInternalI/OHubFaultsPHBErrors(ForHubsattachingexternalI/Odrawers)IOHubPCIBridgeAdvanced64ByteECConMemoryMultiplechipchipkilldetectionsandsparingsHWassis

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功