双活数据中心解决方案发展趋势及解决方案集Agenda•数据中心发展历程及趋势•双活数据中心建设模型•双活数据中心解决方案•成功案例自助管理数据中心动态灵活的IT架构基础资源池共享服务器整合基础架构优化信息孤岛竖井式结构应用资源池共享应用整合应用架构优化内部和外部企业计算云面向服务的云计算平台分布式运营数据大集中双中心运营两地三中心云扩展数据中心发展历程及趋势私有云公共云从传统企业数据中心到云计算、可复用且可扩展的IT服务平台AppSOAppSOAppSOAppSOAppSOAppSOAppSOAppSOAppSOAppSOAppSO第一阶段第二阶段第三阶段第四阶段第五阶段通过数据中心整合和优化来节省能源和场地设施成本通过虚拟技术来提升资源利用率,降低管理和能源成本自动化管理,自动化部署,实时监控,动态伸缩,提高管理效率及服务质量,降低服务成本阶段业务目标阶段业务目标阶段业务目标阶段业务目标通过增加服务流程,实现IT服务标准化、自动化,自助式,IT资源的生命周期管理的云计算平台负载均衡解决方案多链路接入Web应用优化GTM多数据中心主机多中心运行自动化运维精细管理云计算解决方案双活数据中心建设模型应用级双活数据中心业务级灾备业务处理逻辑等非IT系统的冗余应用级灾备应用处理系统的冗余备份从数据灾备到应用灾备到业务灾备数据级灾备数据备份,保证数据完整性生产数据中心1生产数据中心1生产数据中心2生产数据中心2应用级双活数据中心模型一--分应用主备模型•双生产中心均需要完成生产业务•通过数据复制技术将数据复制到对方•通过业务模块或用户的方式将业务分配到不同的中心•平时主要的处理能力均分配给生产应用系统使用•出现灾难时,根据需要接管的方式,动态调度资源给备份系统使用应用A访问应用B访问Clients生产数据中心1生产数据中心1生产数据中心2生产数据中心2Clients应用级双活数据中心模型二--主主模型•业务或用户分配到每个生产数据中心•每个生产中心都有自己的应用集群对外服务•跨双生产中心建立共用数据库•通过数据复制技术将数据镜像到对方•出现灾难时,正常的生产数据中心根据需要接管所有基于指定应用的请求•所有的中心、主机和存储设备均处于生产状态和实现负荷分担应用A访问应用B访问应用A访问应用B访问生产数据中心1生产数据中心1生产数据中心2生产数据中心2Clients应用级双活数据中心模型三--动态主主模型•双生产中心均需要完成生产业务•通过数据复制技术将数据复制到对方•通过业务模块或用户的方式将业务分配到不同的中心•平时主要的处理能力均分配给生产应用系统使用•出现灾难时,根据需要接管的方式,动态调度资源给备份系统使用应用A访问应用B访问应用A访问应用B访问双活数据中心解决方案双活数据中心整体架构业务持续性保证•在架构层面,多个数据中心通过内部私有网络互联,统一对外提供服务。在多个数据中心内,应用在每个数据中心都是处于活动状态,在这种运行模式下,必须使用应用交付设备来实现应用的管理。GTM+DNSWebTierAppTierDBTier(Active)GTM+DNSWebTierAppTierDBTier(Standby)ExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenter智能流量管理互联网业务移动终端业务突发业务流量处理数据库整合动态数据中心自动化运维服务动态调整灾备管理集成数据中心快速切换应用优化和安全应用加速应用安全Clients传输安全与优化智能流量管理GTM探测本地资源GTM之间共享本地资源状态和LocalDNS网络距离信息客户端运营商LocalDNS互联网业务多中心并行运行将客户端请求发送到最佳的数据中心•通过一组GTM来对外提供服务•GTM监控服务的状态,并通知同组内的其他所有GTM设备,对于每一个DNS请求返回最佳结果好的策略选择和配置方式可以最大幅度提高客户体验•GTM与LTM的实时通讯,可以获取更多的应用状况信息,作为流量分发策略的参考•LTM识别最终用户的位置,进行更精确的“就近性”访问GTM+DNSWebTierAppTierGTM+DNSWebTierAppTier互联网ISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClients服务器状态Cookies追踪哪台服务器上包含有用户的Session状态•针对系统使用Weblogic或者Webshpere作为基础构件•大多数使用单独的(因为安全原因)无状态的Web服务器层在DMZ区,另外有单独的应用服务器层在内部•支持Cluster的系统会将服务器的信息加密后包含在状态Cookie里面•LTM可以读取状态Cookie的内容,并且在首选节点Down掉的时候,自动将请求分配到第二备份节点上•在这种设计中,我们甚至可以替代连接代理层的服务器,比如Web代理层Apache服务器AppTierWebTierActiveStandbyActiveStandbyCookie中包含节点信息Clients将Session状态复制到备份节点,并且在Cookie中包含主备节点信息当主节点Down掉的时候转发到备份节点x移动终端业务多中心并行用于追踪当前活动的用户Session数据所归属的数据中心•多中心并行运行后,潜在的风险是可能是用户的第一个请求和后续的请求导向到不同的数据中心或者链路上•ISP大量使用WLAN卸载3G网络的压力•移动用户可能在同一个应用使用期间在3G网络和WIFI之间来回切换WebTierAppTierDBTierWebTierAppTierDBTierExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClientsBIG-IP创建数据中心cookie并且插入到服务器的响应中后续的请求发送到的另外一个数据中心数据中心2的BIG-IP读取到了Cookie并且发现用户的Session存在于数据中心1,则将请求转发到数据中心1突发业务流量处理在出现故障或者服务能力无法支撑的情况下使用另外一个数据中心资源•当本地资源出现故障时使用另外一个数据中心资源•例如,一个服务器存储阵列出现故障的时候,导致多个虚拟服务器同时无法使用•避免本地的服务能力无法支撑的场景•设置每个应用的并发连接数限制,每秒新建连接数•设置优先级组,当本地资源不足时自动启用另外一个站点资源•如果彻底的由于资源响应问题无法服务(或者同时故障),可以在BIG-IP上直接返回错误页面WebTierAppTierDBTierWebTierAppTierDBTierExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClients“对不起,系统忙,请您稍后再试”如果一个数据中心的资源不足或者故障,使用另外一个数据中心资源xxDBTier(Active)DBTier(Standby)通过路由将用户引导到“最近”的数据中心内网基于IP地址发布的业务多中心并行将连接发送到最佳的数据中心通常情况下这些只能基于IP访问的应用包括ATM/自助终端或者银行内的服务器到服务器的应用访问,有以下发布方式:1,在大网上发布一个单一的IP地址,通过IPAnyCast技术将用户请求引导到多个数据中心2,在大网上发布单一IP地址,通过静态路由注入方式将用户引导到单一数据中心,在故障时进行自动切换3,在不同的数据中心发布不同的虚拟IP地址,并且互为备份这种情况下的最佳选择取决于应用和网络拓扑情况直接在数据中心之间进行转发?就近的数据中心作为客户访问接入点?应用自身处理状态信息?AppTierAppTierPrivateNetworkPrimaryDataCenterSecondaryDataCenterKiosksATMsLTM检测本地的资源状况发布VIP的主机路由Branches通过数据中心之间的直接连接实现Active/Active发布同样VIP的主机路由GTM+DNSWebTierAppTierDBTier(Active)GTM+DNSWebTierAppTierDBTier(Standby)ExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClients交易一致性保证和数据库快速切换所有的交易均发往一个数据中心的数据库•通常情况下采用单一数据中心数据库集群主运行方式•数据一致性考虑•另外一个数据中心的数据库运行在备份模式,在一些情况下提供查询服务•在主数据中心数据库故障时切换到备份数据库xF5在数据库实例前端可以减小数据库实例故障切换时间,并支持跨中心数据库快速切换.•主动数据库健康检查•RACFANnotifications动态数据中心GTM+DNSWebTierAppTierDBTier(Active)GTM+DNSWebTierAppTierDBTier(Standby)ExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClients动态数据中心在基础架构和应用之间搭建桥梁VirtualizedServersandstorage自动化部属工具自动化部署工具整合自动化部署工具用于部署虚机、自动执行变更操作等,F5在其中的作用作为命令的执行者,引导对应用的访问流量资源的渐入渐出将当前的应用状况汇报给自动化部署工具,以使其获得更加精确的应用资源使用状况,实现资源的动态调整服务器连接数已经达到上限!所有的活动连接已经结束!站点切换整合与一些站点高可用管理工具比如SiteRecoveryManager整合,在多个数据中心之间实现业务的流量引导xx使用另外一个站点!多数据中心运维的挑战事件响应的及时性和有效性运维的可持续性系统复杂度很高,关联程度深,新员工难以对问题进行快速响应互联网化带来的运维影响•复杂的外部环境带来的影响•应用快速增加,新业务不断涌现多数据中心运维•运维事件响应的及时有效性•联动操作的快速有效性•配置之间的关联性•配置的一致性•两个中心如何协调联动F5自动化运维部署整体架构BIGIPiRuleLogAnalysisConfigcheckEnterpriseManager/CloudManagerITILSyslogSOAPFTPSSHiCalliControlTMSH自动化脚本(iCall&Shell)VS部署WideIP部署延迟性分析安全事件分析自定义报表配置一致性配置合规性统一视图性能监控策略库配置自动部署补丁管理性能监控配置下发系统检查自动事件手动事件自动化运维概貌一键CASE信息采集一键切换TMSH接口iControl接口配置备份以及配置采集云管理员F5BIGIPPlatform一键装机脚本配置一致性F5应用统一视图配置合规性自动化管理软件版本/补丁管理应用性能监控配置下发iRuleEM/BIG-IQ日志分析软件四层应用延迟性分析安全事件分析自定义报表FTPSSHSOAP/RESTSYSLOGSOAP/RESTGuest/Host性能监控应用资源策略库配置自动部署办公自动化软件配置备份以及配置解析外部Server应用分析iRule应用部署DNS部署GTM+DNSWebTierAppTierDBTier(Active)GTM+DNSWebTierAppTierDBTier(Standby)ExternalNetworksISP1ISP2ISP2ISP1PrimaryDataCenterSecondaryDataCenterClientAPP到DB的一键切换•适用于已部署数据库负载均衡的情况•本中心APP连接本中心的数据库负载均衡F5•服务器出现故障通过F5健康检查告警及时发现,修改主中心VS指向备中心数据库,修改备中心VS指向备