IT应用性能管理运维方案—技术顾问—Fan.wang@nimsoft.com—王凡企业的IT环境日益复杂,IT运维的挑战日益艰巨Customers:Global客户:全球化NewDevices:Proliferating新设备:激增。。。Virtualization/Cloud:Exploding虚拟化与云计算:爆炸性增长Applications:DistributedandLooselyCoupled应用:分布式与松耦合企业业务的发展使得IT管理的难度大大增加了今天的业务服务越来越多通过Web应用实现用户做一笔交易,后台其实已经访问了多个系统互联网最终用户应用服务器路由器防火墙交换机Web服务器负载均衡门户SAPSiebelWeb服务第三方应用程序数据库集群大机(Mainframe)PSFT数据库网络前端后台中间件USERMybizapp.comOrderUSERMybizapp.com订单确认!传统运维方式犹如“瞎子摸象”独行侠PK大集中:命令、脚本、批处理……单点工具PK综合平台:随机自带、系统内置……游击队PK集团军:开源软件、免费软件……企业在IT运维中需要管理多个关键监控点网络最终用户应用服务器路由器防火墙交换机Web服务器负载均衡认证服务器门户SAPSiebelWebServices第三方应用数据库核心业务PSFT数据库交易失败了吗?客户受影响了吗?认证变慢?WebServer有问题吗?是否记录问题发生时的详细过程?业务系统慢吗?主机响应时间有问题吗?Web服务出问题?数据库响应如何?第三方服务满足SLAs吗?IT运维的挑战-企业的IT系统是否是健康的?无法全面了解IT系统的整体健康状态?监控的手段缺乏,造成了各种的监控黑洞?手工或分散的管理工具使得故障定位困难?IPPCTFe-CommerceFinanceIT运维的挑战-出现故障是系统的问题?还是应用的问题?82.0%OverallclaimsprocessingMiddleware99.3%SQLServer99.1%Unix99.4%Network99.4%WEB99.2%Database99.8%MVS99.1%CustomerPerspective手工运维根本无法适应IT运维管理的需要需要7×24小时监测业务性能如果基础架构出现故障会影响哪些应用?业务出现中断,会是什么原因引起?IT运维的挑战-能不能快速定位业务故障?如何定位相关故障根源?这个问题是真的根源吗?多久可以定位出问题根源?延迟?影响?.netJ2EEOracleMSBackuprecoveryLinux.netFinanceDirCustomGeoToolsCOPAuditIDMGISAdjudicationCustom业务流程层业务服务层应用服务层基础架构层应用性能管理的建设思路-端到端的业务健康度监控WAN/主动地监测性能变化和问题快速准确的诊断原因的能力监控所有业务交易的性能分解并关联到底层的应用组件,网络,数据库,服务器的性能掌握用户性能体验建立服务水平等级SLA应用性能管理的关键要素:建立统一管理平台ApplicationCommercial&CustomServerPhysical&VirtualDatabaseIT&BusinessCloudPublic&PrivateNetworkLAN&WANBusinessServiceManagement业务服务管理ServiceLevelManagement服务品质管理EnduserResponseTime用户体验管理Performance&Availability性能与可用性管理EventsManagement事件管理统一管理平台统一管理平台•业务整体监控•事件统一处理•性能统一分析•建立运维标准化实现基于SLM的多角色多角度的应用性能管理从维护的角度网络硬件操作系统应用最终用户从业务的角度网络硬件操作系统应用最终用户IT运维人员IT主管IT经理实现基于SLA的运维管理-SLA监测和优化报告实现多个层面的SLA的管理针对操作管理的SLA针对IT服务质量的SLA灵活定制SLA的内容和计算方法快速生成SLA运维报表提供多个角色的管理视图IT经理管理视图-查看整体业务服务状态IT主管管理视图-查看关键系统运行状态IT运维人员管理视图-查看设备性能状态,定位告警实现端到端的面向业务的管理用户体验管理网络监控应用管理用户Internet/Intranet防火墙本地网Userfront-endWeb,Citrixetc.ApplicationSAP,Siebel,J2EE,Netetc.DatabaseOracle,DB2etc.Vblock健康状况监控应用性能分析SLA监控虚拟环境监控性能监控告警监控Nimsoft服务器虚拟机、物理机、存储WEB软件、中间件、数据库管理应用性能管理的关键要素:实时监控真实用户体验15Aug16,2010服务保障——应用性能管理Copyright©2010CA实时监控•所有真实用户体验监控•中间件可用性和性能监控•模拟交易发起及监控主动告警•亚健康告警,可用性告警,性能告警根源分析•交易追踪,异常检测,变更检测,内存泄漏定位,应用关联模型自动报告•用户体验SLA报告•质量报告•趋势报告应用性能管理的关键要素:保障业务应用服务水平保障业务健康•业务性能分析•服务水平管理应用性能管理的关键要素:支持各层面的监控需要应用性能管理的关键要素:选择适合的监控技术特点有代理技术无代理技术成本X维护X部署速度X功能深度X网络负载X对本地服务器的要求X连续操控性X控制粒度XSource:GartnerResearch轻量级代理监控减少对被管系统的影响,对被管系统的资源占用1%CPU,2MBmemory。无代理监控hypervisors、SAN存储、网络设备、SaaS等不能安装代理的环境。应用性能管理的关键要素:对应用的“黑箱透视”ResponseJVMApplicationServerJ2EEApplicationServletEJBMQ/TuxJDBCCICSFileandNetworkI/OMemoryIntegrationPortalPortletsEnginePortletContainerAuthenticationAuthorizationBuildingModelsPageLoadingPageRenderingJDBCPoolsEJBPoolsThreadPoolTransactionRequestMainframeMQSeriesSAP,Siebel,PSFTWebServicesDatabasesLDAPSecurityCICS/IMS/TuxedoJAVA/.NETAPPLICATIONPORTALINTEGRATIONJVMJAVA/.NETAPPLICATIONApplicationServerJ2EEApplicationServletEJBXI/PIJDBCJCOFileandNetworkI/OMemoryIntegrationPortalPortletsEnginePortletContainerAuthenticationAuthorizationBuildingModelsPageLoadingPageRenderingJDBCPoolsEJBPoolsThreadPool通过深入地监控和管理整个应用环境的性能来确保应用的最佳性能!应用性能管理的关键要素:应用问题定位和诊断非专家的用户也可以快速定位问题•定位问题位置,加快问题解决周期•避免扯皮现象,提高工作效率诊断和问题原因分析•监控交易执行过程•标识有问题的应用组件和后台服务事件检测和原因分析集成•按照交易执行的过程追踪定位问题发生的层次应用性能管理的关键要素:提供丰富的告警处理手段•告警级别•告警过滤•告警压缩•告警关联•告警转发•告警自处理•告警分配•告警监控时间•……短信告知E-mail告知自动处理移动终端应用性能管理的关键要素:提供各类标准化的性能管理功能Cisco设备性能管理网络性能分析管理服务器性能管理数据库性能管理应用性能管理的关键要素:无需编程,随心所欲的定制个性化门户和报表简单拖拽即可实现应用性能管理的关键要素:采用较少的工具采用较少的工具•工具集成难度小•安装实施周期短•工具购买和部署的成本低•简单易用、使用者学习成本低•易于维护、后期运维成本低工具较少工具较多应用性能管理的关键要素:对外集成简单CMDB集成Gateway集成API&SDK集成门户集成应用性能管理的实施效果-运维模式的变化运维人员发布修订,验证问题解决AppServerAdminTransactionServerAdminJavaAppDeveloper!!ITAppOwnerDatabaseManagerNetworkManager应用支持集合队伍,分析问题,收集证据运维人员发布修改版本运维人员收集证据,诊断,再次派发管理人员收集证据,诊断,派发任务开发人员诊断,最终评估客服中心验证应用问题,通知云维人员客户客户投诉客服中心“HELP!”被动式管理主动式管理解决问题发现问题运维人员检测问题?????????客户通过端到端的实时监控及时预警并定位性能问题应用性能管理的实施效果-满足各层面的管理需要业务主管客户满意度高用户感受好业务超过预期开发我不再陷入Debug,我可以专心编程我可以直接看到问题所在问题不是代码,是数据库我确信应用的性能满足生产要求我有数据重现问题的发生过程我可以给开发人员指出问题所在运维主管SLAs令人满意团队工作富有效率运维成本在控制范围客服人员我在客户投诉前发现问题我知道该把问题交给哪个部门解决我知道出了问题的是应用还是网络、或者后台系统性能测试国内部分企业成功案例分享客户名称管理范围华能国际实现整个IT系统的端到端监控管理,包括VMWare、服务器、数据库、中间件、网络设备、核心业务等。中铁物资实现整个业务系统的端到端监控管理,包括服务器、数据库、中间件、存储、网络设备、安全平台、核心业务等。胜利油田实现整个IT系统的端到端监控管理,包括服务器、数据库、中间件、网络设备、核心业务等。南方电网实现整个IT系统的端到端监控管理,包括服务器、数据库、中间件、网络设备、核心业务等。成功案例分享-华能国际华能国际基于CANimsoft解决方案建设整个信息监控与管理体系,包括端到端业务流程监控、IT基础架构监控系统、应用软件监控系统。监控范围包括:服务器:100多台,Windows、Linux、Unix数据库:Oracle、DB2、SQLServer、Sybase中间件:Weblogic、Websphere、Tomcat网络:广域网150台、局域网50台,Cisco业务应用:SAP、用户集中管控系统、统一登录系统等华能国际案例分享-综合运维系统架构设计某客户案例分享-满足针对业务的SLM和BSM华能国际案例分享-实现端到端的业务管理华能国际案例分享-实时监控业务的关键状态华能国际案例分享-网络管理视图和机房设备监控网络管理视图机房设备视图个性化管理视图……华能国际案例分享-提供统一的监控平台华能国际案例分享-实时监控系统的关键性能谢谢!