1应用监控系统技术方案2目录1应用监控系统现状与需求.......................................................................................................31.1应用监控系统现状......................................................................................................31.2应用监控系统需求......................................................................................................32应用监控系统方案...................................................................................................................43CompuwareAPM解决方案.....................................................................................................53.1方案组成......................................................................................................................53.2方案部署......................................................................................................................54附录:预期效果..........................................................................................................................64.1模拟交易监测..............................................................................................................64.2真实交易监控..............................................................................................................74.3故障诊断分析..............................................................................................................84.4业务服务管理............................................................................................................1031应用监控系统现状与需求1.1应用监控系统现状随着我行业务范围的不断扩大和业务量的持续增长,应用系统的数量也不断增长、系统规模逐步扩大。如何有效掌握系统运行状况、提前预防潜在风险、及时发现故障,已成为需要迫切解决的现实问题。因此,实现对生产系统的应用级监控,从应用层面尽早发现生产问题,是需要尽快实现的目标。1.2应用监控系统需求应用监控要实现从业务的视角审视所有的应用系统,真实了解应用运行过程中的状况,不但能够及时展现应用系统的运行情况、发现应用系统问题,而且能为运维人员及时采取措施解决问题提供支持。通过应用监控的部署和使用,可以提升IT的服务级别,达到提高我行对外服务质量和最终用户使用感受的目的。通过监控生产系统上应用的运行信息,实时展示应用的运行状态,提示运维人员重点关注内容,防范故障发生或者已发生故障的影响进一步扩大。及时、准确获取联机交易或者批量处理日志中的异常信息,通过对日志的分析提示运维人员关注系统异常情况,做到早发现早处理。通过交易探针(模拟交易或真实交易)的定时执行,做到主动(先于客户)发现系统异常,提前查找异常原因,避免异常情况升级从而导致生产事故,最终达到提升服务质量的目标。42应用监控系统方案Compuware公司建议应用监控管理系统,应该包括如下三方面内容:1、模拟交易监控。通过模拟用户的操作行为来达到检测应用系统可用性的目的。一般通过模拟应用系统的关键交易(如:网银用户登录)或典型交易(如:ATM查询余额)来实现。应用监控针对不同的应用系统预先录制交易脚本,通过定时调用的方式来执行这些交易脚本,并记录交易结果。应用监控通过分析交易结果,做到主动发现应用系统的异常,定位交易路径上出现故障的环节。模拟交易一般选取用户登录或查询类交易,同时要考虑交易路径的长度,做到有区别的选择。由于账务类交易涉及账务变动,交易完成后需要发起冲正交易,一般不适合作为模拟交易来使用。模拟交易的方式即适用于B/S结构的应用,也适用于C/S结构的应用,适用范围较广2、真实交易监控。通过网络旁路的方式来抓取生产系统上真实的交易包,经过分析交易路径上各个环节上的交易处理情况,做到主动发现异常。由于生产系统之间的关联关系复杂,一笔交易往往要通过几个系统的处理才能完成,因此,在交易路径的关键节点上部署真实交易监控,可以比较准确的定位出现故障的环节,帮助运维人员及时处理异常,避免对业务产生影响或把对业务的影响降到最低。真实交易监控除了能主动发现应用异常外,还可以将监控到交易量、交易分布等情况进行汇总统计,形成业务运行情况报告,作为运维工作的重要参考依据。目前,真实交易监控比较适用于采用B/S结构和HTTP协议通讯的应用,适用范围小于模拟交易监控。3、故障诊断及分析。针对应用系统性能较为突出,缺乏合适工具定位问题根源的具体现状,建议部署应用性能诊断工具。当问题产生时,可迅速定位问题,深入分析问题根源。帮助应用维护人员缩短问题排除时间。减少应用系统问题对公司客户和业务的影响。53CompuwareAPM解决方案3.1方案组成方案由CompuwareAPM解决方案中的SyntheticMonitoring、DC-RUM和dynaTrace三个模块组成,分别完成模拟交易监控、真实交易监控和应用性能故障诊断等工作。三个模块协同工作,由BSM业务服务管理作为管理运维界面。3.2方案部署方案部署,包括模拟交易监测、真实用户交易监测和故障诊断的部署。模拟交易监测部署时,首先安装模拟交易分发采集及展示服务器,之后安装模拟交易端软件,并将两者关联即可。真实交易监测的部署,包括三个部分,其中AMD负责接收交换机上镜像过来的Web服务器、中间件服务器、数据库的网络流量,而CAS和ADS与AMD相连通即可。故障诊断部分的安装,需要将Javaplugin安装至相应的Web服务器、Java应用服务器上,之后再安装故障诊断服务器即可。北京农商银行网银性能管理部署示意图各部分安装部署完成以后,将采集数据汇总至BSM系统。运维人员即可从BSM运维系统中,对个人网银和企业网银的模拟机真实交易性能情况进行统一查看,并随时生成各种图形化报表。64附录:预期效果根据北京农商银行的模拟交易监控、真实交易监控和故障诊断需求,本方案建议选择CompuwareAPM应用性能管理解决方案。4.1模拟交易监测1)协议(通讯报文)模式模拟交易;2)监控结果展现和分析;73)故障定位;4.2真实交易监控1)采集数据的多维度展现和分析;应用视角从应用层面展示服务质量及对用户的影响,具体包括:使用情况:各个应用使用的页面数量、业务流量、用户数量等性能状况:各个应用的应用性能、受影响的用户数,慢页面和交易的数量,页面加载或交易时间的长短可用性:各个页面是否存在错误,错误的种类及数量,TCP层面和HTTP层面的可用性指标。84.3故障诊断分析端到端交易分析采用PurePath专利技术提供真正分布式,端到端的交易跟踪,可以跨越WEB/WebServer/Java/.Net/C/CICS边界,同时会记录和捕捉上下文环境,例如用户会话信息、方法参数、返回值,日志消息,异常详细信息等。采用可视化的技术快速定位性能瓶颈。端到端交易分析数据库使用分析9分析执行时间长的SQL语句以及语句执行的上下文和相应的业务交易。数据库SQL使用分析线程问题分析通过线程转储快速发现和定位多线程问题,线程死锁,和因资源竞争造成的线程挂起。线程分析内存问题诊断可视化显示应用的内存使用情况,确定应用每一层内存的内存需求。10内存使用分析.4.4业务服务管理业务服务管理将模拟交易监控、真实交易监控和故障诊断进行了有机整合,成为日常运维管理的主要界面。运维视图(Operations)提供:当前详细的系统状态(包括问题事件,性能数据)问题根源分析(Root-cause)业务影响等相关视图。11