XXXXX系统-故障报告单故障发现人通知时间2010-8-1008:45故障受理人故障处理人起始时间08:45终止时间10:10持续时长两个小时地点故障所属系统故障等级严重故障现象系统web服务down机,导致整个系统无法应用故障影响范围公司所有应用人员故障原因分析8月10号上午,XXXXXX系统TOMCAT的服务DOWN机,通过后台监控发现该DOWN机主要原因是由于最新上线的XXX模块的工单处理查询操作导致,由于界面查询提取SQL语句编写不够规范,导致每次该工单的应用占用耗费很大资源,被同时多次使用后,资源被耗尽导致整个WEB服务DOWN机。处理结果1、优化该界面应用的查询SQL语句。经验总结1、加强测试,上线前使用第三方压力测试软件进行压力测试,经监控后没有BUG问题方可进行上线;2、必须严格要求上线前业务部门务必在测试机器上进行测试使用确认后方可上线;3、增加数据库所有表数据量的增长记录情况,每月提取一次,进行每月定期,根据实际生产情况提出优化方案(如有必要),增加系统自动监控脚本操作,对系统运行进行监控,如有负载超过2以上的需要保留其数据库后台运行SQL记录及访问界面功能菜单记录;4、规范上线时间,每周定时上线,上线前必须确保版本管理,务必记录好每次上线的具体功能代码,确保有故障发生时能迅速定位。责任分析该故障为XXXX公司责任。备注填报人:填写时间:20102年08月14日