宕机,别只怪设备不好

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

保障系统的高可用性,其关键在于IT系统、应用流程、组织管理和业务发展之间的集成管理与平衡负载超额、变更未经测试、流程设置不合理、缺乏相关培训、遗忘操作规程……权威数据显示,在造成系统停机的原因中,软硬件故障只占20%的比例,而人为错误、系统架构和应用程序故障所占比重高达80%。IBM全球服务部大中华区金融事业服务总监余兆祥坦言,国内企业在实施IT系统时,很多时候道理是清楚的,但实施中因为过去既有的包袱让理想无法实现。CIO不是只告诉整个企业什么是高可用性(计算机系统的可用性是通过系统的可靠性和可维护性来度量的。工程上通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性),还有一个任务是怎么样把愿景用可实施的方式表达出来、落实下去。CIO有两个任务,一是要把不同层面的期望值弄清楚,二是用一套方法落实TSA(全面高可用性)。在当今这个高速发展的信息化时代,IT系统的可用性已逐渐成为企业把握市场机会的重要工具,过去银行买机器的投资非常大,要求的标准非常高,事实证明结果还是不尽如人意的。为什么不尽如人意呢?因为过去做项目在采购的行为上比较缺少从全面、整合的角度去思考问题,IT技术过去只是依靠某一个元件、一个CPU或者一个服务器,但这被证明并不能完全支持高可用性。也就是说,今天整个IT系统如果不能从各个环节去考虑,包括硬件、软件、网络、服务、运营去思考可用性的问题的话,常常会以偏概全、挂一漏万。余兆祥分析说,高可用性已经是老生常谈的话题。但IBM发现,其实董事长、银行行长、CIO想的可用性跟科技部负责人想的可用性,甚至包括运营老总想的可用性是不一样的。怎么样去用一套东西服务不同人的要求,这是首先要解决的问题。如何让高可用性落地呢?余兆祥认为,保障系统的高可用性,不但关系到IT系统的每个环节,而且需要在正确的战略目标指引下,建立完整的结构衡量体系和标准管理体系,其关键在于IT系统、应用流程、组织管理和业务发展之间的集成管理与平衡。从程序来看,第一步,必须得从咨询开始,就是要自建企业现在的IT环境以及TSA要达到的目标。第二步就是要建立ManagementProcesses(管理流程),一个IT的环境不能没有一个完整的、成熟的管理体系,全世界的经验告诉我们,所有硬件的投资,如果背后没有一个很好的ManagementProcesses,这个投资会事倍功半。第三步是建立OperationlProcesses(运营流程),很多企业有很好的硬件、软件以及完整的管理方法。但是真正的操作员在实施运营、每天做运营服务的时候,没有遵循一个标准的运营模式和守则,或者有了运营守则没有彻底地执行。第四步是建立IT的基础架构,包括硬件、软件、中间件。问题测试:你的企业IT需要高可用性吗?是否需要IT系统24×365地持续运行?是否迫切需要将IT系统的宕机风险降到最低,并能从系统中断状态下迅速恢复?是否需要全面完善系统架构,提高IT系统的安全性和可用性?是否需要优化系统管理架构,提升IT管理能力?是否需要改进系统运行管理框架,变被动服务为主动服务?是否需要从技术和管理两方面提高IT系统随需应变的能力?管理者是否错误地将系统高可用性看成产品质量问题的孤立事件,并期望依赖软硬件产品质量的提升来改进系统的可用性?是否缺乏明确的系统可用性目标?即使有,也是通过对软硬件系统的可用性指标简单叠加得到的,而非通过对业务的影响程度所设定?

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功