自动化运维管理解决方案 白皮书

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

自动化运维管理解决方案2/17目录1IT运维管理面临挑战................................................................................................32应运而生的自动化解决方案.....................................................................................53自动化应用场景.........................................................................................................73.1灾备切换自动化.................................................................................................73.2故障现场快照.....................................................................................................83.3批量设备操作处理.............................................................................................83.4周期性作业调度.................................................................................................93.5应急处理流程.....................................................................................................93.6重要配置备份、基线比对...............................................................................104产品简介...................................................................................................................124.1运维脚本集中管理...........................................................................................124.2可视化流程配置引擎.......................................................................................124.3作业流程人工干预...........................................................................................134.4作业执行验证/持续监控.................................................................................134.5作业操作手册自动生成...................................................................................134.6作业执行结果展现...........................................................................................144.7配置备份/基线库管理.....................................................................................145产品优势...................................................................................................................166运行环境...................................................................................................................173/171IT运维管理面临挑战随着企业IT服务多样化发展,IT应用的规模也越来越庞大、IT应用的结构也越来越复杂。随着不断变化的IT应用,需要越来越合理的模式,来保障IT服务能灵活便捷、安全稳定地持续保障,这种模式的保障因素就是IT运维管理。据国外某咨询机构2013年调研结果显示,在IT费用中大约有1/2用于系统运营期的运维管理工作。24%31%45%IT运营费用比例新系统开发维护开发运维管理即使当前企业在IT运维管理方面投入大量时间及费用,但是在IT运维管理方面仍存在诸多问题。主要表现为:运维管理效率低、人工成本高:经验未沉淀为实际运维工作,经验利用率、推广率低;分散于各服务器上的运维脚本,存在管理风险,且耗费大量管理成本;日常操作消耗大量人力资源,误操作风险较大,操作执行效率低;4/17操作过程可控度低,运维风险大:操作与执行方案匹配度无法保证,实际操作过程可控度较低;日常操作对人员水平要求高,人力资源风险大;运维操作透明度低:实际操作不便于监督,存在“黑盒”操作风险;日常工作与实际操作无法有效关联,不利于日后审计;5/172应运而生的自动化解决方案面对IT运维管理中的诸多问题,单靠人工已经无法满足在技术、业务等方面的要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本的因素越来越被人们所重视。其中,IT运维自动化是指将IT运维中日常的、大量的重复性工作自动化,把过去的手工执行转为自动化操作。自动化是IT运维工作的升华,IT运维自动化不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。IT运维自动化从诞生发展至今,其重要属性之一已经不仅仅只是代替人工操作,更重要的是深层探知和全局分析,关注的是在当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维的影响,已经不仅仅是人与设备之间的关系,已经发展到了面向客户服务驱动IT运维决策的层面。融海咨询借鉴IT运维自动化发展趋势,结合多年IT服务经验中对用户需求的把控,自行研发自动化解决方案。自动化方案概述:通过自动化手段,实现IT运维管理操作的自动化调度、“一键式”处理;通过异常处理的支持,对操作的结果进行验证,并持续监控作业执行结果;通过时间约束条件,对按照时间计划执行的运维作业进行管理;通过复杂的关系运算条件,处理复杂的作业流程的关系;通过UserTasks人工接口,方便运维人员对作业调度流程的参与;通过图形化的工作流定制平台,实现对业务活动进行整体规划;通过与其它平台的集成,实现了与报警、监控等运维系统的一体化管理。从而实现功能强大、简单易用、安全可靠的作业调度自动化。通过自动化解决方案,推动了企业IT运维管理操作的指令化、标准化、流程化进程。自动化建设目标:6/177/173自动化应用场景3.1灾备切换自动化随着IT设备数量持续增加,IT系统日益复杂,依靠手动方式进行系统灾备切换的传统模式遇到了一定瓶颈,主要表现:操作效率低:RTO(RecoveryTimeObjective,复原时间目标)无法保证;操作风险大:系统复杂度日益增高,操作复杂度也随之增强,操作失误的几率也随之增高;过分依赖个人水平:在尽短的时间内完成整个切换流程,对操作员本人的技能水平、操作规程熟悉程度、环境熟悉程度有着非常高的要求。操作过程不透明:灾备切换有相应的操作规程,但是切换过程中,每个环节执行状态、当前执行环节情况只有操作员本人了解,旁人无从知晓。通过对灾备切换流程进行标准化配置,实现灾备切换管理的配置可视化、执行可视化、过程可视化、规程可视化。配置可视化:提供类似Visio配置方式,每个操作环节配置成为一个节点,然后通过拖拽、连线的方式配置整个切换流程,避免了代码编写工作,降低了系统使用门槛,增加了系统易用性;执行可视化:提供图形界面方式,灾备切换流程无需通过繁琐命令行方式执行,管理员仅需在图形界面中选择相应流程并点击执行即可,执行前还可以在界面进行多人确认;过程可视化:提供操作流程视图,所有人员在流程图中可以清晰了解灾备切换整体流程情况、当前执行环节,以及每个节点执行状态,为保证不同使用习惯,执行过程提供流程视图、树状视图两种展现形态;规程可视化:提供自动生成操作规程文档功能,管理员配置完某自动化流程时,系统能够自动生成该流程的操作规程文档,系统使用人员可以根据文档清晰了解到本自动化流程完整信息。8/173.2故障现场快照传统IT监控系统在故障发生时能及时告警,但是运维人员、厂商、开发商仅仅获得一条告警信息,无法从监控平台获取更多的信息完成故障分析及预防。通过监控/监控集成、作业调度双重技术手段,在故障发生时,对故障现场的本机环境、跨服务器/跨设备环境进行全方位捕捉,对故障现场进行最大程度的保留,协助管理员、厂商、开发商进行事故后的详细分析,并设定相应预案。通过故障现场快照,可以完成:1、故障现场全方位场景获取,获取内容可以根据不同角色需求灵活定制;2、故障发生时系统自行完成场景捕获、保存,并将其分发给不同的角色进行联合“会诊”;3、根据预案内,通过定制化纳入到中,实现故障发生前的预警,并且提供及时处理,避免故障再次发生。3.3批量设备操作处理随着IT规模不断扩大,IT设备数量不断增多,原有简单的运维操作,也随之成倍增长,即增加了运维工作量,又使重复性操作过程中,由于人员注意力降低导致的操作失误次数成倍增长。例如:对设备批量程序更新、批量巡检等、批量密码修改等大批量、重复性操作。提供批量作业并行处理平台,实现多设备同时批处理操作。通过自动化流程把,将简单的操作在大批量设备上操作,并对作业执行过程进行监控对执行结果进行检查。通过部署批量设备操作流程:1、批量设备并发执行,缩短批量操作执行时间,提高执行效率,并且提高系统升级一致性;9/172、减少批量操作过程中,由于实施过程中因操作人员操作疲劳、注意力降低导致的误操作,从而减少人工失误导致的生产系统故障;3、提高IT运维自动化水平,减少人工投入,降低运营成本;3.4周期性作业调度随着IT应用系统不断上线,运维中周期性、重复性操作逐渐增多。此类操作即占用了运维人员大量日常工作时间,又存在人工误操作的风险。并且对于复杂作业流程,还需要运维人员有较高的技术水平及较高的系统熟练度,由此增加了因人员、岗位变动导致的而操作意外发生几率。例如:可以对每日巡检、日终批量操作、事务数据收集、月结批处理、年结批处理等作业执行的自动化。提供统一应用运行操控平台,实现跨平台、跨作业段、跨设备的作业协同调度操作。平台将周期性、重复性批处理作业,以及庞大复杂的作业流程,固化为自动化作业流程,通过时间调度引擎,按照既定时间规则,在指定时间点进行调度。从而实现作业的周期性自动化调度,运维人员仅需查看相应的作业执行过程、执行成功与否、执行结果报告(截图、操作命令输出结果等操作结果信息)。通过自动化流程把成百上千的批处理作业组织起来,规范跑批作业,对作业执行过程进行监控对执行结果进行检查。通过周期性作业调度自动化:1、降低了关键岗位的技能要求:

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功