IT运维整体解决方案介绍•IT运维整体解决方案•经验总结IT运维体系使客户实现“三个放心”•提升信息化的效益。•降低信息化的风险。•支持领导宏观决策。•提升信息化科学管理水平信息主管领导放心•系统了解用户对服务的需求和规范了用户使用服务的行为。•提升IT服务质量和服务感知。业务用户放心•主动监控和预防信息故障发生。•提升信息中心工作人员的专业化水平和能力建设信息中心工作人员放心GartnerIT信息化管理过程成熟度模型被动管理事件发生/解决,控制台,故障记录,备份,拓扑,资产清单主动管理性能,变更,问题管理配置,可用性管理,自动化与工作调度服务管理支持能力计划,服务级别管理,持续性管理业务价值以业务作为衡量标准的紧密结合混乱缺少网管工具与手段,没有用户通知机制NSMITSMBSMIT安全运维——越复杂环境越需要简单管理手段•ITIL:以流程为中心的IT管理行业标准•ISO20000:ITIL的国际标准认证IT运维项目建设步骤IT运维项目建设步骤系统实施建设成果改进咨询理念培训相关人员访谈IT成熟度调查咨询报告参考咨询报告设计产品框架需求调研编写SRS,项目实施计划等文档实施验收评估建设成果ISO20000认证循环改进IT运维平台设计原则综合考虑到项目的成本、资源、执行时间以及流程的可操作性,建议采用以下流程设计的原则:•方便简捷–流程的制定必须简单易行,方便使用•急迫优先–尽量首先制定对业务和实际工作发展影响较大的管理流程和监控点•实用性–制定的流程具备可操作性•渐进性–在较长的时期内,在一个不断演进的环境中持续改进、逐步完善服务管控体系平台标准化、规范化-符合ITIL方法论,符合ISO20000认证标准业务部门知识库IT服务台配置库综合报表系统其它管理系统基础架构管理系统呼叫中心AppsAppsAppsAppsAppsAppsAppsAppsApps外包服务人员现场支持人员IT运维平台的设计管理领导CEO、COO、ServiceManager其他部门服务人员—角色与岗位定义按服务划分热线,一线,二线(专家)……按技能划分系统、应用、网络、安全、桌面……按职能划分技术人员、技术管理人员、项目管理人员、领导层、合同管理员、供应商、外包商……技能服务职能集团管理信息中心服务对象确定标准与客户交互方式呼叫中心电话请求事故服务请求知识库查询在电话中提供支持监控系统查找故障流程管理平台分派处理填报自服务台IT运维体系—各种事件的处理流程服务台事件管理问题管理变更管理发布管理配置管理服务请求网管事件设备故障应用软件业务系统故障。。。其他业务需求生成业务需求审批产品发布管理需求变更管理软件缺陷追踪软件测试管理NOCAMS项目进度管理服务台事件整合软件配置管理资产管理安全资产管理终端资产管理/AD补丁、软件分发终端设置变更终端事件终端远程协助预发布管理(打包)SOCTOC安全事件病毒防护网络漏洞网络堵塞网管事件分类处理问题控制主动问题管理安全事件关联过滤变更评审实施外包管理知识库安全问题处理变更安全策略IT运维平台主机监控资产管理子系统采购管理个人工作台综合监控应急管理安全管理服务管理IT运维统一访问门户ITSMPortal系统配置报表统一资产配置库(ICMDB)监控数据库流程支撑库流程管理子系统事故管理综合监控子系统网络设备监控链路监控服务监控环境监控应用监控自动发现拓扑管理告警管理桌面安全数据总线库存管理资产管理调拨管理合同管理文档管理调拨管理大修管理报废管理资产清理台帐管理卡片管理智能分析巡检管理服务请求问题管理变更管理知识库值班管理绩效管理SLA管理配置管理厂商管理报表管理流量分析流程管控呼叫中心受理请求创建工单处理工单分派工单监督工单关闭工单Portal总线访问门户Portal平台•个人工作台:个性定制个人主页。•综合监控:集成综合监控系统。•服务管理:集成流程平台。•应急管理:提供应急预案的管理。•安全管理:提供安全管理,用户远程对设备的管理。•系统配置:组织结构管理。•报表:在门户中展示相关报表。•单点登录:实现对资产子系统,监控子系统,流程子系统等的统一鉴权,避免多次登录和记忆许多系统的帐户和密码信息。个人工作台•根据角色配置不同的菜单•根据管理要求制定主页显示内容集中监控•集中展示系统所有故障信息•集中处理故障•集中监控系统•大屏幕•个人终端统一故障处理告警平台告警通知方式:手机短信电子邮件RTX即时通信平台告警页面弹出告警内容:告警来源、类型、级别、发生时间、接收时间、责任人、告警详细描述等告警处理方式:告警压缩;告警关联性分析;告警影响范围分析;告警定位;告警类型重定义;告警过滤;告警取消;转发工单(自动、手动)故障告警管理告警显示告警方式告警过滤告警关联性分析告警升级告警定位告警前转告警清除告警诊断预警安全管理•单点登录,安全鉴权,CA接入•提供快捷方式登录相关的业务系统和设备。一般事件管理流程接收记录分类确定优先级服务台人员用户网管KEDBCMDBPDB异常KDB审计SLM一线二线问题管理工单变更管理匹配回访关闭分析调查解决通知投诉咨询、请求、需求、投诉等故障申报流程热线一线二线(专家)客户INI-001申报事故INI-002记录INI-003提交INI-004受理处理INI-006退回INI-007受理INI-008INI-009升级处理INI-010INI-005分派受理INI-011INI-012处理申请变更回访INI-013INI-014确认提交知识INI-015关闭资源管理接口故障管理流程应急管理流程现场支持人员:第一时间响应故障第一时间处理故障第一时间上报故障易耗部件更换现场负责制多线协同作战集团支持人员:协助判断解决故障远程协助协调专家支持备品备件调用现场解决合同管理人员事件管理规则接口manager问题分析组CMDB事故单工单KEDB根本原因工作组已知错误事故管理变更管理KDB问题管理流程记录关联分类优先级分派调查解决变更请求关闭关闭通知升级变更管理•记录建立变更请求直接录入、事件管理模块产生、问题管理模块产生•评审、变更请求•分类和确定优先级•制定变更实施计划变更管理在规划、构建、测试•变更实施根据资源和其它情况确定实施日期,分配相应资源提供沟通、监视功能,并在必要时进行协调•评价和终止变更当变更完成后,问题、事件和配置元素应当自动或手动随之更新配置管理变更管理过程发布管理过程产生新配置项或引起配置项变化(CIs)配置管理计划配置项确认与命名配置控制:只有受权的和确认过的配置项才能被接受配置项状态评估配置确认与审核更新配置项配置管理数据库•计量IT资产和配置项、成本•有效对IT环境管理,快速评估故障对业务产生的影响•属性扩展方便•通过变更确保配置信息的更新和准确•追踪系统软硬件变化配置管理数据库服务影响能力管理财务管理可用性管理持续性管理访问、控制CMDB审计基线视图类别属性关系状态数据日志生命周期变更管理发布管理访问、控制自动发现监控告警识别监控映射网管CMDBSLM工作台自服务台访问监控巡检事故管理问题管理›方便其他流程直接调用、管理›配置关系管理›配置巡检配置管理数据库配置视图分类:关系类视图物理视图业务视图位置视图个体视图基本信息视图生命周期视图全日志视图个性配置视图服务水平管理优先级+时间•明确客户的业务需求及相应的IT服务需求;•确保以合理的成本提供约定的IT服务级别;•确保实际的IT服务级别达到约定的服务级别的要求;•改善客户关系和提高客户满意度。•丰富的通知方式:短信、窗口、RTX、邮件知识共享平台•记录:提供知识评论,收藏夹,点击排行等功能•检索:提供关键字检索,知识点检索,分类检索等,支持全文索引•运用:支持知识相关性匹配,自动按知识点收集和发布,支持专栏设置和展示,支持知识订阅•更新:记录知识更新历史日志,提供知识版本管理,支持版本对比和恢复•统计:提供知识分类统计,来源,点击率,使用率统计,提供知识价值分析•管理:对知识发表观点;将用户感兴趣的知识加入收藏夹;根据知识的浏览次数进行排行SKMSSKMDBSKMDB服务支持流程服务运营流程配置管理服务设计流程JMS/WebServiceJMS/WebService外部系统SKMDB知识知识知识知识知识评论检索收藏排行专栏匹配更新日志版本统计知识管理排班交接班手动排班自动排班有排班表方式无排班表方式值班日历值班报告(巡检)值班管理建议:•总部24小时值班•现场值班5*8第一时间处理故障•定期备份•日常巡检•机房管理任务计划管理•巡检任务•安全管理任务•维护任务•其他任务组织绩效管理IT资源绩效管理供应商绩效管理报表引擎SLM监控数据员工工单完成情况考核团队工单完成情况考核IT资源可用性评估IT资源故障统计供应商UC执行情况评估员工OLA执行情况评估团队OLA执行情况评估…………供应商资产故障率……………………业务流程数据CMDB绩效管理网络设备管理自动生成网络拓扑主动式网络管理设备性能监控事件收集及过滤阀值控制及告警性能分析实时性能监测快速故障定位与第三方系统集成支持网络中Cisco/H3C/华为/ZTE等多厂商的网络设备服务器管理性能监控:监控UNIX服务器、各类PC服务器的性能指标(CPU、内存、硬盘的使用率等),根据预先定义好的阀值进行报警,并且把性能数据存储到标准的数据库或者数据仓库中,以便对其进行数据分析;日志监控:日志文件的变化情况,可跟踪操作系统、数据库及用户应用系统的日志文件,根据日志中出现的特定信息进行报警或自动执行用户预定义的动作:进程监控:能够实时监控进程的运行情况,以及子进程、进程对CPU/内存的占用情况等等。监控方式Agent代理Telnet/SSH、SNMP支持Aix、Hp_unix、Solaris、Windows、Linux等数据库管理对数据库的可用性监控-Oracle、Sybase、Informix、DB2、SQLServer、MySQL等主流数据库能够监控数据库引擎的关键参数,例如:数据库文件系统监控数据库系统设计的文件存储空间表空间使用率;事物日志空间使用情况;数据库配置情况;数据库当前的各种锁资源情况;监控数据库进程的状态;进程所占内存空间等;在参数到达门限值时通过网管系统的事件管理机制发出警告,报告给数据库管理员,以便及时采取措施。JDBC/Agent双方式应用管理EMC/IBM/HP存储VeritasNetBackup、EMCLegatoNetWorker、HPOmniBack、IBMTSM备份软件Websphere、Weblogic、Tuxedo、CICS、MQ、JBOSS、Tomcat、IIS等系统服务管理对应用系统运行状况进行监控:SNMP、JDBC、XML系统的关键进程;应用系统的日志情况;应用系统的性能、告警信息;应用系统的响应时间情况。支持应用服务:http等web服务、IIS、DNS、FTP等LotusDomino、Exchange等群件系统。ERPMessagingInternetInfrastructureDatabaseE-Commerce桌面终端安全管理PC统计进程管理补丁管理远程桌面管理网络访问管理接入安全控制外设管理桌面设置管理DSMS桌面安全管理系统互联网访问日志文件访问日志预警管理桌面终端安全管理机房环境监控•机房动环管理温湿度监控空调、新风机柜温度漏水检测烟感UPS/输出电流V/市电输入电流电压视频监控门禁管理现场监控站RS485网络交换机视频系统子系统2配电系统空调系统RS485UPS系统漏水系统发电机组子系统1SNMP设备资产管理子系统资产管理子系统资产管理资产录入采购管理报废管理资产清理合同管理资产卡片设备管理设备管理大修管理调拨管理厂商管理文档管理设备台帐任务计划管理个人设备台帐管理接口智能分析,绩效低值易耗品管理经营财务维护实现资产的采购管理、入库管理、大