互联网+智慧运维管理平台建设方案互联网+智慧运维管理平台建设方案议程1行业趋势分析2技术能力提升规划3成功案例分享-中行2互联网+智慧运维管理平台建设方案未来信息化技术的发展趋势3大数据移动互联与社交工具云计算与物联网行业趋势近年来,云计算和物联网将深刻改变基础设施的建设方式,也是当前大型企业、互联网的IT建设正在考虑和投入的重要领域对运维带来的变化云计算将传统的运维模式逐步过渡到集中化、服务化、自动化和远程化的服务交付模式物联网实现了对设备的智能化管控,通过和配置集成,实现对设备资源管控的自动化、智能化和集约化未来5~8年,云计算、大数据、移动互联、物联网和社交工具等将引领信息化技术发展的趋势。随着这些技术的广泛、深入和成熟应用,将对IT基础架构带来巨大变革,同时也改变了运维管理的工作内容、工作模式。技术趋势行业趋势互联网式的交互方式改变了传统人与人的交互方式,并进一步蔓延到企业及运维领域,也对运维工作产生了新的影响对运维带来的变化移动互联实质上扩展了运维的外延,实现任何地方、任何时间均可开展运维工作社交工具则改变了运维团队的指挥与互动体系,改变了技术人员之间、技术人员与用户之间的交互方式,使得技术支持对用户而言变得更为亲切,效率也更高行业趋势云计算、物联网、移动互联网等新兴计算形态,既是产生大数据的地方,也是需要大数据分析方法的领域;在未来一段时间内,大数据将成为企业、社会和国家层面重要的战略资源对运维带来的变化传统运维强调电子化、自动化,而大数据的应用则赋予运维管理一个新的方向,即洞察力,通过大数据分析获取更多有价值的信息,引领有限的资源投入到更有价值的业务领域互联网+智慧运维管理平台建设方案信息部门运维支撑的发展模式4移动互联与社交网络故障管理发布变更监控管理日常作业服务请求服务请求…离散雏形阶段项目2项目3项目1机房环境与网络多活和混合云环境数据集中处理应用中心生产中心:•客户服务与运行•应用维护和监控•系统与平台软件•网络与安全管理•机房环境与设备灾备中心:•系统与平台软件•网络与安全管理•机房环境与设备故障管理发布变更监控管理日常作业服务请求服务请求…统一运行监控大数据支撑下服务管理中心统一资源管理云外网核心节点•开发•应用维护•系统维护•开发•应用维护•系统维护•开发•应用维护•系统维护•内网核心节点的建设往往就地取材,没有规划,专业性不强;•IT组织以建设任务为导向,常常随IT项目建设边使用变改造;•运维专业化程度处于较低的水平,缺乏专门的管理目标和管理手段缺乏规划,分割管理、摸索建设•数据集中存储、处理,应用和业务集中化;•外网核心节点建设依托有效规划,更加现代化,大规模外网核心节点引入“两地三中心”模式•引入运维流程框架,通过流程实现跨部门的运维任务在各个专业部门之间的贯穿和协同整体规划,专业运维•外网核心节点在逻辑上成为一个整体,要求运维组织不再按照专业领域进行部门划分,而是按照物理/逻辑进行部门设置划分•外网核心节点“高可用性”有了基础级保障,运行维护工作核心开始围绕服务和资源的合理提供、监管和调度。应用与基础设施松耦合,资源服务化中国真正意义上集中式、大规模的外网核心节点,源于2000年开始的数据集中工程,已从银行业延伸到证券、保险、电力、电信、石油等行业。经过十多年的发展,已从建设离散雏形发展到数据集中处理应用中心,并逐步走向多活和混合云环境阶段随着自动化、云计算、物联网和大数据、移动互联等新技术逐渐推进,另一条主线是从依赖于员工技能建设,逐渐向运维一体化、操作规范化、进而往自动化发展、最终向智能化演进物联网支撑下的无人值守机房机房-IV机房-III机房-II机房-I互联网+智慧运维管理平台建设方案云计算带来的基础架构变化5混合云交付应用环境基础架构层具备软件定义能力与应用脱钩标准化、满配云资源调度层异构资源服务封装软件定义资源调度和容量管理软件应用层统一应用基础平台软件定义应用交付逐步形成PaaS服务能力OLAPMobileOA01011010OLTP资源服务资源服务应用开发平台、应用运行基础平台资源API资源API资源API资源API云平台软件定义(资源与服务、应用脱钩;按需配置组装交付)基础架构服务企业应用系统基础架构VM企业混合云尽管不能照搬互联网的方案,但是IT部门在整合自身现有的传统异构、复杂的基础架构环境的基础上,需要进一步提升软件定义应用环境交付能力,通过统一基础平台,封装统一的IT组件,面向传统架构、大规模虚拟架构和互联网架构提供支持。传统架构大规模虚拟架构互联网架构互联网+智慧运维管理平台建设方案物联网带来运维范畴的延伸和方式的变化6运维方式的改变物联网物联网的应用将物理基础设施和IT基础设施整合为一,通过一系列的信息交换技术和传感设备,将任何物体和互联网、IT连接起来,以实现对机房和服务器设备的智能化识别、定位、跟踪、监控和管理,对运维范畴和运维工作方式带来了较大变化运维范畴延伸:物联网是在互联网基础上延伸和扩展的网络,通过信息交换和通信技术及设备,把机房和服务器设备与互联网相连接,反过来推动了运维范畴的延伸设备智能管理:通过与配置管理集成,通过信息传感技术获取物理设备的信息,实现远端物理设备的智能与快速处理自动反应处理:能够根据温湿度检测结果来自动调整精密空调的送风情况,实现部分运维工作的自动化互联网+智慧运维管理平台建设方案云计算与物联网支撑下的新型机房7无人值守机房以视频监控为主,辅以动力环境监测、综合报警处理和门禁控制信息等。采用先进的图像识别技术,能够对各机房的电路短/断、环境参量、现场状况进行监控和报警,能够实时、直接地了解和掌握各个机房的情况,及时对发生的事件做出反应。资源云化面向云计算和虚拟化,采用“分割”资源方式,将服务器、存储、网络设备等资源进行虚拟化,以便用户调用所需的计算资源、网络资源、存储资源、数据库资源等。自动化运维采用基于流程化框架的技术工具,将事件与IT流程相关联,检测事件后可自动启动故障响应和恢复机制。自动化运维还可帮助IT运维人员完成日常的重复性工作,提高IT运维效率。同时,自动化运维还要能够预测故障、在故障发生前进行报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。远程监控与操作包括“监”和“控”两部分,“监”主要是通过网络获得信息为主要手段来实现对环境和计算机系统的监视;而“控”是指通过网络对远程计算机系统进行操作的方法。新型机房特征云计算与物联网的结合,使得未来计算资源的交付方式转向集中化、自动化和远程化,传统的IT资源将向虚拟化、动态化过渡,同时通过机房远程维护和无人值守等技术,让运维资源更加集约化,运维成本更加经济化互联网+智慧运维管理平台建设方案案例解读8集中运维国内大型企业集中运维国际大型企业集中运维中国人保•用户背景:2019年开始推动全国大集中,在广东佛山建立南中心、背景成立了生控中心,全国40多个分公司原IT技术人员通过远程方式承担对本省应用系统的维护职责;目前整体运行模式还在调整优化过程中,但运维工作已经走上正轨。IBM(美国)集中运维模式在国外已有十多年的成功应用经验,国内大型企业也在数年前开始应用这一模式并取得一定成绩,随着云计算、大数据、物联网、移动运维等技术的深入应用,大集中运维模式已经成为未来运维发展的趋势•运行模式:南中心目前承担机房设施、基础架构硬件设施的维护工作;北京生控中心负责虚拟化和操作系统以上到应用平台等各个逻辑层面的日常维护工作,以及运维管理平台的建设和维护,加上部分提供全局服务应用系统(统一门户)的维护;分公司负责本地业务系统的应用逻辑和数据部分的维护。•用户背景:2019年把全球对内服务的105个外网核心节点整合为北美、欧洲和中东、亚太、日本等4个区域中心。其中北美由原来60多个外网核心节点整合为5个外网核心节点,由分布在全美10多个城市的原有的IT队伍进行维护。•运行模式:5个外网核心节点各有一个本地运维团队,负责机房设施和基础架构硬件的维护和日常工作,其他十几个城市中的技术人员组织为网络、服务器与存储、平台软件、应用系统和总工等5个团队,其中,总工团队负责重大故障的端到端诊断、变更审核和技术架构规范、架构审核等工作。互联网+智慧运维管理平台建设方案移动互联对运维方式带来的变化9日常操作与物联网结合,将整个机房的巡检、设备入库、设备盘点等通过移动终端、物联网与配置管理联动的方式来实现自动化,并简化信息采集与维护步骤信息推送移动互联是大数据的延伸终端,能够将大数据挖掘的有价值信息通过热点推送的方式,来及时、简洁的推动到有消费需求的用户手上移动运维实现运维流程环节下移到移动终端,如通过手机、平板电脑实现流程环节的审批和监控信息的浏览,将技术和管理人员从办公座位上解放出来,实现任何地方、任何时间办公移动互联是一种通过智能移动终端,采用移动无线通信方式获取业务和服务的新兴业务,用户可随时随地乃至在移动过程中都能方便地从互联网获取信息和服务移动互联互联网+智慧运维管理平台建设方案社交工具对用户体验带来的变化10社交工具的快速发展对人际交互的方式和沟通成本产生了巨大的影响,改变了以往或效率低下(邮件)、或单点沟通(电话)的交互模式,使得信息交互能够在更多人之间、更加通畅的进行;同时作为移动互联的外延手段,进一步促进运维工作模式的变化社交工具移动互联的外延社交工具作为移动互联外延的一个手段,增加了用户提交请求、技术人员相应请求的方式和选择,进一步促进了“在任何点点、任何时间均可办公”的运维模式面向人际沟通对外部用户而言,良好的社交工具有助于服务请求的快速响应和及时处理、跟踪,并且互联网式的沟通方式也拉进了用户和技术人员的距离,提升了用户体验对内部而言,良好的社交工具则能够促进技术人员之间的沟通交流,有助于问题的解决和知识的有效积累面向多用户支持面向多用户发生同类问题时,良好的社交工具可以实现一对多、同时段的技术支持和服务交付,对技术人员来说解决了多个用户并发请求支持的情况,对用户而言则加快了技术响应时间互联网+智慧运维管理平台建设方案大数据分析对运维决策带来的变化11面向决策分析的大数据技术大数据分析大数据分析是指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到存取、管理、处理、并整理成为帮助企业机构管理、经营决策更积极有效的资讯,而产生的数据分析技术。大数据对运维管理产生的影响大数据的特点:Volume:大数据量Velocity:数据产生速度Variety:数据多样性Value:数据价值大数据在运维管理中的应用更完整的数据分析—对全部数据而非样本的分析,提升运维洞察力更早的预防预测—在有迹象时而不是发生故障时,提升业务可用性更及时的运维处理—随时反馈,及时准确,快速响应,提升运维保障能力更有效的人际交流—可以通过社交网络提升技术人员与用户、技术人员之间的交互体验,使得沟通更加灵活、便捷决策分析商业智能和预测分析风险分析决策管理内容分析大数据分析预测分析分析整合与治理内容分析决策管理社交媒体分析互联网+智慧运维管理平台建设方案新技术趋势下的一体化运营理念12运维洞察力云计算、物联网下基础设施服务驱动在“混合云”环境下,不仅软硬件资源供应服务化,运维工作也开始服务化,成为云服务的一部分。同时,移动互联和社交网络将互联网方式带入到企业网中,推动和提升了服务体验。所以,新环境下服务取代了流程,成为日常工作的驱动模式。以大数据为依托,在考虑管理的“程度、广度、粒度、深度”前提下,对系统、运维、人和成本进行合理、高效、全面的管理,从而达到真正的“一体化运营管理”,有效提升运维管理的“洞察力”。云计算、物联网技术下的基础设施是一种新型架构的技术基础,相比传统基础设施提供了更多虚拟化、自动化、动态化和远程化的管理能力,进一步拓展的基础架构和运维的外延,并逐步过渡到“智能化”运维核心理念云计算、大数据等新技术不仅从技术上带来了全新的变化,从管理上也带来很多新的要素。以云计算、物联网下新型基础设施为基础