虚拟平台运维服务-2014.8.27

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

虚拟化平台运维服务神州数码系统集成服务有限公司第1页虚拟化平台代维服务作为中国专业的IT服务商,神州数码专业服务部能够为用户提供高质量的虚拟化平台代维服务。一、服务内容虚拟化平台日常维护工作主要可分为平台自身软硬件系统维护、承载业务系统底层维护、业务系统承接和资源配置工作三部分,主要服务内容如下:1.虚拟化平台集群虚拟机资源初步新建、开通、数据配置、修改;2.虚拟化平台内部服务器、存储设备日常业务核查、配置、修改;3.业务系统虚拟化需求初审,核查资源需求合规性和当前资源满足程度;4.完成虚拟化平台所有软硬件版本的升级,包括虚拟化平台vSphere版本、vCenter、ESXi、View版本升级以及硬件版本升级。5.虚拟化平台涉及的光纤存储设备的日常维护;6.提供后期虚拟化平台的扩建支持,包括方案设计、项目实施、项目维护等;7.提供多方面的安全配置策略以保证虚拟化平台安全,包括OS安全策略、访问控制策略、防火墙策略等。8.为业务部门提供技术支持服务,包括方案设计、客户技术交流等。9.配合完成虚拟化平台自身和承载业务系统的网络安全漏洞扫描、基线核查和攻击检测,配合业务部门完成系统加固和整改;10.提供负载均衡、备份、容灾业务方案设计、开通、维护工作;11.虚拟化平台自身和承载的业务系统的日常问题和故障响应、排查、调测;12.完成周期性作业计划,虚拟化平台软硬件日常维护、监控、巡检、告警梳理,做好故障和资源预警工作;13.虚拟化平台日常运行信息收集汇总,周报,双周报、月报和性能分析半年报等日常报表的数据提取和初步整理;虚拟化平台运维服务神州数码系统集成服务有限公司第2页二、代维服务详细内容1.虚拟化平台自身软硬件系统维护1)日常维护内容维护项目维护内容周期网络日常例行维护网络状态检查每日告警检查每日性能事件监视每日协助工单的处理每日查询日志记录每日各出口链路和电路状态检查每日主机存储设备日常例行维护以低级别用户身份登录网管每日电路状态检查每日告警检查每日性能事件监视每日登录管理中心检查状态每日查询日志记录每日检查存储硬盘状态每日检查主机状态每日协助工单的处理每日虚拟化软件日常例行维护查看管理软件状态每日查看集群日志每日查看操作事件每日查看严重告警每日查看致命告警每日查看业务系统告警每日查看管理数据库告警每日查看管理数据库备份每日查看虚拟机告警每日查看虚拟资源使用告警每日协助工单告警的处理每日查看机柜运行环境及监控系统检查每日虚拟化平台运维服务神州数码系统集成服务有限公司第3页2)周期性维护内容维护项目维护内容周期网络周期性例行维护设备声音告警检查每月机柜指示灯观察每月电路板指示灯观察每月设备温度检查每月设备例行检查每月风扇检查和定期清理每月时间检查和校验每月倒换配置检查每月交换机及接入网数据规范性检查每月出入口数据校验每月启动、关闭网管系统检查每月定期更改网管用户的登录口令每月专业的维护报告以及维护建议每月网管计算机维护每月设备配置的备份与转储每月主机设备周期性例行维护主机周期维护每月机柜指示灯观察每月电路板指示灯观察每月设备温度检查每月风扇检查和定期清理每月业务检查1个月启动、关闭网管系统检查1个月定期更改用户的登录口令1个月数据库的备份与转储1个月设备声音告警检查1个月虚拟化软件周期性例行维护集群周期维护每月主机软件版本校验每月过滤操作事件每月过滤每月严重告警每月过滤每月致命告警每月过滤每月业务系统告警每月过滤每月管理数据库告警每月过滤每月虚拟资源使用告警每月定期更改用户的登录口令1个月管理数据库的备份与转储1个月虚拟化主机每月维护1个月虚拟化平台运维服务神州数码系统集成服务有限公司第4页3)突发性维护服务维护项目维护内容周期突发性维护业务中断按需设备倒换失败按需设备硬件故障按需设备掉电按需网络硬件故障按需外部环境因素按需设备软件故障按需集群故障按需电源故障按需4)不间断故障处理出现故障问题后,运维方工程师在到达机房后,立刻开始进行不间断服务直至系统恢复正常运行,同时运维方工程师必须得到用户方确认后方可离开。5)故障分析报告运维方在系统恢复正常运行后,会对系统运行情况进行跟踪,并结合故障现场信息对故障产生原因进行分析,在规定时间(24小时内)提交故障分析报告。6)补丁安装和软件版本升级运维方根据原厂商发布的系统软件版本和补丁升级程序,并结合客户的需求和实际情况,为客户提供系统软件版本和补丁测试,实施现场软件版本和补丁的升级服务以及固件微码升级。原厂补丁版本包括新的功能和特征,对已发现问题的修正及对新硬件平台的支持。运维方会及时获取最新的软件使用说明,修补软件和维护版。运维方若对用户方的软硬件系统进行补丁安装或软件版本升级,实施工作完虚拟化平台运维服务神州数码系统集成服务有限公司第5页成后对更新的系统进行系统测试和跟踪。运维方对于用户方提供补丁安装或软件版本升级的服务具体内容包括但不局限于以下方面:(1)运维方工程师向用户方提交补丁安装或软硬件版本升级实施方案,明确实施过程、实施时间、实施中可能出现的问题、风险和应对措施、升级失败后的回退方案等;(2)运维方工程师提前向用户方提出补丁安装或软件版本升级过程中需要用户方进行配合的工作及要求;(3)运维方工程师在安装或升级完成后,进行安装或升级后的标准测试;(4)运维方工程师在安装或升级完成后,在3日内配合用户方进行全系统测试;(5)运维方工程师在安装或升级实施完成24小时后对本次实施的主机系统进行一次跟踪检查,确认实施成功,并在3个工作日内提供本次服务的实施报告和测试报告。7)回退机制制定在对用户方软件版本或补丁测试/升级前,运维方需同用户方共同协商制订补丁安装及版本升级服务实施的方案(包括对系统回退可能性的评估)。同时运维方将严格按照双方批准的实施方案进行补丁安装及版本升级的实施。在安装或升级过程中,系统允许回退的前提下,若用户方根据业务时限要求或系统运行情况,提出中止安装或升级过程,要求实施回退方案,工程师可以实现系统安全回退。2.虚拟化平台承载业务系统底层维护1)日常维护内容维护项目维护内容周期虚拟化平台运维服务神州数码系统集成服务有限公司第6页业务系统日常例行维护查看虚拟化管理软件状态每日查看集群日志每日查看操作事件每日查看严重告警每日查看致命告警每日查看业务系统告警每日查看管理数据库告警每日查看管理数据库备份每日查看虚拟机告警每日查看虚拟资源使用告警每日协助工单告警的处理每日查看业务系统网络服务状态每日2)常规故障和问题响应对虚拟化平台承载业务系统的常规故障和问题及时响应,在规定时间内排查、解决,并反馈整改建议和方案。3.业务系统云化承接和资源配置维护工作主要包括:日常例行维护、周期性例行维护、突发性维护和其他维护等4项内容。1)资源申请预审按照用户方安排,对虚拟化平台业务系统资源申请进行初审,核查需求合规性和当前资源满足程度并反馈评估意见。单个业务系统普通需求(10台以下虚拟机):收到工单后2小时内完成初次反馈;虚拟化平台运维服务神州数码系统集成服务有限公司第7页单个业务系统复杂需求(10台以上虚拟机或存在特殊需求):收到工单后4小时内完成初次反馈。2)计算资源配置按照用户安排,对虚拟化平台集群完成申请虚拟机资源核查、开通、数据配置、修改等任务。单个业务系统普通需求(10台以下虚拟机):2小时内完成;单个业务系统复杂需求(10台以上虚拟机或存在特殊配置项):4小时内完成。3)安全相关配置按照用户方安排,对虚拟化平台业务系统安全接入申请核查需求合规性,配合用户方完成安全接入任务并及时反馈。配合完成虚拟化平台自身和承载业务系统的网络安全漏洞扫描、基线核查和攻击检测,督促和检查业务部门完成系统加固和整改。单个业务系统安全接入需求:收到工单后2小时内审核提交至安全部门。4)虚拟化技术培训针对用户方相关人员,提供定期的虚拟化平台相关的技术培训。5)技术咨询运维方需要积极配合推广虚拟化平台,根据具体情况,对所提的疑问,由运维方的支撑团队提供专业的技术咨询服务。运维方需要耐心接听用户方的技术咨询电话,解答在技术上的疑难问题,必要时需到客户现场,协助解决相关技术问题,为推广虚拟化平台打好基础。虚拟化平台运维服务神州数码系统集成服务有限公司第8页6)需求分析对业务需求进行调研和分析,帮助理清思路,结合虚拟化平台现有资源情况,给出合理的建议,并提供初步的可行性方案。7)方案设计根据客户的需求及可行性方案,撰写详细的方案设计,包括各种P2V方案设计、系统维护方案设计、安全方案设计、存储方案设计、备份方案设计、迁移方案设计、网络方案设计、以及容灾方案设计等。在此基础上提出更长远的技术发展规划,既考虑现阶段的资源使用适配,也考虑未来的应用增长需求。8)现场交流针对客户的一些复杂需求和方案,运维方必须和用户方一起和客户进行现场交流,反复沟通,直到最终确定客户满意的解决方案。9)环境测试在确定方案之后,要进行方案的验证测试工作,必要时在虚拟化平台上搭建相应的测试环境进行测试,测试完成通过后才能进入试运行阶段。10)用户方要求的其他工作配合用户方完成相关产品及方案宣传资料的撰写、产品/系统演示等工作,以及用户方要求的其他售前工作。虚拟化平台运维服务神州数码系统集成服务有限公司第9页4.其他代维工作1)技术咨询服务在遇到代维人员难以解决的问题时,由运维方的支撑团队提供技术咨询。一般情况下,可以通过电话指导解决问题,必要时可以通过远程工具解决问题。2)故障处理服务要求运维方具备7*24小时的现场支持服务能力,并立即提供现场支持服务。若用户方设备遇到故障,运维方工程师将在故障级别规定的时间内抵达客户故障现场,并协助原厂商认证的服务工程师进行紧急现场支持。当故障解决后,运维方工程师必须需要得到用户方确认后方可离开现场。1)故障处理运维方提供现场软、硬件故障定位和处理服务。相关服务标准参照紧急故障服务标准执行。对于由硬件问题引起的故障,运维方及时上报用户方并第一时间联系设备供应商予以解决。2)配合用户方进行系统故障定位一旦当用户方出现与主机系统相关但难以准确定位故障原因的系统问题时,为了保证故障得到及时、准确的定位和处理,运维方工程师将根据用户方的合理安排到达现场提供技术支持服务和配合用户方和其他相关厂商工程师对故障进行分析定位并及时解决。3)配合用户方对系统进行优化实施根据主机系统的运行情况,按照用户方的优化实施安排,运维方将提供现场技术支持服务,同时配合用户方和其他相关厂商工程师对系统参数和运行情况进行分析,提出改进方案并协助用户方进行调整。虚拟化平台运维服务神州数码系统集成服务有限公司第10页3)建立系统维护档案在代维期间,为所服务范围内的主机系统、存储系统等建立代维服务档案。工程师现场对每台设备进行详细得配置检查,做出保修设备的《详细配置清单》。如果以后对主机、网络、存储或软件系统参数调整后,都由工程师填写系统设置和调整报告,同时所有的变更将按照系统更改管理流程记录在案,详细记录系统的修改参数,并及时修改更新设备配置清单和所有相关文档,双方签字后存档。4)配置服务运维方在服务开始时将对所保所有设备进行配置管理,查清所有设备及其相互之间的关系以及记录这些资源的变化过程,为IT系统健康运营提供基础保障,并将所有信息输入运维方的故障系统,针对服务范围内设备建立资源管理系统,对设备数量、配置、性能等各项目,根据IT设备情况进行及时的统计和更新;系统对用户方开放并在服务结束时对相关数据进行移交。系统档案包括但不限于以下内容:1)用户方机房地址2)用户方联系人姓名、电话3)用户方设备应用情况4)用户方系统软件版本号5)硬件配置6)操作系统环境7)网络配置8)用户方系统软件补丁安装情况9)用户方系统备份情况以上文档均有运维方专人负责管理和维护,同时处理用户方的需求、制定服务计划、监督服务执行、跟踪并改进服务质量、提交各类服务报告、处理投诉等。虚拟化平台运维服务神州数码系统集成服务有限公司第11页5)定期回顾运维方应至少每季度对该阶段进行技术服务情况回顾,并将回顾报告提交给用户方。运维方与用户方至少半年

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功