1前言随着大数据、云计算、智慧城市、移动互联网和物联网等应用的快速发展,各行各业对于数据中心场地基础设施的需求也越来越大。数据中心单体规模越大、系统越复杂,脆弱性也越高,对于数据中心运行维护管理水平的要求也就越高。中国数据中心产业发展联盟为了提升整个数据中心行业在数据中心场地基础设施的运维管理水平,特发起了本标准的制定。本标准适用于:政府及企业信息化管理负责人、数据中心负责人、数据中心场地基础设施的运维管理人员。本标准可为以上人群进行数据中心场地基础设施的运维管理提供系统性的建议,也可作为用户评价数据中心场地基础设施运维服务水平的参考。本标准专注于数据中心场地基础设施层面。本标准从安全、人员、设施以及运行四个角度关注以上界定的场地基础设施,以达到高可用性及经济运行的目标。考虑到标准的篇幅限制,也考虑到不同数据中心间运维目标等级不同、规模不同、配置的巨大差异性,因此,本标准注重于具有普适性的运维管理系统框架的完整性。考虑到标准需要为数据中心行业提供更加具体的指导,我们将陆续提供一系列的最佳实践文档作为本标准的补充。本标准由中国数据中心产业发展联盟发起,由以下个人及单位共同完成。起草人:程小丹、张广明、吕军、曹洁、李良、康楠、蔡欣、张炳华、喻茂萍、陈炎通、张凯、张永萍、石葆春、李润生、李崇辉、尼米智、李红坤、文静、张艳辉、吴铁刚、袁晓东、姜俊海、王茜、左天祖、苏旭江、许志德、李宁、邹松、丁结良、彭飞、刘俊梅、郑圆圆、赵磊。参与单位:北京中科仙络咨询服务有限公司百度在线网络技术公司宝德科技集团股份有限公司北京德拓天全信息技术服务有限公司北京云泰数通互联网科技有限公司国富瑞数据系统有限公司华为技术有限公司联通云数据有限公司运维与服务部上海斐讯数据通信技术有限公司施耐德电气信息技术(中国)有限公司23世纪互联数据中心有限公司曙光云计算技术有限公司招商银行股份有限公司中国电信股份有限公司云计算分公司中国移动通信集团公司政企客户分公司支持单位:北京企商在线数据通信科技有限公司蓝汛首鸣数据中心南京诚赢软件科技有限公司润泽科技发展有限公司山东银澎百盛云计算技术有限公司上海迪佑拂科技咨询服务有限公司上海数讯信息技术有限公司苏州国科综合数据中心有限公司太极计算机股份有限公司万国数据服务有限公司中铁程科技有限责任公司广州宽带主干网络有限公司中金数据系统有限公司本标准将定期更新,以适应数据中心技术及管理最佳实践发展的新趋势。相关单位及个人对于本标准有任何改进建议或意见,请发邮件至秘书处,联系邮箱:mishuchu@chinabda.org。目录一、规范性引用文件.....................................................................5二、术语和缩略语.........................................................................52.1术语.................................................................................52.2缩略语.............................................................................7三、管理范畴................................................................................83.1管理目标..........................................................................83.2参与数据中心建设过程....................................................83.3测试验证.........................................................................93.4技术文档.........................................................................103.5管理边界.........................................................................10四、安全管理和质量管理.............................................................114.1人员安全.........................................................................114.2物理环境安全..................................................................114.3质量管理.........................................................................12五、人员管理................................................................................135.1组织及人员......................................................................135.2培训及认证......................................................................145.3运维外包服务商..............................................................15六、设施管理................................................................................166.1资产数据库......................................................................166.2预防性维护......................................................................166.3操作流程.........................................................................176.4工具及备件管理...............................................................186.5供应商管理......................................................................186.6生命周期管理..................................................................196.7运维管理系统..................................................................1923七、运行管理................................................................................207.1运行管理制度..................................................................207.2设施监控、巡检、及交接班管理.....................................217.3机房清洁管理..................................................................217.4标签标识管理..................................................................217.5变更管理.........................................................................217.6事件管理.........................................................................227.7应急响应.........................................................................227.8容量管理.........................................................................237.9能效管理.........................................................................237.10预算管理.......................................................................24八、附录:数据中心场地基础设施运维管理最佳实践...................25附录A测试验证的最佳实践..................................................25附录B数据中心市电断电应急预案.......................................39附录C数据中心机房基础设施运维人员架构图.....................44附录D数据中心场地基础设施运维中易犯的十大错误..........4545一、规范性引用文件下列文件对于本文件的应用是必不可少的。凡凡是注明日期的引用文件,仅注日期的版本适用于本文件。凡是不注明日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB50157电子信息系统机房设计规范GB26860电力安全工作规程发电厂和变电站电气部分DL408电业安全工作规程二、术语和缩略语2.1术语2.1.1数据中心(DataCenter)主要功能为容纳一个计算机房和该计算机房的各个支持区的一栋建筑或者一栋建筑的一部分。包括容纳信息技术系统的主机房、支持信息技术系统运行的辅助区和行政管理区。2.1.2场地基础设施(SiteInfrastructure)数据中心内为信息技术系统提供运行保障和运行环境的场地设施。包括容纳IT系统的主机房,支持IT系统运行的供电系统、制冷系统、消防系统、安防系统、监控系统及其路由等配套设施及维护IT系统的辅助设施。2.1.3运维管理(OperationandMaintenanceManagement)对数据中心场地基础设施进行日常运行和维护,确保各项基础设施系统安全稳定地运行。运维管理包括制定运维制度和计划、执行运维计划、响应场地基础设施故障、突发事件等紧急情况。2.1.4生命周期(LifeCycle)通常指数据中心从投产到经济寿命结束的全过程。但也有将投产前的规划期、设计期、建设期、测试验证期作为生命周期一部分(孕育期)的说法。2.1.5测试验证(Commissioning)验证并记录数据中心设施作为一个整体及其所有的设备、子系统满足用户的设计目标和运行要求。2.1.6健康评估(HealthAssessment)全面系统性地对机房现有使用状态、设备运行情况、运维管理制度