北京移动欣智通讯技术有限公司节能服务专家11.TIER数据机房评估系统简介1.1.关于TIA-942(ANSI/TIA/EIA-942-2008_TelecommunicationsInfrastructureStandardforDataCenters—『数据中心电信基础设施标准』)由美国国家标准学会(ANSI)于2005批准颁布。此标准由TIA(美国电信产业协会与技术工程委员会)所编撰,包括设备计划编制、电缆系统、网络、建筑架构、电力系统、消防系统、空调系统、接地系统设计,并考虑电力质量等等因素。为数据中心完整架构基础。TIA-942标准附录G中规定,引用UptimeInstitute所定义的工业机房基础架构等级系统(TierRatingsystem)并加以延伸至通讯系统中,作为数据中心机房基础设施等级的定义。TIA-942目前已成为通信与信息行业建设数据中心的国际标准。目前已有数十个国家的新建机房和既有机房采用TIA-942作为标准化准则,承认基于此标准的数据中心评鉴等级。包括英国、美国、加拿大、意大利、UAE、Qatar、SaudiArabia、SouthAfrica、Mexico、Brazil等国家已经完成认证体系。1.2.申请分级认证标章定义(TierCertification)UptimeInstitute针对数据中心基础设施的可用性定义了四种不同等级,作为数据中心基础设施分级认证的标准。四种不同等级认证分别被命名为TierI、TierII、TierIII、TierIV等级,分别对应数据中心的可用性指标及年平均故障时间:第I级:可用性99.671%、年平均故障时间28.8小时。(通过基本认证)第II级:可用性99.741%、年平均故障时间22小时。(通过银级认证)第III级:可用性99.982%、年平均故障时间1.6小时。(通过金级认证)第IV级:可用性99.995%、年平均故障时间0.4小时。(通过白金级认证)北京移动欣智通讯技术有限公司节能服务专家21.3.等级认证程序的阶段等级认证程序,分为两阶段:第一阶段:设计规划认证。认证范围包括设计图,系统架构,操作性能,维护性能、扩充性能检讨,经审查认可后,UptimeInstitute颁发设计等级认证书及牌志。第二阶段:建物现场勘查认证。范围包括整体机电设施的功能认证及测试与检讨。经审验认可后,UptimeInstitute颁发设计等级认证书及牌志。在整体认证之前进行机房整体性能验证十分必要。为使认证顺利通过,必须能让机房试车与运转,证明达到完整的机电整合性能水准。机房整体性能验证包括测试、平衡、调整(TAB)进而推进至量测验证(M&V),可以促进机房可用性全面提升。2.TIA国际技术规范与TIER评估标准在ANSI/TIA/EIA-942-2008_TelecommunicationsInfrastructureStandardforDataCenters(数据中心电信基础设施标准)框架之下所涉及的其他标准如下:ANSI/TIA/EIA-568-B的布线标准ANSI/TIA/EIA-569-A的商业建筑的通信通道和空间标准ANSI/TIA/EIA-607商业建筑的通信接地和连接标准ANSI/TIA/EIA-570-B住宅通信基础设施管理标准ANSI/TIA/EIA-606商业建筑通信基础设施管理标准北京移动欣智通讯技术有限公司节能服务专家3上述国际标准对数据中心的机电建设做出全面和详细规定,内容涵盖了GB5014-2008国标电子信息系统机房设计规范的所有内容。由于这些标准/规范颁布于不同时间,内容多有相互覆盖。为使这些标准/规范更易于落实,并具备可执行性,UptimeInstitute将上述国际标准中涉及到信息机房可用性的内容进行研究归纳整合,形成一套连贯的技术标准。基于这样的具有可执行性的标准,定义出数据中心的可用性等级(以TierI、TierII、TierIII、TierIV等级命名)以及与之配套的等级认证程序。由于Tier认证标准以TIA系列国际标准作为认证的技术基础,TIA完全认同并引用UptimeInstitute的信息机房可用性项目、程序与结果。UptimeInstitute_DataCenterSiteInfrastructureTierStandard:Topology机房基础设施等级拓扑标准UptimeInstitute_TierClassificationsDefineSiteInfrastructure信息机房基础设施等级定义UptimeInstitute_OperationalSustainability信息机房基础设施永续性运行规范3.机房基础设施等级拓扑标准3.1.概要《机房基础设施等级拓扑标准》是一套客观的基准定义。是用来衡量某一特定信息机房基础设施之现实和预期可用性(或性能)的方法。它同样适用于衡量一组或多个机房(如一栋包含多个机房的建筑物)的现实可用性和预期可用性。信息机房的可用是指该机房按照设计能力不间断正常运行。而机房的可用性则以该机房每年不间断正常运行的时间来描述。无疑,机房每年可靠地不间断正常运行的时间越长,或者出现“每年中断不间断正常运行的时间”越少则表示该机房的可用性越高。随着互联网应用的爆炸性增长,对于信息机房基础设施高可用性要求压力不断增加。那些租用或直接使用信息机房(包括数据中心)的客户期望自己的机房可用性可以至少达到“五个九”或99.999%。随之而来的是对计算机硬件的可靠性和计算机软件可靠性的需求增加。不幸的是,面对频繁的业务需求,即使软件平台和计算机硬件的可靠性达到五个九,也不能保证机房可用性可以至少达到99.999%。就是说,依靠增加庞大投资,单纯提升软件平台和计算机硬件的可靠性对于机房整体高可用性保北京移动欣智通讯技术有限公司节能服务专家4障很可能是不够的,除非再配上机房基础设施的补充容错措施(电源、冷却,和其他环境支持系统),才可以支持机房的高可用性目标。《机房基础设施等级拓扑标准》针对机房基础设施的配置情况来衡量机房可用性。从机房的整体组成、各部分功能、容量与能力、可靠性、临界载荷、扩容预期和并发维护措施等多个角度出发,清晰定义并描述机房的可用性与机房基础设施拓扑配置(所拥有的容错组件及可分配路径)之间的对应关系。这种对应关系用来区分机房基础设施拓扑结构的四个等级定义。该标准专注于定义相对于四个等级(TierⅠ,TierⅡ,TierⅢ,TierⅣ)的机房基础设施拓扑结构及其性能确认测试,以确定机房的容错能力和同步维护性符合上述定义。在该标准中提供了机房基础设施系统设计和拓扑配置的典型用例,用来厘清等级分类的标准定义。3.2.范围《机房基础设施等级拓扑标准》认为,机房的基础设施必须具备可靠的容错措施和多种备份选择路径,确保机房的可用性不会因为机房内所有活动——包括计划内的活动(如定期维护、常规测试、业务开通、节能措施、机房改造、故障排除等)和计划外的活动(包括设备故障、意外事故、人为错误操作等)——受到预期之外的影响,以满足机房整体可用性要求。《机房基础设施等级拓扑标准》针对机房基础设施分类等级定义(TierⅠ,TierⅡ,TierⅢ,TierⅣ),建立了四个独特机房基础设施拓扑定义,以及遵循该定义的性能确认测试标准。该分类等级说明了保证机房不同可用性状态下,机房基础设施所需的拓扑结构。一个典型的数据中心是由至少20个主要子系统构成的总和体。这些主要子系统包括机械、供电、消防、制冷、建筑物、安全等。每一个子系统又具有各自的分系统和组件。而所有这些都必须支持并行(同时)维护且具有故障容错措施,进而满足整体机房的容错要求和维护要求,保证整体机房的可用性。该标准基于这样一个事实:信息机房(含数据中心)的可用性(不间断正常运行时间),取决于机房基础设施中所有子系统单独可用性以及它们之间的成功整合运作,而对于其中某些个别的子系统(例如,发电,制冷,不间断电源等),需加以选择来维持运行。每个子系统和经由这些子系统整合而成的信息机房基础设施,必须以机房整体不间断正常运行的相同目标来做一致性的配置,以满足相应特定等级的可用性要求。衡量一个机房的基础设施是否到达某个等级的规定要求由两个因素确定:按照标准拓扑配置后的确认测试结果和对于机房不间断运行的影响来衡量。这种测量方法不同于规范设计,或一份所需设备的清单。北京移动欣智通讯技术有限公司节能服务专家53.3.目的本标准的目的是使专业设计人员,机房操作者,和非技术性之管理人员以客观和有效的途径来确定不同机房基础设施的设计拓扑架构之预期性能。3.4.参考文献2005ASHRAE手册-基础版_美国冷冻空调协会UptimeInstitute错误容忍度电力遵循规范,2.0版本规范。UptimeInstitute持续可用性需要有连续冷却的容量。白皮书。4.机房基础设施等级标准(SiteInfrastructureTierStandards)4.1.TierⅠ机房:基本的机房基础设施4.1.1.基本配置要求TierⅠ机房定义为基本配置机房。基本配置机房内的计算机设备具有无备援容量的电力配送和制冷组件,具有单一或无备份电力配送和制冷分配路径来供应计算机设备。即使有UPS或者发电机,也是单模块系统,具有多处单故障点。4.1.2.性能确认具有足够的空间容量满足机房设备安装的需求;或许有(也许没有)架空地板;已计划的工作将需要关闭大多数或所有基地基础设施系统中受影响的计算机设备,系统,和用户。4.1.3.操作影响:机房运行易受已计划活动和计划外的活动所影响。计划内和计划外的活动都会很容易引起机房整体运行中断。机房基础设施(系统、组件或分配路径等元素)中断或故障将会影响机房计算机设备运行。对于机房基础设施各组件的人为操作错误或自然故障将导致整个数据中心运行中断。北京移动欣智通讯技术有限公司节能服务专家6为了进行预防性的维护和维修,基础设施需完全地手动关闭。一般情况下,基础设施每年需要完全关闭一次,来安全地进行必要的预防性保养和维修工作。紧急情况下,可能需要更频繁的系统关闭。如未定期进行维修,将大大增加意外中断的风险,以及后续故障的严重可能性。TierⅠ数据中心机房的可用性为99.671%。4.2.TierⅡ机房:具冗余组件级机房基础设施4.2.1.基本要求TierⅡ机房具有一些冗余的部件或备援容量组件。具有部分备援容量的电力配送和制冷组件,具有单一或部分备援电力配送和制冷分配路径来供应计算机设备。UPS和发电机的设计容量是N+1,且为单回路设计,因此有单点中断可能。4.2.2.性能确认冗余部件或备援容量组件可以有计划的从服务中删除,不会造成任何引起机房整体运行中断。数据中心配备架空地板。对关键分配路线和其他基础设施进行维护仍需要程序化地关闭设备。删除分配路线或其它备援组件仍需要关闭部分工作的计算机设备。4.2.3.操作影响机房运行易受已计划活动和计划外的活动所影响。计划内和非计划性的活动引起数据中心中断的可能性小于TierⅠ级数据中心。计划外的活动会很容易引起机房整体运行中断。任何计划外之冗余部件失效也许会影响计算机设备。计划外之任何冗余系统中断或故障将会影响计算机设备。机房基础设施组件的人为操作错误也许会导致引起机房整体运行中断。对于机房基础设施各组件的人为操作错误或自然故障将导致引起机房整体运行中断。机房基础设施每年必须完全关闭一次,来安全地进行必要的预防性保养和维修工作。紧急情况下可能需要更频繁的系统关闭。如未定期进行维修,将大大增加意外中断的风险,以及后续故障的严重可能性。TierⅡ数据中心的可用性为99.741%。4.3.TierⅢ机房:可并行维护级机房基础设施4.3.1.基本要求TierⅢ机房具有冗余部件和备援容量组件。具有多个独立的备援电力配送和北京移动欣智通讯技术有限公司节能服务专家7制冷分配路径来供应计算机设备。任何时候只需要一个分配路径来供应计算机设备。所有的IT设备是双电源的。数据中