随着国内金融业全面对外开放和国内大型企业数据大集中的工作,我们已看到数据中心作为一种物理载体在企业发展和运营中的作用越来越突出,也看到国内很多大型IT公司、金融、电信、政府等行业的数据中心在不断地投入建设。笔者有幸参加了一些大型数据中心项目的设计工作,根据一些项目的体会以及结合手中所掌握的国际国内有关此方面的资料,对数据中心各等级的特性要求作一分析与汇总,供同行参考。一.关于数据中心的定义数据中心(DataCenter)通常是指在一个物理空间内实现对数据信息的集中处理、存储、传输、交换、管理,一般含有计算机设备、服务器设备、网络设备、通讯设备、存储设备等关键设备。数据中心的基础设施(DataCenterInfrastructure)是指为确保数据中心的关键设备和装置能安全、稳定和可靠运行而设计配置的基础工程,也称机房工程(FacilitySiteEngineering),数据中心机房工程的建设不仅要为数据中心中的系统设备运营管理和数据信息安全提供保障环境,还要为工作人员创造健康适宜的工作环境。二.数据中心设计的依据和标准目前国内外与数据中心有关的工程建设标准主要有《电子计算机机房设计规范》(GB50174-92)、《电信专用房屋设计规范》(YD/T5003-2005)、《美国通信工业协会(TIA)发布的《ANSI/TIA-942–2005,TelecommunicationsInfrastructureStandardforDataCenters(数据中心的通信基础设施标准)》,它们是数据中心建设定位、功能指标、设计技术、施工工艺、验收标准等的具体技术要求与体现。其中美国通信工业协会(TIA)发布的《ANSI/TIA-942–2005,TelecommunicationsInfrastructureStandardforDataCenters(数据中心的通信基础设施标准)》是国际上第一部较为全面地以数据中心为对象的技术规范标准,它为现代的机房工程建设提出了新的设计理念、系统构架与技术指标,并给出了许多的技术与系统的工程建议与指导。TIA-942《数据中心的通信基础设施标准》是由美国通信工业协会(TIA)委员分会制定,并由美国国家标准学会(ANSI)和美国通信工业协会(TIA)于2005年4月12日共同发布,这是该标准的第一版本。该标准所说的数据中心可以是政府或企业自有产权的自有数据中心,也可以是运营商用于租赁服务的公用数据中心。该标准描述了各类数据中心或计算机房中,对通信基础设施的起码的、最低的要求。三.数据中心机房的等级及其分级的依据在国内标准《电子计算机机房设计规范》(GB50174-92)中主要从机房选址、建筑结构、机房环境、安全管理及对供电电源质量要求等方面对机房分级,可分为A(容错型)、B(冗余型)、C(基本型)三个级别。在美国标准TIA-942《数据中心的通信基础设施标准》中主要是根据数据中心基础设施的“可用性(Availability)”、“稳定性(Stability)”和“安全性(Security)”分为四个等级:TierI,TierII,TierIII,TierIV。其中这四个等级可用性的划分是源于美国标准TheUptimeInstitute,Inc.的《IndustryStandardTierClassi?cationsDe?neSiteInfrastructurePerformance》(《采用分类等级的方式定义场地基础设施性能的工业标准》),在该标准中,美国TheUptimeInstitute依据工程需求与实践,提出了场地基础设施的分类等级的体系框架,针对数据中心的关键设备期望达到“五个九”即%的系统应用可用性的需求,提出了要与之相匹配的机房场地基础设施(电源配电、暖通空调、以及其他的相关系统)的可用性等级指标。四.在TIA-942标准中数据中心各等级的特性及要求根据TIA-942标准,数据中心机房可分为四级:由“等级TierI”没有冗余部件组成的系统(可提供%的可用性)到“等级TierIV”有冗余部件(能够故障容错)和实现不间断维修的系统(可提供%的可用性)。根据该标准场地的可用性分类等级框架分成四个层次等级,下面将介绍该标准中每个等级的特性及其数据中心基础设施等级的类型、要求和相关特性:(一)等级TierI――基本数据中心“等级I”的数据中心对来自有计划和无计划的运营中断反映敏感(影响较大)。数据中心配有计算机电力分配和冷却,但是它可以或不一定有架高的活动地板,一台UPS或者一台发电机。在这些系统上的关键的负荷能达到N的100%。如果它确实有UPS或者发电机,他们是单个模块的系统并且有很多单个的故障点。一个年度内场地内基础设施被完全关闭停运,是基于进行预防性检修和修理的需要。紧急状态下可能需要频繁地关闭设施。场地内基础设施组成器件故障、操作错误,以及自然产生地失败将引起数据中心运营的中断。等级I由电力和冷却分配的一条单通路组成,没有多余的组成部分,提供%的可用性。(二)等级TierII――基础设施部件冗余“等级II”的数据中心采用设备部件冗余要比“基本数据中心”有计划和无计划的运营中断反映稍微要少(影响较小)。场地内有架高的活动地板,一台UPS和发电机,动力的能力设计是N+1,全部有条单一的分配线路。关键的负荷能达到N的100%。关键线路的维修和场地内其他基础设施的维修维护将需要一次处理性关闭中断。等级II由电力和冷却分配的一条单通路组成,带有多余的组成部分,提供%的可用性。(三)等级TierIII――基础设施同时可维修“等级III”的数据中心具有能够进行任何有计划的场地基础设施活动,而又不应使计算机硬件系统运行中断的能力。有计划的活动包括预防性和程序性的维修,修理和替换零部件,添加或调整部件的容量,部件和系统的测试。对使用冷冻水系统的大型场地来说,这表示两套独立的管路。要有足够的能力和分配,一定可提供在进行维修或者在其它管路上测试时,在一条管路上同时带负荷。无计划的活动,例如设备基础设施的零部件,在运行中或者自然的情况下发生故障,引起数据中心的运行中断。在一个系统上的关键的负荷不超过N的90%。当客户的业务需要得到正当合理的额外保护时,“等级III”的场地将被有计划地设计成可升级成“等级IV”的场地。等级III由多条有效的电力和冷却分配道路组成,但是只一条道路活跃,有多余的组成部分,并且同时是可维修的,提供的%的可用性。(四)等级TierIV――基础设施故障容错“等级IV”的数据中心具有能够进行任何有计划的的活动且不会对关键的负荷造成中断的能力,且有提供场地基础设施容量及其能力。基础设施故障容错的功能性为场地基础设施的能力提供至少维持一种最坏的情况,无计划的故障或者事件将不影响关键的负荷。这需要同时活跃的分配道路,通常在S+S的双电源系统配置里。电力系统供应表示为每个有N+1冗余的两个单独的UPS系统。在一个系统上的涉及的关键的负荷不超过N的90%。“等级IV”需要全部计算机硬件有故障容错的双电源输入。严格的故障容错测验使数据中心具有维持无计划故障或者运行错误时,不发生计算机机房过程中断的能力。等级IV由多条有效的电力和冷却分配道路组成,有多余的组成部分,并且是故障容错,提供的%的可用性。综上所述,我们可以用以下几个对照表来总结数据中心的设计依据及其各等级的特性和要求:1.数据中心建设相关标准类别级别具体内容国家规范《电子计算机机房设计规范》(GB50174-92)、《电信专用房屋设计规范》(YD/T5003-2005)A(容错型)、B(冗余型)、C(基本型)从机房选址、建筑结构、机房环境、安全管理及对供电电源质量要求等方面对机房分级,分为A、B、C三个级别美国标准ANSI&TIA-942数据中心通讯网络基础设施标准TierI单电源和冷却分布,没有冗余的构件,仍受计划性和非计划性活动所带来的中断影响,只可提供%的可用性(基本数据中心)TierII单电源和冷却分布,有冗余的构件,可轻微减少计划性和非计划性活动所带来的中断影美国标准ANSI&TIA-942数据中心通讯网络基础设施标准响,只可提供%可用性(冗余设计数据中心)TierIII多路可用的电源和冷却分布通道,但平时只有一路在使用,由冗余的构件,可并行维护,所有计划性的基础设施相关活动不会影响计算机硬件的正常运行,只可提供%的可用性(可并行维护数据中心)TierIV多路可用的电源和冷却分布通道,有冗余的构件,并支持容错能力,只可提供%的可用性(容错数据中心)2.国际行业标准ANSI&TIA-942关于数据中心分级的一些主要技术指标项目第一级基本第二级具冗余单元第三级可并行维护第四级容错数据中心可用性%%%%每年由于基础设施引起的IT服务中断时间小时小时小时(96分钟)小时(24分钟)建筑物类型租用租用,且其它租户没有危险独立运行,且必须都是数据中心或电信运营商(或自独立运行,且必须都是数据中心或电信运营商(或自有)有)供电通路数量仅有一路仅有一路一路主用,一路备用两路互为热备供电冗余措施NN+1N+1S+S或2(N+1)UPS电源冗余NN+1N+1S+S或2(N+1)发电机容量仅供计算机及通信系统设施的用电及其动力仅供计算机及通信系统设施的用电及其动力仅供计算机及通信系统设施的用电及其动力,冗余一台供大楼内所有负载,冗余一台根据所安装UPS的容量正确选择发电机是是是是发电机燃料供应时间(满负载运行)8小时(如果UPS有8min的备份时间可以不设置)24小时72小时96小时UPS电池最少满负载备份时间(有发电机应急电源系统)5min10min15min15min重要负载的自动切换设置带维护旁路的ATS,一旦发生断电,ATS自动切换到发电机供电回路设置带维护旁路的ATS,一旦发生断电,ATS自动切换到发电机供电回路设置带维护旁路的ATS,一旦发生断电,ATS自动切换到发电机供电回路设置带维护旁路的ATS,一旦发生断电,ATS自动切换到发电机供电回路负载同步控制器LBS无无有有动力设备和环境集中监控系统无无有有分类/分区供电不是不是不是是关键的负荷可用度100%NN的100%100%NN的100%90%NN的90%90%NN的90%初始的用电总量(瓦/每平方英尺)(典型值)20-3040-5040-6050-80最终的用电总量(瓦/每平方英尺)(典型值)20-3040-50100-150150+150以上连续冷却没有没有或许是的场地空间架空中活动地板的比率20%30%80%-90%100%架空活动地板的高度(典型值)12”30CM18”45CM30”-36”75-90CM30”-36”75-90CM地板荷载磅/每平方英尺(典型值)85100150150并行维护能力没有没有有有容错能力没有没有没有有单点故障很多+人为错误很多+人为错误有一些+人为错误一个没有+人为错误人员配备没有1班超过1班7*24小时值班没有值班1名值班1名值班+轮班永远24小时值班场地的可用性%%%%(注:1平方米=平方英尺,1千克=磅)3.国际行业标准ANSI&TIA-942标准对数据中心选址的技术指标要求内容TierITierIITierIIITierIV临近水灾区域没有要求不能在水灾区域不在百年一遇的水灾或至少离开50年一遇的水灾区域至少离开百年一遇的水灾区域91米91米临近海岸或内陆河流没有要求没有要求不小于91米不小于800米临近主要的交通要道没有要求没有要求不小于91米不小于800米临近机场没有要求没有要求不小于公里,最好大于48公里不小于8公里,最好大于48公里临近主要城市区域没有要求没有要求不大于48公里不大于16公里源自:ANSI&TIA-942TelecommunicationInfrastructureStandardforDataCenters4.国际行业标准ANSI&TIA-942标准对建筑设计的技术指标要求内容TierITierIITierIIITierIV在建筑物内有多个租户没有限制没有危险的其他租户必须是数据中心或电信运营商必须是数据